Thực tế doanh nghiệp sau cơn sốt Token: quản lý ngân sách trở thành trạng thái bình thường mới, nhưng tàu AI vẫn chưa giảm tốc.

Kỷ nguyên "uống thỏa thích" của doanh nghiệp tiêu dùng AI đang kết thúc, nhưng kiểm soát hóa đơn không có nghĩa là phanh gấp.

Trong nửa đầu năm nay, "Token tối đa hóa" (Tokenmaxxing) đã trở thành từ thông dụng trong giới AI doanh nghiệp. Các công ty như Meta, SalesForce chủ động khuyến khích nhân viên tiêu thụ càng nhiều Token AI càng tốt để nâng cao năng suất. Nội bộ Meta thậm chí còn xuất hiện một bảng xếp hạng mang tên "Kinh tế học Claude" (Claudeconomics), theo dõi 250 người dùng hàng đầu của công ty. Dữ liệu cho thấy, nhân viên Meta đã tiêu thụ hơn 60 nghìn tỷ Token trong 30 ngày, người dùng tiêu thụ cao nhất đạt khoảng 280 tỷ Token. Nhân viên để tranh giành các danh hiệu như "Huyền thoại Token", "Phù thủy bộ nhớ đệm" đã khiến AI agent dành hàng giờ để thực hiện các nghiên cứu vô nghĩa nhằm "đốt Token".

Sau đó, Uber đã lên trang bìa vì đốt sạch ngân sách cả năm của Claude Code và Codex trong vòng bốn tháng, ngay sau đó áp dụng giới hạn sử dụng hàng tháng là 1500 đô la Mỹ cho nhân viên, phần vượt quá cần được phê duyệt từng trường hợp.

Những sự kiện này đã thu hút sự chú ý rộng rãi. Nhưng nhóm SemiAnalysis, sau khi tiến hành khảo sát thực địa tại Hội nghị thượng đỉnh AI của Databricks và trao đổi chuyên sâu với hơn 50 khách hàng doanh nghiệp qua Slack và điện thoại, đã đưa ra kết luận hoàn toàn khác với câu chuyện truyền thông.

Tổ chức này cho rằng, các báo cáo của truyền thông đã phóng đại nghiêm trọng mức độ phổ biến của vấn đề. Các trường hợp cực đoan của Meta và Uber bắt nguồn từ cơ chế khuyến khích không phù hợp và quản lý nội bộ lỏng lẻo, chứ không phải do tổng thể đầu tư AI của doanh nghiệp mất kiểm soát.

Câu chuyện tiêu đề bị phóng đại, dữ liệu thực tế ôn hòa hơn

Truyền thông có thể đã phóng đại cuộc khủng hoảng ngân sách AI của doanh nghiệp.

Dữ liệu chính yếu hỗ trợ nhận định này. SemiAnalysis trích dẫn dữ liệu chi tiêu của Ramp cho thấy, chi tiêu AI trung bình hàng năm trên mỗi nhân viên của 1% khách hàng hàng đầu là khoảng 90.000 đô la Mỹ, 10% hàng đầu là khoảng 7.300 đô la Mỹ, trong khi mức trung vị của khách hàng Ramp chỉ là 136 đô la Mỹ. Trình độ ứng dụng công nghệ tổng thể của khách hàng Ramp đã cao hơn nhiều so với các doanh nghiệp thông thường, nhưng chi tiêu AI bình quân đầu người của các khách hàng truyền thông thuộc Fortune 500 vẫn thấp hơn nhiều so với 100 đô la Mỹ.

Ngay cả "ông lớn đốt Token" Meta, tính theo giá niêm yết mỗi năm mỗi nhân viên tiêu tốn gần 50.000 đô la Mỹ, theo ước tính của SemiAnalysis cũng chỉ chiếm 3% đến 5% doanh thu từ khách hàng của Anthropic.

Tài liệu của chính Anthropic cũng xác nhận điều này: chi tiêu trung bình hàng tháng của nhà phát triển Claude Code chỉ 150 đến 250 đô la Mỹ, chỉ 10% người dùng chi tiêu trung bình hàng ngày trên 30 đô la Mỹ.

SemiAnalysis cho rằng: "Các báo cáo phóng đại của truyền thông là không đúng sự thật - doanh nghiệp vẫn đang tiếp tục đầu tư, các kịch bản nhu cầu mới và các lĩnh vực dọc mới mang lại sự tiêu thụ Token, đang thúc đẩy cỗ xe AI tiếp tục tiến lên với tốc độ chóng mặt."

Điều này có nghĩa là việc áp dụng AI trong doanh nghiệp vẫn đang trong giai đoạn khuếch tán không đồng đều. Không phải tất cả nhân viên đều sử dụng mô hình lớn với tần suất cao. Nhiều công ty chỉ có một số ít nhóm, một số ít vị trí chạy trước.

Kiểm soát ngân sách trở thành trạng thái bình thường mới, nhưng tiêu chuẩn thì muôn hình muôn vẻ

Trong số hơn 50 doanh nghiệp được phỏng vấn, đa số đã đặt giới hạn cứng đối với việc sử dụng AI. Nhưng tiêu chuẩn của mỗi công ty rất khác nhau, không có sự đồng thuận trong ngành.

Trường hợp thấp:

  • Nhà sản xuất hàng không vũ trụ và quốc phòng hàng đầu trong top 3 của Mỹ: giới hạn 250 đô la Mỹ mỗi người mỗi tháng, một số người dùng nặng đã hết hạn mức trong bốn ngày đầu tháng

  • Một trong những công ty dược phẩm lớn nhất thế giới: 500 đô la Mỹ mỗi người mỗi tháng, trường hợp đặc biệt có thể yêu cầu 1.000 đô la Mỹ

Trường hợp cao:

  • Workday, Stripe: ngân sách hàng tháng của nhân viên khoảng 2.000 đô la Mỹ

  • Công ty an ninh mạng đã niêm yết: nhân viên cấp thấp 800 đô la Mỹ mỗi tháng, nhân viên cấp cao 1.600 đến 4.000 đô la Mỹ, nhà khoa học dữ liệu được cấp hạn mức cao nhất

  • Công ty công nghệ du lịch lớn (800 kỹ sư trong số 1.500 nhân viên, chi tiêu AI hàng năm gần 10 triệu đô la Mỹ): mặc định 200 đô la Mỹ mỗi người mỗi tháng, có thể tăng lên hàng chục nghìn đô la Mỹ tùy theo vị trí

Logic thiết lập ngân sách cũng khác nhau. Một trong ba hãng hàng không lớn nhất của Mỹ có cách làm đặc biệt nhất: phân bổ Token liên kết trực tiếp với các dự án cụ thể và doanh thu dự kiến. Ví dụ, đối với một dự án dự kiến doanh thu 10 triệu đô la Mỹ, nhóm tài chính phê duyệt tổng ngân sách chi tiêu là 1 triệu đô la Mỹ, nhóm tự quyết định bao nhiêu phần trăm trong đó dành cho Token – chi phí AI được đưa vào mô hình tài chính của dự án, chứ không phải ngân sách CNTT riêng.

"Sống sót" với Token tiết kiệm: Quy tắc sinh tồn của nhân viên

Áp lực ngân sách đã tạo ra một bộ chiến lược tiết kiệm Token thực tế.

Điển hình nhất là "Chênh lệch lãi suất Copilot": Người đăng ký Microsoft 365 Enterprise có thể sử dụng chatbot Copilot tiêu chuẩn miễn phí không giới hạn và mức sử dụng này không được tính vào ngân sách AI hàng tháng. Một công ty hàng tiêu dùng và công nghệ sức khỏe lớn của Hà Lan cho biết rõ ràng, nhân viên sẽ dùng Copilot để phác thảo và tích hợp ý tưởng trước, sau đó gọi Claude hoặc Codex để xử lý các nhiệm vụ cuối cùng, nhằm tiết kiệm Token có tính phí.

Hạ cấp mô hình cũng là một biện pháp phổ biến. Công ty công nghệ du lịch toàn cầu đó đã chuyển mô hình mặc định Claude của tất cả nhân viên từ Opus sang Sonnet, Opus vẫn có thể sử dụng nhưng cần phải chủ động chọn. Nhà sản xuất hàng không vũ trụ và quốc phòng đó đã trực tiếp "tắt" Opus 4.8 và chế độ nhanh.

Về điều này, nhóm SemiAnalysis đã trực tiếp nhận xét về logic của ban quản lý: "Ban quản lý cho rằng việc cấp cho nhân viên ngân sách Token lớn hơn sẽ khiến họ tự động hóa những nhiệm vụ lẽ ra không nên tự động hóa, chẳng hạn như viết email. Chúng tôi cho rằng quan điểm chống tự động hóa này là quá ngây thơ."

Nhu cầu về Token giá rẻ vẫn tăng, thị trường TaaS/API endpoint không hạ nhiệt

Quản lý ngân sách không đồng nghĩa với giảm gọi. Doanh nghiệp quan tâm hơn đến chi phí đơn vị.

Nhu cầu về Token giá rẻ vẫn mạnh. Thị trường Token-as-a-Service/API endpoint cho cả mô hình tiên tiến và mô hình nguồn mở đều đang tăng trưởng. Sau khi đưa AWS Bedrock vào tính toán, ước tính của SemiAnalysis về tốc độ tăng trưởng tổng thể của AWS trong quý này cao hơn kỳ vọng của thị trường.

Các nhà cung cấp TaaS cũng đang mở rộng. Tổng ARR của Together, Fireworks, Baseten và các công ty khác đã vượt quá 4 tỷ đô la Mỹ.

Điều này cho thấy áp lực ngân sách doanh nghiệp sẽ thay đổi cơ cấu mua hàng. Những vấn đề có thể giải quyết bằng mô hình giá rẻ sẽ không liên tục gọi mô hình đắt nhất. Mô hình mặc định bị hạ cấp không có nghĩa là việc sử dụng AI giảm, mà là đường cong chi phí được tối ưu hóa lại.

Mã hóa vẫn là nhu cầu mạnh nhất, cỗ xe AI không giảm tốc vì giới hạn ngân sách

Kịch bản mã hóa vẫn là động lực lớn nhất cho doanh thu AI hiện tại, hơn 70% ARR của OpenAI và Anthropic đến từ hướng này. Tỷ trọng B2B của Anthropic vượt quá 90% (OpenAI khoảng 60%), quyết định cấu trúc doanh thu của nó phụ thuộc sâu hơn vào phía doanh nghiệp và ổn định hơn.

Làn sóng tăng trưởng tiếp theo được cho là sẽ đến từ an ninh mạng và công việc cổ cồn trắng. Khi các sản phẩm như Cowork, CoPilot, Codex và Computer thâm nhập sâu hơn vào doanh nghiệp, con đường tăng trưởng ARR của các phòng thí nghiệm AI do thị trường mã hóa thúc đẩy sẽ lặp lại trong các kịch bản rộng hơn.

Hiện tại, chi tiêu AI bình quân đầu người của hầu hết các công ty Fortune 500 vẫn thấp hơn nhiều so với 2.000 đô la Mỹ/năm, chủ yếu tập trung ở các bộ phận kỹ thuật và khoa học dữ liệu. Điều này có nghĩa là sự phổ biến của AI trong doanh nghiệp vẫn còn ở giai đoạn đầu, không gian tăng trưởng không biến mất, chỉ thay đổi hình thức – từ "đốt tiền tùy tiện" thành "đầu tư liên tục có ngân sách".

ROI thực sự của AI: Nâng cao hiệu quả, nhưng kỳ vọng đầu ra cũng tăng theo

Trong các doanh nghiệp được phỏng vấn, các trường hợp nâng cao hiệu quả nhờ AI là có thật và hiệu quả rõ rệt.

  • Bộ phận tuyển dụng của Amazon: Quy trình từ sàng lọc sơ bộ đến bố trí nhóm trước đây cần 6 đến 9 tháng, sau khi sử dụng công cụ AI đã rút ngắn xuống còn 3 đến 4 tháng

  • Một công ty cung cấp dịch vụ phân tích dữ liệu cho 85% Fortune 500: Công việc trước đây mất một tuần, nay chỉ mất vài giờ

Nhưng mặt trái của việc nâng cao hiệu quả là: Kỳ vọng đầu ra tăng lên đồng thời. Một nhân viên của công ty giải pháp dữ liệu và rủi ro pháp lý thừa nhận, khối lượng công việc trước đây một tuần bị nén xuống vài giờ, "nhưng công ty lại vì thế mà kỳ vọng cô ấy hoàn thành nhiều việc hơn, kết quả là cô ấy còn bận rộn hơn trước."

SemiAnalysis chỉ ra rằng, các sự kiện vượt ngân sách Token của Uber, Meta, v.v., nguyên nhân cốt lõi là cơ chế khuyến khích không phù hợp và giám sát lỏng lẻo, chứ không phải thiếu các kịch bản ứng dụng có ROI cao. Mặc dù Amazon sa thải quy mô lớn, nhưng nhờ hiệu quả nâng cao từ các công cụ AI, họ đang tuyển dụng nhân viên mới với tốc độ nhanh hơn – đây là chú thích rõ ràng nhất về AI như một "đòn bẩy nhân lực".

Tuyên bố miễn trừ rủi ro và điều khoản

        Thị trường có rủi ro, đầu tư cần thận trọng. Bài viết này không cấu thành lời khuyên đầu tư cá nhân, cũng không xem xét đến mục tiêu đầu tư, tình hình tài chính hoặc nhu cầu đặc biệt của từng người dùng. Người dùng nên xem xét liệu bất kỳ ý kiến, quan điểm hoặc kết luận nào trong bài viết có phù hợp với hoàn cảnh cụ thể của họ hay không. Đầu tư dựa trên bài viết này, tự chịu trách nhiệm.
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Đã ghim