Khi mà các doanh nghiệp cố gắng lấy câu “dùng AI để thay thế nhân lực nhằm giảm chi phí” làm bàn tính, thì Anthropic lại thay đổi luật chơi. Gã khổng lồ AI này gần đây đã cập nhật cấu trúc tính phí của phiên bản doanh nghiệp Claude, tách lượng sử dụng Claude, Claude Code và Cowork khỏi khoản phí thuê bao 40 USD/tháng, chuyển sang tính phí riêng theo số lượng Token thực tế tiêu thụ. Giờ đây, có vẻ như chi phí của “nhân viên AI” không hề rẻ như những gì người ta vẫn nói.
(Dùng văn ngôn và hội thoại AI có tiết kiệm Token không? Một ảnh chụp màn hình đã khơi nổ tranh luận; kỹ sư: thực ra dùng tiếng Anh mới là thượng sách)
Chấm dứt thời đại giá cố định, phiên bản doanh nghiệp Claude đổi cách tính phí: dùng bao nhiêu trả bấy nhiêu
Báo The Information cho biết, trong tài liệu giới thiệu doanh nghiệp mà Anthropic cập nhật có viết: “Phí chỗ ngồi hàng tháng (seats) chỉ bao gồm quyền truy cập nền tảng, không bao gồm bất kỳ lượng sử dụng nào; mọi mức sử dụng đều được tính phí riêng theo mức giá API tiêu chuẩn.” Trước đây doanh nghiệp mua “thả sức dùng”, thì nay chuyển sang “theo lượt tính”.
Theo phương án cũ, chi phí thuê bao hàng tháng cho mỗi tài khoản doanh nghiệp khoảng 40 đến 200 USD, kèm theo chiết khấu API từ 10% đến 15%. Dù phương án mới hạ mức phí thuê bao xuống 20 USD/tháng, nhưng đồng thời loại bỏ mọi chiết khấu API và yêu cầu doanh nghiệp cam kết trước cũng như thanh toán trước lượng Token dự ước sử dụng mỗi tháng. Dù dùng nhiều hay ít thực tế, số tiền cam kết vẫn phải trả nguyên, và cam kết càng cao cũng không được đổi lấy đơn giá thấp hơn.
Cấu trúc này đối với Anthropic là doanh thu thường xuyên có thể dự đoán hằng năm; còn đối với doanh nghiệp thì là sự chuyển giao chi phí theo mức sử dụng và rủi ro.
“Thiếu hụt tài nguyên tính toán” mới là ngòi nổ thật sự cho việc điều chỉnh giá
Anthropic gọi lần điều chỉnh này là “tối ưu hóa sản phẩm”, nhưng động lực đằng sau là chi phí tính toán cao ngất. Dù doanh thu năm hóa của Anthropic chỉ trong vỏn vẹn bốn tháng đã tăng từ 9 tỷ USD lên 30 tỷ USD, thì thứ mà người dùng nhận được không phải là giảm giá, mà là sự tái cấu trúc mô hình doanh thu.
Điểm cốt lõi nằm ở cách tiêu hao của đại lý AI (AI Agent). Việc chat thông thường tiêu thụ theo kiểu “uống từng ngụm nhỏ”, nhưng các tác vụ có nhiều bước, ghép nối lặp lại, thậm chí các luồng công việc phối hợp giữa nhiều đại lý, lại là kiểu “uống ừng ực thả ga”.
Ở phía cung cũng đang căng thẳng. Giá thuê GPU Blackwell tăng 48% trong vòng hai tháng; CoreWeave tăng giá hơn 20% từ cuối năm trước; và một dự báo của ngân hàng Mỹ cho rằng nhu cầu năng lực tính toán sẽ tiếp tục co hẹp cho đến năm 2029. Khoản doanh thu do giá cố định mang lại đối với Anthropic đã sớm không còn chịu nổi gánh nặng.
Dịch vụ không ổn định mới là “đèn cảnh báo” thật sự đối với khách hàng doanh nghiệp
Ngoài ra, tính ổn định của dịch vụ cũng là một vấn đề lớn. Sáng lập viên Retool, David Hsu, cho biết trên báo The Wall Street Journal rằng dù Claude Opus 4.6 hoạt động tốt hơn OpenAI, cuối cùng ông vẫn chuyển quy trình làm việc sang bên sau. Lý do là dịch vụ Claude thường xuyên bị gián đoạn khiến ông nhiều lần không thể bàn giao mã đúng tiến độ.
Trong 90 ngày tính đến ngày 8 tháng 4 năm nay, thời gian hoạt động bình thường của Anthropic API chỉ đạt 98,95%, thấp xa so với chuẩn 99,99% của ngành. Hành động của Hsu cho thấy một điều: khi lựa chọn giữa độ tin cậy dịch vụ và năng lực mô hình, doanh nghiệp cần AI có độ ổn định cao.
Chi phí thật của “nhân viên AI” phức tạp hơn nhiều so với con số trên hóa đơn
Hiện nay, mô hình định giá AI dựa trên “phí thuê bao hằng tháng” của truyền thống đã qua đi; tổng chi phí sẽ được tính lại dựa trên mức Token sử dụng thực tế. Việc giành chiết khấu theo mức sử dụng hoặc điều khoản điều chỉnh linh hoạt trong hợp đồng, hoặc chủ động kiểm soát chi tiêu bằng cách tối ưu Prompt, xử lý theo lô và chiến lược bộ nhớ đệm (cache), đã trở thành bài toán mới đối với các doanh nghiệp đi theo hướng áp dụng và chuyển đổi sang AI.
Vài ngày trước, OpenAI cũng công bố chuyển Codex sang tính phí theo Token; GitHub ngày 10 tháng 4 đã siết lại giới hạn sử dụng Copilot; và Windsurf dùng hạn ngạch theo ngày thay cho cơ chế theo điểm. Toàn bộ ngành công nghiệp AI đồng loạt đang tuyên bố chấm dứt thời đại giá cố định.
Trước khi doanh nghiệp đánh giá “triển khai AI có thể tiết kiệm được bao nhiêu nhân lực”, có lẽ vẫn cần kiểm nghiệm liệu người dùng có thể tạo ra các tác phẩm ổn định và chất lượng cao trong một ngân sách bị giới hạn hay không.
Bài viết này về việc phiên bản doanh nghiệp Anthropic Claude tiên phong chuyển sang tính phí theo mức sử dụng, liệu nhân viên AI có thực sự tiết kiệm tiền hơn không? Xuất hiện sớm nhất trên 鏈新聞 ABMedia.
Bài viết liên quan
Cổ phiếu Meta Tăng 1,73% khi Công Ty Lên Kế Hoạch Sa Thải 8.000 Nhân Sự Bắt Đầu Từ Ngày 20/5
Báo cáo thường niên của Google cho biết Gemini thực hiện chặn theo mili giây, chặn 99% quảng cáo lừa đảo
Đồng sáng lập Ethereum Lubin: AI sẽ là bước ngoặt then chốt cho crypto, nhưng độc quyền của các gã khổng lồ công nghệ tạo ra rủi ro mang tính hệ thống
Elon Musk Thúc Đẩy Các Khoản Chi Trả “Thu Nhập Cao Phổ Quát” như Giải Pháp Tối Ưu Cho Tình Trạng Thất Nghiệp Do AI
Quảng cáo ChatGPT mở rộng sang Úc và New Zealand: người dùng Free và Go dùng trước, các gói trả phí vẫn không có quảng cáo