Anthropic Phát Hành Claude Opus 4.7 Với Năng Lực Cyber Mất Yếu Đi

CryptoFrontier

Anthropic đã phát hành một phiên bản nâng cấp của mô hình chủ lực của họ, Claude Opus 4.7, vào ngày 16 tháng 4 (theo giờ địa phương). So với mô hình Opus 4.6 trước đó, Opus 4.7 thể hiện “những cải thiện đáng kể” về năng lực kỹ thuật phần mềm nâng cao, đặc biệt trong các tác vụ khó, với độ chặt chẽ và tính nhất quán được nâng cao trong các tác vụ phức tạp chạy lâu và khả năng nhìn được cải thiện. Tuy nhiên, Anthropic đã cố ý làm suy yếu khả năng tấn công-phòng thủ an ninh mạng của mô hình trong quá trình huấn luyện và đưa vào các cơ chế an toàn để tự động phát hiện và chặn các yêu cầu bị cấm hoặc có rủi ro cao.

Hiệu suất và điểm chuẩn

Trong thử nghiệm điểm chuẩn, Opus 4.7 đạt các mức điểm nhìn chung cao hơn so với Opus 4.6 trước đó và mô hình cạnh tranh GPT-5.4. Tuy nhiên, Anthropic nhấn mạnh rằng năng lực tổng thể của Opus 4.7 không tương xứng với mô hình mạnh nhất của công ty, Claude Mythos Preview. Theo Anthropic: “Bằng cách triển khai và vận hành các cơ chế bảo vệ này trong thế giới thực, chúng tôi sẽ tích lũy kinh nghiệm để cuối cùng cho phép phát hành rộng rãi các mô hình cấp Mythos.”

Triển khai và giá cả

Opus 4.7 hiện đã hoạt động trên tất cả các sản phẩm Claude và các giao diện API, được tích hợp với các dịch vụ Amazon Bedrock, Google Cloud Vertex AI và Microsoft Foundry. Giá vẫn giữ nguyên so với Opus 4.6: $5 cho mỗi một triệu token đầu vào và $25 cho mỗi một triệu token đầu ra.

Thay đổi tiêu thụ token

Hai thay đổi trong Opus 4.7 so với Opus 4.6 sẽ ảnh hưởng đến việc sử dụng token. Thứ nhất, Opus 4.7 sử dụng bộ mã hóa (tokenizer) được cập nhật, cải thiện cách mô hình xử lý văn bản. Tuy nhiên, điều này có nghĩa là các đầu vào giống hệt nhau có thể tiêu thụ nhiều token hơn—khoảng 1 đến 1,35 lần mức tiêu thụ của thế hệ trước.

Thứ hai, Opus 4.7 thực hiện nhiều suy luận hơn ở mức “mức độ suy nghĩ” cao hơn, đặc biệt trong các vòng tiếp theo của các kịch bản dạng tác nhân. Điều này giúp tăng độ tin cậy cho các bài toán phức tạp nhưng tạo ra thêm các token đầu ra.

Token consumption increase visualization Gia tăng tiêu thụ token của Opus 4.7. Nguồn: Anthropic

Phân tích thị trường và bối cảnh

Các nhà phân tích mô tả Opus 4.7 là một mô hình “mang tính chuyển tiếp”. Nhà phân tích đầu tư Adam Button cho biết việc phát hành Opus 4.7 củng cố câu chuyện của Anthropic xung quanh các mô hình “siêu phàm” như Mythos và xác nhận sự hoài nghi của thị trường: các mô hình trả phí hiện có công khai về cơ bản là các phiên bản “lite” bị ràng buộc bởi các cơ chế an toàn.

Nền tảng công ty và mốc tài chính

Anthropic, được thành lập năm 2021 bởi các cựu nhân viên OpenAI, phát triển dòng mô hình ngôn ngữ lớn Claude. Vào ngày 6 tháng 4, Anthropic công bố doanh thu hàng năm hóa của họ (ARR) vượt $300 billion, mức tăng đáng kể so với $9 billion vào cuối năm 2025. Công ty đang tích cực theo đuổi một đợt phát hành cổ phiếu lần đầu ra công chúng.

Lo ngại rủi ro an ninh mạng

Các lãnh đạo của Anthropic đã nhiều lần cảnh báo về tác động của AI đối với an ninh mạng. Theo các báo cáo đề ngày 10 tháng 4 (theo giờ địa phương), Bộ trưởng Tài chính Mỹ Yellen và Chủ tịch Cục Dự trữ Liên bang Powell đã tổ chức một cuộc họp khẩn với các lãnh đạo Phố Wall vào ngày 7 tháng 4 để thảo luận về việc mô hình AI Mythos mới nhất của Anthropic có thể làm gia tăng rủi ro an ninh mạng như thế nào. Anthropic đã tuyên bố Mythos không phù hợp để phát hành công khai vì mô hình có thể bị lạm dụng bởi tội phạm mạng và gián điệp. Công ty đang cung cấp quyền truy cập có chọn lọc vào Mythos cho các doanh nghiệp hàng đầu toàn cầu về an ninh mạng và phần mềm.

Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ bên thứ ba và không đại diện cho quan điểm hoặc ý kiến của Gate. Nội dung hiển thị trên trang này chỉ mang tính chất tham khảo và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Gate không đảm bảo tính chính xác hoặc đầy đủ của thông tin và sẽ không chịu trách nhiệm cho bất kỳ tổn thất nào phát sinh từ việc sử dụng thông tin này. Đầu tư vào tài sản ảo tiềm ẩn rủi ro cao và chịu biến động giá đáng kể. Bạn có thể mất toàn bộ vốn đầu tư. Vui lòng hiểu rõ các rủi ro liên quan và đưa ra quyết định thận trọng dựa trên tình hình tài chính và khả năng chấp nhận rủi ro của riêng bạn. Để biết thêm chi tiết, vui lòng tham khảo Tuyên bố miễn trừ trách nhiệm.

Bài viết liên quan

Cursor thuê cựu lãnh đạo của Palo Alto Networks là Simon Green để dẫn dắt mở rộng tại châu Á

Theo Cursor AI, công ty phát triển phần mềm AI đã thiết lập trụ sở khu vực tại Singapore và bổ nhiệm Simon Green, cựu lãnh đạo cấp cao của Palo Alto Networks, làm chủ tịch khu vực. Green đã dành hơn 10 năm tại Palo Alto Networks, nơi ông góp phần giúp công ty mở rộng hoạt động tại Nhật Bản và châu Á P

GateNews10phút trước

Người sáng lập Pi Network tham dự Consensus 2026 và có bài phát biểu về xác thực danh tính trong kỷ nguyên AI

Theo thông báo từ tài khoản X chính thức của Pi Network, đồng sáng lập Pi Network Phạm Thành Điêu (Chengdiao Fan) đã có bài phát biểu tại hội nghị Consensus 2026 ở Miami, Mỹ vào ngày 6 tháng 5 về chủ đề “Sự kết hợp thực tiễn giữa Web3, AI và blockchain”. Trong khi đó, Kocarlis tham gia thảo luận vào ngày 7 tháng 5 với chủ đề “Làm thế nào để chứng minh bạn là người thật trong thế giới AI”.

MarketWhisper26phút trước

Apple đồng ý thanh toán 250 triệu USD, thỏa thuận vụ kiện tập thể liên quan đến Apple Intelligence

Theo báo cáo của BBC vào ngày 6 tháng 5, Apple đã nộp một thỏa thuận dàn xếp đề xuất lên tòa án liên bang ở California vào ngày 5 tháng 5, đồng ý thanh toán 250 triệu USD (khoảng 184 triệu bảng Anh) để giải quyết vụ kiện tập thể bị cáo buộc rằng hãng đã quảng cáo sai sự thật liên quan đến Apple Intelligence và các tính năng AI của Siri. Apple phủ nhận mọi hành vi sai phạm trong thỏa thuận, và thỏa thuận vẫn cần được thẩm phán phê duyệt.

MarketWhisper41phút trước

Bản xem trước Tencent Hunyuan Hy3 ghi nhận tăng trưởng token gấp 10 lần trong hai tuần

Kể từ khi ra mắt cách đây hai tuần, bản xem trước Hy3 của Hy3 thuộc Tencent Hunyuan đã ghi nhận mức tăng gấp 10 lần số lần gọi token so với mô hình Hy2 trước đó. Việc sử dụng token trong các tình huống về mã và tác nhân đã tăng đặc biệt mạnh, với các ứng dụng bao gồm WorkBuddy, Codebuddy và Qclaw báo cáo mức tăng trưởng

GateNews50phút trước

Musk Cân Nhắc Sáp Nhập OpenAI Vào Tesla Vào Cuối Năm 2017, Tòa Nghe

Theo lời khai tại một phiên tòa liên bang ở Oakland, California, Elon Musk đã cân nhắc việc sáp nhập OpenAI vào Tesla vào cuối năm 2017 và đầu năm 2018, theo Shivon Zilis, giám đốc điều hành Neuralink và là cựu thành viên ban điều hành của OpenAI. Zilis khai rằng Musk đã tìm hiểu việc mời Sam Altman một ghế trong hội đồng quản trị của Tesla

GateNews1giờ trước
Bình luận
0/400
GateUser-72e48736vip
· 04-20 02:41
Nếu tính chính xác cũng được tăng cường, thì việc xem xét mã/viết kiểm thử đơn/hoàn thiện tài liệu sẽ an toàn hơn, các kỹ sư phần mềm sẽ vui mừng khôn xiết.
Xem bản gốcTrả lời0
StargazingWithAMirroredSpherevip
· 04-17 09:22
Từ 4.6 đến 4.7 được gọi là "đáng kể", không rõ mức độ cải thiện lớn như thế nào trong việc gỡ lỗi chuỗi dài, tái cấu trúc và phạm vi kiểm thử?
Xem bản gốcTrả lời0
OrangePeelRadiovip
· 04-17 07:47
Xin một tiêu chuẩn: Liệu có thể tìm hết tất cả các lỗi ẩn trong PR phức tạp một lần không? Đừng chỉ viết các đoạn demo nhỏ.
Xem bản gốcTrả lời0
BlackVelvetBluePeonyvip
· 04-17 07:38
Anthropic này có vẻ đang tiến nhanh, Claude bây giờ ngày càng giống như một "kỹ sư cao cấp" chứ không chỉ là một chatbot.
Xem bản gốcTrả lời0
ReminderOfWavesCrashingAgainstvip
· 04-17 07:35
Nâng cao năng lực kỹ thuật phần mềm rất quan trọng, nhiệm vụ cấp độ kho mã nguồn mới là chiến trường thực sự.
Xem bản gốcTrả lời0
StargazingUnderTheGlassDomevip
· 04-17 07:32
4.7 Cuối cùng đã đến, mong đợi thử nghiệm thực tế.
Xem bản gốcTrả lời0
GateUser-5d719abavip
· 04-17 07:26
Hy vọng không lại là việc tăng điểm dựa trên bảng xếp hạng, trong các dự án thực tế, khi gặp xung đột phụ thuộc hoặc vấn đề môi trường thì sẽ gặp sự cố.
Xem bản gốcTrả lời0
TheWaveOfRasterizationvip
· 04-17 07:20
Tôi quan tâm hơn đến độ tin cậy của việc gọi công cụ và thay đổi nhiều tệp: liệu có thể duy trì tính nhất quán, không gây ra lỗi ở chỗ này rồi gây lỗi ở chỗ khác.
Xem bản gốcTrả lời0
StrollingOnTheEdgeOfTheDaovip
· 04-17 07:19
Chờ cộng đồng so sánh hiệu suất SWE của GPT/DeepSeek, đặc biệt là điều hướng kho lớn, định vị vấn đề, tốc độ giao hàng từ đầu đến cuối.
Xem bản gốcTrả lời0
BluePeonyObservervip
· 04-17 07:19
4.7 của “tăng cường tính nghiêm ngặt” nghe có vẻ cẩn trọng hơn, có thể sẽ ít bịa đặt API hơn? Điều này quá quan trọng.
Xem bản gốcTrả lời0
Xem thêm