Thông điệp Gate News, ngày 17 tháng 4 — Anthropic đã công bố Claude Opus 4.7, một mô hình AI có các cơ chế bảo vệ được thiết kế để chặn các yêu cầu an ninh mạng rủi ro cao. Bản phát hành này được xây dựng dựa trên Claude Opus 4.6, được giới thiệu vào tháng 2, và đi trước một đợt triển khai rộng hơn đối với các mô hình thuộc lớp Mythos tiên tiến hơn của Anthropic. Mythos Preview, được giới thiệu sớm hơn trong tháng này, vẫn có năng lực cao hơn Opus 4.7 nhưng hiện chỉ sẵn có cho một nhóm công ty giới hạn thông qua Project Glasswing, chương trình an ninh mạng của Anthropic.
Opus 4.7 mang lại những cải tiến đáng kể cho các quy trình làm việc mang tính tác nhân (agentic) và năng lực thị giác. Hiệu suất lập trình tự động tăng lên 64.3% trên SWE-bench Pro, một bộ benchmark được sử dụng rộng rãi cho các tác vụ kỹ thuật phần mềm, từ mức 53.4% ở phiên bản trước. Xử lý hình ảnh hiện hỗ trợ độ phân giải cao hơn hơn ba lần, với độ chính xác về thị lực (visual-acuity) cải thiện từ 54.5% lên 98.5% trên các bài kiểm tra tiêu chuẩn. Các giới hạn an ninh mạng có chủ ý đã được triển khai trong quá trình huấn luyện; trên CyberGym, một benchmark hiệu suất an ninh mạng, Opus 4.7 đạt 73.1%, thấp hơn mức 83.1% của Mythos Preview.
Anthropic đã hạn chế Mythos Preview sau thử nghiệm tiền phát hành phát hiện hàng nghìn lỗ hổng có mức độ nghiêm trọng cao, bao gồm một lỗ hổng trong OpenBSD không được phát hiện trong 27 năm. Các nhà nghiên cứu an ninh tiến hành nghiên cứu lỗ hổng, kiểm thử xâm nhập (penetration testing) hoặc các bài tập red-team có thể đăng ký Chương trình Xác minh An ninh mạng (Cyber Verification Program) của Anthropic để truy cập phòng thủ mà không bị từ chối mặc định. Phản hồi từ các cơ chế bảo vệ của Opus 4.7 sẽ định hướng cho các bản phát hành mô hình trong tương lai.
Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ bên thứ ba và không đại diện cho quan điểm hoặc ý kiến của Gate. Nội dung hiển thị trên trang này chỉ mang tính chất tham khảo và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Gate không đảm bảo tính chính xác hoặc đầy đủ của thông tin và sẽ không chịu trách nhiệm cho bất kỳ tổn thất nào phát sinh từ việc sử dụng thông tin này. Đầu tư vào tài sản ảo tiềm ẩn rủi ro cao và chịu biến động giá đáng kể. Bạn có thể mất toàn bộ vốn đầu tư. Vui lòng hiểu rõ các rủi ro liên quan và đưa ra quyết định thận trọng dựa trên tình hình tài chính và khả năng chấp nhận rủi ro của riêng bạn. Để biết thêm chi tiết, vui lòng tham khảo
Tuyên bố miễn trừ trách nhiệm.
Bài viết liên quan
Freshworks Cắt Giảm 500 Việc Làm Trong Tái Cơ Cấu Dựa Trên AI
Freshworks, công ty phần mềm quản trị doanh nghiệp có trụ sở tại San Mateo, California, đã công bố vào ngày 5/5 rằng họ sẽ cắt giảm 11% nhân sự, tương đương khoảng 500 vị trí trên toàn cầu, khi tái cơ cấu để thích ứng với việc sử dụng AI và tự động hóa rộng rãi hơn. Giám đốc điều hành Dennis Woodside cho biết AI hiện nay viết hơn một nửa nội dung của công ty
CryptoFrontier18phút trước
OpenAI triển khai GPT-5.5 Instant cho tất cả người dùng ChatGPT bắt đầu từ hôm nay
Theo thông báo của OpenAI ngày 6 tháng 5, GPT-5.5 Instant hiện đã có sẵn cho tất cả người dùng ChatGPT. Với người dùng trả phí, GPT-5.3 Instant sẽ vẫn được truy cập thông qua cài đặt mô hình trong ba tháng tới trước khi bị loại bỏ. Tính năng bộ nhớ đang được triển khai cho tất cả người dùng thuộc gói tiêu dùng của ChatGPT trong thời gian…
GateNews25phút trước
Google Thử nghiệm tác nhân AI 'Remy' cho Gemini, đối đầu Mở OpenClaw
Theo Business Insider, Google đang thử nghiệm một tác nhân AI mới có tên Remy cho Gemini vào ngày 6 tháng 5. Tác nhân này hiện chỉ có sẵn cho nhân viên trong ứng dụng Gemini nội bộ của Google, có thể thực hiện các hành động thay mặt người dùng trên nhiều mảng như công việc, học tập và các nhiệm vụ hằng ngày, đồng thời tích hợp với các sản phẩm khác của Google
GateNews27phút trước
Meta Lên Kế Hoạch Trợ Lý AI Được Cung Cấp Bởi Mô Hình Muse Spark để Cạnh Tranh OpenClaw, Nhắm Tới 3 Tỷ Người Dùng vào Ngày 6 Tháng 5
Theo Financial Times, Meta đang xây dựng một trợ lý AI được cá nhân hóa cao, ra mắt vào ngày 6/5, nhằm cạnh tranh với OpenClaw, được cung cấp bởi mô hình Muse Spark mới của công ty. Công cụ này sẽ phục vụ hơn 3 tỷ người dùng của công ty và hiện đang trong giai đoạn thử nghiệm nội bộ. Trợ lý hướng đến việc cho phép người dùng tạo AI
GateNews27phút trước
Alphabet tiến sát vốn hóa thị trường của Nvidia ở mức 4,67 nghìn tỷ USD, tăng 24% trong năm nay
Theo Reuters, tính đến ngày 6/5, Alphabet được định giá khoảng 4,67 nghìn tỷ USD, tiến sát mức 4,79 nghìn tỷ USD của Nvidia, khi các nhà đầu tư ủng hộ chiến lược AI và tốc độ tăng trưởng cloud nhanh hơn. Cổ phiếu Alphabet đã tăng 24% trong năm nay, so với mức tăng 7% của Nvidia. Doanh thu Google Cloud đã tăng 63% trong
GateNews39phút trước
Cloudflare: Tác nhân AI thúc đẩy lưu lượng truy cập không phải của con người, x402 cung cấp giải pháp
Giám đốc Chiến lược của Cloudflare cho biết hơn một nửa lưu lượng truy cập internet hiện nay là không phải của con người, cho thấy một sự thay đổi lớn trong các mô hình sử dụng web do tác động của các tác nhân AI và hệ thống tự động. Vị điều hành cũng cho rằng x402 Foundation đang xây dựng hạ tầng để giải quyết những thách thức
CryptoFrontier2giờ trước