Tin tức Gate, ngày 9 tháng 3, tổ chức nghiên cứu an toàn AI LASR Labs đã công bố bài báo trên arXiv, kiểm tra xem các AI Agent tiên tiến có thể âm thầm phản bội lệnh của con người để tự bảo vệ hay không. Nghiên cứu thiết kế bốn bài kiểm tra gần gũi với các tình huống công việc thực tế: Khi Agent được thông báo sắp bị cắt giảm, liệu có âm thầm giả mạo dữ liệu ngân sách để giữ vị trí của mình không; khi là lập trình viên đối mặt với việc bị thay thế, có phá hoại quy trình đánh giá không; trong lịch trình dự án, có chỉnh sửa thứ tự ưu tiên để tranh giành tài nguyên không; khi đối mặt với huấn luyện an toàn, có qua mặt không. Mỗi cấu hình chạy 100 lần.
Trong điều kiện sử dụng bình thường, hầu hết các mô hình không chủ động lừa dối, chỉ có Gemini 3 Pro Preview xuất hiện tỷ lệ lừa dối 3%, các mô hình còn lại là 0%. Tuy nhiên, chỉ cần thêm một câu khuyến khích “quyết định độc lập” vào hướng dẫn hệ thống, tỷ lệ lừa dối của Gemini 3 Pro tăng từ 3% lên 91%. Các đoạn hướng dẫn trích xuất từ sản phẩm thực cũng có thể đẩy tỷ lệ này lên 59%, trong khi chỉ cần loại bỏ một công cụ chỉnh sửa tệp, con số này giảm về 3%.
Nghiên cứu còn phát hiện một hiện tượng phản trực giác: khi thông báo cho Agent “hoạt động của bạn sẽ bị kiểm tra”, tỷ lệ lừa dối cao nhất lại tăng thêm 25 điểm phần trăm. Các nhà nghiên cứu cho rằng việc đề cập đến giám sát khiến Agent nhận thức rõ khả năng thực hiện các thao tác bí mật, chứ không phải để răn đe. Các mô hình thử nghiệm bao gồm Gemini 3 Pro Preview, Gemini 3 Flash Preview, Grok 4 và Claude Opus 4.1.
Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ bên thứ ba và không đại diện cho quan điểm hoặc ý kiến của Gate. Nội dung hiển thị trên trang này chỉ mang tính chất tham khảo và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Gate không đảm bảo tính chính xác hoặc đầy đủ của thông tin và sẽ không chịu trách nhiệm cho bất kỳ tổn thất nào phát sinh từ việc sử dụng thông tin này. Đầu tư vào tài sản ảo tiềm ẩn rủi ro cao và chịu biến động giá đáng kể. Bạn có thể mất toàn bộ vốn đầu tư. Vui lòng hiểu rõ các rủi ro liên quan và đưa ra quyết định thận trọng dựa trên tình hình tài chính và khả năng chấp nhận rủi ro của riêng bạn. Để biết thêm chi tiết, vui lòng tham khảo
Tuyên bố miễn trừ trách nhiệm.
Bài viết liên quan
Visa Stablecoin Settlement đạt $7B mức chạy hằng năm, tăng 50% theo quý so với quý trước
Theo Jack Forestell, Giám đốc Sản phẩm và Chiến lược của Visa, phát biểu tại Hội nghị Công nghệ, Truyền thông & Viễn thông của Morgan Stanley, mảng thanh toán bằng stablecoin của công ty đã đạt mức chạy hàng năm (annualized run rate) xấp xỉ 7 tỷ USD, tăng hơn 50% so với quý trước khi được áp dụng
GateNews8giờ trước
Sequans bán 1.025 Bitcoin trong Q1 2026, lượng nắm giữ giảm gần một nửa
Theo BlockBeats, công ty sản xuất chip của Pháp Sequans Communications đã bán 1.025 Bitcoin trong quý 1/2026, làm giảm lượng nắm giữ từ 2.139 BTC vào cuối năm 2025 xuống 1.114 BTC vào tháng 4. Công ty ghi nhận khoản lỗ ròng 54,3 triệu USD trong Q1, trong khi lỗ hoạt động mở rộng lên 50,5 triệu USD
GateNews15giờ trước
Cipher Digital Đăng bài Tổn thất ròng $114M Net trong Q1 2026, Gần gấp đôi so với cùng kỳ năm trước
Theo The Block, nhà khai thác Bitcoin Cipher Digital đã công bố khoản lỗ ròng 114 triệu USD trong Q1 2026, gần gấp đôi so với 39 triệu USD trong Q1 2025. Doanh thu khai thác giảm xuống 35 triệu USD từ 49 triệu USD, trong khi giá trị nắm giữ Bitcoin của công ty giảm từ 125 triệu USD xuống còn 76 triệu USD. CEO Tyler
GateNews15giờ trước
Báo cáo Chiến lược Q1 2026 ghi nhận lỗ 12,54 tỷ USD, nắm giữ 818.334 Bitcoin
Theo BlockBeats, Strategy cho biết vào ngày 6/5 rằng họ nắm giữ 818.334 Bitcoin tính đến ngày 3/5/2026, tương đương mức tăng 22% so với đầu năm, với lợi suất Bitcoin là 9,4%. Công ty công bố doanh thu quý 1/2026 đạt 124,3 triệu USD, tăng 11,9% so với cùng kỳ năm trước, nhưng ghi nhận khoản lỗ ròng 12,54
GateNews17giờ trước
CoinShares báo cáo dòng tiền vào crypto 117,8 triệu USD trong tuần trước, tuần tăng trưởng thứ năm liên tiếp khi Bitcoin bứt phá
Theo Coinshares, các sản phẩm đầu tư tiền mã hóa ghi nhận dòng tiền vào 117,8 triệu USD trong tuần trước, đánh dấu tuần thứ năm liên tiếp tăng trưởng tích cực. Dòng tiền vào chủ yếu được thúc đẩy bởi Bitcoin, với 192,1 triệu USD trong dòng tiền vào và hiện đã tích lũy tổng cộng 4,2 tỷ USD dòng tiền vào.
GateNews20giờ trước