Tin tức từ Gate, ngày 24 tháng 4 — DeepSeek V4 đã công bố kết quả từ các bài đánh giá suy luận toán học chính thức, đạt điểm tuyệt đối 120/120 trên Putnam-2025, hòa với Axiom ở vị trí số 1.
Trong chế độ thực dụng sử dụng LeanExplore và lấy mẫu bị ràng buộc, V4-Flash-Max đạt 81.00 trên chuẩn điểm Putnam-200 Pass@8, vượt trội đáng kể so với Seed-2.0-Prover (35.50), Gemini 3 Pro (26.50) và Seed-1.5-Prover (26.50). Kết quả ở chế độ biên cho thấy V4 đứng trước Seed-1.5-Prover (110/120) và Aristotle (100/120).
V4 sử dụng một cách tiếp cận suy luận lai chính thức-vô chính thức: suy luận vô chính thức tạo ra các giải pháp ứng viên bằng ngôn ngữ tự nhiên, tự kiểm chứng lọc các kết quả, và tác nhân chính thức hoàn thiện các phép chứng chặt chẽ trong Lean. Kết quả ở chế độ biên sử dụng khả năng mở rộng tính toán quy mô lớn, trong khi điểm số ở chế độ thực dụng phản ánh tốt hơn năng lực triển khai tiêu chuẩn.
Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ bên thứ ba và không đại diện cho quan điểm hoặc ý kiến của Gate. Nội dung hiển thị trên trang này chỉ mang tính chất tham khảo và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Gate không đảm bảo tính chính xác hoặc đầy đủ của thông tin và sẽ không chịu trách nhiệm cho bất kỳ tổn thất nào phát sinh từ việc sử dụng thông tin này. Đầu tư vào tài sản ảo tiềm ẩn rủi ro cao và chịu biến động giá đáng kể. Bạn có thể mất toàn bộ vốn đầu tư. Vui lòng hiểu rõ các rủi ro liên quan và đưa ra quyết định thận trọng dựa trên tình hình tài chính và khả năng chấp nhận rủi ro của riêng bạn. Để biết thêm chi tiết, vui lòng tham khảo
Tuyên bố miễn trừ trách nhiệm.
Bài viết liên quan
Anthropic nhắm tới thị trường người tiêu dùng, cải thiện tốc độ chatbot Claude
Anthropic đang chuyển chiến lược chatbot Claude của mình từ nhóm khách hàng doanh nghiệp sang thị trường người tiêu dùng, theo Mike Krieger, đồng dẫn dắt nhóm phòng thí nghiệm của công ty. Startup AI này đang tận dụng những tiến triển gần đây trên thị trường người tiêu dùng để tăng sức hấp dẫn của phần mềm đối với người dùng phổ thông, với nội bộ
CryptoFrontier17phút trước
AI trong thiết kế kiến trúc startup Illoca huy động 13 triệu USD vốn, nhà sáng lập gốc Đài Loan đã trả lại sự sáng tạo cho kiến trúc sư như thế nào?
Được thành lập bởi hai nhà sáng lập gốc Đài Loan, startup thiết kế kiến trúc AI của Mỹ Illoca đã công bố vào ngày 6/5/2026 hoàn tất vòng gọi vốn hạt giống trị giá 13 triệu USD. Bessemer Venture Partners dẫn dắt, với sự tham gia của AIX Ventures, Root Ventures và Alt Ventures. Illoca định vị với “cỗ máy thiết kế nguyên bản AI” làm trọng tâm, nỗ lực chuyển quyền chủ động sáng tạo trở lại cho kiến trúc sư, giải quyết “lỗ hổng năng suất” đã gây khó khăn cho ngành trong suốt nhiều thập kỷ.
(Claude
ChainNewsAbmedia44phút trước
Google và Naver đẩy quảng cáo vào các công cụ tìm kiếm bằng AI; Doanh thu quý 1 của Naver tăng 16,3% lên 2,22 tỷ USD
Theo The Korea Times, Google và Naver đang chuyển quảng cáo vào các công cụ tìm kiếm AI khi AI tạo sinh đang làm thay đổi hành vi tìm kiếm và kéo theo chi phí tính toán tăng lên. Google đang phát đi tín hiệu sẵn sàng đón nhận quảng cáo trong Gemini, trong khi Naver dự kiến thử nghiệm quảng cáo theo dạng câu trả lời trong sản phẩm AI Briefing vào quý 2.
Naver
GateNews57phút trước
Samsung dừng bán thiết bị gia dụng tại Trung Quốc để chuyển hướng sang AI
Samsung Electronics hôm 6/5 cho biết hãng sẽ ngừng bán các thiết bị gia dụng tại Trung Quốc đại lục, theo South China Morning Post. Việc rút lui bao gồm TV, tủ lạnh, điều hòa, máy giặt, máy sấy, máy hút bụi và máy lọc không khí, khi công ty chuyển trọng tâm chiến lược sang
CryptoFrontier57phút trước
Reid Hoffman: AI Agents Sẽ Cần Các Hệ Thống Niềm Tin Crypto
Reid Hoffman, đối tác của Greylock và đồng sáng lập LinkedIn, cho biết các tác nhân tự động sẽ cần các hệ thống niềm tin dựa trên crypto để giao dịch qua mạng internet mở, gợi ý rằng sự phát triển này có thể mở đường cho NFT quay trở lại.
Phát biểu của Hoffman liên kết sự xuất hiện của các tác nhân tự động với
CryptoFrontier58phút trước
SoftBank tăng 16,5% khi đợt biểu tình chip AI kéo thị trường chứng khoán Nhật vào ngày 7/5
Theo CNBC, SoftBank Group tăng 16,5% vào ngày 7 tháng 5 sau khi thị trường Nhật Bản mở cửa trở lại sau kỳ nghỉ Golden Week. Đà tăng xuất hiện khi nhà đầu tư đuổi theo đợt tăng trên toàn cầu của cổ phiếu AI và chip, qua đó giúp Nikkei 225 đạt mức cao kỷ lục. Advantest tăng 7,8%, Tokyo Electron tăng 9,2% và Renesas
GateNews1giờ trước