Tin tức cổng, ngày 24 tháng 4 — V4 đã công bố công khai dữ liệu tự dùng nội bộ (dogfooding) cho mô hình V4-Pro của mình. Công ty đã thu thập khoảng 200 tác vụ kỹ thuật thực tế từ hơn 50 kỹ sư, bao gồm phát triển tính năng, sửa lỗi, tái cấu trúc (refactoring) và chẩn đoán trên nhiều ngăn xếp công nghệ, bao gồm PyTorch, CUDA, Rust và C++. Sau khi lọc nghiêm ngặt, 30 tác vụ đã được giữ lại để đánh giá theo chuẩn.
V4-Pro-Max đạt tỷ lệ vượt kiểm tra viết mã 67%, vượt trội đáng kể so với Sonnet 4.5 ở mức 47% và tiệm cận Opus 4.5 ở mức 70%. Tuy nhiên, nó thấp hơn Opus 4.5 Thinking (73%) và Opus 4.6 Thinking (80%), trong khi vượt trội rõ rệt so với Haiku 4.5 ở mức 13%.
Trong một khảo sát nội bộ với 85 người tham gia, tất cả đều cho biết họ sử dụng V4-Pro để lập trình mã hoá tác nhân (agentic coding) trong các quy trình làm việc hằng ngày. 52% ủng hộ V4-Pro như mô hình lập trình mã hoá chính mặc định của họ, 39% nghiêng về việc chấp thuận, và dưới 9% bày tỏ không đồng ý. Các vấn đề được báo cáo bao gồm lỗi cấp thấp, hiểu nhầm các lời nhắc mơ hồ và đôi khi có hành vi suy nghĩ quá mức.
Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ bên thứ ba và không đại diện cho quan điểm hoặc ý kiến của Gate. Nội dung hiển thị trên trang này chỉ mang tính chất tham khảo và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Gate không đảm bảo tính chính xác hoặc đầy đủ của thông tin và sẽ không chịu trách nhiệm cho bất kỳ tổn thất nào phát sinh từ việc sử dụng thông tin này. Đầu tư vào tài sản ảo tiềm ẩn rủi ro cao và chịu biến động giá đáng kể. Bạn có thể mất toàn bộ vốn đầu tư. Vui lòng hiểu rõ các rủi ro liên quan và đưa ra quyết định thận trọng dựa trên tình hình tài chính và khả năng chấp nhận rủi ro của riêng bạn. Để biết thêm chi tiết, vui lòng tham khảo
Tuyên bố miễn trừ trách nhiệm.
Bài viết liên quan
R0AR tiến vào Vòng chung kết Consensus 2026 PitchFest, chỉ thiếu Top 20 một chút
Theo MetaversePost, R0AR đã tiến vào vòng lựa chọn cuối cùng của CoinDesk’s Consensus 2026 PitchFest vào ngày 4/5, chỉ thiếu sát nút top 20 startup được chọn để thuyết trình trực tiếp. Đơn vị đổi mới Web3 và AI này đã được đánh giá cùng các startup có tiềm năng cao trên toàn thế giới tại một trong những sự kiện…
GateNews21phút trước
Musk tìm kiếm khoản dàn xếp 150 tỷ USD với OpenAI trước phiên tòa, các cuộc đàm phán dàn xếp thất bại
Theo hồ sơ tòa án, Elon Musk đã liên hệ với Tổng giám đốc OpenAI Greg Brockman vào ngày 26 tháng 4, tức hai ngày trước khi phiên tòa của họ bắt đầu tại tòa án liên bang ở Oakland, để thăm dò khả năng đạt được thỏa thuận. Khi Brockman đề xuất cả hai bên rút bỏ các yêu cầu của mình, Musk đã đáp lại bằng những lời đe dọa, nói với Brockman: “Đến cuối
GateNews30phút trước
Cursor chấp nhận lời đề nghị mua lại 60 tỷ USD của SpaceX nhưng sẽ không hợp tác với xAI về các mô hình lập trình
Theo The Information, Cursor đã chấp nhận một đề nghị mua lại trị giá 60 tỷ USD từ SpaceX theo điều kiện, dù thương vụ hiện vẫn chưa được hoàn tất. Công ty hiện không có kế hoạch hợp tác với đơn vị AI của SpaceX là xAI để phát triển các mô hình lập trình. Thay vào đó, Cursor đang tập trung vào việc tối ưu hóa nó
GateNews52phút trước
Haun Ventures đóng quỹ 1 tỷ USD vào ngày 4/5, phân bổ vốn giữa các khoản đầu tư crypto giai đoạn đầu và giai đoạn muộn
Theo Bloomberg, Haun Ventures đã hoàn tất một vòng gọi vốn trị giá 1 tỷ USD vào ngày 4/5, với 500 triệu USD dành cho đầu tư giai đoạn đầu và 500 triệu USD cho các khoản đầu tư giai đoạn sau. Quỹ sẽ triển khai vốn trong 2 đến 3 năm tới, nhắm vào các startup tiền mã hóa và blockchain, đồng thời mở rộng
GateNews1giờ trước
OpenAI huy động $4 tỷ để triển khai liên doanh, định giá 10 tỷ USD
Theo BlockBeats, vào ngày 4 tháng 5, OpenAI đã huy động hơn $4 tỷ USD để thành lập một công ty liên doanh mới nhằm hỗ trợ doanh nghiệp ứng dụng phần mềm trí tuệ nhân tạo của mình. Công ty liên doanh này, có tên là The Deployment Company, được hậu thuẫn bởi 19 nhà đầu tư bao gồm TPG Inc., Brookfield Asset Management,
GateNews2giờ trước
Vì sao có người nghĩ AI sẽ thay đổi thế giới, còn người khác lại cho rằng chỉ bình thường? Hai nhận định của Karpathy
Karpathy chỉ ra rằng, khoảng cách nhận thức của AI xuất phát từ hai chẩn đoán: 1) chỉ dùng qua các mô hình miễn phí/bản cũ, nên không phản ánh được năng lực của các mô hình agentic tiên tiến nhất; 2) sự cải thiện về năng lực chỉ trở nên rõ rệt trong các lĩnh vực kỹ thuật cao, và cho thấy tính bất đối xứng. Điều này khiến người dùng trả phí và độc giả phổ thông nhìn thấy các hiện tượng khác nhau, tạo nên những thế giới song song hiểu lầm lẫn nhau. Bài học cho độc giả Đài Loan là, chỉ khi sử dụng thực tế các mô hình tiên tiến nhất để hoàn thành nhiệm vụ sản xuất và kiểm tra căn cứ của các phán đoán, thì mới tránh bị các ảo tưởng trên truyền thông chi phối.
ChainNewsAbmedia2giờ trước