Cursor tiết lộ phương pháp huấn luyện "tự lực" : Sử dụng Composer cũ để thiết lập môi trường cho mô hình mới, Terminal-Bench tăng 14 điểm

BlockBeatNews

Theo giám sát Beating, Cursor đã tiết lộ một kỹ thuật huấn luyện của dòng mô hình Composer: sử dụng mô hình thế hệ trước để tự động xây dựng môi trường chạy cho việc huấn luyện tăng cường (RL) của thế hệ tiếp theo. Khi huấn luyện Composer 2, Cursor dùng Composer 1.5 để thực hiện công việc này, gọi là autoinstall.

Huấn luyện RL cần môi trường mã nguồn có thể chạy được. Nếu môi trường không thiết lập tốt, mô hình sẽ lãng phí token vào việc sửa lỗi, không học được gì; trong trường hợp cực đoan, môi trường hoàn toàn không thể chạy, toàn bộ sức mạnh tính toán của vòng huấn luyện sẽ bị lãng phí. autoinstall giải quyết vấn đề này bằng hai bước: bước một, một agent đọc tài liệu và cấu hình của kho mã, đề xuất 10 lệnh xác minh cùng với kết quả mong đợi; bước hai, một agent khác lấy 3 trong số các lệnh đó, bắt đầu từ đầu để cấu hình môi trường cho đến khi lệnh chạy thành công. Bước hai tối đa thử 5 lần, nếu tất cả đều thất bại thì bỏ qua môi trường đó.

Trong quá trình cấu hình môi trường, agent sẽ chủ động bổ sung các phụ thuộc thiếu: giả lập bảng cơ sở dữ liệu, tạo cấu hình MinIO thay thế S3, khởi động container Docker để làm dịch vụ sidecar, thậm chí tạo hình ảnh tạm thời. Bài viết lấy dự án blockchain celo-org/celo-monorepo làm ví dụ minh họa toàn bộ quy trình, sau khi thất bại trong vòng cấu hình đầu tiên, agent tự tạo người dùng mock để vượt qua xác thực, cuối cùng đã chạy thành công bài kiểm tra.

Composer 2 đạt điểm 61.7% trên Terminal-Bench (chỉ số đo khả năng xây dựng môi trường phát triển mô hình), cao hơn gần 14 điểm phần trăm so với Composer 1.5 là 47.9%. Cursor cho biết trong tương lai, họ dự định để phiên bản Composer cũ tham gia nhiều hơn vào các giai đoạn huấn luyện, bao gồm xử lý dữ liệu trước, quản lý chạy và tối ưu kiến trúc.

Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ bên thứ ba và không đại diện cho quan điểm hoặc ý kiến của Gate. Nội dung hiển thị trên trang này chỉ mang tính chất tham khảo và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Gate không đảm bảo tính chính xác hoặc đầy đủ của thông tin và sẽ không chịu trách nhiệm cho bất kỳ tổn thất nào phát sinh từ việc sử dụng thông tin này. Đầu tư vào tài sản ảo tiềm ẩn rủi ro cao và chịu biến động giá đáng kể. Bạn có thể mất toàn bộ vốn đầu tư. Vui lòng hiểu rõ các rủi ro liên quan và đưa ra quyết định thận trọng dựa trên tình hình tài chính và khả năng chấp nhận rủi ro của riêng bạn. Để biết thêm chi tiết, vui lòng tham khảo Tuyên bố miễn trừ trách nhiệm.

Bài viết liên quan

Public mua lại ứng dụng kho bạc của nền tảng đầu tư AI để mở rộng giao dịch crypto

Theo ChainCatcher, Public đã công bố việc mua lại nền tảng dịch vụ đầu tư AI Treasury App để tăng cường mảng môi giới giao dịch dựa trên AI của mình. Chưa công bố số tiền mua lại. Hiện tại Public hỗ trợ giao dịch cổ phiếu, trái phiếu và tiền mã hóa, bao gồm Bitcoin, Ethereum, a

GateNews37phút trước

Blitzy hoàn tất vòng $200M huy động vốn do Northzone dẫn dắt

Theo ChainCatcher, Blitzy, một công ty AI về lập trình được đồng sáng lập bởi cựu kiến trúc sư của Nvidia Sid Pardeshi, đã hoàn tất một vòng gọi vốn trị giá 200 triệu USD do Northzone dẫn dắt. Battery Ventures, Jump Capital và Morgan Creek Digital đã tham gia vào vòng này. Nền tảng có thể phân tích các hệ thống phức tạp với

GateNews1giờ trước

EU cấm nội dung khiêu dâm deepfake do AI tạo ra vào ngày 7 tháng 5

Theo Hãng Thông tấn Xinhua, vào ngày 7/5, các nghị sĩ Nghị viện châu Âu và các quốc gia thành viên đã đạt được đồng thuận để cấm các hệ thống trí tuệ nhân tạo tạo ra nội dung khiêu dâm deepfake. Lệnh cấm này sẽ được đưa vào các sửa đổi của Đạo luật Trí tuệ nhân tạo năm 2024. Nghị viện châu Âu

GateNews1giờ trước

Tether ra mắt mô hình AI y tế MedPsy QVAC, đạt điểm 62,62 trên phiên bản 17 tỷ tham số

Theo Odaily, Tether AI Research Group đã ra mắt QVAC MedPsy, một mô hình AI y tế được thiết kế để chạy cục bộ trên điện thoại thông minh và các thiết bị đeo mà không phụ thuộc vào đám mây. Phiên bản với 1,7 tỷ tham số đạt 62,62 trên bảy bộ tiêu chí y tế, vượt MedGemma-1.5-4B của Google thêm 11,42 điểm poi

GateNews2giờ trước

B.AI ra mắt 4 mô hình mới, bao gồm GPT-5.5 Instant, trong vòng 48 giờ sau khi OpenAI phát hành

API B.AI đã ra mắt 4 mẫu mới: GPT-5.5 Instant, DeepSeek-v3.2, MiniMax-M2.7 và GLM-5.1. GPT-5.5 Instant đã hoàn tất việc thích ứng nền tảng và tích hợp giao diện trong vòng 48 giờ sau khi OpenAI ra mắt, cho phép truy cập không độ trễ đến

GateNews2giờ trước

Mô hình AI Y tế trị giá 1,7 tỷ USD của Tether vượt trội đối thủ lớn hơn 16 lần vào hôm nay

Theo nhóm nghiên cứu AI của Tether, hôm nay công ty đã ra mắt dòng mô hình ngôn ngữ y tế QVAC MedPsy, được thiết kế để triển khai cục bộ trên điện thoại thông minh và thiết bị đeo mà không cần phụ thuộc đám mây. Phiên bản 1,7B tham số đạt 62,62 trên bảy bộ đánh giá y tế, vượt qua Google MedGemma-4B

GateNews2giờ trước
Bình luận
0/400
Không có bình luận