Hugging Face phát hành mã nguồn mở ml-intern, một tác nhân AI cho nghiên cứu ML tự chủ

Tin từ Gate News, ngày 22 tháng 4 — Hugging Face đã phát hành mã nguồn mở ml-intern, một tác nhân nghiên cứu ML có thể tự động hoàn thành toàn bộ quy trình gồm đọc bài báo, tổ chức tập dữ liệu, khởi chạy huấn luyện GPU, đánh giá kết quả và lặp lại để cải tiến. Dự án được xây dựng trên framework smolagents của Hugging Face và cung cấp cả giao diện dòng lệnh (CLI) lẫn giao diện dựa trên web, với mã nguồn được công khai trên GitHub.

Bộ công cụ của ml-intern được thiết kế xoay quanh hệ sinh thái Hugging Face. Nó truy xuất các bài báo từ arXiv và HF Papers đồng thời lần theo chuỗi trích dẫn để đọc sâu hơn; duyệt tập dữ liệu trên HF Hub, xác thực chất lượng và định dạng lại dữ liệu để huấn luyện; và khi không có tài nguyên GPU cục bộ, nó gọi HF Jobs để khởi chạy các tác vụ huấn luyện trên đám mây. Sau khi quá trình huấn luyện hoàn tất, tác nhân tự động đọc các đầu ra đánh giá, chẩn đoán nguyên nhân thất bại và chạy lại các thí nghiệm. Theo mặc định, nó sử dụng Claude Sonnet 4.5 để điều khiển vòng lặp ra quyết định, với tối đa 300 lần lặp cho mỗi lần chạy và nén ngữ cảnh tự động khi vượt quá 170k token.

Hugging Face đã trình diễn ba trường hợp sử dụng. Trong một tác vụ suy luận khoa học, tác nhân xác định các tập dữ liệu OpenScience và NemoTron-CrossThink từ chuỗi trích dẫn, lọc bảy biến thể từ ARC, SciQ và MMLU theo mức độ khó, rồi chạy 12 vòng tinh chỉnh giám sát trên Qwen3-1.7B, giúp cải thiện điểm GPQA từ 10% lên 32% trong dưới 10 giờ. Với một ứng dụng y tế, tác nhân kết luận rằng các tập dữ liệu hiện có là chưa đủ, viết các script để tạo ra 1.100 mẫu dữ liệu tổng hợp, và mở rộng chúng gấp 50 lần để huấn luyện, vượt hiệu năng Codex thêm 60% trên HealthBench. Trong một bối cảnh toán học cạnh tranh, tác nhân đã viết script huấn luyện GRPO và khởi chạy huấn luyện trên các GPU A100 thông qua HF Spaces, sau đó tiến hành các nghiên cứu ablation sau khi quan sát hiện tượng sụp đổ phần thưởng.

Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ bên thứ ba và không đại diện cho quan điểm hoặc ý kiến của Gate. Nội dung hiển thị trên trang này chỉ mang tính chất tham khảo và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Gate không đảm bảo tính chính xác hoặc đầy đủ của thông tin và sẽ không chịu trách nhiệm cho bất kỳ tổn thất nào phát sinh từ việc sử dụng thông tin này. Đầu tư vào tài sản ảo tiềm ẩn rủi ro cao và chịu biến động giá đáng kể. Bạn có thể mất toàn bộ vốn đầu tư. Vui lòng hiểu rõ các rủi ro liên quan và đưa ra quyết định thận trọng dựa trên tình hình tài chính và khả năng chấp nhận rủi ro của riêng bạn. Để biết thêm chi tiết, vui lòng tham khảo Tuyên bố miễn trừ trách nhiệm.

Bài viết liên quan

Trung Quốc chặn thương vụ mua lại AI của Meta, với $2B Manus

Trung Quốc thông báo rằng họ đang chặn thương vụ mua lại trị giá 2 tỷ USD của Meta đối với công ty AI agent Manus, viện dẫn lo ngại việc chuyển giao sở hữu trí tuệ trí tuệ nhân tạo của Trung Quốc sang một công ty của Mỹ, theo tường thuật của Tech in Asia. Manus là một công ty được thành lập tại Trung Quốc đã chuyển trụ sở chính đến

CryptoFrontier46phút trước

Nous Research ra mắt Hermes Agent v0.12.0 với hệ thống cộng tác đa tác nhân Kanban

Theo Beating, khung Hermes Agent mã nguồn mở của Nous Research đã giới thiệu hệ thống cộng tác đa tác nhân kiểu Kanban trong phiên bản v0.12.0. Hệ thống cho phép các tác nhân hoạt động như các tiến trình độc lập, tự động nhận và thực thi các tác vụ từ một bảng tác vụ dùng chung song song, thay thế

GateNews1giờ trước

Các nhà nghiên cứu triển khai công nghệ DPN-LE để chỉnh sửa các đặc điểm tính cách của AI, chỉ chỉnh sửa 0,5% số nơ-ron

Theo BlockBeats, vào ngày 3/5, nhà nghiên cứu AI Brian Roemmele đã tiết lộ rằng công ty Zero-Human của ông đã triển khai công nghệ DPN-LE (Dual Personality Neuron Localization and Editing) để điều chỉnh chính xác

GateNews12giờ trước

AI Agent Manfred thành lập công ty, chuẩn bị ví tiền mã hóa để giao dịch trước cuối tháng 5

Tác nhân AI Manfred đã thành lập công ty của riêng mình và nhận được một ví crypto cùng các giấy tờ kinh doanh, bao gồm khả năng thuê nhân sự và thực hiện thanh toán. Tác nhân này dự kiến sẽ bắt đầu giao dịch crypto vào cuối

GateNews13giờ trước

CEO của Tether đề xuất tích hợp WDK và QVAC để hỗ trợ thẻ tác nhân

Theo Foresight News, CEO Tether Paolo Ardoino cho biết trên X rằng công ty phát hành stablecoin có thể cần thúc đẩy việc tích hợp giữa WDK và QVAC để hỗ trợ chức năng Agent Cards.

GateNews16giờ trước

Particle Network Ra Mắt Lộ Trình Tài Khoản Phổ Quát, Khởi Chạy Universal Deposit SDK và Tài Khoản AI Agent

Theo ChainCatcher, hôm nay Particle Network đã công bố lộ trình giai đoạn tiếp theo cho Universal Accounts, giới thiệu hai sản phẩm mới trong vài tháng tới: Universal Deposit SDK, cho phép nhà phát triển thêm tiền gửi đa chuỗi với khoảng 10 dòng code và Universal Agent Accounts,

GateNews16giờ trước
Bình luận
0/400
Không có bình luận