Tin từ Gate News, ngày 22 tháng 4 — Hugging Face đã phát hành mã nguồn mở ml-intern, một tác nhân nghiên cứu ML có thể tự động hoàn thành toàn bộ quy trình gồm đọc bài báo, tổ chức tập dữ liệu, khởi chạy huấn luyện GPU, đánh giá kết quả và lặp lại để cải tiến. Dự án được xây dựng trên framework smolagents của Hugging Face và cung cấp cả giao diện dòng lệnh (CLI) lẫn giao diện dựa trên web, với mã nguồn được công khai trên GitHub.
Bộ công cụ của ml-intern được thiết kế xoay quanh hệ sinh thái Hugging Face. Nó truy xuất các bài báo từ arXiv và HF Papers đồng thời lần theo chuỗi trích dẫn để đọc sâu hơn; duyệt tập dữ liệu trên HF Hub, xác thực chất lượng và định dạng lại dữ liệu để huấn luyện; và khi không có tài nguyên GPU cục bộ, nó gọi HF Jobs để khởi chạy các tác vụ huấn luyện trên đám mây. Sau khi quá trình huấn luyện hoàn tất, tác nhân tự động đọc các đầu ra đánh giá, chẩn đoán nguyên nhân thất bại và chạy lại các thí nghiệm. Theo mặc định, nó sử dụng Claude Sonnet 4.5 để điều khiển vòng lặp ra quyết định, với tối đa 300 lần lặp cho mỗi lần chạy và nén ngữ cảnh tự động khi vượt quá 170k token.
Hugging Face đã trình diễn ba trường hợp sử dụng. Trong một tác vụ suy luận khoa học, tác nhân xác định các tập dữ liệu OpenScience và NemoTron-CrossThink từ chuỗi trích dẫn, lọc bảy biến thể từ ARC, SciQ và MMLU theo mức độ khó, rồi chạy 12 vòng tinh chỉnh giám sát trên Qwen3-1.7B, giúp cải thiện điểm GPQA từ 10% lên 32% trong dưới 10 giờ. Với một ứng dụng y tế, tác nhân kết luận rằng các tập dữ liệu hiện có là chưa đủ, viết các script để tạo ra 1.100 mẫu dữ liệu tổng hợp, và mở rộng chúng gấp 50 lần để huấn luyện, vượt hiệu năng Codex thêm 60% trên HealthBench. Trong một bối cảnh toán học cạnh tranh, tác nhân đã viết script huấn luyện GRPO và khởi chạy huấn luyện trên các GPU A100 thông qua HF Spaces, sau đó tiến hành các nghiên cứu ablation sau khi quan sát hiện tượng sụp đổ phần thưởng.
Bài viết liên quan
Trung Quốc chặn thương vụ mua lại AI của Meta, với $2B Manus
Nous Research ra mắt Hermes Agent v0.12.0 với hệ thống cộng tác đa tác nhân Kanban
Các nhà nghiên cứu triển khai công nghệ DPN-LE để chỉnh sửa các đặc điểm tính cách của AI, chỉ chỉnh sửa 0,5% số nơ-ron
AI Agent Manfred thành lập công ty, chuẩn bị ví tiền mã hóa để giao dịch trước cuối tháng 5
CEO của Tether đề xuất tích hợp WDK và QVAC để hỗ trợ thẻ tác nhân
Particle Network Ra Mắt Lộ Trình Tài Khoản Phổ Quát, Khởi Chạy Universal Deposit SDK và Tài Khoản AI Agent