Повідомлення Gate News, 22 квітня — Hugging Face відкрила вихідний код ml-intern, агенту для досліджень ML, здатного автономно виконувати повний робочий процес: читання статей, організація датасетів, запуск тренування на GPU, оцінювання результатів і ітерація покращень. Проєкт створено на основі фреймворку smolagents від Hugging Face і надає як CLI, так і веб-інтерфейси, а код доступний на GitHub.
Пакет інструментів ml-intern розроблено з акцентом на екосистему Hugging Face. Він отримує статті з arXiv та HF Papers, водночас відстежуючи ланцюжки цитувань для глибшого читання; переглядає датасети на HF Hub, валідовує якість і переформатовує дані для тренування; а коли локальні ресурси GPU недоступні, викликає HF Jobs, щоб запускати хмарні задачі тренування. Після завершення тренування агент автоматично читає результати оцінювання, діагностує причини невдач і перезапускає експерименти. За замовчуванням він використовує Claude Sonnet 4.5 для керування циклом прийняття рішень, із максимальною кількістю 300 ітерацій на один запуск і автоматичним стисненням контексту, коли перевищується 170k токенів.
Hugging Face продемонструвала три сценарії використання. У задачі на наукове міркування агент ідентифікував датасети OpenScience та NemoTron-CrossThink через ланцюжки цитувань, відфільтрував сім варіантів із ARC, SciQ та MMLU за рівнем складності та провів 12 раундів керованого fine-tuning на Qwen3-1.7B, покращивши бали GPQA з 10% до 32% менш ніж за 10 годин. Для медичного застосування агент визначив, що наявні датасети є недостатніми, написав скрипти для генерації 1,100 синтетичних зразків даних і масштабував їх у 50 разів для тренування, перевищивши продуктивність Codex на 60% на HealthBench. У змагальному сценарії з математики агент написав скрипт тренування GRPO та запустив тренування на GPU A100 через HF Spaces, а потім провів ablation-дослідження після спостереження колапсу винагород.
Пов'язані статті
Дослідники розгорнули технологію DPN-LE, щоб редагувати риси особистості ШІ, змінюючи лише 0,5% нейронів
AI-агент Менфред створює компанію та готує криптогаманець для торгівлі до кінця травня
Генеральний директор Tether пропонує інтеграцію WDK і QVAC для підтримки карток агентів
Particle Network оприлюднює дорожню карту універсальних акаунтів, запускає Universal Deposit SDK та AI Agent Accounts
OpenAI дозволяє підпискам ChatGPT працювати на агентній платформі OpenClaw
AI-агент Манфред засновує компанію та готується до криптоторгівлі до кінця травня