Mensagem do Gate News, 22 de abril — A Hugging Face abriu o código do ml-intern, um agente de pesquisa em ML capaz de concluir autonomamente todo o fluxo de trabalho de ler artigos, organizar conjuntos de dados, iniciar treinamento em GPU, avaliar resultados e iterar melhorias. O projeto é construído sobre o framework smolagents da Hugging Face e oferece interfaces tanto via CLI quanto baseadas na web, com o código disponível no GitHub.
O conjunto de ferramentas do ml-intern foi projetado em torno do ecossistema da Hugging Face. Ele recupera artigos do arXiv e do HF Papers enquanto rastreia cadeias de citações para leitura mais profunda; navega por conjuntos de dados no HF Hub, valida a qualidade e reformata os dados para treinamento; e, quando os recursos locais de GPU não estão disponíveis, chama o HF Jobs para iniciar tarefas de treinamento baseadas na nuvem. Após a conclusão do treinamento, o agente lê automaticamente as saídas de avaliação, diagnostica as causas de falha e reexecuta os experimentos. Por padrão, ele usa Claude Sonnet 4.5 para conduzir o loop de decisão, com um máximo de 300 iterações por execução e compressão automática de contexto quando excede 170k tokens.
A Hugging Face demonstrou três casos de uso. Em uma tarefa de raciocínio científico, o agente identificou os conjuntos de dados OpenScience e NemoTron-CrossThink a partir das cadeias de citação, filtrou sete variantes de ARC, SciQ e MMLU por nível de dificuldade e realizou 12 rodadas de fine-tuning supervisionado no Qwen3-1.7B, melhorando as pontuações do GPQA de 10% para 32% em menos de 10 horas. Para uma aplicação médica, o agente concluiu que os conjuntos de dados existentes eram insuficientes, escreveu scripts para gerar 1.100 amostras de dados sintéticos e os escalou em 50 vezes para treinamento, superando o desempenho do Codex em 60% no HealthBench. Em um cenário competitivo de matemática, o agente escreveu um script de treinamento GRPO e iniciou o treinamento em GPUs A100 via HF Spaces, depois conduziu estudos de ablação após observar colapso de recompensas.
Related Articles
A China bloqueia a aquisição da AI Manus da Meta (US$2B )
A Nous Research lança o Hermes Agent v0.12.0 com o sistema de colaboração multiagente Kanban
Pesquisadores Implantam a Tecnologia DPN-LE para Editar Traços de Personalidade de IA, Alterando Apenas 0,5% dos Neurônios
Agente de IA Manfred forma empresa, prepara carteira de criptomoedas para começar a negociar até o fim de maio
O CEO da Tether Propõe a Integração de WDK e QVAC para Suporte a Cartões de Agentes
Particle Network Lança Roadmap de Contas Universais, Lança o Universal Deposit SDK e Contas de Agentes de IA