Mensaje de Gate News, 22 de abril — Hugging Face ha publicado en código abierto ml-intern, un agente de investigación en ML capaz de completar de forma autónoma todo el flujo de trabajo de leer artículos, organizar conjuntos de datos, lanzar entrenamiento en GPUs, evaluar resultados e iterar mejoras. El proyecto se construye sobre el framework smolagents de Hugging Face y ofrece interfaces tanto de línea de comandos (CLI) como basadas en la web, con código disponible en GitHub.

La cadena de herramientas de ml-intern está diseñada en torno al ecosistema de Hugging Face. Recupera artículos de arXiv y HF Papers mientras traza cadenas de citación para una lectura más profunda; explora conjuntos de datos en HF Hub, valida la calidad y reformatea los datos para el entrenamiento; y cuando no hay recursos de GPU locales disponibles, invoca HF Jobs para lanzar tareas de entrenamiento basadas en la nube. Tras finalizar el entrenamiento, el agente lee automáticamente las salidas de evaluación, diagnostica las causas de fallos y vuelve a ejecutar experimentos. Por defecto, utiliza Claude Sonnet 4.5 para impulsar el bucle de decisiones, con un máximo de 300 iteraciones por ejecución y compresión automática del contexto cuando supera 170k tokens.

Hugging Face mostró tres casos de uso. En una tarea de razonamiento científico, el agente identificó los conjuntos de datos OpenScience y NemoTron-CrossThink a partir de cadenas de citación, filtró siete variantes de ARC, SciQ y MMLU según el nivel de dificultad, y ejecutó 12 rondas de ajuste fino supervisado en Qwen3-1.7B, mejorando las puntuaciones de GPQA del 10% al 32% en menos de 10 horas. Para una aplicación médica, el agente determinó que los conjuntos de datos existentes eran insuficientes, escribió scripts para generar 1,100 muestras de datos sintéticos y los escaló 50 veces para el entrenamiento, superando el rendimiento de Codex en un 60% en HealthBench. En un escenario competitivo de matemáticas, el agente redactó un script de entrenamiento GRPO y lanzó el entrenamiento en GPUs A100 mediante HF Spaces, y luego realizó estudios de ablación después de observar colapso de la recompensa.

Ver fuente

Aviso legal: La información de esta página puede proceder de terceros y no representa los puntos de vista ni las opiniones de Gate. El contenido que aparece en esta página es solo para fines informativos y no constituye ningún tipo de asesoramiento financiero, de inversión o legal. Gate no garantiza la exactitud ni la integridad de la información y no se hace responsable de ninguna pérdida derivada del uso de esta información. Las inversiones en activos virtuales conllevan riesgos elevados y están sujetas a una volatilidad significativa de los precios. Podrías perder todo el capital invertido. Asegúrate de entender completamente los riesgos asociados y toma decisiones prudentes de acuerdo con tu situación financiera y tu tolerancia al riesgo. Para obtener más información, consulta el Aviso legal.