Mensaje de Gate News, 22 de abril — Hugging Face ha publicado en código abierto ml-intern, un agente de investigación en ML capaz de completar de forma autónoma todo el flujo de trabajo de leer artículos, organizar conjuntos de datos, lanzar entrenamiento en GPUs, evaluar resultados e iterar mejoras. El proyecto se construye sobre el framework smolagents de Hugging Face y ofrece interfaces tanto de línea de comandos (CLI) como basadas en la web, con código disponible en GitHub.
La cadena de herramientas de ml-intern está diseñada en torno al ecosistema de Hugging Face. Recupera artículos de arXiv y HF Papers mientras traza cadenas de citación para una lectura más profunda; explora conjuntos de datos en HF Hub, valida la calidad y reformatea los datos para el entrenamiento; y cuando no hay recursos de GPU locales disponibles, invoca HF Jobs para lanzar tareas de entrenamiento basadas en la nube. Tras finalizar el entrenamiento, el agente lee automáticamente las salidas de evaluación, diagnostica las causas de fallos y vuelve a ejecutar experimentos. Por defecto, utiliza Claude Sonnet 4.5 para impulsar el bucle de decisiones, con un máximo de 300 iteraciones por ejecución y compresión automática del contexto cuando supera 170k tokens.
Hugging Face mostró tres casos de uso. En una tarea de razonamiento científico, el agente identificó los conjuntos de datos OpenScience y NemoTron-CrossThink a partir de cadenas de citación, filtró siete variantes de ARC, SciQ y MMLU según el nivel de dificultad, y ejecutó 12 rondas de ajuste fino supervisado en Qwen3-1.7B, mejorando las puntuaciones de GPQA del 10% al 32% en menos de 10 horas. Para una aplicación médica, el agente determinó que los conjuntos de datos existentes eran insuficientes, escribió scripts para generar 1,100 muestras de datos sintéticos y los escaló 50 veces para el entrenamiento, superando el rendimiento de Codex en un 60% en HealthBench. En un escenario competitivo de matemáticas, el agente redactó un script de entrenamiento GRPO y lanzó el entrenamiento en GPUs A100 mediante HF Spaces, y luego realizó estudios de ablación después de observar colapso de la recompensa.
Artículos relacionados
China bloquea la adquisición de US$2B Manus AI de Meta
Nous Research lanza Hermes Agent v0.12.0 con el sistema de colaboración multiagente Kanban
Los investigadores implementan la tecnología DPN-LE para editar los rasgos de personalidad de la IA, modificando solo el 0,5% de las neuronas
El agente de IA Manfred crea una empresa y prepara una cartera de criptomonedas para operar a finales de mayo
El CEO de Tether propone la integración de WDK y QVAC para compatibilidad con tarjetas de agentes
Particle Network publica una hoja de ruta de Cuentas Universales, lanza el Universal Deposit SDK y cuentas de agentes de IA