Hugging Face publica en código abierto ml-intern, un agente de IA para investigación autónoma en ML

Mensaje de Gate News, 22 de abril — Hugging Face ha publicado en código abierto ml-intern, un agente de investigación en ML capaz de completar de forma autónoma todo el flujo de trabajo de leer artículos, organizar conjuntos de datos, lanzar entrenamiento en GPUs, evaluar resultados e iterar mejoras. El proyecto se construye sobre el framework smolagents de Hugging Face y ofrece interfaces tanto de línea de comandos (CLI) como basadas en la web, con código disponible en GitHub.

La cadena de herramientas de ml-intern está diseñada en torno al ecosistema de Hugging Face. Recupera artículos de arXiv y HF Papers mientras traza cadenas de citación para una lectura más profunda; explora conjuntos de datos en HF Hub, valida la calidad y reformatea los datos para el entrenamiento; y cuando no hay recursos de GPU locales disponibles, invoca HF Jobs para lanzar tareas de entrenamiento basadas en la nube. Tras finalizar el entrenamiento, el agente lee automáticamente las salidas de evaluación, diagnostica las causas de fallos y vuelve a ejecutar experimentos. Por defecto, utiliza Claude Sonnet 4.5 para impulsar el bucle de decisiones, con un máximo de 300 iteraciones por ejecución y compresión automática del contexto cuando supera 170k tokens.

Hugging Face mostró tres casos de uso. En una tarea de razonamiento científico, el agente identificó los conjuntos de datos OpenScience y NemoTron-CrossThink a partir de cadenas de citación, filtró siete variantes de ARC, SciQ y MMLU según el nivel de dificultad, y ejecutó 12 rondas de ajuste fino supervisado en Qwen3-1.7B, mejorando las puntuaciones de GPQA del 10% al 32% en menos de 10 horas. Para una aplicación médica, el agente determinó que los conjuntos de datos existentes eran insuficientes, escribió scripts para generar 1,100 muestras de datos sintéticos y los escaló 50 veces para el entrenamiento, superando el rendimiento de Codex en un 60% en HealthBench. En un escenario competitivo de matemáticas, el agente redactó un script de entrenamiento GRPO y lanzó el entrenamiento en GPUs A100 mediante HF Spaces, y luego realizó estudios de ablación después de observar colapso de la recompensa.

Aviso legal: La información de esta página puede proceder de terceros y no representa los puntos de vista ni las opiniones de Gate. El contenido que aparece en esta página es solo para fines informativos y no constituye ningún tipo de asesoramiento financiero, de inversión o legal. Gate no garantiza la exactitud ni la integridad de la información y no se hace responsable de ninguna pérdida derivada del uso de esta información. Las inversiones en activos virtuales conllevan riesgos elevados y están sujetas a una volatilidad significativa de los precios. Podrías perder todo el capital invertido. Asegúrate de entender completamente los riesgos asociados y toma decisiones prudentes de acuerdo con tu situación financiera y tu tolerancia al riesgo. Para obtener más información, consulta el Aviso legal.

Artículos relacionados

China bloquea la adquisición de US$2B Manus AI de Meta

China anunció que está bloqueando la adquisición de Meta por valor de 2.000 millones de dólares de la empresa de agentes de IA Manus, citando preocupaciones sobre la transferencia de propiedad intelectual de inteligencia artificial china a una empresa estadounidense, según informó Tech in Asia. Manus, una empresa fundada en China que trasladó su sede a

CryptoFrontierhace1h

Nous Research lanza Hermes Agent v0.12.0 con el sistema de colaboración multiagente Kanban

Según Beating, el marco de Hermes Agent de código abierto de Nous Research introdujo un sistema de colaboración multiagente tipo Kanban en la v0.12.0. El sistema permite que los agentes funcionen como procesos independientes, reclamando y ejecutando tareas de forma autónoma desde un tablero de tareas compartido en paralelo, reemplazando

GateNewshace2h

Los investigadores implementan la tecnología DPN-LE para editar los rasgos de personalidad de la IA, modificando solo el 0,5% de las neuronas

Según BlockBeats, el 3 de mayo, el investigador de IA Brian Roemmele reveló que su empresa Zero-Human ha implementado la tecnología DPN-LE (Dual Personality Neuron Localization and Editing) para ajustar con precisión

GateNewshace14h

El agente de IA Manfred crea una empresa y prepara una cartera de criptomonedas para operar a finales de mayo

El agente de IA Manfred ha establecido su propia empresa y ha obtenido una cartera de criptomonedas y credenciales comerciales, incluida la capacidad de contratar personal y realizar pagos. El agente tiene previsto comenzar a operar con cripto para finales de

GateNewshace14h

El CEO de Tether propone la integración de WDK y QVAC para compatibilidad con tarjetas de agentes

Según Foresight News, el CEO de Tether, Paolo Ardoino, afirmó en X que el emisor de la stablecoin podría necesitar avanzar en la integración entre WDK y QVAC para respaldar la funcionalidad de Agent Cards.

GateNewshace17h

Particle Network publica una hoja de ruta de Cuentas Universales, lanza el Universal Deposit SDK y cuentas de agentes de IA

Según ChainCatcher, Particle Network hoy publicó la hoja de ruta de la siguiente fase para Universal Accounts, presentando dos nuevos productos en los próximos meses: Universal Deposit SDK, que permite a los desarrolladores añadir depósitos multi-cadena con aproximadamente 10 líneas de código, y Universal Agent Accounts,

GateNewshace17h
Comentar
0/400
Sin comentarios