Cursor revela el método de entrenamiento "auto-inicialización": usar Composer antiguo para preparar el entorno del nuevo modelo, Terminal-Bench aumenta 14 puntos

BlockBeatNews

2026-05-07 10:50:58

Según la monitorización de Beating, Cursor reveló un truco de entrenamiento para la serie de modelos Composer: usar el modelo de la generación anterior para construir automáticamente un entorno de ejecución para el aprendizaje por refuerzo (RL) de la próxima generación. Al entrenar Composer 2, Cursor utilizó Composer 1.5 para realizar esta tarea, denominado autoinstall.

El entrenamiento RL requiere un entorno de código ejecutable. Si el entorno no está bien configurado, el modelo desperdicia tokens en depurar errores, sin aprender nada; en casos extremos, el entorno no funciona en absoluto, y toda la potencia de cálculo del entrenamiento se desperdicia. autoinstall resuelve este problema en dos pasos: primero, un agente lee la documentación y configuración del repositorio de código, y propone 10 comandos de validación con sus salidas esperadas; segundo, otro agente toma 3 de esos comandos, configura el entorno desde cero hasta que los comandos se ejecuten correctamente. La segunda etapa puede reintentar hasta 5 veces, y si todos fallan, se descarta ese entorno.

Durante la configuración del entorno, el agente rellenará proactivamente las dependencias faltantes: falsificando tablas de bases de datos, creando configuraciones de MinIO como sustituto de S3, iniciando contenedores Docker para actuar como servicios sidecar, e incluso generando imágenes de marcador de posición. En un blog, se utilizó el proyecto de blockchain celo-org/celo-monorepo como ejemplo para demostrar todo el proceso, donde tras la primera falla en la configuración del entorno, en la segunda ronda el agente creó automáticamente usuarios simulados para sortear la autenticación, logrando finalmente ejecutar la prueba.

Composer 2 obtuvo una puntuación de 61.7% en Terminal-Bench (una referencia para evaluar la capacidad de construir entornos de desarrollo de modelos), superando en casi 14 puntos porcentuales al 47.9% de Composer 1.5. Cursor indica que en el futuro planean involucrar más al Composer de versiones anteriores en varias etapas del entrenamiento, incluyendo preprocesamiento de datos, gestión de ejecución y ajuste de arquitectura.

Aviso legal: La información de esta página puede proceder de terceros y no representa los puntos de vista ni las opiniones de Gate. El contenido que aparece en esta página es solo para fines informativos y no constituye ningún tipo de asesoramiento financiero, de inversión o legal. Gate no garantiza la exactitud ni la integridad de la información y no se hace responsable de ninguna pérdida derivada del uso de esta información. Las inversiones en activos virtuales conllevan riesgos elevados y están sujetas a una volatilidad significativa de los precios. Podrías perder todo el capital invertido. Asegúrate de entender completamente los riesgos asociados y toma decisiones prudentes de acuerdo con tu situación financiera y tu tolerancia al riesgo. Para obtener más información, consulta el Aviso legal.