Según Beating Monitor, Cursor revela técnicas de entrenamiento de Composer: usar el modelo de la generación anterior para construir automáticamente un entorno ejecutable para la próxima generación de RL. Composer2, con la ayuda de Composer1.5, realiza autoinstall en dos pasos: primero, un agente proporciona 10 comandos de verificación y sus salidas, luego, otro agente configura y ejecuta desde cero usando 3 de esos comandos, con un máximo de 5 reintentos; si falla, abandona. Durante el proceso, se completan dependencias, como falsificar bases de datos, MinIO en lugar de S3, activar Docker sidecar, imágenes de marcador de posición. Tomando el monorepo de celo como ejemplo, tras la falla en la primera ronda, en la segunda se construyó un usuario simulado para sortear la autenticación y hacer que la prueba funcionara. Composer2 obtuvo una puntuación de 61.7% en Terminal-Bench, liderando por 1.5 puntos sobre el 47.9% de la versión anterior, y en el futuro permitirá que la versión antigua participe en más fases de entrenamiento.

BlockBeatNews

2026-05-07 10:50:58

Generación de resúmenes en curso

Según la monitorización de Beating, Cursor reveló un truco de entrenamiento para la serie de modelos Composer: usar el modelo de la generación anterior para construir automáticamente un entorno de ejecución para el aprendizaje por refuerzo (RL) de la próxima generación. Al entrenar Composer 2, Cursor utilizó Composer 1.5 para realizar esta tarea, denominado autoinstall.

El entrenamiento RL requiere un entorno de código ejecutable. Si el entorno no está bien configurado, el modelo desperdicia tokens en depurar errores, sin aprender nada; en casos extremos, el entorno no funciona en absoluto, y toda la potencia de cálculo del entrenamiento se desperdicia. autoinstall resuelve este problema en dos pasos: primero, un agente lee la documentación y configuración del repositorio de código, y propone 10 comandos de validación con sus salidas esperadas; segundo, otro agente toma 3 de esos comandos, configura el entorno desde cero hasta que los comandos se ejecuten correctamente. La segunda etapa puede reintentar hasta 5 veces, y si todos fallan, se descarta ese entorno.

Durante la configuración del entorno, el agente rellenará proactivamente las dependencias faltantes: falsificando tablas de bases de datos, creando configuraciones de MinIO como sustituto de S3, iniciando contenedores Docker para actuar como servicios sidecar, e incluso generando imágenes de marcador de posición. En un blog, se utilizó el proyecto de blockchain celo-org/celo-monorepo como ejemplo para demostrar todo el proceso, donde tras la primera falla en la configuración del entorno, en la segunda ronda el agente creó automáticamente usuarios simulados para sortear la autenticación, logrando finalmente ejecutar la prueba.

Composer 2 obtuvo una puntuación de 61.7% en Terminal-Bench (una referencia para evaluar la capacidad de construir entornos de desarrollo de modelos), superando en casi 14 puntos porcentuales al 47.9% de Composer 1.5. Cursor indica que en el futuro planean involucrar más al Composer de versiones anteriores en varias etapas del entrenamiento, incluyendo preprocesamiento de datos, gestión de ejecución y ajuste de arquitectura.

Ver original

Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.

Recompensa
Me gusta
Comentar
Republicar
Compartir

Comentar

Añadir un comentario

Sin comentarios

Temas de actualidad
Ver más
#
GateSquareMayTradingShare
562.27K Popularidad
#
BTCPullback
106.31M Popularidad
#
IsraelStrikesIranBTCPlunges
43.76K Popularidad
#
CLARITYActStalled
3.28M Popularidad
#
CryptoStocksRally
1.42M Popularidad

Anclado

Cursor revela el método de entrenamiento "auto-inicialización": usar Composer antiguo para preparar el entorno del nuevo modelo, Terminal-Bench aumenta 14 puntos

Temas de actualidad

GateSquareMayTradingShare

BTCPullback

IsraelStrikesIranBTCPlunges

CLARITYActStalled

CryptoStocksRally

Anclado