Según la monitorización de Beating, Cursor reveló un truco de entrenamiento para la serie de modelos Composer: usar el modelo de la generación anterior para construir automáticamente un entorno de ejecución para el aprendizaje por refuerzo (RL) de la próxima generación. Al entrenar Composer 2, Cursor utilizó Composer 1.5 para realizar esta tarea, denominado autoinstall.
El entrenamiento RL requiere un entorno de código ejecutable. Si el entorno no está bien configurado, el modelo desperdicia tokens en depurar errores, sin aprender nada; en casos extremos, el entorno no funciona en absoluto, y toda la potencia de cálculo del entrenamiento se desperdicia. autoinstall resuelve este problema en dos pasos: primero, un agente lee la documentación y configuración del repositorio de código, y propone 10 comandos de validación con sus salidas esperadas; segundo, otro agente toma 3 de esos comandos, configura el entorno desde cero hasta que los comandos se ejecuten correctamente. La segunda etapa puede reintentar hasta 5 veces, y si todos fallan, se descarta ese entorno.
Durante la configuración del entorno, el agente rellenará proactivamente las dependencias faltantes: falsificando tablas de bases de datos, creando configuraciones de MinIO como sustituto de S3, iniciando contenedores Docker para actuar como servicios sidecar, e incluso generando imágenes de marcador de posición. En un blog, se utilizó el proyecto de blockchain celo-org/celo-monorepo como ejemplo para demostrar todo el proceso, donde tras la primera falla en la configuración del entorno, en la segunda ronda el agente creó automáticamente usuarios simulados para sortear la autenticación, logrando finalmente ejecutar la prueba.
Composer 2 obtuvo una puntuación de 61.7% en Terminal-Bench (una referencia para evaluar la capacidad de construir entornos de desarrollo de modelos), superando en casi 14 puntos porcentuales al 47.9% de Composer 1.5. Cursor indica que en el futuro planean involucrar más al Composer de versiones anteriores en varias etapas del entrenamiento, incluyendo preprocesamiento de datos, gestión de ejecución y ajuste de arquitectura.
Aviso legal: La información de esta página puede proceder de terceros y no representa los puntos de vista ni las opiniones de Gate. El contenido que aparece en esta página es solo para fines informativos y no constituye ningún tipo de asesoramiento financiero, de inversión o legal. Gate no garantiza la exactitud ni la integridad de la información y no se hace responsable de ninguna pérdida derivada del uso de esta información. Las inversiones en activos virtuales conllevan riesgos elevados y están sujetas a una volatilidad significativa de los precios. Podrías perder todo el capital invertido. Asegúrate de entender completamente los riesgos asociados y toma decisiones prudentes de acuerdo con tu situación financiera y tu tolerancia al riesgo. Para obtener más información, consulta el
Aviso legal.
Artículos relacionados
La UE prohíbe la pornografía deepfake generada por IA el 7 de mayo
Según la agencia Xinhua, el 7 de mayo, los miembros del Parlamento Europeo y los Estados miembros alcanzaron un consenso para prohibir que los sistemas de inteligencia artificial generen contenido pornográfico deepfake. La prohibición se incorporará en las enmiendas de la Ley de Inteligencia Artificial de 2024. Parlamento Europeo
GateNewsHace8m
Tether lanza el modelo de IA médica MedPsy QVAC y logra una puntuación de 62,62 en la versión de 17 mil millones de parámetros
Según Odaily, Tether AI Research Group lanzó QVAC MedPsy, un modelo de IA médica diseñado para ejecutarse localmente en teléfonos inteligentes y dispositivos portátiles sin depender de la nube. La versión de 1,7 mil millones de parámetros obtuvo 62,62 en siete evaluaciones médicas, superando a MedGemma-1.5-4B de Google por 11,42 poi
GateNewsHace28m
La API de B.AI lanza cuatro modelos nuevos, incluido GPT-5.5 Instant en las 48 horas posteriores al lanzamiento de OpenAI
La API de B.AI ha lanzado cuatro nuevos modelos: GPT-5.5 Instant, DeepSeek-v3.2, MiniMax-M2.7 y GLM-5.1. GPT-5.5 Instant completó la adaptación subyacente y la integración de la interfaz en 48 horas desde el lanzamiento de OpenAI, lo que permite acceso sin retraso a
GateNewsHace33m
El modelo de IA médica de Tether, de 1,7 mil millones, supera hoy a un competidor 16 veces más grande
Según el equipo de investigación de IA de Tether, la compañía lanzó hoy los modelos de lenguaje médicos de la serie QVAC MedPsy, diseñados para su implementación local en teléfonos inteligentes y dispositivos wearables sin dependencia de la nube. La versión de 1,7B parámetros obtuvo 62,62 en siete puntos de referencia médicos, superando a Google MedGemma-4B
GateNewsHace44m
La valoración de Anthropic antes de su salida a bolsa alcanza 1,2 billones de dólares, superando a OpenAI en un 20%
Según Odaily, la valoración implícita de Anthropic en el mercado de pre-IPO basado en blockchain alcanzó 1,2 billones de dólares, superando a OpenAI en aproximadamente un 20%. Si la empresa saliera a bolsa con esa valoración, se situaría como la 11.ª empresa cotizada públicamente más grande a nivel mundial por capitalización de mercado, detrás de Apple,
GateNewsHace49m
La subida bursátil de Corea del Sur supera a los mercados globales por el auge de la IA
El mercado de valores de Corea del Sur está experimentando ganancias sin precedentes impulsadas por acciones de semiconductores relacionadas con la inteligencia artificial, con el índice KOSPI subiendo 78% este año, superando a cualquier otro mercado importante a nivel global, según los datos de Financial Modeling Prep citados en un análisis de Axios.
AI
CryptoFrontierHace57m