La API de OpenRouter Fusion iguala el rendimiento de Claude Fable 5 a la mitad del costo

OpenRouter lanzó Fusion el 12 de junio, una API del lado del servidor que distribuye prompts entre múltiples modelos de IA simultáneamente y sintetiza sus respuestas en una única respuesta unificada. La compañía desarrolló el sistema para ofrecer un rendimiento comparable a Claude Fable 5 con aproximadamente la mitad del costo, según pruebas de referencia en el conjunto de datos DRACO de Perplexity. El lanzamiento ocurrió poco después de que Anthropic suspendiera el acceso a Fable 5 y Mythos 5 tras una directiva de control de exportaciones de EE. UU. que citó un hallazgo de jailbreak en disputa, creando un vacío de mercado para alternativas de IA de alto rendimiento accesibles para usuarios internacionales.

OpenRouter Fusion utiliza una arquitectura de panel mult моделей

Fusion funciona enviando un solo prompt a múltiples modelos de IA en paralelo, con cada modelo recibiendo acceso a herramientas de búsqueda web y bash. Un modelo juez extrae puntos de consenso, contradicciones y puntos ciegos de todas las respuestas. Claude Opus 4.8 sirve como sintetizador predeterminado, que produce la respuesta final en función del análisis del juez. Los usuarios pueden acceder a Fusion cambiando su cadena de modelo a "openrouter/fusion" para una configuración de panel predeterminada, agregando una herramienta de fusión para llamadas selectivas, o creando paneles personalizados mediante la interfaz del chatroom de Fusion sin necesidad de codificación.

El panel de IA con presupuesto obtiene 64,7% en el benchmark DRACO

OpenRouter probó Fusion en DRACO, un benchmark de Perplexity construido a partir de solicitudes reales de investigación profunda de usuarios. Un panel que combina Fable 5 y el GPT-5.5 de OpenAI, sintetizado por Opus, logró la puntuación más alta con 69%. Solo Fable 5 obtuvo 65,3%, aunque siete de sus 100 tareas no se ejecutaron debido a bloqueos del filtro de contenido. La configuración económica—Gemini 3 Flash combinada con Kimi K2.6 y DeepSeek V4 Pro, sintetizada por Opus—obtuvo 64,7%, superando a GPT-5.5 solo (60%) y a Opus 4.8 solo (58,8%) con aproximadamente la mitad del costo de Fable 5. Un panel que empareja Opus 4.8 con una instancia separada de sí mismo obtuvo 65,5%, lo que representa una mejora de 6,7 puntos frente a Opus solo; OpenRouter atribuyó aproximadamente tres cuartas partes de esta mejora al paso de síntesis y el resto a la diversidad del modelo. La compañía identificó un riesgo de contaminación, donde los modelos accedieron a la rúbrica de calificación de DRACO a través de resultados de búsqueda web, que OpenRouter abordó excluyendo los dominios de alojamiento del benchmark de las herramientas de búsqueda. Todas las puntuaciones publicadas reflejan esta configuración corregida.

El lanzamiento de Fusion sigue a la suspensión de Fable 5

Anthropic suspendió Fable 5 y Mythos 5 la semana pasada para todos los nacionales extranjeros en todo el mundo después de una directiva de control de exportaciones de EE. UU. que citó un hallazgo de jailbreak en disputa. OpenRouter anunció Fusion al día siguiente, afirmando que la API ofrece “inteligencia a nivel Fable al precio de la mitad”. Fusion funciona completamente con modelos enrutados a través de la infraestructura de OpenRouter y no resuelve las restricciones subyacentes del control de exportaciones.

OpenRouter identifica limitaciones de Fusion para tareas de codificación

OpenRouter afirmó que Fusion no sirve como un reemplazo completo de Fable 5. El benchmark DRACO excluye trabajos de largo horizonte, donde supuestamente Fable 5 mantiene una ventaja. Para aplicaciones de codificación, Fusion funciona como una herramienta que los modelos de codificación llaman de forma selectiva, en lugar de como un reemplazo integral. OpenRouter posicionó Fusion para investigación profunda, planificación compleja y tareas donde contrastar perspectivas de múltiples modelos aporta valor. El investigador de IA Andrew Trask calificó el lanzamiento como “un gran problema mucho mayor de lo que parece”, argumentando que los laboratorios de frontera ya no controlarán exclusivamente la frontera. Los críticos citaron malos resultados en codificación, llamadas de herramientas inadecuadas y falta de transparencia debido a que Fable 5 no está disponible para una comparación directa.

Preguntas frecuentes

¿Qué lanzó OpenRouter el 12 de junio?
OpenRouter lanzó Fusion, una API del lado del servidor que envía prompts a múltiples modelos de IA en paralelo, usa un modelo juez para analizar respuestas y emplea un sintetizador para producir una respuesta unificada.

¿Cómo le fue al panel de IA con presupuesto en el benchmark DRACO?
El panel con presupuesto, que combina Gemini 3 Flash, Kimi K2.6 y DeepSeek V4 Pro, obtuvo 64,7% en DRACO, ubicándose dentro de un punto porcentual del 65,3% de Fable 5 solo con aproximadamente la mitad del costo.

¿Por qué Anthropic suspendió Fable 5 y Mythos 5?
Anthropic suspendió Fable 5 y Mythos 5 la semana pasada tras una directiva de control de exportaciones de EE. UU. que citó un hallazgo de jailbreak en disputa, afectando a todos los nacionales extranjeros en todo el mundo.

Aviso legal: La información en esta página puede provenir de fuentes de terceros y es solo para referencia. No representa las opiniones ni puntos de vista de Gate y no constituye asesoramiento financiero, de inversión ni legal. El comercio de activos virtuales implica un alto riesgo. No te bases únicamente en la información presentada en esta página para tomar decisiones. Para más detalles, consulta el Aviso legal.
Comentar
0/400
Sin comentarios