OpenRouter Fusion API atinge o desempenho do Claude Fable 5 a metade do custo

DEEPSEEK-2,81%

OpenRouter lançou a Fusion em 12 de junho, uma API de servidor que distribui prompts para múltiplos modelos de IA em paralelo e, em seguida, usa um modelo “juiz” e um sintetizador para mesclar as respostas em uma resposta unificada. A empresa afirma que o sistema consegue igualar o desempenho da Claude Fable 5 por um custo de aproximadamente metade, com base em testes usando o benchmark DRACO da Perplexity, onde um painel de modelos em nível de orçamento marcou 64,7% em comparação com os 65,3% da Fable 5. O lançamento veio pouco depois de a Anthropic ter suspendido a Fable 5 e a Mythos 5 na semana passada, após uma diretriz de controle de exportação dos EUA citar uma descoberta de jailbreak contestada; com isso, a OpenRouter posicionou a Fusion como uma alternativa, oferecendo “inteligência no nível da Fable pelo preço de metade”.

OpenRouter Fusion Processa Prompts por Meio de uma Arquitetura de Painel com Multi-Modelos

Quando um usuário envia um prompt para a Fusion, a OpenRouter o distribui para um painel de modelos em paralelo, com cada modelo recebendo ferramentas de busca na web e bash. Um modelo juiz então extrai pontos de consenso, contradições e “lacunas” (blind spots) de cada resposta. Depois dessa fase de análise, um sintetizador — Claude Opus 4.8 por padrão — escreve a resposta final baseada nessa análise. Todo o processo acontece no lado do servidor. Os usuários podem trocar a string do modelo para “openrouter/fusion” para um painel padrão, adicionar uma ferramenta de fusion para que seu próprio modelo a chame seletivamente, ou criar um painel personalizado no chat da Fusion, sem código.

Painel de IA Econômico Gera 64,7% no Benchmark DRACO Contra 65,3% da Fable 5

A OpenRouter testou a Fusion no DRACO, um benchmark da Perplexity construído a partir de pedidos reais de pesquisa profunda de usuários. A Fable 5, em combinação com o GPT-5,5 da OpenAI e sintetizada pelo Opus, liderou o ranking com 69%. A Fable solo teve 65,3%, embora sete de suas 100 tarefas nunca tenham sido executadas porque os próprios filtros de conteúdo bloquearam essas tarefas. A combinação econômica — Gemini 3 Flash com modelos chineses open-source Kimi K2.6 e DeepSeek V4 Pro, fundidos e sintetizados pelo Opus — atingiu 64,7%, superando o GPT-5,5 solo (60%) e o Opus 4.8 solo (58,8%) e ficando dentro de um ponto percentual da Fable pelo custo de aproximadamente metade. Ao emparelhar o Opus 4.8 com uma instância separada de si mesmo, a pontuação foi de 65,5%, um salto de 6,7 pontos acima do Opus solo. A OpenRouter afirma que aproximadamente três quartos dessa melhora vêm do passo de síntese em si, e o restante da diversidade real entre modelos.

A OpenRouter divulgou que, ao dar acesso à web em tempo real ao painel, os modelos conseguem mostrar o próprio rubric de avaliação do DRACO nos resultados de busca, um risco de contaminação que a empresa descreve como coincidência e não algo deliberado. A correção exigiu uma linha de configuração para excluir os domínios de hospedagem do benchmark das ferramentas de busca, e cada número publicado reflete essa execução “limpa”.

Anthropic Suspendeu a Fable 5 e a Mythos 5 Após Diretriz de Exportação dos EUA

Pouco depois de lançar a Fable 5 e a Mythos 5 na semana passada, uma diretriz de controle de exportação dos EUA forçou a Anthropic a suspender esses modelos para todo nacional estrangeiro no mundo todo, citando uma descoberta de jailbreak contestada. A OpenRouter anunciou a Fusion no X em 13 de junho, posicionando-a como uma alternativa com a promessa de “inteligência no nível da Fable pelo preço de metade”.

OpenRouter Identifica Limitações da Fusion para Codificação e Tarefas de Longo Prazo

A OpenRouter afirma que a Fusion não é uma substituta completa da Fable. O DRACO ignora tarefas de longo prazo, nas quais a Fable, segundo relatos, ainda lidera. Para codificação, a Fusion funciona como uma ferramenta que um modelo de código chama seletivamente, não como uma substituição total. O fio do lançamento dividiu o acompanhamento de sentimento em aproximadamente dois para um a favor. O pesquisador de IA Andrew Trask chamou isso de “um negócio muito maior do que parece”, argumentando que os laboratórios de fronteira nunca mais vão dominar a fronteira sozinhos. Os céticos citaram maus resultados de codificação, chamadas ruins de ferramentas e falta de transparência, já que a Fable 5 não está mais disponível para comparar os resultados. A Fusion roda inteiramente em modelos roteados pela própria infraestrutura da OpenRouter, então ela não resolve o problema do controle de exportação na origem.

FAQ

O que a OpenRouter lançou em 12 de junho?

A OpenRouter lançou a Fusion em 12 de junho, uma API de servidor que distribui prompts para múltiplos modelos de IA em paralelo e, em seguida, usa um modelo juiz e um sintetizador para mesclar respostas em uma resposta unificada.

Como o painel econômico da Fusion se saiu no benchmark DRACO em comparação com a Claude Fable 5?

No benchmark DRACO da Perplexity, o painel econômico da Fusion, combinando Gemini 3 Flash, Kimi K2.6 e DeepSeek V4 Pro, marcou 64,7%, ficando dentro de um ponto percentual da pontuação de 65,3% da Fable 5 solo, a um custo de aproximadamente metade.

Por que a Anthropic suspendeu a Claude Fable 5 e a Mythos 5?

A Anthropuic suspendeu a Fable 5 e a Mythos 5 na semana passada após uma diretriz de controle de exportação dos EUA citar uma descoberta de jailbreak contestada, o que afetou o acesso para todo nacional estrangeiro no mundo todo.

Isenção de responsabilidade: as informações nesta página podem ter origem em fontes terceiras e servem apenas como referência. Não representam as opiniões da Gate e não constituem orientação financeira, de investimentos ou jurídica. A negociação de ativos virtuais envolve alto risco. Não tome decisões baseando-se apenas nas informações desta página. Para mais detalhes, consulte a Isenção de responsabilidade.
Comentário
0/400
Sem comentários