Resultados da pesquisa por "GPT"
2026-04-23
04:54

A Perplexity revela método de pós-treinamento de agente de busca na web; modelo baseado em Qwen3.5 supera GPT-5.4 em acurácia e custo

A Perplexity usa SFT seguida de RL com modelos Qwen3.5, aproveitando um conjunto de dados de QA multi-hop e verificações por rubrica para aumentar a precisão e a eficiência da busca, alcançando desempenho FRAMES de nível superior. Resumo: O fluxo de trabalho de pós-treinamento da Perplexity para agentes de busca na web combina fine-tuning supervisionado (SFT) para impor aderência a instruções e consistência de linguagem com aprendizado por reforço online (RL) via o algoritmo GRPO. A etapa de RL usa um conjunto de dados proprietários de QA verificável multi-hop e dados conversacionais baseados em rubricas para evitar deriva do SFT, com agregação filtrada por recompensa e penalidades de eficiência dentro do grupo. A avaliação mostra que o Qwen3.5-397B-SFT-RL alcança o melhor desempenho em FRAMES, com 57,3% de acurácia com uma única chamada de ferramenta e 73,9% com quatro chamadas a US$ 0,02 por consulta, superando GPT-5.4 e Claude Sonnet 4.6 nessas métricas. A precificação é baseada em API e exclui caching.
Mais
12:05

Kimi K2.6 lidera o benchmark de programação do OpenRouter e supera Claude e a série GPT

Kimi K2.6 supera o OpenRouter no ranking, superando Claude, GPT e rivais de código aberto, sinalizando avanço doméstico em IA e reduzindo a diferença para líderes globais. Resumo: A Kimi.ai anunciou que seu modelo mais recente, Kimi K2.6, ficou em primeiro lugar no ranking de capacidade de programação do OpenRouter, liderando avaliações de desenvolvedores. Benchmarks indicam que o K2.6 entrega desempenho superior em tarefas de programação em relação a Claude, séries GPT e outros modelos de código aberto, destacando ganhos na geração de código e no tratamento de tarefas de desenvolvimento e sinalizando progresso da IA doméstica rumo a líderes internacionais.
Mais
00:02

OpenAI lança GPT-5.4 mini e nano, preços até 4 vezes superiores à geração anterior

A OpenAI lançou a 18 de março os novos modelos GPT-5.4 mini e GPT-5.4 nano, orientados para cenários multimodais e de programação, com preços significativamente mais elevados. O GPT-5.4 mini apresenta desempenho superior nos testes de referência de programação, suporta contexto em larga escala e operações multifuncionais. Além disso, os utilizadores da versão gratuita do chatGPT também terão acesso às novas funcionalidades de raciocínio.
Mais