A Perplexity revela o método de pós-treinamento do agente de pesquisa na web; o modelo baseado em Qwen3.5 supera o GPT-5.4 em precisão e custo

Mensagem do Gate News, 23 de abril — A equipa de investigação da Perplexity publicou um artigo técnico que detalha a sua metodologia de pós-treinamento para agentes de pesquisa na web. A abordagem utiliza dois modelos Qwen3.5 de código aberto (Qwen3.5-122B-A10B e Qwen3.5-397B-A17B) e recorre a um pipeline em duas etapas: fine-tuning supervisionado (SFT) para estabelecer obediência a instruções e consistência linguística, seguido de aprendizagem por reforço online (RL) para otimizar a precisão da pesquisa e a eficiência no uso de ferramentas.

A fase de RL utiliza o algoritmo GRPO com duas fontes de dados: um conjunto de dados proprietário de perguntas e respostas verificáveis multi-hop construído a partir de queries iniciais internas que exigem 2–4 hops de raciocínio com verificação por múltiplos solucionadores, e dados conversacionais gerais baseados em rubricas que convertem requisitos de implementação em condições atómicas objetivamente verificáveis para evitar a degradação do comportamento do SFT.

O desenho de recompensas emprega agregação com gating — as pontuações de preferência só contribuem quando a correcção de base é alcançada (correspondência pergunta-resposta ou quando todos os critérios da rubrica são satisfeitos), impedindo que sinais de preferência elevados mascarem erros factuais. As penalizações de eficiência utilizam ancoragem dentro do grupo, aplicando penalizações suaves às chamadas de ferramentas e ao comprimento da geração que excede a base de respostas correctas no mesmo grupo.

A avaliação mostra que o Qwen3.5-397B-SFT-RL atinge o melhor desempenho de referência em benchmarks de pesquisa. No FRAMES, alcança 57,3% de precisão com uma única chamada de ferramenta, superando o GPT-5.4 em 5,7 pontos percentuais e o Claude Sonnet 4.6 em 4,7 pontos percentuais. Sob um orçamento moderado (quatro chamadas de ferramentas), atinge 73,9% de precisão a $0,02 por consulta, em comparação com 67,8% de precisão do GPT-5.4 a $0,085 por consulta e 62,4% de precisão do Sonnet 4.6 a $0,153 por consulta. Os valores de custo baseiam-se na tarifação pública por API de cada fornecedor e excluem optimizações de caching.

Isenção de responsabilidade: As informações contidas nesta página podem ser provenientes de terceiros e não representam os pontos de vista ou opiniões da Gate. O conteúdo apresentado nesta página é apenas para referência e não constitui qualquer aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou o carácter exaustivo das informações e não poderá ser responsabilizada por quaisquer perdas resultantes da utilização destas informações. Os investimentos em ativos virtuais implicam riscos elevados e estão sujeitos a uma volatilidade de preços significativa. Pode perder todo o seu capital investido. Compreenda plenamente os riscos relevantes e tome decisões prudentes com base na sua própria situação financeira e tolerância ao risco. Para mais informações, consulte a Isenção de responsabilidade.

Related Articles

A TON Tech Lança Agentes com IA para Transações On-Chain Autónomas

Mensagem de Gate News, 28 de abril — A TON Tech, a equipa de desenvolvimento por detrás da blockchain TON preferida do Telegram, lançou agentes com IA capazes de executar autonomamente transações-chave on-chain. Os utilizadores podem financiar uma carteira dedicada para um agente, que pode então realizar transferências, swaps, atividades DeFi

GateNews53m atrás

B.AI e CROSS fazem parceria para explorar agentes de IA em infraestruturas de gaming Web3

Mensagem do Gate News, 28 de abril — A B.AI, uma plataforma de infraestrutura financeira digital de próxima geração para agentes de IA, anunciou ontem (27 de abril) uma parceria estratégica com a CROSS, um fornecedor de infraestrutura de gaming Web3 full-stack. A colaboração tem como objetivo explorar como os agentes de IA podem automatizar

GateNews1h atrás

Relatório da Messari Analisa o Desenvolvimento da Arquitetura de Trading com IA

Mensagem do Gate News, 28 de abril — O mais recente relatório Pulse da Messari fornece uma análise aprofundada do sistema de trading com IA de uma CEX líder, revelando uma arquitetura de produto de IA de quatro camadas, composta por componentes de análise de mercado, execução autónoma, integração com programadores e interação de estratégia. O componente de interação de estratégia

GateNews5h atrás

Amber Premium regista receitas recorde de 66,1 M$ em 2025, o volume de negociação ultrapassa 11 mil M$

Mensagem de Gate News, 28 de abril — Amber International Holding Limited (Amber Premium) alcançou um volume de negócios recorde de 66,1 milhões de dólares em 2025, com o volume de negociação anual a ultrapassar $11 billion. Os ativos médios dos clientes atingiram 1,3 milhões de dólares. A empresa obteve oficialmente a licença VARA VASP de Dubai em abril e h

GateNews7h atrás

A Ant International Lança o Protocolo Móvel Agentic Open Source para Pagamentos por IA

Mensagem da Gate News, 28 de abril — A Ant International lançou o Protocolo Móvel Agentic Open Source em 28 de abril em Kuala Lumpur, para permitir que carteiras móveis e aplicações suportem pagamentos por agentes de IA, colmatando a lacuna já que a maioria dos sistemas existentes ainda depende de redes tradicionais de cartões. O framework

GateNews9h atrás

Tencent Cloud melhora capacidades do Agent de nível empresarial e lança vários produtos de IA

Mensagem de notícias da Gate, 28 de Abril — A Tencent Cloud anunciou uma actualização abrangente das capacidades do seu produto Agent de nível empresarial, de ponta a ponta, na Cimeira 2026 Tencent Cloud City Summit em Chongqing, a 28 de Abril. A empresa revelou vários novos produtos, incluindo a edição de cloud privada ClawPro, ADP

GateNews11h atrás
Comentar
0/400
Nenhum comentário