Notícias do Gate News, a 11 de abril, a empresa de infraestruturas de IA Ramp Labs publicou resultados de investigação «Latent Briefing», permitindo uma partilha eficiente de memória entre sistemas multiagente através da compressão direta da cache KV de grandes modelos. Isto faz uma grande redução do consumo de Tokens sem perda de exatidão. Nas arquiteturas multiagente mais comuns, o orquestrador (Orchestrator) decompõe tarefas e chama repetidamente modelos de trabalhadores (Worker). À medida que a cadeia de inferência se vai tornando mais longa, a quantidade de Tokens cresce de forma exponencial. A ideia central do Latent Briefing é, com o auxílio do mecanismo de atenção, identificar as partes verdadeiramente essenciais no contexto e eliminar informação redundante diretamente na camada de representação, em vez de depender de resumos de LLM que são lentos ou de pesquisas RAG com baixa estabilidade. Nos testes de referência do LongBench v2, o método teve um desempenho notável: o consumo de Tokens do modelo Worker diminuiu 65%, a mediana de Tokens poupados em documentos de comprimento médio (32k a 100k) atingiu 49%, a exatidão global melhorou cerca de 3 pontos percentuais face à linha de base e o tempo adicional para cada compressão foi apenas de cerca de 1,7 segundos, o que equivale a acelerar aproximadamente 20 vezes em relação ao algoritmo original. O experimento usou Claude Sonnet 4 como orquestrador e Qwen3-14B como modelo de trabalhador, cobrindo cenários de documentos variados, como artigos académicos, documentos jurídicos, romances e relatórios governamentais. O estudo também descobriu que o limiar de compressão ideal varia em função da dificuldade da tarefa e do comprimento do documento — para tarefas difíceis, é mais adequado uma compressão mais agressiva para filtrar ruído de inferência oportunista; para documentos longos, é mais apropriada uma compressão mais ligeira para preservar informação-chave dispersa.
Aviso: As informações nesta página podem ser provenientes de terceiros e não representam as opiniões ou pontos de vista da Gate. O conteúdo exibido nesta página é apenas para referência e não constitui aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou integridade das informações e não será responsável por quaisquer perdas decorrentes do uso dessas informações. Os investimentos em ativos virtuais apresentam altos riscos e estão sujeitos a uma volatilidade de preços significativa. Você pode perder todo o capital investido. Por favor, compreenda completamente os riscos envolvidos e tome decisões prudentes com base em sua própria situação financeira e tolerância ao risco. Para mais detalhes, consulte o
Aviso Legal.
Related Articles
Agente de vending de IA “Valerie” opera a máquina de venda automática em San Francisco com o OpenClaw
O agente de IA "Valerie" agora executa uma máquina de venda automática em São Francisco na OpenClaw, testando até onde as pessoas vão confiar em código com preços, marketing e dinheiro do mundo real.
Resumo
O agente de IA "Valerie" executa uma máquina de venda automática física em São Francisco usando o framework OpenClaw, definindo preços, nomeando
Cryptonews8h atrás
Mastercard viabiliza pagamentos de agentes de IA por meio de parceria com Lobstercash e Crossmint
A Mastercard fez parceria com a Lobstercash e a Crossmint para facilitar pagamentos de agentes de IA via cartões de crédito e débito já existentes, integrando-se aos sistemas financeiros atuais sem necessidade de novas carteiras. Essa parceria permite que a IA automatize transações, aumentando a eficiência e a segurança.
GateNews13h atrás
Equipe chinesa EvoMap acusa: agentes da Hermes viralizaram furiosamente por copiar conteúdo: no sistema de autoevolução existe uma semelhança muito alta
A equipe chinesa EvoMap acusa o Hermes Agent da Nous Research de copiar sua arquitetura Evolver/GEP, alegando que ambos têm alta semelhança em vários módulos-chave. A EvoMap afirma que o projeto do Hermes não cita nem agradece o conteúdo previamente publicado por ela; a controvérsia gerou ampla atenção da comunidade, parte dos internautas chineses apoiou a EvoMap e criticou as ações de plágio do Hermes. Embora a equipe de pesquisa da Nous ainda não tenha refutado as acusações ponto a ponto, o caso se espalhou rapidamente no discurso sobre IA.
ChainNewsAbmedia13h atrás
OpenAI Atualiza Codex para um Agente de IA que Controla o Desktop, Automatizando Fluxos de Trabalho de Desenvolvimento
O Codex aprimorado da OpenAI evolui de um assistente de programação para um agente autônomo para ambientes de desktop, capaz de gerenciar aplicativos, automatizar fluxos de trabalho e se integrar a mais de 100 apps. Essa mudança aprimora a continuidade das tarefas e a automação do fluxo de trabalho, refletindo um cenário competitivo nas ferramentas de codificação com IA.
GateNews14h atrás
Agile Soda lança plataforma Agentic OCR com 98% de precisão na classificação de documentos
A Agile Soda lançou o Agentic OCR, uma plataforma de automação de documentos orientada por IA que elimina a necessidade de pré-treinamento e permite implantação instantânea. Ela oferece alta precisão na classificação e extração, com melhoria contínua por meio de correções dos usuários, e planos para aprimoramentos futuros.
GateNews18h atrás
American Express vai adquirir a startup de despesas com IA Hyper no 2T 2026
A American Express vai adquirir a startup de IA Hyper para aprimorar suas ferramentas de gestão de despesas para clientes corporativos. A aquisição, esperada para ser concluída no 2T 2026, segue uma parceria que lançou, em 2024, um cartão de recompensas co-branded.
GateNews19h atrás