A Ramp Labs apresenta uma nova solução para a partilha de memória entre múltiplos agentes, reduzindo o consumo de tokens em até 65%

GateNews

Notícias do Gate News, a 11 de abril, a empresa de infraestruturas de IA Ramp Labs publicou resultados de investigação «Latent Briefing», permitindo uma partilha eficiente de memória entre sistemas multiagente através da compressão direta da cache KV de grandes modelos. Isto faz uma grande redução do consumo de Tokens sem perda de exatidão. Nas arquiteturas multiagente mais comuns, o orquestrador (Orchestrator) decompõe tarefas e chama repetidamente modelos de trabalhadores (Worker). À medida que a cadeia de inferência se vai tornando mais longa, a quantidade de Tokens cresce de forma exponencial. A ideia central do Latent Briefing é, com o auxílio do mecanismo de atenção, identificar as partes verdadeiramente essenciais no contexto e eliminar informação redundante diretamente na camada de representação, em vez de depender de resumos de LLM que são lentos ou de pesquisas RAG com baixa estabilidade. Nos testes de referência do LongBench v2, o método teve um desempenho notável: o consumo de Tokens do modelo Worker diminuiu 65%, a mediana de Tokens poupados em documentos de comprimento médio (32k a 100k) atingiu 49%, a exatidão global melhorou cerca de 3 pontos percentuais face à linha de base e o tempo adicional para cada compressão foi apenas de cerca de 1,7 segundos, o que equivale a acelerar aproximadamente 20 vezes em relação ao algoritmo original. O experimento usou Claude Sonnet 4 como orquestrador e Qwen3-14B como modelo de trabalhador, cobrindo cenários de documentos variados, como artigos académicos, documentos jurídicos, romances e relatórios governamentais. O estudo também descobriu que o limiar de compressão ideal varia em função da dificuldade da tarefa e do comprimento do documento — para tarefas difíceis, é mais adequado uma compressão mais agressiva para filtrar ruído de inferência oportunista; para documentos longos, é mais apropriada uma compressão mais ligeira para preservar informação-chave dispersa.

Aviso: As informações nesta página podem ser provenientes de terceiros e não representam as opiniões ou pontos de vista da Gate. O conteúdo exibido nesta página é apenas para referência e não constitui aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou integridade das informações e não será responsável por quaisquer perdas decorrentes do uso dessas informações. Os investimentos em ativos virtuais apresentam altos riscos e estão sujeitos a uma volatilidade de preços significativa. Você pode perder todo o capital investido. Por favor, compreenda completamente os riscos envolvidos e tome decisões prudentes com base em sua própria situação financeira e tolerância ao risco. Para mais detalhes, consulte o Aviso Legal.

Related Articles

Agile Soda lança plataforma Agentic OCR com 98% de precisão na classificação de documentos

A Agile Soda lançou o Agentic OCR, uma plataforma de automação de documentos orientada por IA que elimina a necessidade de pré-treinamento e permite implantação instantânea. Ela oferece alta precisão na classificação e extração, com melhoria contínua por meio de correções dos usuários, e planos para aprimoramentos futuros.

GateNews2h atrás

American Express vai adquirir a startup de despesas com IA Hyper no 2T 2026

A American Express vai adquirir a startup de IA Hyper para aprimorar suas ferramentas de gestão de despesas para clientes corporativos. A aquisição, esperada para ser concluída no 2T 2026, segue uma parceria que lançou, em 2024, um cartão de recompensas co-branded.

GateNews3h atrás

Startup de Nuvem de Singapura OrtCloud Levanta US$ 1,7M em Rodada Pré-Seed Liderada pela Golden Gate Ventures

A OrtCloud, startup de Singapura, levantou US$ 1,7 milhão em financiamento pré-seed para sua infraestrutura de nuvem especializada, projetada para cargas de trabalho de IA. Com clientes como OpenAI e Samsung, a empresa busca aprimorar o desenvolvimento de produtos e expandir na região Ásia-Pacífico e nos EUA.

GateNews3h atrás

Canva Lança Plataforma de IA 2.0, Expandindo de Ferramenta de Design para um Work OS Unificado

O Canva AI 2.0 transforma o Canva, de uma ferramenta de design, em uma plataforma abrangente de operações de trabalho. Ele usa IA generativa para simplificar fluxos de trabalho, permitindo que os usuários criem e editem designs por meio de linguagem natural, automatizem tarefas e integrem-se a vários aplicativos.

GateNews5h atrás

Sahara AI Lança Agente de Investimentos Sorin com Suporte a Criptomoedas, Ações e Mercados de Predição

A Sahara AI lançou a Sorin, um agente de investimentos para negociar uma variedade de ativos como criptomoedas e ações. Ele oferece negociação autônoma, automação de estratégias quantitativas e gerenciamento de risco personalizado para todos os usuários, após testes com 20.000 participantes.

GateNews17h atrás

AlphaNet capta rodada seed $10M liderada pela Joffre Capital para lançar uma plataforma de negociação quantitativa de padrão institucional

Plataforma de negociação quantitativa com IA AlphaNet garante $10 milhões em rodada seed, se preparando para um lançamento público com mais de 30 estratégias de alto desempenho. Os planos incluem uma Open Platform para integração de estratégias até 2026, com o objetivo de 100+ estratégias.

GateNews20h atrás
Comentário
0/400
Sem comentários