A Ramp Labs apresenta uma nova solução para a partilha de memória entre múltiplos agentes, reduzindo o consumo de tokens em até 65%

GateNews

Notícias do Gate News, a 11 de abril, a empresa de infraestruturas de IA Ramp Labs publicou resultados de investigação «Latent Briefing», permitindo uma partilha eficiente de memória entre sistemas multiagente através da compressão direta da cache KV de grandes modelos. Isto faz uma grande redução do consumo de Tokens sem perda de exatidão. Nas arquiteturas multiagente mais comuns, o orquestrador (Orchestrator) decompõe tarefas e chama repetidamente modelos de trabalhadores (Worker). À medida que a cadeia de inferência se vai tornando mais longa, a quantidade de Tokens cresce de forma exponencial. A ideia central do Latent Briefing é, com o auxílio do mecanismo de atenção, identificar as partes verdadeiramente essenciais no contexto e eliminar informação redundante diretamente na camada de representação, em vez de depender de resumos de LLM que são lentos ou de pesquisas RAG com baixa estabilidade. Nos testes de referência do LongBench v2, o método teve um desempenho notável: o consumo de Tokens do modelo Worker diminuiu 65%, a mediana de Tokens poupados em documentos de comprimento médio (32k a 100k) atingiu 49%, a exatidão global melhorou cerca de 3 pontos percentuais face à linha de base e o tempo adicional para cada compressão foi apenas de cerca de 1,7 segundos, o que equivale a acelerar aproximadamente 20 vezes em relação ao algoritmo original. O experimento usou Claude Sonnet 4 como orquestrador e Qwen3-14B como modelo de trabalhador, cobrindo cenários de documentos variados, como artigos académicos, documentos jurídicos, romances e relatórios governamentais. O estudo também descobriu que o limiar de compressão ideal varia em função da dificuldade da tarefa e do comprimento do documento — para tarefas difíceis, é mais adequado uma compressão mais agressiva para filtrar ruído de inferência oportunista; para documentos longos, é mais apropriada uma compressão mais ligeira para preservar informação-chave dispersa.

Isenção de responsabilidade: As informações contidas nesta página podem ser provenientes de terceiros e não representam os pontos de vista ou opiniões da Gate. O conteúdo apresentado nesta página é apenas para referência e não constitui qualquer aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou o carácter exaustivo das informações e não poderá ser responsabilizada por quaisquer perdas resultantes da utilização destas informações. Os investimentos em ativos virtuais implicam riscos elevados e estão sujeitos a uma volatilidade de preços significativa. Pode perder todo o seu capital investido. Compreenda plenamente os riscos relevantes e tome decisões prudentes com base na sua própria situação financeira e tolerância ao risco. Para mais informações, consulte a Isenção de responsabilidade.

Related Articles

O agente de IA Manfred funda uma empresa e prepara uma carteira de criptomoedas para começar a negociar até ao final de maio

O agente de IA Manfred formou a sua própria empresa e obteve uma carteira cripto, juntamente com credenciais empresariais, para contratar pessoal e fazer pagamentos, de acordo com os relatórios disponíveis. O agente não está previsto para começar a negociar cripto até ao fim de

GateNews1h atrás

A MoonPay Lança o Cartão MoonAgents na Rede Mastercard Sexta-feira

De acordo com a The Block, a MoonPay lançou a MoonAgents Card na sexta-feira — um cartão de débito virtual Mastercard que permite a agentes de IA e aos utilizadores gastar stablecoins diretamente a partir de carteiras onchain. O cartão é emitido através da Monavate, uma plataforma global de pagamentos regulamentada e membro principal da Mastercard, em

GateNews3h atrás

A 137 Ventures fecha $700M em novos fundos, AUM atinge 15 mil milhões de dólares

De acordo com o ChainCatcher, a 137 Ventures, um dos primeiros investidores na SpaceX, concluiu recentemente a recolha de fundos para dois novos fundos, num total superior a 700 milhões de dólares, elevando os seus activos sob gestão para mais de 15 mil milhões de dólares. O novo capital vai apoiar investimentos em agentes de IA, robótica e propulsão espacial

GateNews4h atrás

O Reddit regista um aumento de 16% com fortes perspetivas para o 2.º trimestre; a Apple enfrenta falta de Macs à medida que a procura por IA supera a oferta

As acções da Reddit subiram 16% antes da abertura do mercado na sexta-feira, depois de a empresa ter divulgado uma previsão de receitas para o próximo trimestre superior ao esperado. Os visitantes diários ativos cresceram 17% para 126,8 milhões, enquanto a receita média por utilizador a nível mundial disparou 44%, impulsionada por IA alimentada por

GateNews4h atrás

A Visa lança em Hong Kong, a 1 de maio, o programa Agentic Ready, permitindo pagamentos com agentes de IA

De acordo com a comunicação social de Hong Kong Ming Pao, a Visa lançou o programa Visa Agentic Ready em Hong Kong a 1 de maio, permitindo pagamentos com agentes de IA. O programa tira partido da tokenização, verificação de identidade, gestão de risco e mecanismos de autorização. Os participantes iniciais incluem

GateNews7h atrás

OpenClaw lança a v2026.4.29 a 29 de abril, atualiza a memória para uma Wiki personalizada com acompanhamento de relações

Segundo Beating, o assistente de IA open-source OpenClaw (GitHub com 367 mil estrelas) lançou a versão v2026.4.29 a 29 de abril, assinalando a sua segunda atualização em dois dias. O sistema de memória evoluiu de uma recuperação simples para uma wiki personalizada, permitindo que os agentes construíssem automaticamente perfis de personagens e acompanhassem r

GateNews17h atrás
Comentar
0/400
Nenhum comentário