Ramp Labs presenta una nueva solución para compartir la memoria entre múltiples agentes, con una reducción máxima del consumo de tokens del 65%

GateNews

Noticias de Gate, 11 de abril, la empresa de infraestructura de IA Ramp Labs publicó resultados de investigación titulados «Latent Briefing», que logran un intercambio de memoria eficiente entre sistemas multiagente mediante la compresión directa de la caché KV de modelos de gran tamaño, reduciendo de forma significativa el consumo de Tokens sin perder precisión. En las arquitecturas multiagente más comunes, el orquestador (Orchestrator) descompone las tareas y llama repetidamente al modelo del trabajador (Worker); a medida que la cadena de inferencia se alarga, el uso de Tokens se expande de manera exponencial. La idea central de Latent Briefing es usar el mecanismo de atención para identificar en el contexto las partes realmente clave, eliminando la información redundante directamente en la capa de representación, en lugar de depender de resúmenes de LLM que son lentos o de la recuperación RAG con poca estabilidad. En el benchmark LongBench v2, el método mostró un rendimiento sobresaliente: el consumo de Tokens del modelo Worker se reduce en 65%, el ahorro de Tokens en documentos de longitud media (32k a 100k) alcanza una mediana del 49%, la precisión global mejora alrededor de 3 puntos porcentuales frente a la línea base, y el tiempo adicional por cada compresión es de solo aproximadamente 1.7 segundos, lo que acelera el proceso unas 20 veces frente al algoritmo original. El experimento utilizó Claude Sonnet 4 como orquestador y Qwen3-14B como modelo de trabajador, cubriendo escenarios de documentos de múltiples tipos, como artículos académicos, documentos legales, novelas e informes gubernamentales. La investigación también encontró que el umbral de compresión óptimo varía según la dificultad de la tarea y la longitud del documento: para tareas difíciles conviene una compresión más agresiva para filtrar el ruido de razonamiento especulativo, mientras que para documentos largos es más adecuado una compresión ligera para conservar información clave dispersa.

Aviso legal: La información de esta página puede proceder de terceros y no representa los puntos de vista ni las opiniones de Gate. El contenido que aparece en esta página es solo para fines informativos y no constituye ningún tipo de asesoramiento financiero, de inversión o legal. Gate no garantiza la exactitud ni la integridad de la información y no se hace responsable de ninguna pérdida derivada del uso de esta información. Las inversiones en activos virtuales conllevan riesgos elevados y están sujetas a una volatilidad significativa de los precios. Podrías perder todo el capital invertido. Asegúrate de entender completamente los riesgos asociados y toma decisiones prudentes de acuerdo con tu situación financiera y tu tolerancia al riesgo. Para obtener más información, consulta el Aviso legal.

Artículos relacionados

El agente expendedor de IA “Valerie” opera una máquina expendedora en San Francisco con OpenClaw

El agente de IA "Valerie" ahora ejecuta una máquina expendedora en San Francisco en OpenClaw, probando hasta qué punto la gente confiará en el código con precios, marketing y efectivo del mundo real. Resumen El agente de IA "Valerie" ejecuta una máquina expendedora física en San Francisco usando el framework OpenClaw, estableciendo precios, nombrando

Cryptonewshace2h

Mastercard habilita los pagos de agentes de IA mediante una asociación con Lobstercash y Crossmint

Mastercard se ha asociado con Lobstercash y Crossmint para facilitar pagos de agentes de IA mediante tarjetas de crédito y débito existentes, integrándose en los sistemas financieros actuales sin necesidad de nuevas billeteras. Esta colaboración permite a los agentes de IA automatizar transacciones, mejorando la eficiencia y la seguridad.

GateNewshace7h

El equipo de China EvoMap enfurece: el Hermes Agent se vuelve viral por la explosión de popularidad, presunta copia: dentro del sistema de autoevolución existen similitudes de alta intensidad

El equipo de China EvoMap acusa al agente Hermes de Nous Research de copiar su arquitectura Evolver/GEP, y sostiene que ambos presentan un alto grado de similitud en varios módulos clave. EvoMap señala que el diseño de Hermes no hace referencia ni da reconocimiento a su contenido previamente publicado; la polémica ha despertado una amplia atención en la comunidad. Parte de los internautas chinos apoya a EvoMap y critica la conducta de copia de Hermes. Aunque el equipo de Nous aún no ha refutado punto por punto las acusaciones, el incidente se ha difundido rápidamente en la opinión pública sobre IA.

ChainNewsAbmediahace7h

OpenAI actualiza Codex a un agente de IA que controla el escritorio, automatizando los flujos de trabajo de desarrollo

El Codex mejorado de OpenAI evoluciona de un asistente de programación a un agente autónomo para entornos de escritorio, capaz de gestionar aplicaciones, automatizar flujos de trabajo e integrarse con más de 100 aplicaciones. Este cambio mejora la continuidad de las tareas y la automatización de flujos de trabajo, reflejando un panorama competitivo en herramientas de codificación con IA.

GateNewshace8h

Agile Soda presenta la plataforma Agentic OCR con 98% de precisión en la clasificación de documentos

Agile Soda lanzó Agentic OCR, una plataforma de automatización de documentos impulsada por IA que elimina la necesidad de preentrenamiento y permite una implementación instantánea. Ofrece alta precisión en la clasificación y la extracción, mejorando continuamente mediante correcciones de los usuarios, con planes de mejoras futuras.

GateNewshace12h

American Express adquirirá en el segundo trimestre de 2026 la startup de gastos con IA Hyper

American Express adquirirá la startup de IA Hyper para mejorar sus herramientas de gestión de gastos para clientes empresariales. La adquisición, que se espera que se cierre en el segundo trimestre de 2026, sigue a una asociación que lanzó en 2024 una tarjeta de recompensas co-brandeada.

GateNewshace13h
Comentar
0/400
Sin comentarios