Ramp Labs выдвигает новое решение для совместного использования памяти мультиагентами, при этом расход токенов снижается максимум на 65%

Новости Gate News: 11 апреля компания по инфраструктуре ИИ Ramp Labs опубликовала результаты исследования «Latent Briefing». Они достигаются за счет прямого сжатия KV-кэша больших языковых моделей для эффективного обмена памятью между многоагентными системами — при этом точность не снижается, а потребление токенов существенно уменьшается. В большинстве распространенных архитектур многоагентных систем оркестратор (Orchestrator) разбивает задачу и многократно вызывает модели рабочих (Worker). По мере того как цепочка рассуждений постоянно удлиняется, количество токенов растет экспоненциально. Ключевая идея Latent Briefing — использовать механизм внимания, чтобы выявлять в контексте действительно важные части, а на уровне представлений напрямую отбрасывать избыточную информацию, а не полагаться на LLM-сводки, которые работают медленно, или на RAG-поиск, который отличается нестабильностью. На бенчмарке LongBench v2 этот подход показал впечатляющие результаты: потребление токенов у модели Worker снизилось на 65%, для документов средней длины (от 32k до 100k) медианный объем сэкономленных токенов составил 49%, общая точность относительно базовой линии выросла примерно на 3 процентных пункта, при этом дополнительное время на каждое сжатие — лишь около 1,7 секунды, что ускоряет исходный алгоритм примерно в 20 раз. Эксперименты проводились с Claude Sonnet 4 в роли оркестратора и Qwen3-14B в роли модели рабочего, охватывая разнообразные сценарии документов, включая научные статьи, юридические документы, романы и правительственные отчеты. Исследование также выявило, что оптимальные пороги сжатия зависят от сложности задачи и длины документа: для сложных задач подходит более агрессивное сжатие, чтобы отфильтровать спекулятивный шум рассуждений, а для длинных документов лучше применять более легкое сжатие, чтобы сохранить разрозненные ключевые сведения.

Отказ от ответственности: Информация на этой странице может поступать от третьих лиц и не отражает взгляды или мнения Gate. Содержание, представленное на этой странице, предназначено исключительно для справки и не является финансовой, инвестиционной или юридической консультацией. Gate не гарантирует точность или полноту информации и не несет ответственности за любые убытки, возникшие от использования этой информации. Инвестиции в виртуальные активы несут высокие риски и подвержены значительной ценовой волатильности. Вы можете потерять весь инвестированный капитал. Пожалуйста, полностью понимайте соответствующие риски и принимайте разумные решения, исходя из собственного финансового положения и толерантности к риску. Для получения подробностей, пожалуйста, обратитесь к Отказу от ответственности.

Связанные статьи

AI-вендинг-агент «Валери» управляет вендинговым автоматом в Сан-Франциско с OpenClaw

AI-агент «Valerie» теперь управляет вендинговым автоматом в Сан-Франциско на OpenClaw, проверяя, насколько далеко люди готовы доверять коду с ценообразованием, маркетингом и реальными наличными. Краткое содержание AI-агент «Valerie» запускает физический вендинговый автомат в Сан-Франциско с использованием фреймворка OpenClaw, устанавливая цены, давая названия

Cryptonews2ч назад

Mastercard дает возможность платежам с ИИ-агентами благодаря партнерству с Lobstercash и Crossmint

Mastercard объединилась с Lobstercash и Crossmint, чтобы облегчить платежи с помощью ИИ-агентов через существующие кредитные и дебетовые карты, интегрируясь в текущие финансовые системы без необходимости в новых кошельках. Это партнерство позволяет ИИ автоматизировать транзакции, повышая эффективность и безопасность.

GateNews7ч назад

Китайская команда EvoMap в ярости: резкий рост Hermes Agent и плагиат — в системе самоэволюции есть высокая степень сходства

Команда из Китая EvoMap обвиняет Hermes Agent компании Nous Research в плагиате их архитектуры Evolver/GEP, считая, что обе системы имеют высокую степень сходства по нескольким ключевым модулям. EvoMap указывает, что дизайн Hermes не ссылается и не выражает признательность за ранее опубликованные ими материалы; спор вызвал широкий общественный интерес в сообществе. Часть китайских пользователей поддержала EvoMap и раскритиковала действия Hermes по копированию. Хотя команда Nous Research еще не опровергла обвинения по пунктам, событие быстро распространилось в дискуссиях об ИИ.

ChainNewsAbmedia8ч назад

OpenAI обновляет Codex до ИИ-агента, который управляет рабочим столом и автоматизирует процессы разработки

Обновлённый Codex от OpenAI развивается от инструмента для написания кода до автономного агента для настольных сред: он способен управлять приложениями, автоматизировать рабочие процессы и интегрироваться более чем с 100 приложениями. Такой сдвиг повышает непрерывность задач и автоматизацию рабочих процессов, отражая конкурентный ландшафт в инструментах ИИ для написания кода.

GateNews8ч назад

Agile Soda запускает платформу Agentic OCR с точностью классификации документов 98%

Agile Soda запустила Agentic OCR — платформу автоматизации документов, управляемую агентными ИИ-решениями: она устраняет необходимость в предварительном обучении и позволяет выполнять мгновенное развертывание. Платформа обеспечивает высокую точность классификации и извлечения, постоянно улучшаясь за счет исправлений пользователей; в планах — дальнейшие улучшения.

GateNews12ч назад

American Express планирует приобрести ИИ-стартап Hyper по управлению расходами во II квартале 2026 года

American Express приобретет ИИ-стартап Hyper, чтобы расширить инструменты управления расходами для корпоративных клиентов. Ожидается, что сделка будет завершена во II квартале 2026 года. Она последовала за партнерством, которое в 2024 году запустило кобрендовую бонусную карту.

GateNews13ч назад
комментарий
0/400
Нет комментариев