Ответственный за большую модель Xiaomi: когда конкуренция в ИИ переходит в эпоху агентов, саморазвитие — ключевое событие для AGI

AI自進化

Руководитель команды по большим моделям Xiaomi Луо Фули 24 апреля на платформе Bilibili провела углублённое интервью (номер видео: BV1iVoVBgERD); длительность интервью — 3,5 часа. Это её первое публичное систематическое изложение технических взглядов в качестве технического руководителя. Луо Фули сказала, что конкуренция в направлении больших моделей уже перешла из эпохи Chat в эпоху Agent, и указала, что «самоэволюция» станет ключевым событием для AGI в ближайший год.

От эпохи Chat к эпохе Agent: ключевые технические суждения

小米大模型團隊負責人羅福莉訪談

(Источник: Bilibili)

Согласно тому, что Луо Фули заявила в своём интервью на Bilibili, она отметила, что в 2026 году акцент конкуренции больших моделей сместится с качества универсального диалога на способность к непрерывному автономному выполнению сложных задач. В ходе интервью она сказала, что сейчас топовые модели уже могут автономно оптимизироваться для конкретных задач и стабильно выполнять их в течение 2–3 дней, не требуя вмешательства человека для настройки. В интервью она подчеркнула, что прорыв в способности «самоэволюции» означает, что AI-системы начинают обладать возможностью самокоррекции, и назвала технологические траектории Anthropic, а также такие технические переменные, как Claude Opus 4.6, которые влияют на всю экосистему AI.

Пересмотр соотношения вычислительных ресурсов Xiaomi и оценка разницы в Pre-train

Согласно раскрытию Луо Фули в интервью, Xiaomi уже провела существенные изменения в стратегии распределения вычислительных ресурсов. Она пояснила, что обычно в отрасли соотношение вычислительных ресурсов составляет Pre-train:Post-train:Inference = 3:5:1, тогда как текущая стратегия Xiaomi была скорректирована до 3:1:1 — существенно сжата доля вычислений на дообучение при одновременном повышении вложений ресурсов на этапе вывода.

В интервью она объяснила, что этот сдвиг обусловлен зрелостью стратегии Agent RL Scaling: послеобучение больше не требует наращивания больших объёмов вычислительной мощности, а увеличение ресурсов на стороне вывода отражает потребность прикладных сценариев Agent в возможностях оперативного реагирования.

Что касается проблемы отставания отечественных больших моделей по Pre-train, в интервью Луо Фули заявила, что этот разрыв сократился с прежних 3 лет до нескольких месяцев, а текущий фокус стратегии движется в сторону Agent RL Scaling. Её карьерный путь включает Институт Дамo в Alibaba, Fangfang Quant и DeepSeek (ведущий разработчик DeepSeek-V2); в ноябре 2025 года она присоединилась к Xiaomi.

Технические спецификации серии MiMo-V2 и позиционирование в открытом рейтинге

Согласно объявлению серии MiMo-V2, опубликованному официально Xiaomi 19 марта 2026 года, на этот раз за один выпуск представлены три модели:

MiMo-V2-Pro:число параметров — 兆总參數, включаемые параметры — 42B, архитектура гибридного внимания, поддержка контекста в миллионы, уровень выполнения задач — 81%

MiMo-V2-Omni:сценарии Agent во всех модальностях

MiMo-V2-TTS:сценарии синтеза речи

Согласно объявлению, открытая версия MiMo-V2-Flash заняла второе место в мировом рейтинге открытых моделей, а скорость вывода достигла 3-кратного показателя DeepSeek-V3.2.

Часто задаваемые вопросы

Как Луо Фули определяет «самоэволюцию» и почему считает её самым ключевым событием для AGI?

Согласно заявлению Луо Фули в интервью на Bilibili от 24 апреля 2026 года (BV1iVoVBgERD), в интервью она отметила, что сейчас топовые модели уже могут автономно оптимизироваться в рамках конкретных задач и стабильно выполнять их в течение 2–3 дней без вмешательства человека, а «самоэволюцию» охарактеризовала как самое ключевое событие для развития AGI в ближайший год.

Какие конкретные изменения Xiaomi внесла в соотношение вычислительных ресурсов и в чём логика?

Согласно раскрытию Луо Фули в интервью, соотношение вычислительных ресурсов Xiaomi было изменено с обычно принятого в отрасли Pre-train:Post-train:Inference = 3:5:1 на 3:1:1, — существенно сжата доля вычислений на дообучение; она объяснила, что эта корректировка связана с повышением эффективности послеобучения после зрелости стратегии Agent RL Scaling, а также с потребностью в возможностях оперативного реагирования на стороне вывода со стороны сценариев внедрения Agent.

Какова позиция MiMo-V2-Flash в открытом рейтинге и как проявляется его скорость?

Согласно официальному объявлению Xiaomi от 19 марта 2026 года, открытая версия MiMo-V2-Flash заняла второе место в мировом рейтинге открытых моделей; скорость вывода в 3 раза выше, чем у DeepSeek-V3.2, а уровень выполнения задач у флагманской версии MiMo-V2-Pro составляет 81%.

Отказ от ответственности: Информация на этой странице может поступать от третьих лиц и не отражает взгляды или мнения Gate. Содержание, представленное на этой странице, предназначено исключительно для справки и не является финансовой, инвестиционной или юридической консультацией. Gate не гарантирует точность или полноту информации и не несет ответственности за любые убытки, возникшие от использования этой информации. Инвестиции в виртуальные активы несут высокие риски и подвержены значительной ценовой волатильности. Вы можете потерять весь инвестированный капитал. Пожалуйста, полностью понимайте соответствующие риски и принимайте разумные решения, исходя из собственного финансового положения и толерантности к риску. Для получения подробностей, пожалуйста, обратитесь к Отказу от ответственности.

Связанные статьи

a16z запустила пятый фонд на 2,2 миллиарда долларов и возглавила раунд инвестиций в три AI-стартапа

5 мая a16z (Andreessen Horowitz) объявила, что инвестиционная компания официально запустила пятый фонд, ориентированный на криптовалюты, «Crypto Fund 5». Объём привлечённых средств составил 2,2 миллиарда долларов. Одновременно a16z сообщила, что выступит ведущим инвестором в финансировании компаний по интеграции ИИ Tessera Labs, AI-платформы для подбора персонала Ethos и платформы для AI-создания контента Glif.

MarketWhisper8м назад

Основатель Cardano: AI-агенты превзойдут активность людей в интернете к 2035 году, нарушив модели, основанные на рекламе

По данным CoinDesk, основатель Cardano Чарльз Хоскинсон на конференции Consensus 7 мая спрогнозировал, что AI-агенты к 2035 году превзойдут человеческую активность в интернет-поиске, коммерции и транзакциях. Поскольку AI-агенты не кликают по рекламе и не демонстрируют предпочтений к брендам, Хоскинсон сказал это w

GateNews3ч назад

Руководитель Claude Code Борис: ИИ-агенты повышают производительность людей и переписывают историю разработки программного обеспечения

Руководитель Claude Code Борис Черны в интервью CNBC отметил, что инструменты для AI-агентов, такие как Co-Work, могут передавать ИИ рутинные задачи, а инженеры из операторов превращаются в наставников; это позволяет одновременно запускать несколько агентов для отладки, заметно повышая производительность. Компании должны перестроить процессы, рассматривая AI как центральное звено; AI демонстрирует ценность во всех отраслях. Разработка ПО сместится от написания к совместной работе, где логика и диалог задают направление, технический порог снизится, а инновации и стартапы начнут расти взрывными темпами.

ChainNewsAbmedia4ч назад

Рид Хоффман: NFT могут вернуться, поскольку AI-агентам нужен криптодоверие

Рид Хоффман, партнер в Greylock и сооснователь LinkedIn, заявил, что автономным агентам понадобятся основанные на криптографии системы доверия, чтобы проводить сделки через открытый интернет, предположив, что NFT могут вернуться, об этом говорится в его заявлении. AI-агенты и инфраструктура доверия Замечания Хоффмана указывают на потенциальное

CryptoFrontier5ч назад

IBM расширяет набор корпоративных AI-инструментов с новыми агентными решениями на Think 2026

По данным IBM, компания объявила о расширении своих корпоративных возможностей ИИ на конференции Think 2026 в Бостоне, запуская новые агентные инструменты, чтобы помочь организациям внедрять искусственный интеллект в повседневные операции. Context Studio, теперь доступный в общем пользовании, позволяет предприятиям

GateNews6ч назад

Мечты Claude от Anthropic: агент сам упорядочивает память между задачами, устраняет дубликаты и противоречия

Anthropic на мероприятии Code with Claude объявила Dreams: чтобы Claude Managed Agents автоматически систематизировали воспоминания, устраняли дубликаты и противоречия между несколькими сессиями, а также обновляли устаревшие записи, выводя проверяемую сводную базу воспоминаний; входной лимит — 100 сессий и 4 096 символов, асинхронное выполнение, занимает от нескольких минут до нескольких десятков минут, поддерживает наблюдение в режиме стриминга. Исследовательский превью-тест нужно подать отдельно; пока что доступна только поддержка claude-opus-4-7 и claude-sonnet-4-6, дата официального релиза не определена.

ChainNewsAbmedia9ч назад
комментарий
0/400
Нет комментариев