NVIDIA представила Nemotron 3 Nano Omni — открытый мультимодальный проект

Согласно объявлению NVIDIA в официальном блоге от 28 апреля (автор Kari Briski), NVIDIA представила Nemotron 3 Nano Omni — открытый многомодальный модель, объединяющую визуальные, голосовые и языковые возможности в одном моделe. Цель — обеспечить для систем AI agent более низкую задержку и более низкую стоимость «уровня восприятия».

Ключевые характеристики: 30B-A3B MoE, контекст 256K, 9-кратная пропускная способность, заняла 6 первых мест в рейтингах

Ключевая архитектура:

30B-A3B hybrid mixture-of-experts (общее число параметров 30B, активируемые 3B)

Интеграция Conv3D и EVS кодирования

Длина контекста 256K

Вход: текст, изображение, аудио, видео, документы, диаграммы, GUI-экраны

Выход: текст

Сигналы по производительности: по сравнению с другими открытыми omni-моделями при сопоставимой интерактивности — 9-кратная пропускная способность; во всех трех категориях бенчмарков (smart documents, video understanding, audio understanding) суммарно в шести бенчмарках заняла первое место (в объявлении NVIDIA не приведены конкретные баллы; читателей направляют на разработческий блог, чтобы ознакомиться с детальными данными).

NVIDIA позиционирует Nemotron 3 Nano Omni как «глаза и уши» для агентных систем: она работает в связке с моделями того же семейства — Nemotron 3 Super (высокочастотное выполнение), Nemotron 3 Ultra (сложное планирование) — а также может быть совместима с облачными моделями сторонних разработчиков. Три типичных сценария применения agent:

Агент для управления компьютером (Computer Use Agent): нативное визуальное рассуждение с разрешением 1920×1080

Smart documents: рассуждение по входным данным из разных типов — графики, таблицы, скриншоты и смешанные медиа

Понимание аудио/видео: объединение речи, изображения и записей в единую цепочку вывода

Состав внедряющих: в списке — Foxconn (Hon Hai), Palantir, а также именное заявление CEO H Company

В объявлении NVIDIA четко различает «производственное внедрение» и «на стадии оценки»:

Уже внедрено в производство: Aible, Applied Scientific Intelligence (ASI), Eka Care, Hon Hai (Foxconn), H Company, Palantir, Pyler

На стадии оценки: Amdocs, Dell, Docusign, Infosys, IQVIA, Lila, Oracle, Quantiphi, TCS, Zefr и т.д.

CEO H Company Gautier Cloix в объявлении сделал именное заявление: «To build useful agents, you can’t wait seconds for a model to interpret a screen. By building on Nemotron 3 Nano Omni, our agents can rapidly interpret full HD screen recordings — something that wasn’t practical before.» Перевод: «Чтобы создавать полезные agent’ы, нельзя ждать секунды, пока модель интерпретирует экран. Опираясь на Nemotron 3 Nano Omni, наши агенты могут быстро интерпретировать записи полноэкранного HD — то, что раньше было непрактично».

Стратегия открытого кода и развертывание: веса / датасеты / методы обучения — полностью раскрыты

Во время релиза NVIDIA также опубликовала:

веса модели

обучающий датасет

технологии / методологию обучения

Конвейер развертывания охватывает три слоя:

Локальная рабочая станция: NVIDIA DGX Spark, DGX Station

NIM микросервисы: build.nvidia.com

Платформы третьих сторон: Hugging Face, OpenRouter, а также через 25+ NVIDIA Cloud Partners, провайдеров inference-платформ и облачных сервисов

Индивидуальные инструменты — с помощью NVIDIA NeMo. Семейство Nemotron 3 (Nano/Super/Ultra) за последний год на Hugging Face накопило более 50 000 000 загрузок; в этот раз Omni расширяет возможности этого семейства на многомодальность и агентную область.

Эта статья NVIDIA представила Nemotron 3 Nano Omni с открытым исходным кодом: самый ранний материал появился в Linked News ABMedia.

Отказ от ответственности: Информация на этой странице может поступать от третьих лиц и не отражает взгляды или мнения Gate. Содержание, представленное на этой странице, предназначено исключительно для справки и не является финансовой, инвестиционной или юридической консультацией. Gate не гарантирует точность или полноту информации и не несет ответственности за любые убытки, возникшие от использования этой информации. Инвестиции в виртуальные активы несут высокие риски и подвержены значительной ценовой волатильности. Вы можете потерять весь инвестированный капитал. Пожалуйста, полностью понимайте соответствующие риски и принимайте разумные решения, исходя из собственного финансового положения и толерантности к риску. Для получения подробностей, пожалуйста, обратитесь к Отказу от ответственности.

Связанные статьи

CZ заявил, что YZi Labs выделяет 70% на блокчейн и 20% на ИИ на Consensus Miami 2026

Согласно ChainCatcher, на Consensus Miami 2026 Чжао Чанпэн (CZ) заявил, что YZi Labs направляет 70% финансирования на блокчейн, 20% — на ИИ и 10% — на биотехнологии. CZ добавил, что BNB следует позиционировать как нативную валюту для AI-агентов, а все блокчейны должны быть «AI ready», чтобы поддерживать

GateNews32м назад

Zypher Network интегрирует AIDEN, чтобы повысить доступность знаний о блокчейне

В официальном объявлении IQ AI от 6 мая Zypher Network интегрировала AIDEN — агента искусственного интеллекта, разработанного IQ AI — чтобы повысить доступность знаний о блокчейне и усилить проверяемость в экосистемах, работающих с ИИ. В рамках сотрудничества появилась отдельная страница вики

GateNews34м назад

Virtuals Protocol запускает открытый градиентный Titan Airdrop от OpenGradient и сегодня распределяет 500 тыс. OPG

Согласно официальному объявлению Virtuals Protocol, аирдроп OpenGradient Titan уже запущен — по состоянию на 7 мая. Имеющие право пользователи могут получить токены OPG напрямую из своих аккаунтов Virtuals. Сегодня распределяется в общей сложности 500 000 токенов OPG, чтобы вознаградить участников экосистемы Virtuals

GateNews4ч назад

NeoSoul и AllScale объявляют о стратегическом партнёрстве по агентскому кредиту и расчётам в стейблкоинах сегодня

По данным ChainCatcher, проект NeoSoul из AI Agent Economy объявил сегодня (7 мая) о стратегическом партнёрстве с AllScale, чтобы изучить механизмы формирования кредита и расчётов в стейблкоинах для автономного взаимодействия агентов. Партнёрство будет сосредоточено на автоматизации платёжных потоков между агентами — так

GateNews5ч назад

FIS и Anthropic разрабатывают AI-агентов для борьбы с отмыванием денег, запуская их в BMO и Amalgamated Bank во II полугодии 2026 года

FIS и Anthropic разрабатывают ИИ-агентов, предназначенных для автоматизации расследований финансовых преступлений, начиная с операций по противодействию отмыванию денег. Агент Financial Crimes AI будет извлекать данные из банковских систем, оценивать транзакции на соответствие известным типологиям и помогать следователям при проверке al

GateNews6ч назад

Prime Intellect Lab запускает всеобщую доступность 7 мая, завершив в бета-версии 10 000+ обучающих прогонов

По данным Prime Intellect, платформа Lab компании вышла из бета-версии 7 мая 2026 года, перейдя в режим общей доступности как сквозная среда для обучения самосовершенствующихся AI-агентов. Единый конвейер объединяет рабочие процессы улучшения моделей, позволяя пользователям задавать задачи, настраивать и

GateNews7ч назад
комментарий
0/400
Нет комментариев