
Во время выступления генерального директора Nvidia Дженсена Хуана на GTC Taipei 2026 он подробно изложил архитектурное определение AI Agent: большая языковая модель (LLM) отвечает за мышление, рассуждение и планирование, а внешний оркестратор (harness) действует как операционная система — соединяет модель с такими инструментами, как электронные таблицы, браузер и базы данных, и управляет рабочей памятью и долговременной памятью.
Архитектурное определение AI Agent: большая модель плюс оркестратор
В своём выступлении Хуанг разделил ключевую структуру AI Agent на две части: большая языковая модель как «центр мышления», отвечающая за рассуждение и планирование; внешний оркестратор, играющий роль операционной системы, который соединяет модель с разными типами инструментов и одновременно управляет краткосрочной рабочей памятью и долговременной памятью.
Он отметил, что такая архитектура означает фундаментальный сдвиг в способе вычислений, а не просто обновление инструментов для повышения эффективности. Во время демонстрации на сцене он упомянул: «Мы здесь используем Claude Code, но Codex тоже показывает отличные результаты».
Три подтверждённых кейса на GTC Taipei
На выступлении Хуанг показал три примера AI Agent: во‑первых, через подсказку на естественном языке сразу генерируется полный код приложения; во‑вторых, после ввода текстового описания Agent в реальном времени сгенерировал динамическую анимацию частиц на тему «Taipei 101 → GTC Taipei 2026 → логотип NVIDIA»; в‑третьих, на сцене он сфотографировал пульт с отсутствующей прищепкой для батарейки — Agent автоматически вызвал CAD‑инструмент и сгенерировал файл с заменяющей деталью, пригодный для 3D‑печати.
Опровержение тезиса о крахе ПО: «Сейчас — лучшее время для софтверных компаний»
Отвечая на распространявшиеся заявления о том, что «AI Agent приведёт к банкротству софтверных компаний», Хуанг чётко возразил: «Как раз наоборот». Он сказал, что когда работа больше не ограничена количеством людей, тысячи Agent будут использовать больше программных инструментов, чем люди: «сейчас — лучшее время для софтверных компаний», но при условии, что программное обеспечение должно быть спроектировано и представлено так, чтобы Agent мог напрямую вызывать его. Библиотека CUDA X от Nvidia полностью открыта для использования Agent, а эффективность использования Agent даже выше, чем у человеческих разработчиков.
Частые вопросы
Чем AI Agent, определённый Хуаном, принципиально отличается от традиционных софтверных приложений?
AI Agent, который Хуанг определил на GTC Taipei 2026, состоит из LLM (рассуждение и планирование) и оркестратора (соединение инструментов + управление памятью). Традиционное ПО — это «запуск — клики — ввод» со стороны пользователя, а режим Agent — «описать AI намерение, и AI автоматически генерирует код, вызывает инструменты и выводит результат», при этом операционный субъект смещается от человека к самому AI.
Что показывает пример с 3D‑печатным держателем батарейки для пульта?
Эта демонстрация на сцене продемонстрировала способность Agent вызывать множество инструментов: Agent распознал проблему на фото (отсутствует держатель батарейки), понял потребность (нужна замена детали), вызвал CAD‑инструмент для моделирования и сразу выдал файл, пригодный для 3D‑печати. Тем самым получился полный рабочий процесс от распознавания проблемы до решения, без необходимости в пошаговом вмешательстве человека.
Что означает полное открытие CUDA X для Agent?
Хуанг объявил, что библиотека CUDA X от Nvidia полностью открыта для AI Agent, и что эффективность использования Agent превосходит эффективность человеческих разработчиков. Это означает, что ключевая инфраструктура AI‑ускорения Nvidia официально расширяется до экосистемы разработки Agent, предоставляя разработчикам более эффективную основу для вызова инструментов.