#GateSquareDaily #Deepseek #AIPriceWar #AIAgents
Ціна AI-війну розігріває
DeepSeek V4 знижує ціни на ринку, і ефекти вже проявляються
Новий фронт відкрився у гонці штучного інтелекту, і він не про бенчмарки. Це про ціну.
24 квітня 2026 року компанія DeepSeek із Ханчжоу випустила попередні версії сімейства моделей V4: V4-Pro та V4-Flash. Обидві мають відкриту вагу, ліцензію MIT і підтримують контекстне вікно на 1 мільйон токенів. Головна новина — це вартість.
1. Наскільки агресивне зниження?
Ціноутворення API DeepSeek оновлює мінімум для моделей класу фронтір:
• V4-Flash: 0,14 долара за мільйон вхідних токенів, 0,28 долара за мільйон вихідних токенів • V4-Pro: 1,74 долара за мільйон вхідних токенів, 3,48 долара за мільйон вихідних токенів
Порівняйте з поточними лідерами США: GPT-5.5 коштує $5 за вхід / $30 за вихід на мільйон токенів, тоді як Claude Opus 4.6 — $25 за мільйон вихідних токенів. Gemini 3.1 Pro — $2 за вхід / $12 за вихід.
Простими словами: V4-Pro приблизно у сім разів дешевше за Claude Opus 4.6 і майже у дев’ять разів дешевше за GPT-5.5 за вихідними токенами. V4-Flash у 12,4 рази дешевше за Pro, при цьому відстає лише на 1,6 пункту у SWE-bench Verified. Для розробників це різниця між 4-місячним бюджетом на AI, який вистачає на 7 років при тому ж рівні використання.
Компанія заявила, що V4-Pro « відповідає провідним моделям у кількох сферах» і покращує можливості агентів для багатоступеневих завдань. Незалежне тестування показує 80,6% на SWE-bench Verified, що на 0,2 пункту менше за Claude Opus 4.6. Вона лідирує на LiveCodeBench з показником 93,5%.
2. Чому це важливо: три точки тиску
Можливе прискорення впровадження
За 0,28 долара за мільйон вихідних токенів V4-Flash робить життєздатними високовольтні сценарії використання: обробка документів, аналіз кодової бази, цикли агентів. Стартапи, які через ціну не могли дозволити собі GPT-5-класу розуміння, тепер можуть запускати виробничі навантаження за 1/10 вартості. Контекст на 1 мільйон токенів означає, що цілі репозиторії коду або юридичні документи поміщаються в один запит.
Конкуренти стикаються з стисненням маржі
Західні лабораторії вже підвищують ціни і обмежують використання для управління попитом. Рух DeepSeek змушує зробити вибір: знизити ціни і звузити маржу або поступитися увагою розробників. Різниця у цінах — не 10% або 20%, а 7-9 разів за вихідними токенами. Для компаній, що створюють агентські робочі процеси, вартість токена тепер — це стаття витрат, а не дрібниця.
Наратив про AI отримує додаткове підживлення, включаючи крипто-AI
Дешева інференція змінює економіку AI-агентів. Якщо ви можете запускати модель з 1,6 трильйона параметрів за 3,48 долара за мільйон вихідних токенів, то агентські мережі, децентралізовані інференційні мережі та проєкти з AI-токенами раптово отримують шлях до сталих одиничних витрат. V4 має ліцензію MIT і відкриту вагу, тобто будь-хто з GPU може самостійно хостити. Це усуває залежність від постачальника і відповідає тезі криптовалютної композиційності.
Обладнання теж відіграє роль. Huawei у той самий день оголосила про повну підтримку V4 на своїх чипах Ascend 950. DeepSeek підтвердила модель на GPU Nvidia та NPU Huawei Ascend. Компанія заявила, що ціни на Pro можуть різко знизитися, коли суперноді Ascend 950 почнуть масштабно розгортатися у другій половині 2026 року. Внутрішній китайський AI-стек — моделі та чипи — знижує витрати ще більше і зменшує залежність від американського обладнання.
3. Вибір між компромісами
V4-Pro не найкраща у всьому. На SWE-bench Pro, що оцінює реальні завдання програмної інженерії, Opus 4.7 лідирує з 64,3% проти 55,4% у V4-Pro. У завданнях глибокого мислення GPT-5.5 все ще має перевагу. DeepSeek визнає, що «обмеження високопродуктивних обчислювальних потужностей» обмежують пропускну здатність Pro при запуску.
І є регуляторний контекст: за день до запуску V4 Державний департамент США попередив світ про нібито китайське дистиляція американських моделей AI. OpenAI та Anthropic звинуватили DeepSeek у дистиляції їхніх моделей. DeepSeek не коментувала ці звинувачення.
4. Що далі
1. Пілоти для підприємств: очікуйте повторного аналізу ROI керівниками фінансів. Якщо V4-Pro дає 95% можливостей за 10% вартості, «достатньо добре» стане перемогою для багатьох завдань. 2. Момент відкритого коду: з 1,6 трильйонами параметрів, ліцензією MIT і вагами Hugging Face, V4 стає найбільшою відкритою моделлю. Тонка настройка і приватне розгортання стають простішими. 3. Диверсифікація обладнання: повна підтримка Ascend сигналізує про зрілість китайського AI-стека. Якщо Huawei масово запустить, китайські розробники зможуть будувати без Nvidia. 4. Відповідь на ціну: слідкуйте за OpenAI, Anthropic і Google. Утримання ціни при досягненні 80,6% на SWE-bench при 1/9 цінової політики — не стабільний баланс.
Це ціна війна, але й стратегічна зміна. DeepSeek V4 не претендує на перемогу над GPT-5.5 або Claude Opus 4.7 у кожному бенчмарку. Вона стверджує, що близько до них, відкрита і радикально дешевша. За останні два роки припускалося, що фронтір-моделі потребують фронтір-бюджетів. V4 розриває цю зв’язку.
Якщо впровадження йде за ціною, тоді попит на інференцію, використання агентів і AI-застосунки — включаючи крипто-AI токени — зростають. Конкуренти змушені відповідати за вартістю, а не лише за можливостями. І наратив, що передовий AI має працювати лише на американських чипах, отримав контрприклад.
Ця AI-війна вже не лише про те, хто має найрозумнішу модель. Вона про те, хто робить інтелект доступним.
Ціна AI-війну розігріває
DeepSeek V4 знижує ціни на ринку, і ефекти вже проявляються
Новий фронт відкрився у гонці штучного інтелекту, і він не про бенчмарки. Це про ціну.
24 квітня 2026 року компанія DeepSeek із Ханчжоу випустила попередні версії сімейства моделей V4: V4-Pro та V4-Flash. Обидві мають відкриту вагу, ліцензію MIT і підтримують контекстне вікно на 1 мільйон токенів. Головна новина — це вартість.
1. Наскільки агресивне зниження?
Ціноутворення API DeepSeek оновлює мінімум для моделей класу фронтір:
• V4-Flash: 0,14 долара за мільйон вхідних токенів, 0,28 долара за мільйон вихідних токенів • V4-Pro: 1,74 долара за мільйон вхідних токенів, 3,48 долара за мільйон вихідних токенів
Порівняйте з поточними лідерами США: GPT-5.5 коштує $5 за вхід / $30 за вихід на мільйон токенів, тоді як Claude Opus 4.6 — $25 за мільйон вихідних токенів. Gemini 3.1 Pro — $2 за вхід / $12 за вихід.
Простими словами: V4-Pro приблизно у сім разів дешевше за Claude Opus 4.6 і майже у дев’ять разів дешевше за GPT-5.5 за вихідними токенами. V4-Flash у 12,4 рази дешевше за Pro, при цьому відстає лише на 1,6 пункту у SWE-bench Verified. Для розробників це різниця між 4-місячним бюджетом на AI, який вистачає на 7 років при тому ж рівні використання.
Компанія заявила, що V4-Pro « відповідає провідним моделям у кількох сферах» і покращує можливості агентів для багатоступеневих завдань. Незалежне тестування показує 80,6% на SWE-bench Verified, що на 0,2 пункту менше за Claude Opus 4.6. Вона лідирує на LiveCodeBench з показником 93,5%.
2. Чому це важливо: три точки тиску
Можливе прискорення впровадження
За 0,28 долара за мільйон вихідних токенів V4-Flash робить життєздатними високовольтні сценарії використання: обробка документів, аналіз кодової бази, цикли агентів. Стартапи, які через ціну не могли дозволити собі GPT-5-класу розуміння, тепер можуть запускати виробничі навантаження за 1/10 вартості. Контекст на 1 мільйон токенів означає, що цілі репозиторії коду або юридичні документи поміщаються в один запит.
Конкуренти стикаються з стисненням маржі
Західні лабораторії вже підвищують ціни і обмежують використання для управління попитом. Рух DeepSeek змушує зробити вибір: знизити ціни і звузити маржу або поступитися увагою розробників. Різниця у цінах — не 10% або 20%, а 7-9 разів за вихідними токенами. Для компаній, що створюють агентські робочі процеси, вартість токена тепер — це стаття витрат, а не дрібниця.
Наратив про AI отримує додаткове підживлення, включаючи крипто-AI
Дешева інференція змінює економіку AI-агентів. Якщо ви можете запускати модель з 1,6 трильйона параметрів за 3,48 долара за мільйон вихідних токенів, то агентські мережі, децентралізовані інференційні мережі та проєкти з AI-токенами раптово отримують шлях до сталих одиничних витрат. V4 має ліцензію MIT і відкриту вагу, тобто будь-хто з GPU може самостійно хостити. Це усуває залежність від постачальника і відповідає тезі криптовалютної композиційності.
Обладнання теж відіграє роль. Huawei у той самий день оголосила про повну підтримку V4 на своїх чипах Ascend 950. DeepSeek підтвердила модель на GPU Nvidia та NPU Huawei Ascend. Компанія заявила, що ціни на Pro можуть різко знизитися, коли суперноді Ascend 950 почнуть масштабно розгортатися у другій половині 2026 року. Внутрішній китайський AI-стек — моделі та чипи — знижує витрати ще більше і зменшує залежність від американського обладнання.
3. Вибір між компромісами
V4-Pro не найкраща у всьому. На SWE-bench Pro, що оцінює реальні завдання програмної інженерії, Opus 4.7 лідирує з 64,3% проти 55,4% у V4-Pro. У завданнях глибокого мислення GPT-5.5 все ще має перевагу. DeepSeek визнає, що «обмеження високопродуктивних обчислювальних потужностей» обмежують пропускну здатність Pro при запуску.
І є регуляторний контекст: за день до запуску V4 Державний департамент США попередив світ про нібито китайське дистиляція американських моделей AI. OpenAI та Anthropic звинуватили DeepSeek у дистиляції їхніх моделей. DeepSeek не коментувала ці звинувачення.
4. Що далі
1. Пілоти для підприємств: очікуйте повторного аналізу ROI керівниками фінансів. Якщо V4-Pro дає 95% можливостей за 10% вартості, «достатньо добре» стане перемогою для багатьох завдань. 2. Момент відкритого коду: з 1,6 трильйонами параметрів, ліцензією MIT і вагами Hugging Face, V4 стає найбільшою відкритою моделлю. Тонка настройка і приватне розгортання стають простішими. 3. Диверсифікація обладнання: повна підтримка Ascend сигналізує про зрілість китайського AI-стека. Якщо Huawei масово запустить, китайські розробники зможуть будувати без Nvidia. 4. Відповідь на ціну: слідкуйте за OpenAI, Anthropic і Google. Утримання ціни при досягненні 80,6% на SWE-bench при 1/9 цінової політики — не стабільний баланс.
Це ціна війна, але й стратегічна зміна. DeepSeek V4 не претендує на перемогу над GPT-5.5 або Claude Opus 4.7 у кожному бенчмарку. Вона стверджує, що близько до них, відкрита і радикально дешевша. За останні два роки припускалося, що фронтір-моделі потребують фронтір-бюджетів. V4 розриває цю зв’язку.
Якщо впровадження йде за ціною, тоді попит на інференцію, використання агентів і AI-застосунки — включаючи крипто-AI токени — зростають. Конкуренти змушені відповідати за вартістю, а не лише за можливостями. І наратив, що передовий AI має працювати лише на американських чипах, отримав контрприклад.
Ця AI-війна вже не лише про те, хто має найрозумнішу модель. Вона про те, хто робить інтелект доступним.




