
Компанія Alibaba цього тижня опублікувала модель серії Qwen3.7-Plus Qwen: вхідне ціноутворення — 0,40 долара за 1 млн token, вихідне — 1,60 долара за 1 млн token; разом — 2,00 долара. Це на 80% нижче за Qwen3.7-Max; вхідне ціноутворення для кешу може бути знижене до 0,04 долара за 1 млн token. Цільові сценарії — високочастотні повторювані завдання.
Qwen3.7-Plus: підтверджені розцінки — ставки для різних режимів оплати
Згідно з офіційно опублікованими Alibaba матеріалами щодо ціноутворення:
Звичайне введення: 0,40 долара за 1 млн token
Звичайний вивід: 1,60 долара за 1 млн token
Разом (введення + вивід): 2,00 долара
Вхід для кешу: 0,04 долара за 1 млн token (застосовується для сценаріїв agent, де потрібне повторне зчитування однакових програмних репозиторіїв або корпоративних UI)
Об’єкт порівняння: Qwen3.7-Max — введення 2,50 долара, вивід 7,50 долара, разом 10,00 долара. Китайські конкуренти, MiniMax-M3, у межах обмеженої промо-акції пропонують разом 1,50 долара; ціноутворення Qwen3.7-Plus щільно прив’язане до цього рівня.
Офіційні базові тестові цифри (самооцінка)
Нижче наведені базові тестові цифри Qwen3.7-Plus, оприлюднені Alibaba; це дані самооцінки:
Terminal Bench 2.0-Terminus: 70,3 (DeepSeek-V4-Pro Max — 67,9, Gemini-3.1 Pro — 63,5)
ScreenSpot Pro (комп’ютерний зір і розуміння інтерфейсів): 79,0 (GPT-5.4 xhigh — 67,4, Claude-Opus-4.6 — 49,5)
Варто зазначити, що офіційна документація Alibaba також пояснює: загальна продуктивність Qwen3.7-Plus усе ще нижча за більшість провідних американських закритих моделей. Наведені цифри — це порівняння для конкретних завдань в одній точці й не відображають повної картини.
Вплив підтвердження закритого розгортання: міркування щодо комплаєнсу та обмеження придатності
Qwen3.7-Plus не надає завантажувані відкриті ваги моделей. Усі виклики API мають проходити через міжнародні вузли Alibaba Cloud, а дані циркулюють за межами власних серверів користувача. За цією архітектурою визначені чіткі бар’єри комплаєнсу для таких сценаріїв:
Галузі з обмеженнями на суверенність даних або регуляторними вимогами: медицина (HIPAA, GDPR), оборона, державні установи. Потрібно оцінити, чи відповідає маршрутизація через зовнішній API вимогам комплаєнсу
Сценарії із ізольованим внутрішнім контуром (on-premise): неможливо розгорнути у середовищі з повною ізоляцією
Натомість перевага режиму закритого API полягає в тому, що не потрібно самостійно купувати й підтримувати апаратну інфраструктуру для багатьох GPU-зібрань (наприклад, Nvidia H100). Також формат, сумісний з OpenAI, мінімізує витрати на адаптацію наявної інфраструктури.
Поширені запитання
Для яких сценаріїв підходить кеш-ціна 0,04 долара за 1 млн token у Qwen3.7-Plus?
Кеш-ціноутворення застосовується у сценаріях, коли agent багаторазово читає ті самі дані на вході, наприклад під час тривалого доступу до одного й того самого репозиторію коду, використання фіксованих шаблонів корпоративного UI або коли системні підказки тривалий час залишаються незмінними. У великих робочих процесах із високою частотою й повторюваністю механізм кешу може істотно зменшити загальні витрати на API. Alibaba не опублікувала конкретні гарантії щодо частки кеш-попадань або деталізацію обмежень використання.
У чому основна різниця між Qwen3.7-Plus та попередніми відкритими версіями Qwen із ліцензією?
Раніше серія Qwen виходила з ліцензією Apache 2.0 та надавала завантажувані ваги моделей, що дозволяло будь-кому розгортати їх локально, виконувати мікро-налаштування та інтегрувати в власні системи. Qwen3.7-Plus доступний лише через API Alibaba Cloud: він не публікує ваги моделей, отже неможливо розгорнути їх локально або в ізольованій мережі; усе використання залежить від зовнішньої інфраструктури Alibaba Cloud.
Як слід трактувати довіру до офіційних базових тестових цифр Qwen3.7-Plus?
В офіційних поясненнях Qwen3.7-Plus прямо зазначено, що прогонки для Terminal Bench і ScreenSpot Pro — це цифри самооцінки Alibaba, і що загальна продуктивність усе ще нижча за більшість провідних американських закритих моделей. Базові тестові цифри відображають одноточкову продуктивність у межах конкретних завдань і не означають фактичної наскрізної затримки, стабільності або повної продуктивності в умовах реального виробництва.