Ціна Ali Qwen3.7-Plus скорочена на 80%: перехід на закритий код заради нижчих витрат

2026-06-03 05:14:01

Компанія Alibaba цього тижня опублікувала модель серії Qwen3.7-Plus Qwen: вхідне ціноутворення — 0,40 долара за 1 млн token, вихідне — 1,60 долара за 1 млн token; разом — 2,00 долара. Це на 80% нижче за Qwen3.7-Max; вхідне ціноутворення для кешу може бути знижене до 0,04 долара за 1 млн token. Цільові сценарії — високочастотні повторювані завдання.

Qwen3.7-Plus: підтверджені розцінки — ставки для різних режимів оплати

Згідно з офіційно опублікованими Alibaba матеріалами щодо ціноутворення:

Звичайне введення: 0,40 долара за 1 млн token

Звичайний вивід: 1,60 долара за 1 млн token

Разом (введення + вивід): 2,00 долара

Вхід для кешу: 0,04 долара за 1 млн token (застосовується для сценаріїв agent, де потрібне повторне зчитування однакових програмних репозиторіїв або корпоративних UI)

Об’єкт порівняння: Qwen3.7-Max — введення 2,50 долара, вивід 7,50 долара, разом 10,00 долара. Китайські конкуренти, MiniMax-M3, у межах обмеженої промо-акції пропонують разом 1,50 долара; ціноутворення Qwen3.7-Plus щільно прив’язане до цього рівня.

Офіційні базові тестові цифри (самооцінка)

Нижче наведені базові тестові цифри Qwen3.7-Plus, оприлюднені Alibaba; це дані самооцінки:

Terminal Bench 2.0-Terminus: 70,3 (DeepSeek-V4-Pro Max — 67,9, Gemini-3.1 Pro — 63,5)

ScreenSpot Pro (комп’ютерний зір і розуміння інтерфейсів): 79,0 (GPT-5.4 xhigh — 67,4, Claude-Opus-4.6 — 49,5)

Варто зазначити, що офіційна документація Alibaba також пояснює: загальна продуктивність Qwen3.7-Plus усе ще нижча за більшість провідних американських закритих моделей. Наведені цифри — це порівняння для конкретних завдань в одній точці й не відображають повної картини.

Вплив підтвердження закритого розгортання: міркування щодо комплаєнсу та обмеження придатності

Qwen3.7-Plus не надає завантажувані відкриті ваги моделей. Усі виклики API мають проходити через міжнародні вузли Alibaba Cloud, а дані циркулюють за межами власних серверів користувача. За цією архітектурою визначені чіткі бар’єри комплаєнсу для таких сценаріїв:

Галузі з обмеженнями на суверенність даних або регуляторними вимогами: медицина (HIPAA, GDPR), оборона, державні установи. Потрібно оцінити, чи відповідає маршрутизація через зовнішній API вимогам комплаєнсу

Сценарії із ізольованим внутрішнім контуром (on-premise): неможливо розгорнути у середовищі з повною ізоляцією

Натомість перевага режиму закритого API полягає в тому, що не потрібно самостійно купувати й підтримувати апаратну інфраструктуру для багатьох GPU-зібрань (наприклад, Nvidia H100). Також формат, сумісний з OpenAI, мінімізує витрати на адаптацію наявної інфраструктури.

Поширені запитання

Для яких сценаріїв підходить кеш-ціна 0,04 долара за 1 млн token у Qwen3.7-Plus?

Кеш-ціноутворення застосовується у сценаріях, коли agent багаторазово читає ті самі дані на вході, наприклад під час тривалого доступу до одного й того самого репозиторію коду, використання фіксованих шаблонів корпоративного UI або коли системні підказки тривалий час залишаються незмінними. У великих робочих процесах із високою частотою й повторюваністю механізм кешу може істотно зменшити загальні витрати на API. Alibaba не опублікувала конкретні гарантії щодо частки кеш-попадань або деталізацію обмежень використання.

У чому основна різниця між Qwen3.7-Plus та попередніми відкритими версіями Qwen із ліцензією?

Раніше серія Qwen виходила з ліцензією Apache 2.0 та надавала завантажувані ваги моделей, що дозволяло будь-кому розгортати їх локально, виконувати мікро-налаштування та інтегрувати в власні системи. Qwen3.7-Plus доступний лише через API Alibaba Cloud: він не публікує ваги моделей, отже неможливо розгорнути їх локально або в ізольованій мережі; усе використання залежить від зовнішньої інфраструктури Alibaba Cloud.

Як слід трактувати довіру до офіційних базових тестових цифр Qwen3.7-Plus?

В офіційних поясненнях Qwen3.7-Plus прямо зазначено, що прогонки для Terminal Bench і ScreenSpot Pro — це цифри самооцінки Alibaba, і що загальна продуктивність усе ще нижча за більшість провідних американських закритих моделей. Базові тестові цифри відображають одноточкову продуктивність у межах конкретних завдань і не означають фактичної наскрізної затримки, стабільності або повної продуктивності в умовах реального виробництва.

Застереження: інформація на цій сторінці може походити зі сторонніх джерел і надається виключно для ознайомлення. Вона не відображає позицію чи думку Gate і не є фінансовою, інвестиційною чи юридичною консультацією. Торгівля віртуальними активами пов’язана з високим ризиком. Будь ласка, не покладайтеся лише на інформацію з цієї сторінки під час прийняття рішень. Детальніше дивіться у Застереженні.

Пов’язані новини

06-03 03:22

NAWS（NAWS.AI）за 24 години виріс на 35,31%

06-02 08:13

Tencent Cloud різко знижує ціни на модель DeepSeek-V4 до 97,5% починаючи з 3 червня

06-02 00:57

Alibaba запускає мультимодальну AI-модель агента Qwen3.7-Plus із комерційним доступом через API

Пов'язані статті

Аналіз PlanB: дно для біткоїна ще не з’явилося, з імовірністю понад 50% можливе падіння до 53 тис.

Market Whisper06-03 05:04

Microsoft Build випустила 7 моделей ШІ; використання токенів на 60% менше, ніж у конкурентів

Market Whisper06-03 02:57

Акції Cisco за один день виросли на 5%, ціль щодо замовлень на AI підвищили до 9 мільярдів доларів

Market Whisper06-03 02:23

Google запускає $80B фінансування за рахунок пайового інвестування$10B з інвестиціями Berkshire

Lucas Bennett06-02 05:53

Деталі бренду Qualcomm Dragonfly перенесли на 24 червня, ціна акцій до відкриття ринку впала більш ніж на 8%

Market Whisper06-02 02:33

Прокоментувати

0/400

Немає коментарів