
Компанія Alibaba цього тижня опублікувала модель серії Qwen3.7-Plus Qwen: вхідне ціноутворення — 0,40 долара за 1 млн token, вихідне — 1,60 долара за 1 млн token; разом — 2,00 долара. Це на 80% нижче за Qwen3.7-Max; вхідне ціноутворення для кешу може бути знижене до 0,04 долара за 1 млн token. Цільові сценарії — високочастотні повторювані завдання.
Згідно з офіційно опублікованими Alibaba матеріалами щодо ціноутворення:
Звичайне введення: 0,40 долара за 1 млн token
Звичайний вивід: 1,60 долара за 1 млн token
Разом (введення + вивід): 2,00 долара
Вхід для кешу: 0,04 долара за 1 млн token (застосовується для сценаріїв agent, де потрібне повторне зчитування однакових програмних репозиторіїв або корпоративних UI)
Об’єкт порівняння: Qwen3.7-Max — введення 2,50 долара, вивід 7,50 долара, разом 10,00 долара. Китайські конкуренти, MiniMax-M3, у межах обмеженої промо-акції пропонують разом 1,50 долара; ціноутворення Qwen3.7-Plus щільно прив’язане до цього рівня.
Нижче наведені базові тестові цифри Qwen3.7-Plus, оприлюднені Alibaba; це дані самооцінки:
Terminal Bench 2.0-Terminus: 70,3 (DeepSeek-V4-Pro Max — 67,9, Gemini-3.1 Pro — 63,5)
ScreenSpot Pro (комп’ютерний зір і розуміння інтерфейсів): 79,0 (GPT-5.4 xhigh — 67,4, Claude-Opus-4.6 — 49,5)
Варто зазначити, що офіційна документація Alibaba також пояснює: загальна продуктивність Qwen3.7-Plus усе ще нижча за більшість провідних американських закритих моделей. Наведені цифри — це порівняння для конкретних завдань в одній точці й не відображають повної картини.
Qwen3.7-Plus не надає завантажувані відкриті ваги моделей. Усі виклики API мають проходити через міжнародні вузли Alibaba Cloud, а дані циркулюють за межами власних серверів користувача. За цією архітектурою визначені чіткі бар’єри комплаєнсу для таких сценаріїв:
Галузі з обмеженнями на суверенність даних або регуляторними вимогами: медицина (HIPAA, GDPR), оборона, державні установи. Потрібно оцінити, чи відповідає маршрутизація через зовнішній API вимогам комплаєнсу
Сценарії із ізольованим внутрішнім контуром (on-premise): неможливо розгорнути у середовищі з повною ізоляцією
Натомість перевага режиму закритого API полягає в тому, що не потрібно самостійно купувати й підтримувати апаратну інфраструктуру для багатьох GPU-зібрань (наприклад, Nvidia H100). Також формат, сумісний з OpenAI, мінімізує витрати на адаптацію наявної інфраструктури.
Кеш-ціноутворення застосовується у сценаріях, коли agent багаторазово читає ті самі дані на вході, наприклад під час тривалого доступу до одного й того самого репозиторію коду, використання фіксованих шаблонів корпоративного UI або коли системні підказки тривалий час залишаються незмінними. У великих робочих процесах із високою частотою й повторюваністю механізм кешу може істотно зменшити загальні витрати на API. Alibaba не опублікувала конкретні гарантії щодо частки кеш-попадань або деталізацію обмежень використання.
Раніше серія Qwen виходила з ліцензією Apache 2.0 та надавала завантажувані ваги моделей, що дозволяло будь-кому розгортати їх локально, виконувати мікро-налаштування та інтегрувати в власні системи. Qwen3.7-Plus доступний лише через API Alibaba Cloud: він не публікує ваги моделей, отже неможливо розгорнути їх локально або в ізольованій мережі; усе використання залежить від зовнішньої інфраструктури Alibaba Cloud.
В офіційних поясненнях Qwen3.7-Plus прямо зазначено, що прогонки для Terminal Bench і ScreenSpot Pro — це цифри самооцінки Alibaba, і що загальна продуктивність усе ще нижча за більшість провідних американських закритих моделей. Базові тестові цифри відображають одноточкову продуктивність у межах конкретних завдань і не означають фактичної наскрізної затримки, стабільності або повної продуктивності в умовах реального виробництва.
Пов’язані новини
Microsoft Build випустила 7 моделей ШІ; використання токенів на 60% менше, ніж у конкурентів
Акції Cisco за один день виросли на 5%, ціль щодо замовлень на AI підвищили до 9 мільярдів доларів
Google запускає $80B фінансування за рахунок пайового інвестування$10B з інвестиціями Berkshire
Деталі бренду Qualcomm Dragonfly перенесли на 24 червня, ціна акцій до відкриття ринку впала більш ніж на 8%