Microsoft у вівторок представила сім нових моделей ШІ на щорічній події Build, заявивши, що вони в к сліпих тестах і в бенчмарках для редагування зображень перевершили Claude Sonnet 4.6 від Anthropic та Nano Banana 2 від Google. Запуск відображає прагнення Microsoft закріпитися як розробник frontier-ШІ, а не лише як найбільший інвестор OpenAI та постачальник інфраструктури. Оголошення виходить на тлі посилення конкуренції серед провідних розробників ШІ: нещодавно Anthropic і Google випустили власні флагманські моделі.
MAI-Thinking-1 випереджає Claude Sonnet 4.6 у сліпих тестах
MAI-Thinking-1, флагманська текстова фундаментальна модель Microsoft, була кращою за Claude Sonnet 4.6 від Anthropic у сліпих тестах, проведених незалежними оцінювачами, згідно з CEO Microsoft AI Мустафою Сулейманом. Модель набрала 97% на AIME 2025 — бенчмарку, що вимірює передові навички розв’язання задач і міркування. Сулейман заявив, що результат SWE Bench Pro ставить модель «прямо поруч з Opus 4.6 на одному з найскладніших бенчмарків для кодування». Також Microsoft стверджує, що MAI «забезпечила найвищий показник перемог, випередивши GPT-5.5 за якістю, водночас витрати були у 10 разів нижчі».
«Дуже радію оголосити сьогодні сім нових моделей світового рівня MAI», — написав Сулейман у X. «Вони уособлюють те, що ми вважаємо новою ерою в ШІ, створеною, щоб тримати вас під контролем і на передовій».
Microsoft запускає шість додаткових моделей ШІ в категоріях кодування, зображень, голосу
Microsoft представила MAI-Code-1-Flash — легку модель для кодування, створену для GitHub Copilot і Visual Studio Code. Компанія також показала MAI-Image-2.5 та її Flash-варіант, які Microsoft стверджує, що перевершують Nano Banana Pro від Google у завданнях з редагування зображень. Також анонсували MAI Transcribe-1.5 — модель транскрипції, що підтримує 43 мови, і MAI-Voice-2 — модель генерації мовлення, здатну створювати природно звучні голоси 15 мовами та адаптуватися до мовця за коротким аудіозразком.
«Це надзвичайний час у технологіях. Обчислення, які використовували для навчання frontier-моделей, збільшилися у стільки разів, що це дорівнює трильйону», — сказав Сулейман у блозі, де оголошував нові моделі. «Тепер ми очікуємо ще одне зростання у тисячу разів протягом наступних трьох років, а це, своєю чергою, означає більше розширені можливості та подальше впровадження дедалі ефективнішого ШІ».
Anthropic і Google випускають конкуруючі моделі
Минулого тижня Anthropic оголосила про запуск Opus 4.8, який компанія назвала швидшим і розумнішим на тестах бенчмарків та таким, що має нові функції. У вівторок Anthropic оголосила розширення свого Project Glasswing, надаючи 150 компаніям доступ до орієнтованої на кібербезпеку моделі Mythos. На Google I/O у травні Google представила Gemini Omni — мультимодальну модель ШІ, яка поєднує Gemini з Veo, Nano Banana та моделями генерації медіа Genie, а також Gemini Spark — хмарного агента ШІ, розробленого для керування завданнями в межах застосунків і робочих процесів.
«Розробники й бізнеси просили ШІ, який працює на їхніх умовах і під їхнім контролем», — написав Сулейман. «Ми бачимо в цьому великий крок до досягнення саме цього».
FAQ
Що Microsoft оголосила на події Build у вівторок?
Microsoft представила сім нових моделей ШІ, зокрема MAI-Thinking-1, MAI-Code-1-Flash, MAI-Image-2.5, MAI Transcribe-1.5 та MAI-Voice-2, заявивши, що вони в різних бенчмарках перевершили Claude Sonnet 4.6 від Anthropic і Nano Banana 2 від Google.
Як MAI-Thinking-1 показала себе на бенчмарках?
MAI-Thinking-1 набрала 97% на AIME 2025 і була кращою за Claude Sonnet 4.6 у сліпих тестах, проведених незалежними оцінювачами, згідно з CEO Microsoft AI Мустафою Сулейманом.