100 мільйонів нових стартапів Thinking Machines представила інтерактивну модель ШІ в реальному часі, роблячи акцент на підході «говори — слухай — виконуй роботу».

Заснована колишніми керівниками OpenAI Мірою Мураті та Джоном Шульманом, нова компанія в галузі штучного інтелекту Thinking Machines із оцінкою в десятки мільярдів доларів у вівторок представила перший попередній реліз двобічної (full duplex) AI-моделі, яка вміє «говорити й слухати» одночасно. Затримка — до 0,4 секунди, що кидає виклик наявним моделям взаємодії в реальному часі між людьми та AI.

(Внесок Nvidia у Thinking Machines Lab: розгортання Vera Rubin для підвищення ефективності передових моделей)

Новий напрям Thinking Machines: прорив крізь застарілий режим «черги в розмові»

Усі наявні провідні AI-моделі працюють за принципом «користувач вводить, модель чекає, а потім відповідає». Колишній CTO OpenAI Міра Мураті та співзасновник OpenAI Джон Шульман вважають, що цей процес «почергових відповідей» схожий на пересилання повідомлень, а не на справжню розмову. Сьогодні вони разом запустили Thinking Machines Lab, яке 11 травня офіційно представило дослідницький попередній реліз нових «інтерактивних моделей (Interaction Models)» — спробу змінити ситуацію докорінно.

People talk, listen, watch, think, and collaborate at the same time, in real time. We’ve designed an AI that works with people the same way.

We share our approach, early results, and a quick look at our model in action. pic.twitter.com/uxl1InS6Ay

— Thinking Machines (@thinkymachines) May 11, 2026

Thinking Machines зазначає, що нинішні AI-моделі сприймають реальність у межах одного потоку: поки користувач не договорив, модель змушена чекати; поки модель не завершила генерацію, сприйняття «заморожується». Такий дизайн стає вузьким місцем у співпраці людини з AI, через що спілкування з агентом не є природним і плинним так, як із живою людиною.

Команда вважає, що розв’язання не в тому, щоб «підлатати» стару архітектуру зовнішніми компонентами, а в тому, щоб із нуля тренувати модель, яка нативно підтримує миттєву інтерактивність.

Двобічна архітектура: AI-система, яка «іде двома справами»

Модель, випущена Thinking Machines, має назву TML-Interaction-Small — гібридна архітектура «мікс експертів» (MoE) із 276 млрд параметрів, але фактично для запуску в роботі використовується 12 млрд параметрів. Система обробляє вхід і генерацію виходу в інтервалах по 200 мілісекунд, без жодних штучних меж чергування, реально втілюючи так званий full duplex — як під час дзвінка, а не як у форматі повідомлень.

У системі використано дизайн із двома моделями: «інтерактивна модель» відповідає за миттєве спілкування, підхоплення реплік і реакцію; «фоновa модель» у бекграунді асинхронно виконує складні міркування, мережевий пошук і виклики інструментів, після чого безшовно вбудовує результати в діалог, що триває. Це дозволяє AI паралельно, поки говорить або слухає, непомітно завершувати призначені задачі — наприклад пошук або генерацію графіків.

Бенчмарки: повне перевершення OpenAI та Google

Оголошення повідомляє, що в стандартному тесті якості AI-інтеракцій FD-bench, затримка «заміни черги» для TML-Interaction-Small становить 0,40 секунди — близько до швидкості природної реакції людини та значно краще за Google Gemini-3.1-flash-live (0,57 секунди) і GPT-realtime-2.0 (1,18 секунди).

Темний колір означає найкращого у відповідній позиції, світлий — найкращого серед моделей у режимі миттєвості

Коли ж команда застосувала власні тести, спеціально розроблені для нового типу інтерактивних можливостей, у завданні «TimeSpeak» правильність TML-Interaction-Small сягнула 64,7%, тоді як GPT-realtime-2.0 — лише 4,3%; у завданні «CueSpeak» (голосовий тригер) перша досягла 81,7%, друга — лише 2,9%; у завданні «RepCount-A» (візуальний підрахунок) перша — 35,4%, а друга майже нуль (1,3%).

Thinking Machines наголошує, що жодна наявна комерційна модель не здатна осмислено виконати ці завдання, зокрема й «thinking»-моделі вищого класу від OpenAI та Google.

Потенціал для бізнесу: від сапорту до безпекового моніторингу

Окрім більш природного досвіду щоденного діалогу, потенційна цінність технології в корпоративних сценаріях також заслуговує на увагу.

Наприклад, у виробництві чи лабораторії AI, який здатен у реальному часі моніторити зображення, може одразу, в момент виявлення порушення безпеки, активувати попередження — без потреби чекати, доки працівник запитає. У сегменті голосового сапорту сучасні системи часто мають затримку обробки 1–2 секунди, і саме це є найпрямішим «болем» для користувачів. Швидкість відповіді 0,4 секунди потенційно може повністю вирішити проблему.

Наразі TML-Interaction-Small і його супутня фоновa модель доступні лише обмеженому колу партнерів для дослідницького попереднього тестування; публічна версія очікується дещо пізніше цього року. Thinking Machines також оголосила про запуск програми дослідницьких грантів, щоб заохотити академічну спільноту розробляти більше нових фреймворків для оцінювання якості інтеракцій.

Від кадрової мобільності до стабільного зростання: наступний крок Thinking Machines Lab

Thinking Machines Lab, заснована у 2025 році, цього року вже привернула увагу: раніше кілька засновників пішли працювати в Meta, а також було найнято співзасновника PyTorch та старшого інженера Meta Соуміта Чінталу (Soumith Chintala) на посаду технічного директора. Зараз штат компанії виріс приблизно до 130 людей.

(Кого Зукерберг переманив у поразку: хто такий Andrew Tulloch, який відмовився від пропозиції Meta на 1,5 мільярда доларів за 6 років?)

У березні компанія також оголосила про партнерство з Nvidia для розгортання щонайменше 1 гігавата нової системи Vera Rubin, а також розширення співпраці з Google Cloud для просування досліджень навчання передових моделей і підкріпленого навчання.

Ця стаття «Десятки мільярдів стартап Thinking Machines представив AI-модель миттєвих інтеракцій із акцентом на “говорити — слухати — виконувати роботу”» вперше з’явилася на ланцюжку новин ABMedia.

Застереження: Інформація на цій сторінці може походити від третіх осіб і не відображає погляди або думки Gate. Вміст, що відображається на цій сторінці, є лише довідковим і не є фінансовою, інвестиційною або юридичною порадою. Gate не гарантує точність або повноту інформації і не несе відповідальності за будь-які збитки, що виникли в результаті використання цієї інформації. Інвестиції у віртуальні активи пов'язані з високим ризиком і піддаються значній ціновій волатильності. Ви можете втратити весь вкладений капітал. Будь ласка, повністю усвідомлюйте відповідні ризики та приймайте обережні рішення, виходячи з вашого фінансового становища та толерантності до ризику. Для отримання детальної інформації, будь ласка, зверніться до Застереження.
Прокоментувати
0/400
Немає коментарів