3 роки досягли 14 мільярдів доларів! SoftBank, NVIDIA борються за інвестиції на трильйонний оцінку «єдинорога»

軟銀、輝達搶投Skild AI

У 2026 році коло штучного інтелекту породить найшвидші 100 мільярдів єдинорогів. Skild AI завершила фінансування серії C з оцінкою понад 140 мільярдів доларів і була інвестована SoftBank, Nvidia та Bezos лише за 3 роки після заснування. Засновник походить із Meta AI, яка не створює апаратне забезпечення роботів, а зосереджується на створенні «універсального мозку» Skilld Brain, який використовує спільні моделі для надання роботам можливості працювати у фізичному світі.

Логіка капіталу — десятикратне зростання оцінки за два роки

Skilld AI — найшвидший єдиноріг, який подолав 100 мільярдів цього року, завдяки швидкому темпу розвитку та стрімкому розширенню оцінки, що є феноменальним навіть у шаленій хвилі інвестицій у ШІ. Всього через два місяці після заснування компанія отримала початковий раунд у розмірі $14,5 мільйона під керівництвом Lightspeed Ventures, успішно запустивши свій запуск. У першу річницю Skild AI завершила раунд фінансування серії A на суму до 300 мільйонів доларів, а оцінка після інвестицій зросла до 15 мільярдів доларів. Менш ніж за два роки її оцінка зросла майже вдесятеро, а останнє фінансування серії C підняло оцінку до 140 мільярдів доларів.

Причина інвестування капіталу на Skilld AI проста – світовий ринок праці стикається з серйозною прірвою. Очікується, що розрив у робочих місцях лише у виробничому секторі США досягне 2,1 мільйона до 2030 року, а проблема старіння населення в розвинених економіках, таких як Європа та Японія, є ще серйознішою. Універсальні роботи, здатні виконувати складні фізичні завдання, вважаються ключем до вирішення кризи продуктивності. Однак нинішня індустрія робототехніки дуже фрагментована, і кожен виробник намагається розвивати все — від механічних конструкцій до систем керування, що призводить до високих витрат на дослідження та розробок і неможливості міграції можливостей між платформами.

Чисто програмна модель Skild AI «працювати лише з мозком, а не тілом» відповідає загальній тенденції переходу індустрії від «апаратно-орієнтованих» до «AI-моделей і програмних можливостей». Sequoia Capital написала у звіті після інвестицій: «Основна цінність Skilld AI полягає у використанні спільної моделі фундаменту для розкриття ‘емерджентних здібностей’ роботів у фізичному світі. Це принципово відрізняється від немасштабованості «одноточкового контролера» в минулому.» Ця «емерджентна здатність» схожа на прорив GPT-3 у розумінні мови, коли модель досягає критичної точки, вона автоматично отримує здібності, які не були явно навчені під час навчання.

Втручання SoftBank є особливо стратегічним. Японський технологічний гігант придбав ARM ще у 2016 році за $320 мільярдів і зараз працює у сфері робототехніки (наприклад, придбавши Boston Dynamics). Фонд SoftBank Vision відомий своєю агресивністю у інвестуванні в ШІ, і ця важка позиція в Skild AI свідчить про те, що він вважає «універсальний мозок роботів» наступним трильйонним ринком. Додавання Nvidia забезпечує обчислювальну потужність і екологічну підтримку, а навчальна інфраструктура Skild AI, ймовірно, буде побудована на кластері GPU Nvidia. Особисті інвестиції Безоса трапляються ще рідше, оскільки засновник Amazon рідко бере участь у ранніх проєктах, а його підтримка приносить Skild AI нематеріальну цінність бренду.

Технологічні гени команди, яка покинула Мету

Відповідь на технічні можливості Skild AI прихована на задньому плані засновницької команди. До заснування Skild AI Діпак Патхак був відомим науковцем і практиком у галузі штучного інтелекту та робототехніки, працював асистентом професора в Університеті Карнегі-Меллон і опублікував кілька широко цитованих статей. Під час роботи в Meta AI він активно брав участь у кількох ключових проєктах з адаптивного навчання, міграції з симуляції у реальний світ та масштабного навчання роботизованих даних.

Патхак твердо вірить, що справжній загальний інтелект ШІ має будуватися через взаємодію та методом проб і помилок у фізичному світі, а не покладатися лише на цифровий текст чи зображення. Ця концепція була поставлена під сумнів у Meta, оскільки тоді Meta зосереджувалася на метавсесвіті та соціальному ШІ, а інвестиції у фізичних роботів були відносно консервативними. Ця стратегічна суперечка зрештою спонукала Патхака започаткувати бізнес і втілити цю ідею в життя.

Абхінав Гупта, також з Meta AI, досяг досягнень на перетині комп’ютерного зору та навчання робототехніці. Він наголошував на вивченню фізичних знань із відеоданих мережевого масштабу, що дозволяло машинам розуміти властивості об’єктів, фізичні закони та людські наміри. Насправді Гупта і Патхак неодноразово співпрацювали під час роботи в Meta, щоб дослідити, як відтворити «емерджентні можливості» великих мовних моделей у фізичних роботах.

Обидві вважають, що сучасна індустрія робототехніки надто покладається на індивідуальні рішення для конкретних завдань і обладнання, а також не має узагальненого та масштабованого «універсального мозку», що серйозно обмежує потенціал застосування та швидкість популяризації роботів у реальному світі. Внаслідок цього обидві вже почали розробляти внутрішній проєкт на пізніх етапах Meta, щоб спробувати створити базову модель робота, яка не залежить від конкретного обладнання. Нарешті, на початку 2023 року Патхак і Гупта вирішили залишити Meta і відкрити повноцінний бізнес. Вони твердо вірять, що майбутнє індустрії робототехніки — це не створення нових «тіл», а створення потужного, спільного «мозку».

Момент GPT-3 у індустрії робототехніки

Перенесемося у 2023 рік, коли розумні роботи розквітали всюди, але кожному роботу доводилося навчати спеціалізовані алгоритми з нуля, що призводило до тривалих циклів досліджень і розробок, високих витрат і непроникних можливостей між різними роботами. У індустрії втіленої розвідки завжди існувала проблема: як узагальнювати? Так зване узагальнення стосується здатності одного робота швидко копіювати на інших роботів.

Це дуже складно для роботів, оскільки фізичний світ надзвичайно складний, невизначений і дуже динамічний, і роботам потрібно одночасно розв’язувати задачі узагальнення на трьох рівнях: сприйняття, прийняття рішень і виконання. Наприклад, зміни освітлення, погодні ефекти, фоновий захаращування, перешкоди оклюзії тощо можуть суттєво змінити розподіл даних вхідних даних з візуальних сенсорів. Навіть якщо кожне просте завдання (наприклад, схопити, прогулятися) засвоюється, у складних завданнях (наприклад, «відкрити холодильник, взяти напій і налити його в чашку»), простір для прийняття рішень зростає експоненційно.

Skilld Brain розв’язує три основні технічні шляхи узагальнення

Великомасштабне мультимодальне попереднє навчання: Вивчайте знання з фізики з веб-відео, змодельованих середовищ та реальних даних роботів, щоб створити спільні представлення у різних сценаріях

Апаратне забезпечення є архітектурно незалежним: Відокремлення логіки сприйняття та прийняття рішень від конкретних механічних структур через абстракційні шари, щоб одна й та сама модель могла бути застосована до різних типів роботів, таких як колеса, ноги та руки

Механізм безперервного навчання: Дані, створені роботом під час виконання завдання, повертаються до хмари, модель постійно оптимізується, і досвід кожного робота може бути корисним для всієї мережі

Skild AI не виробляє апаратне забезпечення для роботів, а має на меті встановити «універсальний мозок» для всіх роботів, і його засновники стверджують, що створюють «моменти GPT-3» втіленого інтелекту. Skild Brain відокремлює програмне забезпечення від апаратного забезпечення, уникаючи прив’язаності до єдиного апаратного дизайну. Водночас це максимально знижує поріг галузі, дозволяючи іншим виробникам роботів або інтеграторам зосередитися на оптимізації апаратного забезпечення та реалізації сценаріїв, а також безпосередньо використовувати API Skild Brain для отримання передового інтелекту, що значно прискорює популяризацію роботозастосувань.

Перспективи комерціалізації також обнадійливі. У промисловому та комерційному секторах роботів на виробничій лінії не потрібно зупиняти через незначні збої; Під час рятувальних операцій під час стихійних лиха роботи можуть продовжувати виконувати завдання, навіть якщо у них «відрізані кінцівки»; На споживчому ринку «мозок» можна використовувати «з оболонки» для суттєвого зниження витрат. Ці технологічні наріжні камені змінюють розуміння людей про AGI — цифрові знання самі по собі не можуть створити справжній AGI, і машинні агенти повинні навчатися через «практичне» навчання, щоб розуміти справжні закони роботи у фізичному світі.

Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
0/400
Немає коментарів
  • Закріпити