Автор: Лін Ванвань
1876 рік — Всесвітня виставка в Філадельфії. Імператор Бразилії Педро II підняв телефон, винайдений Беллом, і почув голос з іншого кінця, здивовано вигукнув: «Боже, він говорить!»
Сто п’ятдесят років потому, 18 березня 2026 року, конференц-центр Сан-Хосе. У чорній шкірянці Юань Женьхун стоїть на сцені GTC і каже щось, що дивує.
«Через десять років, NVIDIA матиме приблизно 75 тисяч співробітників. Вони будуть дуже зайняті, бо працюватимуть разом з 7,5 мільйонами AI-агентів.»
Зала засміялася.
75 тисяч людей, 7,5 мільйона агентів, співвідношення 1:100.
Юань Женьхун сам посміхнувся і додав: «Вони працюватимуть цілодобово. Сподіваюся, наші люди не будуть з ними змагатися.»
Аплодисменти стихли, і ця цифра була загублена серед більш яскравих анонсів чипів та угод про співпрацю того дня. Але якщо виділити її окремо, це може бути одне з найважливіших слів всього форуму.
Не тільки Юань Женьхун. Три місяці тому інша людина описала таке майбутнє більш конкретно.
Січень 2026 року, CES у Лас-Вегасі. Генеральний директор McKinsey Боб Стернфельс назвав цифри.
«Зараз у нас 40 тисяч людських співробітників і приблизно 25 тисяч AI-агентів.» Менше ніж два роки тому ця цифра була кілька тисяч. За півроку ці 25 тисяч агентів створили 2,5 мільйона графіків.
2,5 мільйона графіків. Раніше цю роботу виконували новачки-аналітики. 23-24 роки, з дипломами престижних університетів, о 3 ночі вирівнювали осі координат.
Це був старт кожного нового співробітника McKinsey — механічна праця заради квитка до партнерства.
Зараз цю першу половину квитка вже взяли на себе агенти. Стернфельс каже: «AI збільшив кількість робочих місць на 25%, але й зменшив — на 25%. Компанія розділилася навпіл: одна частина зростає, інша скорочується.»
Історії NVIDIA та McKinsey говорять про одне й те саме.
У світі 1:100 працюють токен-агенти, а люди — лише інтерфейс до них.
Того тижня на GTC Юань Женьхун у гостях у подкасту All-In сказав щось ще більш потужне.
«Припустимо, у вас інженер із зарплатою 500 тисяч доларів на рік. Якщо він не витрачає щонайменше 250 тисяч доларів на токени, я буду дуже занепокоєний.»
Ведучий запитав, чи NVIDIA витрачає 200 мільйонів доларів на купівлю токенів для інженерної команди, і Юань Женьхун відповів: «Ми працюємо над цим.»
Інженер, який не витрачає токени, навіть із зарплатою 500 тисяч, не коштує стільки.
Рішення NVIDIA дуже просте — додати токени до пакету зарплати. У своєму виступі на GTC Юань Женьхун сказав, що у майбутньому кожен інженер NVIDIA матиме щорічний бюджет токенів, приблизно половину своєї базової зарплати.
Інженер із базовою зарплатою у кілька десятків тисяч доларів отримуватиме додатково приблизно половину цієї суми у вигляді обчислювальної потужності для розуміння, третина всього пакету — чистий паливо.
Той, хто отримує повний бюджет токенів, має цілодобово допомогу від десятків AI-агентів: пише код, тестує, шукає літературу, моделює. Той, хто користується лише безкоштовним API, ще працює руками. Двоє з них можуть мати однакові резюме, але їхній результат може відрізнятися у 5-10 разів.
У Кремнієвій долині це вже не теорія.
У березні цього року Business Insider повідомив про зміну: інженери почали питати на співбесідах «Який у вас бюджет токенів?» Товариство Theory Ventures називає цей бюджет «четвертою опорою» зарплати інженера, після базової, бонусів і акцій.
Грег Брокман, президент OpenAI, сказав ще прямо: «Кількість обчислювальної потужності для розуміння, яку ви можете викликати, все більше визначає вашу продуктивність.»
Юань Женьхун у своєму виступі на GTC сказав: «Скільки токенів йде з моєю посадою? Це вже інструмент найму у Кремнієвій долині.»
У 1950-х роках зарплати робітників у Детройті були одними з найвищих у США. Реальною причиною їхнього середнього рівня життя стала лінійка виробництва Генрі Форд. Робітники стояли на конвеєрі, і механізми збільшували їхню продуктивність у десятки разів. Зарплата детройтського робітника була значно вищою за ремісника того ж часу — хоча майстерність могла бути гіршою, але він працював на більшій швидкості.
Токен-бюджет 2026 року — це лінійка виробництва 1950-х.
Але є одна різниця.
Робітник у Детройті міг піти до General Motors або Chrysler, і всюди була лінійка. Профспілки могли домовлятися з роботодавцями про швидкість і безпеку.
Токен-бюджет — це зовсім інше. У день, коли ти — супергерой, компанія його повертає, і ти стаєш простим працівником. Акції можна продати, навички — змінити роботу. Токен — це просто зовнішній плагін, перемикач у руках компанії.
У Кремнієвій долині з’явився новий термін — «GPU-голод».
Топ-інженери AI, що змінюють роботу, вже ставлять друге за важливістю питання після зарплати — скільки у них обчислювальної потужності. Без неї вони не зможуть запускати експерименти, розгортати агентів, їхні можливості обмежені квотами. «Скільки у вас токенів» іноді важливіше за акції. Акції — це чек, що може впасти, а токени — це сьогоднішня продуктивність.
Ті, хто не використовує AI, — просто виходять з гри.
Goldman Sachs оцінює, що AI може автоматизувати 25% робочого часу в США. Mercer опитування показує, що 65% керівників очікують, що 20-30% працівників будуть перепрофільовані через AI. Об’єднані дані — очевидний висновок: у тих, у кого є токени, продуктивність зростає експоненційно, а у тих, у кого їх немає — оптимізують.
Межа — це квота токенів і людські навички, і з часом вона стає все менш важливою.
Особиста цінність визначається квотою токенів. А що з компанією?
На початку березня 2026 року шанхайська компанія MiniMax опублікувала перший за час існування річний звіт. За рік її дохід склав 7,9 мільйонів доларів, чистий збиток — 250 мільйонів. За традиційними фінансовими показниками — це маленька компанія, доходи якої — лише частка одного кварталу компанії Accenture.
Але на ринку її не ігнорують.
Генеральний директор MiniMax, Ян Цзюньцзе, у телефонній конференції сказав щось важливіше за весь звіт: «Цінність компанії визначається щільністю інтелекту та пропускною здатністю токенів.»
Пропускна здатність токенів — не темпи зростання доходів, не кількість користувачів, не валова маржа.
Дані підтверджують цю ідею. У лютому 2026 року середньоденне споживання токенів у моделях серії M2 MiniMax зросло у 6 разів порівняно з груднем попереднього року. У сценаріях програмування — у 10 разів. На платформі OpenRouter, де агрегуються AI-моделі, за два тижні MiniMax витратив 4,55 трильйонів токенів, обігнавши всі американські моделі і вперше піднявшись на перше місце у глобальному рейтингу споживання токенів.
«South China Morning Post» повідомила, що ця подія поклала край домінуванню американських розробників на ринку протягом року — все через обсяг споживання токенів. Той, у кого їх найбільше — той і переможець.
Ця логіка працює і для OpenAI. Платформа API OpenAI обробля 6 мільярдів токенів за хвилину, за два роки зросла у 20 разів. Корпоративні клієнти, що витрачають понад 100 тисяч доларів на рік, — майже у 7 разів більше за минулий рік. Аналізатор Barclays, Росс Сандлер, підрахував: споживання токенів у OpenAI у два рази перевищує Google Gemini.
Обсяг споживання токенів став жорстким валютним еквівалентом для ранжування AI-компаній.
Ще цікавіше — як це виглядає всередині компаній. The New York Times повідомила про явище «tokenmaxxing»: інженери Meta та OpenAI змагаються у внутрішніх рейтингах, хто витрачає більше токенів.
Бюджет токенів стає стандартною перевагою, як і безкоштовна їжа та стоматологічне страхування десять років тому. Інженер у Стокгольмі, що працює в Ericsson, розповів NYT, що гроші, витрачені ним на Claude, можливо, перевищують його зарплату, але компанія платить.
Стаття TechCrunch минулого тижня підрахувала: інженер, що пише статтю ввечері, може витратити 10 тисяч токенів, а інженер із агентським кластером — за день — мільйони. Не потрібно навіть друкувати слова.
Два роки тому ціна за мільйон токенів становила 33 долари. Зараз — 9 центів. Знизилася на 99,7%. Чим дешевше — тим швидше спалюєш. Чим швидше — тим важче відмовитися.
Янь Цзюньцзе у телефонній конференції передбачив: «У майбутньому попит на токени може зрости у 10-100 разів.»
Це новий спосіб оцінки компанії у 2026 році. Не важливо, скільки ти заробляєш, важливо, скільки ти спалюєш токенів. MiniMax втрачає 250 мільйонів, але графік зростання пропускної здатності токенів — стрімкий, і ринок готовий ставити на це. Можна порівняти з YouTube 2006 року: доходів майже немає, але пропускна здатність зростає експоненційно, і Google готовий витратити 1,65 мільярда доларів, щоб його купити.
Тоді YouTube спалював пропускну здатність каналів. Сьогодні MiniMax — токени. Одиниці виміру змінилися, логіка — ні.
У тиждень GTC сталася ще одна подія.
18 березня Stripe оголосила про Machine Payments Protocol. По суті: AI-агенти тепер можуть самі витрачати гроші.
Агент потребує даних — платить сам за їх завантаження. Потрібна обчислювальна потужність — купує її за секунду. Потрібно викликати API іншого агента — розраховується сам. Весь процес не потребує підтвердження людини. Visa адаптувала цю протокол до кредитних карт, Coinbase створила спеціальний гаманець для агентів, Mastercard розробляє Agent Pay.
Обсяг споживання токенів тепер має ще один джерело. Раніше — лише «люди керують агентами». Тепер — агенти самі витрачають токени і купують ще більше за зароблені гроші. Засновник Stripe Джон Коллісон назвав це «потоком».
Юань Женьхун навів відповідні цифри: NVIDIA планує збільшити швидкість генерації токенів з 22 мільйонів до 700 мільйонів, у 350 разів.
Це — будівництво цілого дорожнього полотна, ставки — зростання трафіку у геометричній прогресії.
Інвестиції у 600 мільярдів доларів у інфраструктуру базуються на одному — що світова споживання токенів буде достатньою для окупності. Це — лише гіпотеза, і дуже дорога.
У четвертому кварталі 2025 року технологічні компанії випустили рекордні 108,7 мільярдів доларів боргів. На початку 2026 року — ще 100 мільярдів.
Morgan Stanley та JPMorgan прогнозують, що за кілька років сукупний борг AI-компаній може досягти 1,5 трильйонів доларів. Goldman Sachs оцінює, що капітальні витрати на AI вже становлять близько 3% ВВП США.
Перші, хто відчув ризики, — почали купувати страхові поліси. Обсяг угод з кредитних дефолтних свопів зростає. За кілька десятків базисних пунктів — ставки страхових премій, що вказують на можливість несплати. Директор з кредитної стратегії Citi, Деніел Сорід, сказав на інвестиційній конференції: «Як інвестор у кредит, щоб пережити таку трансформацію, потрібно вкладати величезні капітали, і це викликає природне занепокоєння.»
Засновник Google Ларрі Пейдж у внутрішньому листі сказав ще більш радикально: «Я краще збанкрутію, ніж програю цю гонку.»
Це точно описує дилему в’язня: кожен гігант ставить на те, що конкуренти продовжать інвестувати, і сам не може зупинитися. Той, хто зупиниться — вилетить.
Оптимісти мають тверді дані. Швидкість генерації токенів зросла у 350 разів. Stripe дозволила агентам витрачати гроші самостійно. McKinsey за два роки збільшила кількість агентів з кількох тисяч до 25 тисяч. Якщо економіка агентів повністю запуститься, зростання споживання токенів може стати експоненційним.
Але є дата, яка тривожить багатьох — друга половина 2026 року, «обрив» контрактів.
З 2024 по 2025 рік компанії витрачають «інноваційний бюджет». Генеральний директор має сказати на звіті: «Ми впроваджуємо AI», — і це не дуже чутливо до цін, і не дуже вимогливо до результатів, — просто демонструє намір. Але у другій половині 2026 року перші пілотні проєкти закінчуються, і починається перегляд контрактів. Бюджет закінчується, CTO здає позицію, а CFO сідає навпроти. Єдине число, яке цікавить — ROI.
Якщо багато пілотів закриють, різко зменшиться споживання токенів. Потенційно, потужності, створені на 600 мільярдів доларів, — будуть просто без діла. Центри обробки даних збудовані, електрика підключена, чіпи встановлені — і все це стане просто резервом.
Таке вже траплялося в історії.
У 2000 році телеком компанії витратили трильйони доларів на прокладку підводних кабелів. Після краху бульбашки 90% кабелів залишилися на дні океану, і майже десять років вони просто лежали без діла. Лише коли Netflix почав стрімінг і iPhone запустив мобільний інтернет, кабелі почали знову працювати. Вони не були даремними — компанії-інвестори, такі як Lucent, Nortel, WorldCom, збанкрутували, але інфраструктура залишилася.
У 2012 році в Китаї почалася сонячна енергетика. Wuxi Suntech і Jiangsu Svi вартістю знизили ціну модулів до світового рівня. Виробництво перенасичене, галузь пережила три роки кровопролиття. Потім попит повернувся — сьогодні сонячна енергетика — найшвидше зростаюча галузь у світі. Suntech збанкрутував. Svi збанкрутував. Першопрохідці опинилися у темряві перед світанком.
Після винаходу телефону Беллом, Western Union відмовилася купити патент за 100 тисяч доларів. Через десять років Western Union заплатила 25 мільйонів, але Белл не продав. Тридцять років потому телефонна мережа охопила всю Америку. Але дрібні компанії, що будували мережі, — здебільшого не дожили до моменту масового поширення телефону. Переможцем стала AT&T, яка згодом монополізувала все.
Історія інфраструктури завжди однакова. Напрямок майже завжди правильний, але час може знищити.
Повертаючись до токенів. Та структура, що описана раніше — токени стають робочою силою, люди — інтерфейсами, квоти токенів визначають усе, — існує лише за умови, що токени будуть постійно, масово і швидко витрачатися. Виробництво у 10 разів більшої продуктивності інженерів тримається на постійному постачанні токенів, інакше — нуль. Оцінка OpenAI у 840 мільярдів доларів базується на обіцянках обчислювальної потужності, і при припиненні протоколу вона зменшиться. Інфраструктура вартістю 600 мільярдів — на основі зростання споживання — і якщо цей ріст зупиниться, вона стане просто бездіяльною.
Кожен рівень залежить від нижчого. Якщо темпи споживання будуть відставати від темпів будівництва у два-три роки, вся ланцюг почне розхитуватися.
2023 рік — це «карта — це батько». 2026 рік — «токени — це батько».
Звучить як просто заміна слова, але зміни глибші, ніж здається.
GPU — це актив, купив — і він твій, він у серверній, і ніхто його не забере.
Токени — це трафік. Твій у 10 разів більший обсяг, твоя висока оцінка, твої переговорні позиції — все базується на безперервному, не твоєму постачанні. Закриєш кран — і все зникне.
Коли токени стануть справжньою робочою силою, люди перетворяться на інтерфейси до них. Хороший інтерфейс дозволяє токенам працювати ефективніше, але здатність, естетика, досвід — все ще залишаються. Але скільки справ може зробити інтерфейс, залежить перш за все від кількості підключених токенів.
У 1870-х роках американські фермери зрозуміли: виростити хорошу пшеницю — недостатньо, потрібно біля залізниці. У 1950-х ремісники зрозуміли: навіть найкраща майстерність не зрівняється з роботою на конвеєрі. У 2026 році інженери усвідомлюють: навіть найгарніший код — порожній без достатньої кількості токенів.
Коли токени стануть справжньою робочою силою, люди перетворяться на інтерфейси. Важливо не лише якість інтерфейсу, а й те, хто його живить.