Повідомлення Gate News, 25 квітня — Дефіцит GPU знову повертається, оскільки великі хмарні провайдери, зокрема Microsoft та Amazon, спрямовують обчислювальні потужності на внутрішні команди та ключових клієнтів на кшталт OpenAI й Anthropic, через що менші стартапи в сфері ШІ стикаються зі зростанням цін, подовженими термінами очікування та суворішими умовами контрактів. Керівництво з продажів Microsoft Azure повідомило співробітникам, що час очікування GPU для хмарних клієнтів, як очікується, зберігатиметься до кінця 2026 року.
Стартовий проєкт у сфері генерації зображень Krea, який залучив $83 мільйонів від інвесторів, зокрема Andreessen Horowitz і Bain Capital Ventures, раніше орендував сотні чипів Blackwell за $2.80 на годину за шестимісячним контрактом. Після поновлення запитам кількох хмарних провайдерів перестали відповідати; зрештою Krea отримала чипи за $3.70 на годину, що на 32% більше, а контракт продовжили до одного року. Генеральний директор Віктор Перес зазначив, що деякі постачальники просто не відповідали, тоді як інші наполягали на багаторічних зобов’язаннях перед тим, як розпочинати переговори. Генеральний директор провайдера GPU для хмари Lightning AI Вілл Фалкон розкрив, що компанія тримає в мережі 40,000 GPU, але приблизно 40 клієнтів у черзі потребують сумарно 400,000 GPU, при цьому орендні ціни зросли більш ніж на 25% протягом шести місяців.
Microsoft запровадила ступеневе керування доступом до GPU: приблизно 1,000 найбільших клієнтів (Tier 1) отримують пріоритетне виділення, тоді як менші клієнти, які прагнуть чипів Blackwell, мають зобов’язатися щонайменше 1,000 одиницями мінімум на один рік, а контракти починаються з десятків мільйонів доларів. Клієнти з оплатою за фактом споживання ризикують втратити доступ до GPU, якщо пристрої простоюють кілька годин. Стартапам, які беруть участь у безкоштовній програмі Microsoft for Startups, також повідомили, що недостатнє використання GPU може призвести до анулювання доступу.
Венчурна компанія General Catalyst проводить опитування своїх портфельних компаній щодо вузьких місць у обчисленнях і вивчає спільні пули GPU або стратегії колективних переговорів. Деякі стартапи розглядають прямі покупки GPU, щоб обійти черги: стартап зі ШІ для нафтогалузі Collide планує витратити приблизно $500,000 на GPU Nvidia, орендуючи місце в дата-центрі, щоб працювати незалежно й уникати невизначеності.
Related News
Рекордний рівень акцій Nvidia(NVDA), інвестиції у 5 млрд у Intel уже дали прибутковість 155%
Чому позитивні новини для Intel спричинили різке зростання акцій Nvidia?
Чень Ліву — «заклик до богів»! Citrini оцінює Intel як «найвидатніший звіт цього року», сподіваючись підхопити ефект поширення попиту CoWoS з TSMC