Gate Newsのメッセージ、4月25日—大手クラウド事業者(MicrosoftやAmazonを含む)が、社内チームやOpenAI、Anthropicのような主要顧客向けに計算能力を集中させることで、小規模なAIスタートアップが価格上昇、待ち時間の延長、そしてより厳格な契約条件に直面するなか、GPU不足が再び浮上している。Microsoft Azureの営業管理は、クラウド顧客のGPU待ち時間は2026年末まで継続するとスタッフに伝えた。
画像生成スタートアップKreaは、Andreessen HorowitzやBain Capital Venturesを含む投資家から$83 百万ドルを調達しているが、これまで6か月契約のもとで、Blackwellチップを1時間あたり$2.80で数百枚レンタルしていた。更新時には複数のクラウド事業者が問い合わせに応じなくなり、Kreaは最終的に1時間あたり$3.70のチップを確保した。これは32%の増加で、契約は1年に延長された。CEOのVictor Perezは、一部のベンダーは単に返信しなかった一方で、ほかは交渉の前に複数年のコミットメントを求めたと述べた。GPUクラウド事業者Lightning AIのCEO Will Falconは、同社はオンラインで40,000のGPUを運用しているものの、待機列にいる約40社の顧客が合計400,000のGPUを必要としており、レンタル価格は6か月の間に25%超上昇していると明かした。
Microsoftは階層型のGPUアクセス管理を導入した。(Tier 1)の優先配分を受けるのは、約1,000の最大顧客である。 一方、Blackwellチップを求める小規模なクライアントは、少なくとも1,000ユニットを、最低1年コミットする必要があり、契約は数千万ドルから始まる。従量課金(使った分だけ)型の顧客は、デバイスが数時間アイドル状態のままだとGPUアクセスを失うリスクがある。Microsoft for Startupsの無料ティアのプログラムに参加しているスタートアップも、GPU利用率が不十分だとアクセスが取り消される可能性があると警告されている。
ベンチャーキャピタルのGeneral Catalystは、計算(コンピュート)のボトルネックについてポートフォリオ企業に対して調査を行い、共有GPUプールや共同交渉戦略を検討している。行列を回避するために、スタートアップの中にはGPUを直接購入することを考えるところもある。石油業界向けAIスタートアップのCollideは、NvidiaのGPUに約$500,000を投じる計画で、独立して運用するためにデータセンターのスペースをリースし、不確実性を避けるとしている。
Related News