Gate Newsのメッセージ、4月22日――Google Cloudは、4月22日に第8世代の独自設計TPU (Tensor Processing Unit)チップのリリースを発表した。新ラインアップには、AI学習タスク専用に設計されたTPU 8tと、AI推論ワークロード向けに最適化されたTPU 8iが含まれる。両チップは今年後半に提供開始となる。Googleはまた、AIエージェントを構築するための新しいツールを公開し、エンタープライズ向けAIの導入を後押しするための$750 百万ドル規模のファンドを発表した。
TPU 8tは、同価格帯でGoogleの従来世代のIronwood TPUに比べて2.8倍の性能を提供する。TPU 8iは、先代に比べて性能を80%向上させ、静的ランダムアクセスメモリ (SRAM)のアーキテクチャを組み込むことで、「費用対効果の高い大規模スループットと低レイテンシーを実現し、何百万ものエージェントを同時に稼働させられる」とCEOのスンダー・ピチャイは述べている。Ironwoodと比べて、TPU 8tとTPU 8iはいずれも、ワット当たりの性能効率が2倍以上を達成しており、TPU 8tは124%向上、TPU 8iは117%向上だ。Googleは技術スタック全体で電力効率を最適化し、リアルタイム需要に基づいて消費を調整するダイナミック電力管理システムも統合した。
Googleの自社モデルは、顧客向けAPIを直接呼び出すことで、毎分1600億トークン超を処理するようになった。これは前四半期の1000億から増加している。AIは現在、Googleにおける新規コードの75%を生成しており、昨年秋の50%と比べて増加している。Googleの法人向け提供であるGemini Enterpriseは、有料の月間アクティブユーザーで四半期比40%増となった。同社は、クラウド顧客とパートナーにより良い形でサービスを提供するため、2026年までに機械学習の計算(コンピュート)予算の半分強をクラウドサービスに投資する見込みだ。さらに、NVIDIAやAMDが提供する高価で供給制約のあるGPUの代替を求める大手テック企業の動きに合わせ、GoogleはBroadcomとの協業を拡大し、今後の世代向けのカスタムTPUチップの開発と供給を進めていく。
Related News