改良された価格性能比を備えた第8世代TPUチップをGoogleが発表。学習と推論を分離

Gate Newsのメッセージ、4月22日――Google Cloudは、4月22日に第8世代の独自設計TPU (Tensor Processing Unit)チップのリリースを発表した。新ラインアップには、AI学習タスク専用に設計されたTPU 8tと、AI推論ワークロード向けに最適化されたTPU 8iが含まれる。両チップは今年後半に提供開始となる。Googleはまた、AIエージェントを構築するための新しいツールを公開し、エンタープライズ向けAIの導入を後押しするための$750 百万ドル規模のファンドを発表した。

TPU 8tは、同価格帯でGoogleの従来世代のIronwood TPUに比べて2.8倍の性能を提供する。TPU 8iは、先代に比べて性能を80%向上させ、静的ランダムアクセスメモリ (SRAM)のアーキテクチャを組み込むことで、「費用対効果の高い大規模スループットと低レイテンシーを実現し、何百万ものエージェントを同時に稼働させられる」とCEOのスンダー・ピチャイは述べている。Ironwoodと比べて、TPU 8tとTPU 8iはいずれも、ワット当たりの性能効率が2倍以上を達成しており、TPU 8tは124%向上、TPU 8iは117%向上だ。Googleは技術スタック全体で電力効率を最適化し、リアルタイム需要に基づいて消費を調整するダイナミック電力管理システムも統合した。

Googleの自社モデルは、顧客向けAPIを直接呼び出すことで、毎分1600億トークン超を処理するようになった。これは前四半期の1000億から増加している。AIは現在、Googleにおける新規コードの75%を生成しており、昨年秋の50%と比べて増加している。Googleの法人向け提供であるGemini Enterpriseは、有料の月間アクティブユーザーで四半期比40%増となった。同社は、クラウド顧客とパートナーにより良い形でサービスを提供するため、2026年までに機械学習の計算(コンピュート)予算の半分強をクラウドサービスに投資する見込みだ。さらに、NVIDIAやAMDが提供する高価で供給制約のあるGPUの代替を求める大手テック企業の動きに合わせ、GoogleはBroadcomとの協業を拡大し、今後の世代向けのカスタムTPUチップの開発と供給を進めていく。

免責事項:このページの情報は第三者から提供される場合があり、Gateの見解または意見を代表するものではありません。このページに表示される内容は参考情報のみであり、いかなる金融、投資、または法律上の助言を構成するものではありません。Gateは情報の正確性または完全性を保証せず、当該情報の利用に起因するいかなる損失についても責任を負いません。仮想資産への投資は高いリスクを伴い、大きな価格変動の影響を受けます。投資元本の全額を失う可能性があります。関連するリスクを十分に理解したうえで、ご自身の財務状況およびリスク許容度に基づき慎重に判断してください。詳細は免責事項をご参照ください。
コメント
0/400
コメントなし