広場
最新
注目
ニュース
プロフィール
ポスト
CoinNetwork
2026-05-06 07:30:01
フォロー
币界网のニュースによると、GoogleはGemma 4シリーズのマルチトークン予測(MTP)ドラフトモデルを公開し、オープンソース化しました。
これは投機的デコーディング(speculative decoding)アーキテクチャを採用した軽量な補助モデルであり、メインモデルが最終検証権を保持したまま、最大3倍の推論速度向上を実現し、出力の品質や論理推論能力を全く損なうことなく動作します。
このモデルはGemma 4と同じApache 2.0ライセンスの下で全面的にオープンソース化されており、vllm、sglang、ollamaなどの主流推論フレームワークにネイティブに対応しています。
今回の高速化最適化により、一般的な消費者向けグラフィックカード上で26bのMOEモデルや31bの密結合モデルをスムーズに動作させることができ、またモバイルデバイス上でも低消費電力でリアルタイムAIインタラクションをサポートできるようになりました。
原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については
免責事項
をご覧ください。
報酬
いいね
コメント
リポスト
共有
コメント
コメントを追加
コメントを追加
コメント
コメントなし
人気の話題
もっと見る
#
GateSquareMayTradingShare
384.33K 人気度
#
BitcoinHoldsFirmAbove80K
94.29M 人気度
#
CryptoMarketRecovery
112.83K 人気度
#
IsraelStrikesIranBTCPlunges
43.21K 人気度
#
AaveSuesToUnfreeze73MInETH
1.84M 人気度
ピン
サイトマップ
币界网のニュースによると、GoogleはGemma 4シリーズのマルチトークン予測(MTP)ドラフトモデルを公開し、オープンソース化しました。
これは投機的デコーディング(speculative decoding)アーキテクチャを採用した軽量な補助モデルであり、メインモデルが最終検証権を保持したまま、最大3倍の推論速度向上を実現し、出力の品質や論理推論能力を全く損なうことなく動作します。
このモデルはGemma 4と同じApache 2.0ライセンスの下で全面的にオープンソース化されており、vllm、sglang、ollamaなどの主流推論フレームワークにネイティブに対応しています。
今回の高速化最適化により、一般的な消費者向けグラフィックカード上で26bのMOEモデルや31bの密結合モデルをスムーズに動作させることができ、またモバイルデバイス上でも低消費電力でリアルタイムAIインタラクションをサポートできるようになりました。