Beating Monitoringによると、智谱は一部のエンタープライズ顧客向けにGLM-5.1 ハイスピードAPIを立ち上げました。モデルの出力速度は400 tokens/sに達し、大規模言語モデルの公式インターフェースにおけるスループットとして世界新記録を樹立しています。高速版は、智谱とTileRTチームが共同開発した高性能推論エンジンを搭載しており、GPUカーネル最適化およびタイル単位のタスクスケジューリングによりレイテンシを大幅に低減しつつ、フラッグシップモデルの持つフル機能を維持しています。
免責事項:本ページの情報には第三者提供の内容が含まれる場合があり、参考目的のみで提供されています。これらはGateの見解や意見を示すものではなく、金融、投資、または法律上の助言を構成するものでもありません。暗号資産取引には高いリスクが伴います。意思決定を行う際には、本ページの情報のみに依存しないでください。詳細については、
免責事項をご確認ください。