2月11日、智谱は新世代大規模モデルGLM-5を正式に発表しました。モールスレッドはSGLang推論フレームワークを基に、フラッグシップAI訓練推論一体型のフル機能GPU MTT S5000上で、Day-0に全工程の適応と検証を完了しました。MUSAアーキテクチャの広範な演算子カバーと強力なエコシステム互換性により、モールスレッドはモデル推論の全リンクを成功裏に連携させ、MTT S5000のネイティブFP8加速能力を深く解放しました。これにより、モデルの精度を確保しつつ、顕著にGPUメモリ使用量を削減し、GLM-5の高性能推論を実現しました。この迅速な適応は、MUSAソフトウェアスタックの成熟度を証明するとともに、国産フル機能GPUが最新の大規模モデルに対して即時かつ効率的に対応できる能力を十分に示しています。(モールスレッド)
モールスレッドMTT S5000がGLM-5への適応を最初に完了
2月11日、智谱は新世代大規模モデルGLM-5を正式に発表しました。モールスレッドはSGLang推論フレームワークを基に、フラッグシップAI訓練推論一体型のフル機能GPU MTT S5000上で、Day-0に全工程の適応と検証を完了しました。MUSAアーキテクチャの広範な演算子カバーと強力なエコシステム互換性により、モールスレッドはモデル推論の全リンクを成功裏に連携させ、MTT S5000のネイティブFP8加速能力を深く解放しました。これにより、モデルの精度を確保しつつ、顕著にGPUメモリ使用量を削減し、GLM-5の高性能推論を実現しました。この迅速な適応は、MUSAソフトウェアスタックの成熟度を証明するとともに、国産フル機能GPUが最新の大規模モデルに対して即時かつ効率的に対応できる能力を十分に示しています。(モールスレッド)