5月12日の投資家向け広報開示によると、現在開発中の雲天亿飞の推論チップは、その中核となる技術ロードマップとしてGPNPUアーキテクチャを採用しています。主な技術的ポイントは、主流のCUDAエコシステムに対応したGPGPUレベルの汎用プログラミング能力、推論効率を高めるための最適化されたNPUコア、そして帯域幅を向上させアクセス遅延を低減するよう設計された3Dスタックメモリアーキテクチャであり、「メモリウォール」のボトルネックを突破しています。
同社はまた、計算モジュール型アーキテクチャを採用しており、ラック規模でのスケールアップを前提に、trillionおよびhundred-trillion規模のMoEモデル推論のためのスーパー ノード構築を支えます。技術ロードマップは、トークンコストを指数関数的に引き下げ、大規模モデルのアプリケーション展開を加速することを目標としています。