PANewsは1月1日に、JinshiによるとDeepSeekが新しい論文を発表し、多様制約ハイパーコネクション(mHC)と呼ばれる新しいアーキテクチャを提案したと報じました。このアーキテクチャは、ハイパーコネクションネットワーク(HC)技術の識別マッピング特性の破壊による訓練の不安定性や限られたスケーラビリティの問題を解決することを目的としています。 このアーキテクチャは、HCの残留接続空間を特定のマニホールドにマッピングし、アイデンティティマッピング特性を復元しつつ、厳格なインフラ最適化を組み込んで効率性を確保することで、パフォーマンスの向上と優れたスケーラビリティを実現しています。 DeepSeekは、HCの柔軟かつ実用的な拡張として、トポロジカルアーキテクチャ設計をより深く理解し、ベースモデルの進化に有望な方向性を示すのに役立つと期待しています。 論文は謝振達、魏一宣、環奇によって執筆されました