Yuntianliyifei Introduz 3D Arquitetura de Memória Empilhada no Desenvolvimento de Chips de Inferência

De acordo com divulgações de relações com investidores em 12 de maio, o chip de inferência em desenvolvimento de Yuntianliyifei adota uma arquitetura GPNPU como tecnologia-base do seu roteiro. Os principais destaques técnicos incluem capacidade de programação universal no nível GPGPU compatível com ecossistemas CUDA comuns, núcleos NPU otimizados para eficiência na inferência e uma arquitetura de memória empilhada em 3D projetada para aumentar a largura de banda e reduzir a latência de acesso, superando o gargalo do limite de memória.

A empresa também utiliza uma arquitetura modular de computação para suportar a construção de supernodes em escala a nível de rack para inferência de modelos MoE em escalas de trilhão e cem-trilhões. O roteiro de tecnologia busca reduzir exponencialmente o custo dos tokens e acelerar a implantação de aplicações de grandes modelos.

Isenção de responsabilidade: as informações nesta página podem ter origem em fontes terceiras e servem apenas como referência. Não representam as opiniões da Gate e não constituem orientação financeira, de investimentos ou jurídica. A negociação de ativos virtuais envolve alto risco. Não tome decisões baseando-se apenas nas informações desta página. Para mais detalhes, consulte a Isenção de responsabilidade.
Comentário
0/400
Sem comentários