Yuntianliyifei presenta una arquitectura de memoria apilada en 3D en el desarrollo de chips de inferencia

De acuerdo con las divulgaciones de relaciones con inversores del 12 de mayo, el chip de inferencia en desarrollo de Yuntianliyifei adopta una arquitectura GPNPU como hoja de ruta tecnológica principal. Los puntos técnicos clave incluyen una capacidad de programación universal a nivel GPGPU compatible con los ecosistemas CUDA más habituales, núcleos NPU optimizados para la eficiencia en inferencia y una arquitectura de memoria apilada en 3D diseñada para aumentar el ancho de banda y reducir la latencia de acceso, superando el cuello de botella de la “muralla de la memoria”.

La empresa también utiliza una arquitectura modular de cómputo para respaldar la construcción de un supernodo de escalado a nivel de rack, a escala de trillón y cien billones para la inferencia de modelos MoE. La hoja de ruta tecnológica apunta a reducir exponencialmente los costos por token y acelerar el despliegue de aplicaciones con modelos grandes.

Aviso legal: La información de esta página puede proceder de terceros y no representa los puntos de vista ni las opiniones de Gate. El contenido que aparece en esta página es solo para fines informativos y no constituye ningún tipo de asesoramiento financiero, de inversión o legal. Gate no garantiza la exactitud ni la integridad de la información y no se hace responsable de ninguna pérdida derivada del uso de esta información. Las inversiones en activos virtuales conllevan riesgos elevados y están sujetas a una volatilidad significativa de los precios. Podrías perder todo el capital invertido. Asegúrate de entender completamente los riesgos asociados y toma decisiones prudentes de acuerdo con tu situación financiera y tu tolerancia al riesgo. Para obtener más información, consulta el Aviso legal.
Comentar
0/400
Sin comentarios