Zhipu lanza la API de alta velocidad GLM-5.1, logrando un récord global de 400 tokens/s

Según Beating Monitoring, Zhipu ha lanzado GLM-5.1 High-Speed API para clientes empresariales seleccionados, con la velocidad de salida del modelo alcanzando 400 tokens/s, estableciendo un nuevo récord global para el rendimiento de la interfaz oficial de modelos de lenguaje a gran escala. La versión de alta velocidad está impulsada por un motor de inferencia de alto rendimiento co-desarrollado por Zhipu y el equipo TileRT, manteniendo todas las capacidades del modelo insignia mientras reduce significativamente la latencia mediante optimización de kernels de GPU y la programación de tareas a nivel de teselas.
Aviso legal: La información en esta página puede provenir de fuentes de terceros y es solo para referencia. No representa las opiniones ni puntos de vista de Gate y no constituye asesoramiento financiero, de inversión ni legal. El comercio de activos virtuales implica un alto riesgo. No te bases únicamente en la información presentada en esta página para tomar decisiones. Para más detalles, consulta el Aviso legal.
Comentar
0/400
Sin comentarios