Zhipu випустила GLM-5.1 високошвидкісний API, який досягає 400 токенів/с та встановлює світовий рекорд

За даними Beating Monitoring, Zhipu запустила GLM-5.1 High-Speed API для вибраних корпоративних клієнтів, а швидкість виведення моделі досягла 400 токенів/с, встановивши новий глобальний рекорд для пропускної здатності офіційного інтерфейсу великої мовної моделі. Високошвидкісна версія працює на високопродуктивному механізмі виведення, спільно розробленому Zhipu та командою TileRT; він зберігає повні можливості флагманської моделі, водночас суттєво зменшує затримку завдяки оптимізації GPU kernel і плануванню задач на рівні tile.
Застереження: інформація на цій сторінці може походити зі сторонніх джерел і надається виключно для ознайомлення. Вона не відображає позицію чи думку Gate і не є фінансовою, інвестиційною чи юридичною консультацією. Торгівля віртуальними активами пов’язана з високим ризиком. Будь ласка, не покладайтеся лише на інформацію з цієї сторінки під час прийняття рішень. Детальніше дивіться у Застереженні.
Прокоментувати
0/400
Немає коментарів