Zhipu lança a API de alta velocidade GLM-5.1, atingindo recorde global de 400 tokens/s

De acordo com Beating Monitoring, a Zhipu lançou a GLM-5.1 High-Speed API para clientes empresariais selecionados, com velocidade de saída do modelo atingindo 400 tokens/s, estabelecendo um novo recorde global para o throughput da interface oficial de grandes modelos de linguagem. A versão de alta velocidade é alimentada por um mecanismo de inferência de alto desempenho co-desenvolvido pela Zhipu e pela equipe TileRT, mantendo toda a capacidade do modelo principal enquanto reduz significativamente a latência por meio de otimização de kernels de GPU e escalonamento de tarefas em nível de tiles.
Isenção de responsabilidade: as informações nesta página podem ter origem em fontes terceiras e servem apenas como referência. Não representam as opiniões da Gate e não constituem orientação financeira, de investimentos ou jurídica. A negociação de ativos virtuais envolve alto risco. Não tome decisões baseando-se apenas nas informações desta página. Para mais detalhes, consulte a Isenção de responsabilidade.
Comentário
0/400
Sem comentários