Zhipu AI Lança a API de Alta Velocidade GLM-5.1 a 400 Tokens por Segundo

A Zhipu AI lançou a API de Alta Velocidade GLM-5.1 para clientes empresariais selecionados, com velocidade de saída atingindo 400 tokens por segundo. A Zhipu AI afirmou que o serviço utiliza um motor de inferência desenvolvido em conjunto com TileRT e continuará adicionando inferência FP8 e suporte a contexto ultra longo.
ZHIPU-9,05%
Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixado