De acordo com Beating, o Step Audio 2.5 Realtime, um modelo de voz em tempo real ponta a ponta da Step Cosmos, foi lançado em sua API de plataforma aberta em abril de 2026. O modelo dá ênfase a conversas naturais, com personas de personagem personalizáveis e percepção paralinguística (tom, pausas, suspiros).
Em testes oficiais em cinco dimensões, o Step Audio 2.5 Realtime ficou em primeiro lugar em todas as categorias. A pontuação de avaliação subjetiva (conversas em um app de telefone de usuários reais) atingiu 80,41, contra 68,01 do GPT-Realtime-1.5 e 67,16 do Gemini Live. O benchmark de Voice Q&A teve pontuação 79,80, quase 1,5 vezes a do GPT-Realtime-1.5, que foi 53,20. Preços da API: 10 iuanes por milhão de tokens de entrada (2 iuanes com cache hits), 70 iuanes por milhão de tokens de saída, com chamadas de voz contínuas estimadas em 3,8 iuanes por hora.
Aviso: As informações nesta página podem ser provenientes de terceiros e não representam as opiniões ou pontos de vista da Gate. O conteúdo exibido nesta página é apenas para referência e não constitui aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou integridade das informações e não será responsável por quaisquer perdas decorrentes do uso dessas informações. Os investimentos em ativos virtuais apresentam altos riscos e estão sujeitos a uma volatilidade de preços significativa. Você pode perder todo o capital investido. Por favor, compreenda completamente os riscos envolvidos e tome decisões prudentes com base em sua própria situação financeira e tolerância ao risco. Para mais detalhes, consulte o
Aviso Legal.
Related Articles
O TCI Fund vende quase $8B em ações da Microsoft, citando ameaça de IA
De acordo com o Financial Times, o fundo de hedge de Chris Hohn, a TCI, recentemente reduziu sua posição em quase US$ 8 bilhões em ações da Microsoft. O fundo disse aos investidores que a inteligência artificial representa uma ameaça ao software dominante da Microsoft
GateNews41m atrás
Tessera Labs conclui rodada de financiamento $60M liderada pela a16z
De acordo com a Odaily, a startup de automação por IA Tessera Labs anunciou a conclusão de uma rodada de captação de US$ 60 milhões liderada pela Andreessen Horowitz (a16z), com participação da Foundation Capital, Myriad Venture Partners e Osage University Partners. A plataforma nativa de IA da empresa automatiza operações empresariais
GateNews2h atrás
Atacantes Injetam 575 Habilidades Maliciosas na Hugging Face e na ClawHub Usando 13 Contas
De acordo com o CISO da Mist Security @im23pds, atacantes recentemente invadiram 13 contas para inserir 575 Skills maliciosas no Hugging Face e no ClawHub (OpenClaw), conforme divulgado na plataforma X.
GateNews2h atrás
DeepSeek planeja captar até RMB 50 bilhões em uma rodada de financiamento recorde, com o modelo V4.1 chegando em junho
De acordo com a PANews em 8 de maio, a DeepSeek planeja arrecadar até RMB 50 bilhões em sua primeira rodada de financiamento, o que marcaria a maior captação individual já feita por uma empresa chinesa de IA. O fundador e CEO Liang Wenfeng deve contribuir com o valor máximo. A empresa planeja acelerar o desenvolvimento de grandes modelos de linguagem
GateNews3h atrás
Sportix conclui rodada de financiamento de US$ 3,2 milhões liderada pela Coinvestor Ventures, Animoca Brands
De acordo com o ChainCatcher, a plataforma de infraestrutura de IA para esportes Sportix concluiu uma rodada de captação de US$ 3,2 milhões. A rodada foi liderada pela Coinvestor Ventures, com participação da Animoca Brands, Becker Ventures, X21 Digital e Alpha Capital.
O Sportix disse que usará os recursos para avançar sua IA
GateNews3h atrás
O custo dos dados de treinamento de robôs caiu 65% desde 2024, caindo de US$ 340 para US$ 118 por hora
De acordo com a Cointelegraph, os custos dos dados de treinamento de robôs caíram 65% desde 2024, passando de US$ 340 por hora para US$ 118 por hora em 2026.
GateNews3h atrás