De acordo com Beating, Thinking Machines, o laboratório fundado pela ex-CTO da OpenAI Mira Murati, lançou uma pré-visualização de pesquisa do seu modelo Interaction, com processamento nativo em áudio e vídeo em tempo real, com respostas micro-turn de 200 milissegundos. O modelo permite ouvir, ver e falar em simultâneo, ao mesmo tempo que suporta interrupções em tempo real por parte do utilizador.
O modelo TML-Interaction-Small utiliza uma arquitetura MoE com 276 mil milhões de parâmetros, com 12 mil milhões de parâmetros ativados por inferência. Os dados oficiais mostram uma latência de alternância de turnos de fala de 0,40 segundos e uma pontuação FD-bench V1.5 de 77,8, ambas a exceder GPT-Realtime-2.0 e Gemini 3.1 Flash Live. Está prevista uma disponibilização limitada da pré-visualização para os próximos meses.
Isenção de responsabilidade: As informações contidas nesta página podem ser provenientes de terceiros e não representam os pontos de vista ou opiniões da Gate. O conteúdo apresentado nesta página é apenas para referência e não constitui qualquer aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou o carácter exaustivo das informações e não poderá ser responsabilizada por quaisquer perdas resultantes da utilização destas informações. Os investimentos em ativos virtuais implicam riscos elevados e estão sujeitos a uma volatilidade de preços significativa. Pode perder todo o seu capital investido. Compreenda plenamente os riscos relevantes e tome decisões prudentes com base na sua própria situação financeira e tolerância ao risco. Para mais informações, consulte a
Isenção de responsabilidade.