Mensagem de Gate News, 23 de Abril — A Tencent lançou e disponibilizou como código aberto uma pré-visualização de Hunyuan Hy3, um modelo híbrido de linguagem com mistura de especialistas, que combina pensamento rápido e lento. O modelo tem 295 mil milhões de parâmetros no total, com 21 mil milhões de parâmetros ativos, suportando um comprimento máximo de contexto de 256K tokens. A pré-visualização Hy3 é o primeiro modelo treinado após a reestruturação do Hunyuan e o modelo mais inteligente da Tencent até à data. A empresa afirma melhorias significativas em raciocínio complexo, seguimento de instruções, aprendizagem em contexto, geração de código, capacidades agentic e desempenho na inferência. O Cientista-Chefe de IA Yao Shunyu declarou que a pré-visualização Hy3 marca o primeiro passo da reconstrução do Hunyuan e expressou a esperança de que o feedback da comunidade de código aberto aumente a utilidade prática da versão formal.
A Tencent está simultaneamente a ampliar o pré-treino e a aprendizagem por reforço para elevar o teto de inteligência do modelo e a colaborar com múltiplos produtos da Tencent através de um co-design profundo, a fim de melhorar o desempenho no mundo real. A empresa está também a começar a explorar capacidades de modelos especializados.
Related News
Os bancos de Taiwan juntam-se para criar uma IA local! Modelos de linguagem financeiros de grande escala em funcionamento o mais tardar até ao final do ano
SlowMist: alerta do CISO — ShinyHunters afirma ter comprometido os sistemas internos da Anthropic
Imagens do ChatGPT 2.0 chegaram! A precisão na geração de texto melhora significativamente, permitindo criar facilmente cartazes de marketing