A série MiMo-V2.5 da Xiaomi vai para o código aberto: 1T de parâmetros com eficiência de token superior vs GPT-5.4

Mensagem do Gate News, 27 de abril — A equipe MiMo da Xiaomi disponibilizou em código aberto a série de modelos de linguagem de grande porte MiMo-V2.5 sob licença MIT, com suporte a implantação comercial, treinamento contínuo e ajuste fino. Ambos os modelos apresentam uma janela de contexto de 1 milhão de tokens. O MiMo-V2.5-Pro é um modelo de especialistas mistos de texto puro (MoE) com 1,02 trilhão de parâmetros totais e 42 bilhões de parâmetros ativos, enquanto o MiMo-V2.5 é um modelo multimodal nativo com 310 bilhões de parâmetros totais e 15 bilhões de parâmetros ativos, com suporte à compreensão de texto, imagem, vídeo e áudio.

O MiMo-V2.5-Pro mira tarefas complexas de agentes e de programação. Nos benchmarks ClawEval, ele obteve 64% de Pass@3 consumindo aproximadamente 70.000 tokens por trajetória de tarefa — 40% a 60% menos tokens do que Claude Opus, Gemini 3.1 Pro e GPT-5.4. O modelo obteve 78,9 no SWE-bench Verified. Em uma demonstração, o V2.5-Pro implementou de forma independente um compilador completo de SysY para RISC-V para um projeto de curso do compilador da Universidade de Pequim em 4,3 horas, com 672 chamadas de ferramenta, alcançando uma pontuação perfeita de 233/233 em conjuntos de testes ocultos.

O MiMo-V2.5 foi projetado para cenários de agentes multimodais, equipado com um codificador de visão dedicado (729 milhões de parâmetros) e um codificador de áudio (261 milhões de parâmetros), com pontuação 62,3 no subconjunto geral Claw-Eval. Ambos os modelos empregam uma arquitetura híbrida que combina atenção por janela deslizante (SWA) e atenção global (GA), acompanhada por um módulo de predição de múltiplos tokens em 3 camadas (MTP) para inferência acelerada. Os pesos do modelo estão disponíveis no Hugging Face.

Junto ao lançamento de código aberto, a equipe MiMo lançou o “Orbit Quadrillion Token Creator Incentive Program”, oferecendo 100 quadrilhões de tokens gratuitos ao longo de 30 dias para usuários globais. Desenvolvedores individuais, equipes e empresas podem se inscrever via a página do programa, com um ciclo de avaliação de aproximadamente 3 dias úteis; os benefícios aprovados são distribuídos como Token Plans ou créditos diretos, compatíveis com ferramentas como Claude Code e Cursor.

Aviso: As informações nesta página podem ser provenientes de terceiros e não representam as opiniões ou pontos de vista da Gate. O conteúdo exibido nesta página é apenas para referência e não constitui aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou integridade das informações e não será responsável por quaisquer perdas decorrentes do uso dessas informações. Os investimentos em ativos virtuais apresentam altos riscos e estão sujeitos a uma volatilidade de preços significativa. Você pode perder todo o capital investido. Por favor, compreenda completamente os riscos envolvidos e tome decisões prudentes com base em sua própria situação financeira e tolerância ao risco. Para mais detalhes, consulte o Aviso Legal.

Related Articles

A Microsoft implanta o Copilot para 743.000 funcionários da Accenture

A Microsoft está lançando o Microsoft 365 Copilot para todos os 743.000 funcionários da Accenture, marcando sua maior implantação corporativa até o momento, segundo a Reuters. A medida amplia o plano da Accenture para 2024 de oferecer o Copilot a até 300.000 funcionários. Pesquisa da Accenture

CryptoFrontier4m atrás

DeepSeek Aumenta Capital Registrado em 50%, Participação do Fundador Liang Wenfeng Sobe para 34%

Mensagem do Gate News, 28 de abril — De acordo com dados do Qichacha, a DeepSeek (Hangzhou Deepseek AI Basic Technology Research Co., Ltd.) aumentou seu capital registrado de 10 milhões de iuanes para 15 milhões de iuanes. A contribuição do capital registrado do fundador Liang Wenfeng aumentou de 1 milhão de iuanes para 5,1 milhões de iuanes

GateNews10m atrás

Reservas da Meta de 1GW+ de Solar e Armazenamento de Energia para Data Centers de IA

A Meta assinou acordos de energia com a Overview Energy e a Noon Energy para garantir capacidade de energia para seus data centers de inteligência artificial, de acordo com o The Economic Times. A empresa reservou até 1 gigawatt

CryptoFrontier14m atrás

Zhipu Z.ai estende a promoção triplo de cotas do GLM Coding Plan até 30 de junho

Mensagem da Gate News, 28 de abril — A Zhipu Z.ai anunciou uma extensão da promoção triplo de cotas do seu GLM Coding Plan, originalmente com prazo até 30 de abril, para 30 de junho, abrangendo tanto os modelos GLM-5.1 quanto GLM-5-Turbo. A promoção está disponível no horário do Leste dos EUA, das 6:00 AM até 2:00 AM do dia seguinte. GLM Coding

GateNews30m atrás

TSMC Acelera Expansão em Ritmo Duplicado, Cinco Fábricas de 2 nm para Iniciar Produção em 2026

Mensagem do Gate News, 28 de abril — A Taiwan Semiconductor Manufacturing Company (TSMC) está acelerando sua expansão de capacidade em ritmo duas vezes mais rápido do que o histórico para atender à demanda crescente de inteligência artificial e computação de alto desempenho, de acordo com Hou Yongqing, vice-presidente sênior da TSMC. A

GateNews35m atrás

GitHub Copilot muda para cobrança baseada em tokens a partir de 1º de junho; mensalidades permanecem inalteradas

Mensagem do Gate News, 28 de abril — A GitHub anunciou que todos os planos do Copilot vão migrar para cobrança baseada em tokens a partir de 1º de junho de 2026. O modelo de preços existente de "solicitação premium" será substituído por GitHub AI Credits, com o uso calculado com base no consumo real de tokens (incluindo entrada, saída, e tokens em cache a taxas que correspondem ao preço público da API de cada modelo.

GateNews41m atrás
Comentário
0/400
Sem comentários