A Microsoft Build lançou 7 modelos de IA, com uma utilização de tokens 60% inferior à dos concorrentes

微軟Build AI模型

A Microsoft (Microsoft) anunciou, na conferência Build de junho, o lançamento de 7 novos modelos de IA, cobrindo os domínios de raciocínio, código, imagens, transcrição e voz. Em 4 testes de referência de programação principais, o MAI-Code-1-Flash superou integralmente o Claude Haiku 4.5 e, no SWE-Bench Verified, o uso de tokens diminuiu até 60%.

Lista de 7 modelos: cobertura completa em cinco grandes áreas

A conferência Build da Microsoft já divulgou os nomes completos de 6 dos modelos: MAI Thinking-1 (raciocínio), MAI Code-1-Flash (código), MAI Image-2.5 (imagens), MAI Image-2.5-Flash (versão compacta de imagens), MAI Transcribe-1.5 (transcrição) e um modelo de voz; o nome completo do 7.º modelo ainda não foi totalmente revelado nos relatórios existentes. A Microsoft afirmou que o modelo de raciocínio de topo MAI-Thinking-1 é competitivo em tarefas de raciocínio e codificação em STEM, mas não forneceu dados de referência específicos.

MAI-Code-1-Flash vs Claude Haiku 4.5: dados de 4 testes de referência

O MAI-Code-1-Flash tem taxas de sucesso superiores ao Claude Haiku 4.5 nos seguintes 4 testes de referência, ao mesmo tempo que utiliza menos tokens:

SWE-Bench Pro: MAI-Code-1-Flash 51,2% vs Claude Haiku 4.5 35,2%, à frente em 16 pontos

SWE-Bench Verified: uso de tokens para resolver problemas complexos reduzido até 60%

IF Bench (seguimento preciso de instruções): MAI-Code-1-Flash à frente em 28,9 pontos

Advanced IF: MAI-Code-1-Flash à frente em 14,5 pontos

A documentação oficial da Microsoft indica que a precisão do MAI-Code-1-Flash em categorias adversariais fundamentais como o teste Einstellung continua abaixo de 50%, estando ainda associado a oportunidades de melhoria já identificadas.

Âmbito atual do MAI-Code-1-Flash: utilizadores individuais sem necessidade de configuração adicional

O MAI-Code-1-Flash já está disponível na versão para utilizadores individuais do GitHub Copilot no VS Code, podendo ser usado diretamente através do seletor de modelos ou automaticamente encaminhado pelo Copilot. O modelo utiliza controlo adaptativo de comprimento de saída: mantém respostas concisas para pedidos simples e aloca mais recursos de raciocínio para tarefas complexas. O calendário de implementação da versão empresarial e de outros grupos de utilizadores do MAI-Code-1-Flash ainda não foi divulgado.

Perguntas frequentes

Quais são os 7 novos modelos lançados pela Microsoft Build 2026?

Incluem-se MAI Thinking-1, MAI Code-1-Flash, MAI Image-2.5, MAI Image-2.5-Flash, MAI Transcribe-1.5 e um modelo relacionado com voz, num total de 6 modelos com nomes completos publicados; o nome completo do 7.º modelo ainda não foi totalmente revelado nos relatórios oficiais atuais.

Como é que a redução de 60% de tokens do MAI-Code-1-Flash é alcançada?

A Microsoft afirma que o modelo é treinado com controlo adaptativo de comprimento de solução, ajustando automaticamente a profundidade da resposta conforme a complexidade da tarefa. Os resultados da Microsoft nos testes SWE-Bench Verified mostram que, ao resolver problemas complexos, o uso de tokens pode reduzir-se em até 60%.

A que utilizadores o MAI-Code-1-Flash está atualmente disponível e qual é o calendário para a versão empresarial?

Até junho de 2026, o MAI-Code-1-Flash já está disponível para utilizadores individuais do GitHub Copilot no VS Code, sem necessidade de configuração adicional. A Microsoft ainda não divulgou o calendário de implementação da versão empresarial nem de outros grupos de utilizadores.

Aviso legal: As informações contidas nesta página podem provir de fontes externas e têm caráter meramente informativo. Não refletem os pontos de vista nem as opiniões da Gate e não constituem qualquer tipo de aconselhamento financeiro, de investimento ou jurídico. A negociação de ativos virtuais envolve um risco elevado. Não se baseie exclusivamente nas informações contidas nesta página ao tomar decisões. Para mais detalhes, consulte o Aviso legal.
Comentar
0/400
Nenhum comentário