
マイクロソフト(Microsoft)は6月のBuildカンファレンスで、推論、コード、画像、書き起こし、音声の領域を含む7つの新しいAIモデルの提供を発表した。4つの主要なプログラミング基準テストにおいて、MAI-Code-1-FlashはいずれもClaude Haiku 4.5をすべて上回り、SWE-Bench Verifiedではトークン使用量が最大60%減少する。
7つのモデル一覧:5つの領域を完全にカバー
マイクロソフトのBuildカンファレンスでは、正式名称が公開されている6つのモデルは次のとおりだ。MAI Thinking-1(推論)、MAI Code-1-Flash(コード)、MAI Image-2.5(画像)、MAI Image-2.5-Flash(画像の簡略版)、MAI Transcribe-1.5(書き起こし)および1つの音声モデルである。第7のモデルの正式名称は、現時点の報道ではまだ完全には明かされていない。マイクロソフトは、旗艦の推論モデルであるMAI-Thinking-1がSTEM推論およびコーディング課題において同種モデルと競争力があると述べたが、具体的なベンチマーク数値は提供していない。
MAI-Code-1-Flash vs Claude Haiku 4.5:4つのベンチマークテストデータ
MAI-Code-1-Flashは以下の4つのベンチマークテストで、通過率がいずれもClaude Haiku 4.5より高く、同時に使用するトークンもより少ない。
SWE-Bench Pro:MAI-Code-1-Flash 51.2% vs Claude Haiku 4.5 35.2%、16ポイントのリード
SWE-Bench Verified:複雑な問題を解く際のトークン使用量が最大60%減少
IF Bench(正確な指示追跡):MAI-Code-1-Flashが28.9ポイントリード
Advanced IF:MAI-Code-1-Flashが14.5ポイントリード
マイクロソフトの公式ドキュメントによれば、MAI-Code-1-FlashはEinstellung(陥穽)などの主要な対抗的カテゴリにおいて、正確率が依然として50%未満であり、既に識別されている改善の余地があるという。
MAI-Code-1-Flashの現在の提供範囲:個人ユーザーは追加設定不要
MAI-Code-1-FlashはすでにVS CodeのGitHub Copilot個人ユーザー向けバージョンで提供が開始されており、モデルセレクターから直接利用できるほか、Copilotによる自動セレクターのルーティングでも使える。モデルは自適応の長さ制御を採用しており、簡単な依頼には簡潔に対応し、複雑なタスクにはより多くの推論リソースを投入する。MAI-Code-1-Flashの企業版および他のユーザー層への展開時期は、現時点では公表されていない。
よくある質問
マイクロソフト Build 2026で発表された7つの新しいモデルはそれぞれ何?
正式名称が公開されているのは、MAI Thinking-1、MAI Code-1-Flash、MAI Image-2.5、MAI Image-2.5-Flash、MAI Transcribe-1.5および1つの音声関連モデルの計6つ。第7のモデルの正式名称は、現行の公式報道ではまだ完全には明らかにされていない。
MAI-Code-1-Flashのトークン削減60%はどのように実現される?
マイクロソフトによれば、このモデルは自適応の長さ制御を用いた学習を行い、タスクの複雑さに応じて反応の深さを自動調整する。マイクロソフトのSWE-Bench Verifiedのテスト結果では、複雑な問題を解決する際のトークン使用量が最大60%まで減らせることが示されている。
MAI-Code-1-Flashは現在どのユーザーに開放されており、企業版の時期はどうなる?
2026年6月時点で、MAI-Code-1-FlashはVS CodeのGitHub Copilot個人ユーザー向けに開放されており、追加設定は不要だ。マイクロソフトは企業版または他のユーザー層の展開時期についてはまだ公表していない。