マイクロソフトが7つのAIモデルを発表、ClaudeやNano Bananaに対する優位性を主張

Microsoftは火曜日の年次イベント「Build」で、7つの新しいAIモデルを発表し、ブラインドテストや画像編集ベンチマークでAnthropicのClaude Sonnet 4.6およびGoogleのNano Banana 2を上回ったと主張した。この発表は、MicrosoftがOpenAIの最大の出資者兼インフラ提供者にとどまらず、フロンティアAI開発者としての地位を確立しようとする取り組みを意味している。この発表は、主要なAI開発企業間の競争がさらに激化する中で行われたもので、AnthropicとGoogleは最近それぞれのフラッグシップモデルを公開している。

MAI-Thinking-1はブラインドテストでClaude Sonnet 4.6を上回る

MAI-Thinking-1は、Microsoftのフラッグシップとなるテキスト基盤モデルで、Mustafa Suleyman率いるMicrosoft AIによれば、独立した評価者によるブラインドテストではAnthropicのClaude Sonnet 4.6よりも選ばれた。AIME 2025(高度な問題解決と推論スキルを測るベンチマーク)で97%を獲得した。Suleymanは、このモデルのSWE Bench Proの結果は「最も厳しいコーディング用ベンチマークの1つでOpus 4.6と並ぶ」位置づけだと述べた。さらにMicrosoftは、MAIが「品質面でGPT-5.5を上回り、コストは10分の1という最も高い勝率を実現した」とも主張した。

「今日、世界クラスの新しいMAIモデルを7つ発表できてとても興奮しています」とSuleymanはXに書いた。「それらは、あなたが主導権を握り、最前線に立ち続けるために私たちが考えるAIの新しい時代を示しています。」

Microsoftはコーディング、画像、音声の各カテゴリで追加の6つのAIモデルを公開

Microsoftは、GitHub CopilotとVisual Studio Code向けに作られた軽量のコーディングモデル「MAI-Code-1-Flash」を導入した。同社は、画像編集タスクにおいてGoogleのNano Banana Proを上回るとMicrosoftが言う「MAI-Image-2.5」とそのFlash版も発表した。さらに、43の言語をサポートする文字起こしモデル「MAI Transcribe-1.5」、短い音声サンプルから話者に適応し、15の言語で自然に聞こえる声を生成できる音声生成モデル「MAI-Voice-2」も発表された。

「技術にとって非常に特別な時期です。フロンティアモデルの学習に使われる計算能力は1兆倍に増えました」と、新モデルを発表するブログ記事でSuleymanは述べた。「そして今後3年間でさらに1000倍の増加が見込まれ、それにより、より高度な能力が生まれ、ますます効果的なAIの継続的な展開につながると考えています。」

AnthropicとGoogleが競合するモデルをリリース

先週、AnthropicはOpus 4.8の提供開始を発表し、同社はベンチマークテストでより速く、より賢くなり、新機能も搭載されていると述べた。火曜日にはAnthropicが「Project Glasswing」を拡張すると発表し、同社のサイバーセキュリティ重視のMythosモデルを150社に提供する。5月のGoogle I/Oでは、GoogleがGemini Omniを公開した。これは、GeminiにVe o、Nano Banana、Genieのメディア生成モデルを組み合わせたマルチモーダルAIモデルで、さらに、アプリやワークフロー全体でタスクを管理するよう設計されたクラウドベースのAIエージェント「Gemini Spark」も同時に発表された。

「開発者や企業は、自分たちの条件と自分たちの意思のもとで提供されるAIを求めて切望してきました」とSuleymanは書いた。「私たちは、それを実現するための大きな一歩だと考えています。」

FAQ

火曜日のBuildイベントでMicrosoftは何を発表しましたか? Microsoftは、MAI-Thinking-1、MAI-Code-1-Flash、MAI-Image-2.5、MAI Transcribe-1.5、そしてMAI-Voice-2を含む7つの新しいAIモデルを発表し、さまざまなベンチマークでAnthropicのClaude Sonnet 4.6およびGoogleのNano Banana 2を上回ったと主張しました。

MAI-Thinking-1はベンチマークでどのように成績を出しましたか? MAI-Thinking-1はAIME 2025(高度な問題解決と推論スキルを測るベンチマーク)で97%を獲得し、Microsoft AIのCEO Mustafa Suleymanによれば、独立した評価者によるブラインドテストではClaude Sonnet 4.6よりも優先されました。

免責事項:本ページの情報には第三者提供の内容が含まれる場合があり、参考目的のみで提供されています。これらはGateの見解や意見を示すものではなく、金融、投資、または法律上の助言を構成するものでもありません。暗号資産取引には高いリスクが伴います。意思決定を行う際には、本ページの情報のみに依存しないでください。詳細については、免責事項をご確認ください。
コメント
0/400
コメントなし