Microsoftは火曜日の年次イベント「Build」で、7つの新しいAIモデルを発表し、ブラインドテストや画像編集ベンチマークでAnthropicのClaude Sonnet 4.6およびGoogleのNano Banana 2を上回ったと主張した。この発表は、MicrosoftがOpenAIの最大の出資者兼インフラ提供者にとどまらず、フロンティアAI開発者としての地位を確立しようとする取り組みを意味している。この発表は、主要なAI開発企業間の競争がさらに激化する中で行われたもので、AnthropicとGoogleは最近それぞれのフラッグシップモデルを公開している。
MAI-Thinking-1はブラインドテストでClaude Sonnet 4.6を上回る
MAI-Thinking-1は、Microsoftのフラッグシップとなるテキスト基盤モデルで、Mustafa Suleyman率いるMicrosoft AIによれば、独立した評価者によるブラインドテストではAnthropicのClaude Sonnet 4.6よりも選ばれた。AIME 2025(高度な問題解決と推論スキルを測るベンチマーク)で97%を獲得した。Suleymanは、このモデルのSWE Bench Proの結果は「最も厳しいコーディング用ベンチマークの1つでOpus 4.6と並ぶ」位置づけだと述べた。さらにMicrosoftは、MAIが「品質面でGPT-5.5を上回り、コストは10分の1という最も高い勝率を実現した」とも主張した。
「今日、世界クラスの新しいMAIモデルを7つ発表できてとても興奮しています」とSuleymanはXに書いた。「それらは、あなたが主導権を握り、最前線に立ち続けるために私たちが考えるAIの新しい時代を示しています。」
Microsoftはコーディング、画像、音声の各カテゴリで追加の6つのAIモデルを公開
Microsoftは、GitHub CopilotとVisual Studio Code向けに作られた軽量のコーディングモデル「MAI-Code-1-Flash」を導入した。同社は、画像編集タスクにおいてGoogleのNano Banana Proを上回るとMicrosoftが言う「MAI-Image-2.5」とそのFlash版も発表した。さらに、43の言語をサポートする文字起こしモデル「MAI Transcribe-1.5」、短い音声サンプルから話者に適応し、15の言語で自然に聞こえる声を生成できる音声生成モデル「MAI-Voice-2」も発表された。
「技術にとって非常に特別な時期です。フロンティアモデルの学習に使われる計算能力は1兆倍に増えました」と、新モデルを発表するブログ記事でSuleymanは述べた。「そして今後3年間でさらに1000倍の増加が見込まれ、それにより、より高度な能力が生まれ、ますます効果的なAIの継続的な展開につながると考えています。」
AnthropicとGoogleが競合するモデルをリリース
先週、AnthropicはOpus 4.8の提供開始を発表し、同社はベンチマークテストでより速く、より賢くなり、新機能も搭載されていると述べた。火曜日にはAnthropicが「Project Glasswing」を拡張すると発表し、同社のサイバーセキュリティ重視のMythosモデルを150社に提供する。5月のGoogle I/Oでは、GoogleがGemini Omniを公開した。これは、GeminiにVe o、Nano Banana、Genieのメディア生成モデルを組み合わせたマルチモーダルAIモデルで、さらに、アプリやワークフロー全体でタスクを管理するよう設計されたクラウドベースのAIエージェント「Gemini Spark」も同時に発表された。
「開発者や企業は、自分たちの条件と自分たちの意思のもとで提供されるAIを求めて切望してきました」とSuleymanは書いた。「私たちは、それを実現するための大きな一歩だと考えています。」
FAQ
火曜日のBuildイベントでMicrosoftは何を発表しましたか?
Microsoftは、MAI-Thinking-1、MAI-Code-1-Flash、MAI-Image-2.5、MAI Transcribe-1.5、そしてMAI-Voice-2を含む7つの新しいAIモデルを発表し、さまざまなベンチマークでAnthropicのClaude Sonnet 4.6およびGoogleのNano Banana 2を上回ったと主張しました。
MAI-Thinking-1はベンチマークでどのように成績を出しましたか?
MAI-Thinking-1はAIME 2025(高度な問題解決と推論スキルを測るベンチマーク)で97%を獲得し、Microsoft AIのCEO Mustafa Suleymanによれば、独立した評価者によるブラインドテストではClaude Sonnet 4.6よりも優先されました。