Meta、新AIモデル「Muse Spark」発表 ── Llama失敗から1年、”考え方が違うAI”で巻き返しへ

📅 2026年4月8日発表／参照：Meta AI公式ブログ、TechCrunch、Fortune、Axios、Artificial Analysis

2026年4月8日、Metaがまったくのゼロから作り直した新AIモデル「Muse Spark」を発表しました。

約1年前にLlama 4の「ベンチマーク不正」で信頼を大きく失ったMetaが、なぜ今このタイミングで再挑戦するのか？そしてMuse Sparkは、OpenAIやAnthropicといった先行勢に本当に追いつけるのか？今回は、このニュースのポイントをわかりやすく解説します。

1. Muse Sparkとは何か？── Llama失敗からの「作り直し」
2. 最大の特徴：3つの「考え方」を使い分ける
3. ベンチマーク：トップ5入り、ただし弱点も明確
4. 無料で使える、ただし「Meta経済圏の中」で
5. AI業界への影響：「4強時代」の幕開けか

1. Muse Sparkとは何か？── Llama失敗からの「作り直し」

Muse Sparkは、Metaの新AI研究組織「Meta Superintelligence Labs（MSL）」が開発した初のモデルです。2025年4月のLlama 4以来、約1年ぶりの大型リリースとなります。

そもそもLlama 4が厳しい評価を受けたのは、公開されたベンチマーク結果が、実際にユーザーが使えるバージョンではなく特化版で計測されていたことが発覚したためです。この一件でMetaのAI部門は信頼を失い、大規模な組織再編に追い込まれました。

2025年6月、MetaはAI評価企業Scale AIに143億ドル（約2兆円）を投じて49%の株式を取得。同社CEOだったAlexandr Wangを初代Chief AI Officerに迎え入れ、元GitHub CEOのNat Friedman、OpenAIでGPT-4やo1を手がけたShengjia Zhaoらとともに、9ヶ月かけてトレーニング基盤をゼロから再構築しました。

つまりMuse Sparkは、失敗を認めた上での「やり直し」の成果物です。

2. 最大の特徴：3つの「考え方」を使い分ける

Muse Sparkの最大の特徴は、タスクの難易度に応じて3段階の推論モードを切り替えられる点です。

Instant（即応モード）： 日常的な質問やリアルタイムの音声対話向け。Ray-Banスマートグラスでの利用も想定されており、待ち時間ゼロで回答を返します。

Thinking（思考モード）： 中間ステップを踏みながら推論し、科学や数学など、より難しい問題に対応します。公開されているベンチマーク結果の多くはこのモードで計測されています。

Contemplating（熟考モード）： ここがMuse Sparkの”目玉機能”です。複数のAIエージェントを並列に起動し、それぞれが異なるサブタスクを同時処理した上で結果を統合します。OpenAIのGPT ProやGoogleのGemini Deep Thinkが「1つのAIがより長く考える」のに対し、Muse Sparkは「複数のAIがより広く考える」というアプローチをとります。並列処理により、精度を高めつつ待ち時間を抑えられるとMetaは主張しています。

3. ベンチマーク：トップ5入り、ただし弱点も明確

独立評価機関Artificial Analysisのランキングでは、Muse Sparkはスコア52でグローバルトップ5に入りました。上位にはGPT-5.4（57）、Gemini 3.1 Pro（57）、Claude Opus 4.6（53）が並びます。Llama 4 Maverickのスコア18から一気に3倍近くまで引き上げた形で、Metaの「やり直し」が数字にも表れています。

特に突出しているのが以下の分野です。

ヘルス領域が全モデル中1位。 HealthBench Hardで42.8を記録し、GPT-5.4（40.1）やGemini 3.1 Pro（20.6）を上回りました。1,000人以上の現役医師と共同でトレーニングデータを整備した成果です。

マルチモーダル理解が全モデル中2位。 MMMU-Proで80.5%を記録し、Gemini 3.1 Pro（82.4%）に次ぐ成績。チャート・図表理解のCharXivでは86.4で全モデル中トップです。

一方で、弱点も明確です。コーディングではGPT-5.4（75.1）に対して59.0と大きな差があり、複雑な多段階タスクを自律的にこなすエージェント性能でもClaude Opus 4.6やGPT-5.4に劣ります。Meta自身もこの点は認めており、長期的なエージェントシステムとコーディングワークフローへの投資を継続するとしています。

4. 無料で使える、ただし「Meta経済圏の中」で

Muse Sparkは 完全無料 で利用できます。meta.aiおよびMeta AIアプリで即座にアクセス可能で、Facebook、Instagram、Messenger、WhatsAppへの統合も順次進められる予定です。

ただし、注意すべき点が2つあります。

ひとつは、Metaとして初のクローズドモデルであること。 これまでのLlamaシリーズはオープンソースで提供されてきましたが、Muse Sparkはオープンウェイトでは公開されていません。APIも現時点では一部パートナー向けのプライベートプレビューにとどまり、一般開発者向けの公開時期や料金は未発表です。将来的なオープンソース化の可能性には言及していますが、具体的なスケジュールは示されていません。

もうひとつは、プライバシーの問題です。 Muse Sparkの利用にはFacebookやInstagramのアカウントでのログインが必要です。Metaは一般的にユーザーの公開データをAIの学習に使用しており、個人情報がどこまでAIに活用されるかは明示されていません。無料である代わりに、利用者のデータがMuse Sparkの改善に使われる可能性は十分に考えられます。

5. AI業界への影響：「4強時代」の幕開けか

Muse Sparkの登場により、フロンティアAIモデルの競争構図は大きく変わりつつあります。

2026年4月の1週間だけで、AnthropicはサイバーセキュリティAI「Claude Mythos Preview」を限定公開、Googleはオープンモデル「Gemma 4」を発表、そしてMetaがMuse Sparkを投入しました。OpenAI、Anthropic、Googleの3強に加え、MetaがLlama 4の失敗を経て本格的にフロンティアに復帰したことで、AI業界は明確な「4強時代」に突入しています。

特にMuse Sparkが興味深いのは、30億人以上のユーザーを抱えるMetaのプラットフォーム上で無料提供される点です。性能ではまだトップではないものの、到達可能なユーザー数では他社を圧倒しています。AIの価値が「モデルの性能」だけでなく「どれだけ多くの人が日常的に使うか」で測られる時代が近づいていることを、Muse Sparkは象徴しているのかもしれません。