
- MiniMax M3はコーディング・100万トークンコンテキスト・マルチモーダルの3機能を統合した初のオープンウェイトモデル
- SWE-Bench Proで59.0%を記録し、GPT-5.5やGemini 3.1 Proを上回る性能
- API料金は入力$0.30 / 出力$1.20(プロモ価格)でClaude Opusの約5%のコスト
2026年6月1日、中国・上海のAI企業MiniMaxは公開した次世代フラッグシップAIモデル「MiniMax M3」をリリースしました!
コーディング性能を測るSWE-Bench Proでは59.0%のスコアを記録し、GPT-5.5やGemini 3.1 Proを上回る結果を叩き出しています。
とはいえ、「具体的にどう使うの?」「オープンウェイトって何が嬉しいの?」「料金はどのくらい?」と気になっている方も多いのではないでしょうか。
そこで本記事では、MiniMax M3の概要・仕組み・料金体系から具体的な使い方、活用シーンまでを網羅的に解説します。ぜひ最後までご覧ください!
\生成AIを活用して業務プロセスを自動化/
MiniMax M3とは?

MiniMax M3は、上海拠点のAIスタートアップMiniMaxが開発したトリリオンパラメータ級のMoE(Mixture of Experts)型マルチモーダル基盤モデルです。2026年1月に香港証券取引所に上場した同社が、M2シリーズの集大成としてリリースした次世代モデルとなっています。
最大の注目ポイントは、「フロンティアレベルのコーディング能力」「100万トークンの超長文コンテキスト」「ネイティブマルチモーダル対応」という3つの最先端機能を、オープンウェイトモデルとして初めて1つに統合した点です。MiniMax公式は、この3つの機能をすべて備えたオープンウェイトモデルは2026年6月時点でM3のみだと明言しています。
テキスト・画像・動画の入力をネイティブにサポートしており、デスクトップPCの操作にも対応するなど、単なる言語モデルの枠を超えた汎用的なエージェントプラットフォームとしての性格を持っています。
MiniMax M3の仕組み
MiniMax M3のアーキテクチャを理解するうえで最も重要なのが、MSA(MiniMax Sparse Attention)と呼ばれる独自のスパースアテンション機構です。

従来のTransformerが採用するフルアテンションは、すべてのトークンが他のすべてのトークンに注意を払う仕組みのため、コンテキスト長が2倍になるとアテンション計算量はおよそ4倍に膨れ上がります。これが、長文コンテキストの推論コストを爆発的に増大させるボトルネックでした。
MSAはこの問題に対して、KVキャッシュをブロック単位で分割し、各クエリに対して最も関連性の高いブロックだけを選択的に参照するというアプローチで解決しています。公式の説明によると、MSAは、KVを外側のループとして、ヒットしたクエリを集約する方式を採用しており、各ブロックは1回だけ読み込まれるため、メモリアクセスが連続的になり演算効率が大幅に向上します。
この設計によって実現された性能改善は、公式発表によると以下のとおりです。
| 項目 | 性能改善 |
|---|---|
| プリフィル速度 | 前世代比で約9.7倍高速化 |
| デコード速度 | 前世代比で約15.6倍高速化 |
| 1トークンあたりの計算量 | 100万トークン時に前世代の約1/20 |
MiniMax M3の特徴
MiniMax M3の大きな特徴は、コーディング・エージェント・長文処理・マルチモーダルという4つの領域で同時に最先端クラスの性能を発揮する点です。
コーディング・エージェントベンチマーク
M3は複数の国際的なベンチマークで、フロンティアモデルに匹敵するスコアを記録しています。MiniMaxの公式発表によるベンチマーク結果は以下のとおりです。

| ベンチマーク | MiniMax M3 | GPT-5.5 | Gemini 3.1 Pro | Claude Opus 4.7 |
|---|---|---|---|---|
| SWE-Bench Pro | 59.0% | 58.6% | 54.2% | 64.3% |
| Terminal-Bench 2.1 | 66.0% | 78.2% | 70.0% | — |
| SWE-fficiency | 34.8% | — | — | — |
| KernelBench Hard | 28.8% | — | — | — |
| MCP Atlas | 74.2% | — | — | 77.0% |
| BrowseComp | 83.5 | — | — | 79.3 |
| SVG-Bench | 63.7% | — | — | 62.3% |
長時間自律稼働の実証

ベンチマークのスコアだけでなく、MiniMax M3は長時間にわたる自律的なタスク実行能力でも注目を集めています。公式の実験事例では、ICLR 2025の最優秀論文を与えて再現実験を指示したところ、M3は約12時間にわたり自律的に稼働し、18件のコミットと23枚の実験グラフを独力で生成しました。
さらに印象的なのが、NVIDIA Hopper GPUでのFP8行列演算カーネルの最適化タスクです。M3は参照実装なしの状態から約24時間連続で稼働し、147回のベンチマーク提出と1,959回のツール呼び出しを経て、ハードウェア利用率を7.6%から71.3%まで引き上げました。
ネイティブマルチモーダル
MiniMax M3は、マルチモーダル能力も学習の初期段階から深く統合しています。OmniDocBenchではGemini 3.1 Proを上回り、自律エージェント評価フレームワークClaw-Evalでは最高スコアを獲得しています。
画像・動画の理解に加えて、デスクトップPCの画面操作にも対応するという、エンドツーエンドの自律エージェントとして幅広い活用が期待できるモデルです。
MiniMax M3の安全性・制約
MiniMax M3は高性能なモデルですが、いくつかの留意点があります。
まず、公式に発表されているベンチマークスコアは、MiniMax自身のインフラ上で、Claude CodeやMini-SWE-Agentといったエージェントスキャフォールディングを使用して計測されたものが含まれています。独立した第三者による検証結果は今後のコミュニティの評価を待つ必要があります。
MiniMax M3の料金
MiniMax M3のAPI料金体系は、入力トークン数と利用ティアによって段階的に設定されているのが特徴です。2026年6月1日のリリース時点では、7日間限定で50%オフのプロモーション割引が適用されています。

| プラン | 入力 | 出力 | プロンプトキャッシュ読取 |
|---|---|---|---|
| ≤ 51.2万トークン(プロモ価格) | |||
| > 51.2万トークン | $1.20 / 100万トークン | $4.80 / 100万トークン | $0.24 / 100万トークン |
| プラン | 入力 | 出力 | プロンプトキャッシュ読取 |
|---|---|---|---|
| ≤ 51.2万トークン(プロモ価格) | |||
| > 51.2万トークン | $1.80 / 100万トークン | $7.20 / 100万トークン | $0.36 / 100万トークン |
Priorityティアはservice_tierパラメータで有効化でき、高負荷環境でのリクエスト優先スケジューリングが受けられるプランです。
MiniMax M3のライセンス
MiniMax M3はオープンウェイトモデルとして公開されていますが、ライセンスの扱いには注意が必要です。
前世代のM2.7では、モデルウェイトのダウンロードと研究目的での利用は自由に行える一方、商用利用にはMiniMaxの事前の書面による許可が必要というライセンス条件が設定されていました。M3についても同様のライセンス体系が踏襲される見込みです。
| 利用形態 | 可否 |
|---|---|
| 私的利用(研究・個人開発) | ![]() |
| 商用利用 | (MiniMaxの書面許可が必要) |
| 改変(ファインチューニング含む) | ![]() |
| 再配布 | (ライセンス条項の確認が必要) |
| 特許利用 | (個別確認推奨) |
MiniMax M3の使い方
MiniMax M3にアクセスする方法は複数用意されています。ここからは、代表的な3つの方法をステップ・バイ・ステップで解説します。
MiniMax Agent(Mavis)で試す
MiniMax Agentは、M3をブラウザ上で手軽に試せるチャット型インターフェースです。2026年6月のアップデートで「Mavis」という名称に一新されました。
チャット画面が表示されたら、そのままプロンプトを入力するだけでMiniMax M3を体験できます。M3がデフォルトモデルとして設定されており、コーディングタスクやマルチモーダル入力もここから試すことができます。

MiniMax Platform APIを使う
自分のアプリケーションやエージェントにMiniMax M3を組み込みたい場合は、APIを利用します。OpenAI互換のエンドポイントを採用しているため、既存のコードからの移行もスムーズです。
APIキーを発行します。ダッシュボードの「API Keys」セクションからキーを生成できます。

残高をチャージします。Pay as You Go方式のため、事前にクレジットを購入する必要があります。
以下のようなcurlコマンドでAPIを呼び出せます。
curl https://api.minimax.io/v1/chat/completions \
-H "Authorization: Bearer $MINIMAX_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "MiniMax-M3",
"messages": [
{"role": "user", "content": "このリポジトリの構造を要約して、リファクタリング計画を提案してください。"}
]
}'モデルIDはMiniMax-M3を指定します。ストリーミング出力や画像入力にも対応しており、「thinking」モードと「non-thinking」モードの切り替えにも対応しています。
Ollama Cloud + Claude Code / OpenCodeで使う
OllamaとMiniMaxの公式パートナーシップにより、Ollama Cloud経由でMiniMax M3をClaude CodeやOpenCodeなどのコーディングエージェントで利用できます。ゼロデータリテンション(データ保持なし) のUS拠点環境で動作するのが特徴です。
以下のコマンドでMiniMax M3を各種エージェントで起動できます。
# Claude Codeで使う場合
ollama launch claude --model minimax-m3:cloud
# OpenCodeで使う場合
ollama launch opencode --model minimax-m3:cloud
# Codexで使う場合
ollama launch codex --model minimax-m3:cloudコマンドを実行するとエージェントが起動し、MiniMax M3をバックエンドとしてコーディングタスクを開始できます。

【業界別】MiniMax M3の活用シーン
MiniMax M3はコーディング・エージェント・長文処理・マルチモーダルという4つの強みを持つため、さまざまな業界で活用の可能性が広がっています。ここからは、特に相性の良い業界別のユースケースを紹介します。
ソフトウェア開発・SIer業界
MiniMax M3の最も得意とする領域がソフトウェア開発です。100万トークンのコンテキストウィンドウにより、大規模リポジトリ全体を一度に読み込んだうえでバグ修正やリファクタリングの提案を行うことができます。
SWE-Bench Proでの高スコアが示すとおり、実際のソフトウェアエンジニアリングの問題を解決する能力に長けており、コードレビューの自動化やCIパイプラインへの組み込みなど、開発チームの生産性向上に直結する使い方が想定されます。
生成AIを搭載したSaaSについて、詳しく知りたい方は以下の記事も参考にしてみてください。

金融・コンサルティング業界
大量の決算資料や契約書、規制文書を一度に投入して横断的に分析できるのがMiniMax M3の強みです。
100万トークンという入力サイズは、数千ページ分のドキュメントに相当します。金融監査レポートの自動チェックや、複数企業のIR資料をまとめて比較分析するといったワークフローにおいて、M3のコストパフォーマンスはClaudeやGPT-5.5と比べても有利に働くでしょう。
金融業界における生成AI活用について、詳しく知りたい方は以下の記事も参考にしてみてください。

学術・研究機関
MiniMaxの公式デモでも紹介されているように、MiniMax M3は学術論文の自律的な再現実験という高度なタスクをこなすことができます。論文のPDFと関連コードを長文コンテキストに入れ、実験の設計から実行・結果の可視化までを自律的に行うワークフローは、研究者の実験サイクルを劇的に加速させる可能性を秘めています。
教育業界における生成AI活用について、詳しく知りたい方は以下の記事も参考にしてみてください。

【課題別】MiniMax M3が解決できること
ここからは、実際の業務で直面しやすい課題ごとに、MiniMax M3がどのように役立つかを整理します。
長文ドキュメントの全体把握の高速化
数百ページの技術マニュアルや法的文書を読み込んで要点を把握するのに、従来は何時間もかかっていた作業が、MiniMax M3の100万トークンコンテキストならドキュメント全体を1回のプロンプトで投入することができます。分割して投げ直す手間がなくなるため、文脈の途切れによる情報の欠落も防げるでしょう。
コーディングエージェントのAPI利用コスト削減
Claude OpusやGPT-5.5をコーディングエージェントのバックエンドに使うと、長時間のタスクでは1回あたり数ドル単位のコストが発生することも珍しくありません。
MiniMax M3は、プロモーション価格でOpusの約5%のコストで同等のタスクを処理できるため、高頻度のエージェントワークロードを現実的な予算内に収められます。
複数のツールやAPIをまたぐ自動化の効率化
MiniMax M3はMCP Atlas(エージェントプロトコル評価)で74.2%を記録しており、数百〜数千のAPIを1つのワークフロー内で正確にオーケストレーションする能力を備えています。金融監査の自動化や、複数プラットフォームにまたがるサプライチェーン連携といった複雑な業務フローの自動化に向いているでしょう。
MiniMax M3を使ってみた
それでは実際にMiniMax M3の実力を検証するため、MiniMax Agent(Mavis)を使ってコーディングタスクを試してみましょう。テーマとして、複数ファイルにまたがるバグ修正の指示を検証していきます。
プロンプトはこちら
utils.pyのparse_date関数でタイムゾーンが考慮されていないバグがあるので修正して、影響のある他のファイルも合わせて直して
結果はこちら


よくある質問
最後に、MiniMax M3に関して、多くの方が疑問に感じるポイントをQ&A形式でまとめました。
MiniMax M3を活用してフロンティアAIを体験しよう!
MiniMax M3は、オープンウェイトモデルとして初めてフロンティアレベルのコーディング・100万トークンコンテキスト・ネイティブマルチモーダルの3機能を統合したモデルです。
SWE-Bench ProでGPT-5.5を上回り、BrowseCompでClaude Opus 4.7を超えるスコアを記録しながらも、API利用料は主要フロンティアモデルの数十分の1という価格設定を実現しています。
コーディングエージェントや長文ドキュメント分析、マルチモーダルワークフローの構築を検討している開発者にとって、高性能と低コストを両立させる現実的な選択肢といえるでしょう。
最後に
いかがだったでしょうか?
弊社では、AI導入を検討中の企業向けに、業務効率化や新しい価値創出を支援する情報提供・導入支援を行っています。最新のAIを活用し、効率的な業務改善や高度な分析が可能です。
株式会社WEELは、自社・業務特化の効果が出るAIプロダクト開発が強みです!
開発実績として、
・新規事業室での「リサーチ」「分析」「事業計画検討」を70%自動化するAIエージェント
・社内お問い合わせの1次回答を自動化するRAG型のチャットボット
・過去事例や最新情報を加味して、10秒で記事のたたき台を作成できるAIプロダクト
・お客様からのメール対応の工数を80%削減したAIメール
・サーバーやAI PCを活用したオンプレでの生成AI活用
・生徒の感情や学習状況を踏まえ、勉強をアシストするAIアシスタント
などの開発実績がございます。
生成AIを活用したプロダクト開発の支援内容は、以下のページでも詳しくご覧いただけます。
︎株式会社WEELのサービスを詳しく見る。
まずは、「無料相談」にてご相談を承っておりますので、ご興味がある方はぜひご連絡ください。
︎生成AIを使った業務効率化、生成AIツールの開発について相談をしてみる。

「生成AIを社内で活用したい」「生成AIの事業をやっていきたい」という方に向けて、生成AI社内セミナー・勉強会をさせていただいております。
セミナー内容や料金については、ご相談ください。
また、大規模言語モデル(LLM)を対象に、言語理解能力、生成能力、応答速度の各側面について比較・検証した資料も配布しております。この機会にぜひご活用ください。

(MiniMaxの書面許可が必要)

