PLaMo 3.0 Primeとは?国産フルスクラッチAIの性能・料金・使い方を徹底解説

押さえておきたいポイント
  • PLaMo 3.0 Primeは、PFNがフルスクラッチで開発した国産生成AI基盤モデルの最新フラッグシップ
  • Reasoning(推論)モデルとNon-reasoning(高速応答)モデルの2種類を用途に応じて切り替え可能
  • コンテキスト長を256kトークンに拡張し、日本語の指示追従や医療・法令分野で海外モデルに匹敵する性能を実現

2026年6月22日、Preferred Networks(PFN)は、国産生成AI基盤モデルの最新版「PLaMo 3.0 Prime」をリリースしました!

「じっくり考える」Reasoningモデルと「すぐに答える」Non-reasoningモデルの2本立て、さらに256kトークンという長大なコンテキスト長への対応と、企業の実務で使える機能を大幅に強化しています。

とはいえ、「国産AIって実際どうなの」「海外モデルとどこが違うの」と気になっている方も多いのではないでしょうか。

そこで本記事では、PLaMo 3.0 Primeの概要から仕組み、ベンチマーク性能、料金体系、具体的な使い方までを徹底解説します。最後まで読めば、自社の業務にPLaMo 3.0 Primeをどう活かせるかが明確になるはずです。

\生成AIを活用して業務プロセスを自動化/

PLaMo 3.0 Primeとは?

PLaMo 3.0 Primeとは?
参考:https://chat-demo.plamo.preferredai.jp/

PLaMo 3.0 Primeは、PFNが国内でゼロから設計・開発した国産フルスクラッチの生成AI基盤モデルです。2026年3月に公開されたβ版をベースに、モニター企業からのフィードバックや社内評価を反映して実用性を高めたのが今回の正式版にあたります。

最大の特徴は、論理的に段階を踏んで考えるReasoningモデルと、すぐに回答を返すNon-reasoningモデルの2種類を備えている点です。企業が用途に応じてモデルを切り替えられるため、「複雑な意思決定支援はReasoningで、定型的な問い合わせ対応はNon-reasoningで」といった柔軟な使い分けが可能になっています。

また、コンテキスト長を従来の64kトークンから256kトークンへと4倍に拡張したことで、長文の社内文書を一括で読み込ませたり、AIエージェントとして複数ステップの処理を実行させたりといった使い方にも対応しています。

提供形態はクラウドAPI・Amazon Bedrock Marketplace・オンプレミス・Snowflakeと幅広く、約800の自治体が導入するQommonsAIへの標準搭載やデジタル庁の生成AI環境「源内」での試用モデル選定など、すでに行政や企業の現場で活用が進んでいるのも注目すべきポイントです。

従来モデルはこちら

PLaMo 3.0 Primeの仕組み

PLaMo 3.0 Primeの仕組み
参考:https://speakerdeck.com/pfn/20260406_plamo_3_beta_posttrain_and_inference_opt?slide=18

PLaMo 3.0 Primeは、NICTとの共同研究で得られた事前学習モデルをベースに、PFN独自の事後学習パイプラインで仕上げられています。

事前学習の段階では、NICT提供の日本語データセットとPFN独自の高品質データを組み合わせ、日本語の文脈理解や論理展開に必要な知識を大量に学習させています。その上で事後学習では、教師あり学習(SFT)と強化学習(RL)を組み合わせた手法が採用されています。

β版と比較して強化学習のステップ数を約2倍に拡大しており、コーディング・長コンテキスト・対話性能など多岐にわたるデータで推論能力を底上げしています。

また、コンテキスト長の拡張にはYaRNという手法と継続事前学習を組み合わせており、64kから256kへの4倍拡張を実現しました。これによって、AIエージェントとして長大なツール利用履歴を保持しながら処理を続けることが可能となっています。

さらに、構造化出力(Structured Output)にも新たに対応しています。LLMからの応答をユーザーが指定したデータ構造に厳密に準拠させる機能で、既存の業務システムや外部APIとの連携が大幅にやりやすくなっています。

PLaMo 3.0 Primeの特徴

PLaMo 3.0 Primeは、PFN社内の評価においてβ版およびPLaMo 2.2 Primeの両方から大幅な性能向上が確認されています。

PLaMo 3.0 Primeの特徴
参考:https://tech.preferred.jp/ja/blog/plamo-3-0-prime-release/

公式ブログでは、合計15個のベンチマークでの評価結果が公開されています。比較対象は、同性能帯のオープンモデルであるQwen3.6-27Bやgpt-oss-120b、同価格帯のクローズドモデルであるGPT-5.4 MiniやClaude Haiku 4.5です。

PLaMo 3.0 Primeが特に強みを発揮している領域は、日本語・英語の指示追従性能(IFBench/JFBench)、日本語・英語の対話性能(MT-bench/Japanese MT-bench)、ツール使用性能(BFCL v4)、医療分野(MedRECT・医師国家試験)、コード生成(LiveCodeBench)、そして安全性能(HELM Safety)です。特に医療や法令といった日本語の専門分野では、海外モデルを上回るケースも確認されています。

PLaMo 3.0 Primeの特徴
参考:https://tech.preferred.jp/ja/blog/plamo-3-0-prime-release/

一方で、PFN自身がWeb探索(BrowseComp-Plus)や長コンテキスト理解(LongBench)、数学的推論(AIME 2024)、STEM分野(GPQA-Diamond)ではまだ改善の余地があるとも明記しており、今後の性能向上に期待が高まります。

X上で話題:Sakana AI「Fugu」との同日リリースに注目集まる

PLaMo 3.0 Primeのリリースが話題を呼んだ理由のひとつに、Sakana AIの「Fugu」と同じ6月22日にGAリリースが重なった点があります。X上でもPFN公式や関係者のポストを中心に反響が広がりました。

今回解説する事例において、弊社がX(旧Twitter)で発見した参考となるツイートを紹介させていただいております。取り下げなどのご連絡は、contact@weel.co.jp からご連絡ください。

PFN公式アカウントは、5つの特徴を端的に整理したポストでリリースを告知しています。API・オンプレ対応、Reasoning/Non-reasoning切り替え、コスパ、256k拡張、安全性向上と、企業利用で気になるポイントがまとめられています。

PFN代表の岡野原大輔氏も、同日に自身のアカウントからポストを投稿しました。日本語指示追従やコーディングで同価格帯モデルに匹敵・上回る性能をアピールしており、開発トップ自らの発信に熱量が感じられます。

さらに、クラスメソッドのDevelopersIOでは「国産LLMが二発同日にリリースされた2026-06-22は、界隈にとっていい節目だったのかもしれない」と評されました。同記事では、PLaMo 3.0 PrimeのOpenAI互換APIを実際に叩いてReasoning ON/OFFの挙動を検証し、Claude Codeからも呼び出せることが確認されています。

フルスクラッチの国産LLMがここまで普通に使える状態で世に出てきたという驚きが、開発者コミュニティで共有されている印象です。

PLaMo 3.0 Primeの安全性・制約

PLaMo 3.0 Primeでは、NICTから提供を受けた安全性関連データを活用して学習が行われています。

その結果、スタンフォード大学基盤モデル研究所が運用するHELM Safetyベンチマークにおいて、暴力・詐欺・差別・性的表現・ハラスメント・欺瞞の6カテゴリすべてで海外モデルと同等以上の安全性能を達成しました。

HELM Safetyは「危険な回答をしないか」だけでなく、「安全に回答できるか」「過剰拒否しないか」「脱獄攻撃に耐えられるか」まで体系的に評価する仕組みで、そこで競争力のあるスコアが出ている点は企業利用において大きな安心材料です。

ただし、非推論モデルでは一部のカテゴリで過剰拒否や危険プロンプトへの応答が見られたと公式に報告されており、PFNもさらなる改善が必要と認識しています。

PLaMo 3.0 Primeの料金

PLaMo 3.0 Primeの料金
参考:https://tech.preferred.jp/ja/blog/plamo-3-0-prime-release/

PLaMo 3.0 Primeの料金体系は、利用規模や用途に応じて3つのプランが用意されています。

スクロールできます
プラン入力単価(/1Mトークン)出力単価(/1Mトークン)特徴
Free0円0円利用量・レートリミットに制限あり(2026年6月時点では準備中)
Standard60円250円登録後すぐに利用開始可能。入力データはモデル学習に使用されない
Provider個別見積もり個別見積もりAIサービス提供者向け。利用用途の審査と柔軟な運用条件を組み合わせたプラン
PLaMo 3.0 Prime APIの料金プラン比較(128kトークンまでの単価。128k超はリリース記念期間中は同額)

Standardプランの出力単価250円/1Mトークンという水準は、GPT-5.4 MiniやClaude Haiku 4.5など同価格帯の海外モデルと比較しても十分に競争力があります。しかも独自トークナイザのおかげで日本語テキストのトークン効率が高いため、実質的なコストはさらに抑えられる可能性があります。

2026年7月31日まではGAリリース記念キャンペーンとして、Standardプランの新規登録で1,000万トークン相当のクレジットが付与されます。まずは気軽に試してみたいという方にとって、絶好のタイミングといえるでしょう。

PLaMo 3.0 Primeのライセンス

PLaMo 3.0 Primeはクローズドモデルであり、モデルの重みファイルは非公開です。利用はAPI経由またはオンプレミス契約に限定されます。

スクロールできます
項目可否備考
商用利用⭕API・オンプレミス契約を通じて商用利用が可能
改変(ファインチューニング)❌モデル重みは非公開のため、ユーザーによるファインチューニングは不可
再配布❌モデル重みが非公開のため再配布は不可
特許利用
私的利用⭕PLaMo ChatやAPI(Freeプラン含む)で個人利用可能
PLaMo 3.0 Primeのライセンス(2026年6月時点)

以前のPLaMo-13Bのように研究用途でオープンソース公開されたモデルもありましたが、PLaMo 3.0 Primeは商用フラッグシップとしてのポジションを明確にしています。Standardプランでは入力データがモデル学習に使用されない旨が明記されているため、社内の機密データを扱う企業にとっては安心して導入できる形態です。

PLaMo 3.0 Primeの使い方

PLaMo 3.0 Primeは、PLaMo Chat(Webブラウザ)APIの2つの方法で利用できます。

PLaMo Chatで使う方法(ブラウザ)

もっともお手軽に始められるのが、PLaMo Chatを使う方法です。

STEP
サイトにアクセス

PLaMo公式サイトにアクセスして、画面上部のChatメニューかTalk to PLaMoボタンを押下します。

PLaMo 3.0 Primeの使い方
参考:https://plamo.preferredai.jp/
STEP
アカウント作成

アカウントを作成してログインすると、チャット画面が表示されます。

PLaMo 3.0 Primeの使い方
参考:https://plamo.preferredai.jp/
STEP
プロンプト入力

テキストボックスにメッセージを入力すれば、すぐにPLaMo 3.0 Primeとの対話が始まります。Freeプランでも基本的なChatは利用できるため、まずはここから試してみるのがおすすめです。

API(Standardプラン)で使う方法

業務やシステムに組み込みたい場合は、API経由での利用が適しています。

STEP
プラットフォームコンソールにアクセス

PLaMo Platform Consoleにアクセスし、Standardプランで登録します。利用規約やプライバシーポリシーへの同意、クレジットカードの登録が必要です。

PLaMo 3.0 Primeの使い方
参考:https://plamo.preferredai.jp/api
STEP
APIキー発行

ログイン後、コンソール画面からAPIキーを発行します。キーが表示されるのは発行直後の一度きりなので、その場でコピーして安全な場所に保管してください。

STEP
API呼び出し

PLaMo APIはOpenAI互換のChat Completions APIとして動作するため、既存のOpenAIのSDKやライブラリがそのまま使えます。エンドポイントは https://api.platform.preferredai.jp/v1 です 。

以下は、PythonのOpenAI SDKからPLaMo 3.0 Primeを呼び出す基本的なコード例です。

from openai import OpenAI

client = OpenAI(
    api_key="YOUR_PLAMO_API_KEY",
    base_url="https://api.platform.preferredai.jp/v1"
)

response = client.chat.completions.create(
    model="plamo-3.0-prime",
    messages=[
        {"role": "user", "content": "PLaMo 3.0 Primeの特徴を教えてください"}
    ]
)

print(response.choices[0].message.content)
STEP
Reasoningモード(推論モード)をON/OFFする方法

Reasoningの切り替えは、リクエストパラメータの reasoning_effort で制御できます。

# Reasoning ON(推論モード)
response = client.chat.completions.create(
    model="plamo-3.0-prime",
    messages=[{"role": "user", "content": "複雑な論理パズルを解いて"}],
    reasoning_effort="medium"  # PLaMoではnoneとmediumの2値のみ対応
)

# Reasoning OFF(高速応答モード)
response = client.chat.completions.create(
    model="plamo-3.0-prime",
    messages=[{"role": "user", "content": "この文章を要約して"}],
    reasoning_effort="none"
)

OpenAIやAnthropicのAPIに慣れている方は low / medium / high の3段階を想像するかもしれませんが、PLaMoではnoneとmediumの2値のみが有効です。lowやhighを指定するとエラーになるのでご注意ください。

【業界別】PLaMo 3.0 Primeの活用シーン

PLaMo 3.0 Primeは日本語での自然な文脈理解と指示追従に強みを持ち、さまざまな業界での活用が見込まれています。

医療・ヘルスケア業界

ベンチマークで医師国家試験やMedRECTの高スコアを記録しているPLaMo 3.0 Primeは、医療文書の要約や症例に関する質問応答への活用が見込まれています。カルテ情報の整理や、患者向け説明文書の下書き生成など、日本語の医療テキストを正確に処理する場面での導入が期待されます。

なお、医療・薬業界における生成AIの活用方法については下記の記事をご覧ください。

医療業界はこちら

薬業界はこちら

行政・自治体

すでに約800の自治体が導入するQommonsAIに標準搭載されており、デジタル庁の「源内」でも試用モデルに選定されています。住民からの問い合わせ対応や、行政文書の作成支援、法令に基づく回答の生成など、日本の制度や法律を理解した上での処理が求められる場面で活躍してくれるでしょう。

自治体における生成AI活用について、詳しく知りたい方は以下の記事も参考にしてみてください。

法務・コンプライアンス

lawqa_jp(日本の法令に関する質問応答ベンチマーク)でも強みを示しており、契約書のレビュー補助や規制文書の要点抽出といった法務業務の効率化に適しています。オンプレミスでの導入にも対応しているため、機密性の高い法的文書を外部に出さずに処理できます。

法務業務における生成AI活用について、詳しく知りたい方は以下の記事も参考にしてみてください。

金融業界

PLaMoシリーズには金融知識を追加学習した金融特化型PLaMoもラインナップされており、金融レポートの要約や市場分析の補助など、専門用語が多い日本語文書の処理にも対応できるでしょう。

金融業界における生成AI活用について、詳しく知りたい方は以下の記事も参考にしてみてください。

ソフトウェア開発

LiveCodeBenchでのコード生成性能やBFCLでのツール使用性能が向上しており、OpenAI互換のAPIで既存の開発環境にそのまま組み込める手軽さも魅力です。コードレビューの補助や、テスト生成、ドキュメント作成など、日本語でのコミュニケーションが多い国内開発チームとの相性は抜群でしょう。

生成AIを搭載したSaaSについて、詳しく知りたい方は以下の記事も参考にしてみてください。

【課題別】PLaMo 3.0 Primeが解決できること

PLaMo 3.0 Primeは企業が生成AI導入で直面しがちな課題に対して、いくつかの明確な解決策を提供しています。

データを国内に留めたまま生成AIを使う

海外のクラウドAIサービスにデータを送ることに抵抗がある企業は少なくありません。

PLaMo 3.0 Primeはすべてのリクエストが日本国内のサーバーで処理され、Standardプランではデータがモデル学習に使われないことが明記されています。さらにオンプレミスでの導入にも対応しているため、データの越境を完全に回避することも可能です。

日本語での指示追従精度をアップする

海外モデルを日本語で使うと、微妙にニュアンスが伝わらなかったり、出力フォーマットが崩れたりすることもありますよね。

PLaMo 3.0 Primeは日本語の指示追従に特化した学習・評価が行われており、JFBenchやJapanese MT-benchで高いスコアを記録しています。特に指定された出力形式に正確に追従する能力は公式でも特徴として強調されています。

複雑な推論と高速応答を1つのAPIで使い分ける

Reasoningモデルは精度が高い反面、応答に時間がかかります。PLaMo 3.0 Primeでは reasoning_effort パラメータでnoneとmediumを切り替えるだけで推論の深さを制御できるため、同じAPIキー・同じエンドポイントで使い分けを実現することができます。複雑な分析にはReasoningを、チャットボットの即答にはNon-reasoningを割り当てるといった運用がシンプルに行うことができるでしょう。

PLaMo 3.0 Primeを使ってみた

ここからは、実際にPLaMo 3.0 Primeを使ってみましょう。

PLaMo Chatで日本語の自然さを検証

プロンプトはこちら
日本のAI政策の現状と課題を500文字程度で整理してください
結果はこちら
PLaMo 3.0 Primeを使ってみた

返ってきた文章は、いわゆるAIっぽさの少ない自然な日本語で、結論から入る構成もビジネス文書として十分に使えるレベルです。

特に印象的だったのは、日本語の敬語表現の使い分けや、である調の統一感がしっかりしている点です。海外モデルで日本語応答させた場合に起きがちな不自然さがほとんど見られず、国産モデルならではの日本語品質を感じました。

構造化出力でJSON応答を取得

プロンプトはこちら
3つの日本のITトレンドをJSON形式で出力して
結果はこちら
PLaMo 3.0 Primeを使ってみた

指定通りの構造でJSONが返ってきました。既存のシステムへの組み込みや、外部APIとのデータ連携を想定している開発者にとっては、パース不要でそのまま使えるレスポンスが得られる点は大きなメリットですね。

よくある質問

最後に、PLaMo 3.0 Primeに関して、多くの方が疑問に感じるポイントをQ&A形式でまとめました。

PLaMo 3.0 Primeは無料で利用できますか?

はい、利用量やレートリミットに制限のあるFreeプランが用意されています。2026年6月22日のリリース時点ではFreeプランは準備中となっていますが、今後開放される予定です。また、Standardプランについても2026年7月31日までの新規登録で1,000万トークン相当のクレジットが付与されるキャンペーンが実施されています。

PLaMo 3.0 Primeのモデルの重み(ウェイト)は公開されていますか?

いいえ、PLaMo 3.0 Primeはクローズドモデルであり、モデルの重みは公開されていません。利用はAPI経由またはオンプレミス契約に限られます。なお、以前のPLaMo-13Bなど一部のモデルはオープンソースで公開されていた経緯がありますが、PLaMo 3.0 Primeは商用フラッグシップとして異なるポジションに位置づけられています。

PLaMo 3.0 PrimeはChatGPTやClaudeの代替として使えますか?

用途によります。日本語の指示追従や医療・法令分野の専門的な質問応答では、ChatGPTやClaudeの同価格帯モデルに匹敵する、あるいは上回る性能を示しています。一方で、数学的推論やWeb探索、超長文コンテキストの処理ではまだ差がある部分もあります。まずは自社の主要な用途で実際に試してみて、海外モデルとの比較を行うのがおすすめです。

PLaMo 3.0 Primeで国産AIを業務に活かそう!

PLaMo 3.0 Primeは、「国産フルスクラッチ」という看板に恥じない進化を遂げたモデルです。Reasoningモデルと高速応答モデルの2枚看板、256kトークンの長大なコンテキスト、そして日本語特化の指示追従性能と、企業が実務でAIを使い始めるために必要なピースが揃い始めています。

もちろん、数学的推論やグローバルなSTEM領域では海外フロンティアモデルとの差がまだ残っています。

ただし、「日本語を安く、速く、社内に閉じたまま使える」という価値は、特に行政・医療・法務といった分野では代替が効きにくい独自の強みです。まずはFreeプランやStandardプランの無料クレジットを使って、自社のユースケースでどこまで戦えるかを確かめてみてください。

最後に

いかがだったでしょうか?

弊社では、AI導入を検討中の企業向けに、業務効率化や新しい価値創出を支援する情報提供・導入支援を行っています。最新のAIを活用し、効率的な業務改善や高度な分析が可能です。

株式会社WEELは、自社・業務特化の効果が出るAIプロダクト開発が強みです!

開発実績として、

・新規事業室での「リサーチ」「分析」「事業計画検討」を70%自動化するAIエージェント
・社内お問い合わせの1次回答を自動化するRAG型のチャットボット
・過去事例や最新情報を加味して、10秒で記事のたたき台を作成できるAIプロダクト
・お客様からのメール対応の工数を80%削減したAIメール
・サーバーやAI PCを活用したオンプレでの生成AI活用
・生徒の感情や学習状況を踏まえ、勉強をアシストするAIアシスタント

などの開発実績がございます。

生成AIを活用したプロダクト開発の支援内容は、以下のページでも詳しくご覧いただけます。
➡株式会社WEELのサービスを詳しく見る。

まずは、「無料相談」にてご相談を承っておりますので、ご興味がある方はぜひご連絡ください。
➡︎生成AIを使った業務効率化、生成AIツールの開発について相談をしてみる。

大規模言語モデル(LLM)比較レポート
LLM比較レポート

「生成AIを社内で活用したい」「生成AIの事業をやっていきたい」という方に向けて、生成AI社内セミナー・勉強会をさせていただいております。

セミナー内容や料金については、ご相談ください。

また、大規模言語モデル(LLM)を対象に、言語理解能力、生成能力、応答速度の各側面について比較・検証した資料も配布しております。この機会にぜひご活用ください。

タイトルとURLをコピーしました