Stable Diffusionのおすすめ神モデル16選!リアル・アニメに強いモデル一覧も徹底解説

押さえておきたいポイント
  • モデルによって生成される画像の雰囲気が変わる
  • モデルは「Hugging Face」と「Civitai」から入手できる
  • VAEや最新モデルを組み合わせると、より高品質な画像が作れる

Stable Diffusion」を使うと写真のようにリアルな画像や、高画質なアニメ調の画像を作れますが、これは使用するモデルによって異なることをご存知でしたか?

今回は、画像生成に大きく影響するStable Diffusionのモデルに焦点を当てて、おすすめのモデル、ダウンロード方法、使用方法、さらに商用利用時の注意点について詳しくご紹介します。

この記事を最後までお読みいただければ、お好みの画像を自由に作れるようになるかもしれません。

ぜひ、最後までご覧ください!

\生成AIを活用して業務プロセスを自動化/

  1. Stable Diffusionとは
  2. Stable Diffusionにおけるモデルとは
    1. Stable Diffusionのベースモデル別特徴
    2. モデルの仕組み
    3. モデルのダウンロード方法
    4. モデルを使用する方法・入れ方
    5. Stable Diffusionモデルを動かすおすすめUI(WebUI / ComfyUI)
    6. LoRA・VAE・ControlNetについて
  3. Stable Diffusionで使えるおすすめモデル
    1. アニメ風・イラスト系モデル
    2. 実写・リアル系モデル
    3. 汎用・多目的モデル
    4. 実験的・最新系モデル
  4. Stable Diffusionモデルを選ぶポイント
    1. 用途に合ったモデルを選ぶ
    2. 2次元イラスト特化型モデルの選び方と特徴
    3. リアルな日本人画像生成に強いモデルを選ぶ
    4. コミュニティサポートの活発さ
    5. ライセンスと利用規約の確認
    6. PCスペック(VRAM容量)に対応したモデルを選ぶ
  5. Stable Diffusionでモデルを使ってみた
  6. Stable Diffusionの活用事例
    1. 写真や3Dを手描きコミックに変換できる「RealComic」
    2. ゲーム開発現場での背景生成に活用
    3. 個人クリエイターが使いやすい「Ani fusion」
  7. Stable Diffusionの商用利用・著作権に関して
    1. Creative ML OpenRAIL-Mライセンスとは?
    2. Hugging Faceのライセンス確認方法
    3. Civitaiのライセンス確認方法
    4. Stability AI Community Licenseとは?
  8. Stable Diffusionの導入時の注意点
  9. Stable Diffusionの利用料金は?無料と有料の違い
  10. Stable Diffusionモデルについてよくある質問
    1. Stable Diffusionモデルとは何ですか?
    2. Stable Diffusionモデルはどこからダウンロードできますか?
    3. モデルの拡張子「.ckpt」と「.safetensors」の違いは?
    4. VAEとは何ですか?モデルと一緒に使う必要がありますか?
    5. 商用利用は可能ですか?
    6. モデルを切り替えるときの注意点はありますか?
    7. 初心者におすすめのStable Diffusionモデルは?
  11. Stable Diffusionのモデルを使いこなそう!
  12. 最後に

Stable Diffusionとは

Stable Diffusionは、テキストから高品質な画像を生成できる画像生成AIモデルの一つです。英国のStability AI社によって2022年8月22日に初めてリリースされました。

オープンソースとして公開されているため、誰でも無料で利用でき、世界中のクリエイターが独自のモデルや拡張機能を開発しています。イラストや写真風の画像、3Dレンダリング風など幅広い表現が可能で、個人利用からプロジェクト利用まで活用の幅が広がっています。

Stable Diffusionにおけるモデルとは

Stable Diffusionにおける「モデル」とは、画像生成を行うために学習するデータセットやアルゴリズムの組み合わせのことです。モデルごとに学習データや特徴が異なるため、生成される画像のテイストや得意分野も変わります。

例えばアニメ風のイラストを生成するために特化したモデルを使用すれば、ユーザーは細かなスタイルや雰囲気を指定しなくても、自動的にアニメ系の高品質なイラストを生成可能です。

また、Stable Diffusionでは異なるモデルを組み合わせることもできます。これは「マージ」と呼ばれる技術で、各モデルの強みと弱みを補完しあうことで、より高品質で個性的な画像の生成も可能です。

Stable Diffusionのベースモデル別特徴

Stable Diffusionには複数のベースモデルが存在し、それぞれ画質傾向や必要なPCスペックが異なります。バージョンごとの特徴を理解したうえで、自分のPC環境と作りたい表現に合ったものを選ぶことが重要です。

スクロールできます
モデル名
(リリース年)
必要なVRAM(目安)特徴
Stable Diffusion 1.5(2022年)4〜8GB軽量で動かしやすく、派生モデル(特にアニメ・イラスト系)が豊富。入門用途にも最適。
Stable Diffusion 2.1(2022年)8GB前後1.5より高解像度・写実寄りに強化された世代。リアル系ベースとして使われることが多い。
Stable Diffusion XL(2023年)8〜16GB高品質・高解像度(1024系)に強く、構図やディテールが安定。イラスト・リアル両方でバランスが良い。
Stable Diffusion 3
(2024年)
16GB以上テキスト理解や破綻の少なさが強化された新世代。複雑な指示・自然な構図に強い(ハイスペック向け)。
Stable Diffusion 3.5(2024年)16GB以上最新世代として多様性と安定性を両立。リアル・イラスト問わず高精度で、本格制作・業務利用にも向く。
Stable Diffusionのベースモデル一覧

上記の一覧表をもとに、「PCスペック」と「やりたい表現」の両方を考慮してベースモデルを選びましょう。軽く試したい場合はStable Diffusion 1.5、画質や構図の安定性を重視するならSDXL、最新の表現力や多様性を活かした本格的な生成を行いたい場合はStable Diffusion 3.5が適しています。

モデルの仕組み

Stable Diffusionモデルは、大量の画像とテキストの対応関係を学習しており、入力されたプロンプト(文章)を「潜在空間」と呼ばれる数値データに変換し、そこからノイズを除去することで画像を生成します。

それぞれのモデルは異なる画像や条件で学習されているので、生成される画像の色味・構図・リアリティが大きく変わります。

モデルのダウンロード方法

次にモデルのダウンロード方法についてです。Stable Diffusionのモデルは次の2つのサイトからダウンロードできます。

  • Hugging Face
  • Civitai

それぞれのダウンロード方法について解説します。

Hugging Faceからのダウンロード

1. Hugging Faceの公式サイトにアクセスし、画面上部のメニューから「Models」を選びます。

参考:https://huggingface.co/

2. 画面左側にあるタブから「Text-to-Image」を選びます。

3.Stable Diffusionに対応するモデルの一覧が表示されます。

今回は、後ほど紹介するおすすめモデルの「yayoi_mix」を検索しました。

4.モデルをダウンロードする前に、「License」をクリックして利用規約や利用条件を確認しましょう。特に商用利用や著作権に関する規則に注意してください。

5.「Files and versions」をクリックし、「.ckpt」や「.safetensors」などのファイル形式を選び、ダウンロードします。

特に「safetensors」形式は安全性が高くおすすめです。

これで、Hugging Faceからのダウンロードは完了です。

Civitaiからのダウンロード

1. Civitaiの公式サイトにアクセスし、画面上部のメニューから「Models」を選びます。

2. モデルの一覧が表示されますので、好みのモデルを選んでください。

3.ダウンロードページが表示されますので、利用に関する制限事項の確認をしておきましょう。下の方にスクロールするとあるアイコンをクリックすると確認できます。

日本語に訳すと以下のとおりです。

日本語訳

このモデルは、ユーザーに以下のことを許可します:

  • 作成者のクレジットを記載せずにモデルを使用する
  • 自ら生成した画像を販売する
  • お金を得るために、モデルを画像生成サービスで利用する
  • Civitai上で利用する
  • このモデルを使用したマージを共有する
  • このモデルやこのモデルを使用したマージを販売する
  • マージを共有する際に異なる権限を持つ

バツがついている箇所は禁止している行為です。この場合は「このモデルやこのモデルを使用したマージを販売する」ことや、「マージを共有する際に異なる権限を持つ」ことはやらないでください、ということになります。

4. 「Download」ボタンをクリックするとダウンロードが開始されます。この時、ボタンの右下に「SafeTensor」と表記されているものが安全性が高くおすすめです。

CIVITAIでの使い方4

これで、Civitaiからのダウンロードは完了です。

以上が、Stable Diffusionモデルのダウンロードに関する基本的な流れです。

「Hugging Face」と「Civitai」どちらのサイトを使うかは個人の好みによります。いずれにせよモデルの選択や使用時は、商用利用や著作権の問題がありますので、必ずライセンスや制限事項を確認するようにしてください。

モデルを使用する方法・入れ方

続いて、モデルを使用する方法についてです。先ほどダウンロードしたモデルファイルを、Stable Diffusionがインストールされているフォルダに移動させます。

「stable-diffusion-webui」→「models」→「Stable-diffusion」と進み、その中に保存してください。

これで、モデルが認識されて使えるようになります。

Stable Diffusionモデルを動かすおすすめUI(WebUI / ComfyUI)

Stable Diffusionモデルは、主にStable Diffusion WebUIまたはComfyUIを使って動かします。どちらも無料で利用できますが、目的やスキルレベルによって向き・不向きがあります。

スクロールできます
項目Stable Diffusion WebUIComfyUI
操作方法フォーム入力型のGUIノードベースでフローを構築
学習コスト低い(初心者向け)高め(慣れが必要)
導入情報日本語記事・解説が豊富英語情報が中心
モデル切り替えプルダウンで簡単ノード設定で指定
LoRA / VAE設定UI上で簡単に設定可能ノードで柔軟に制御可能
ControlNet対応拡張機能で利用可能標準で高度に対応
SD3.5対応対応可能安定して対応
大量生成・バッチ処理あまり向かない非常に得意
向いているユーザー初心者・まず試したい人上級者・本格運用したい人
Stable Diffusion WebUI または ComfyUIの違い

最初はWebUIでモデルや画風の違いを試し、より高度な制御やSD3.5の本格運用が必要になった段階でComfyUIへステップアップする流れがおすすめです。

LoRA・VAE・ControlNetについて

Stable Diffusionでは、モデル本体(Checkpoint)に、LoRA・VAE・ControlNetを組み合わせることで、表現の幅や安定性を大きく向上させられます。それぞれの役割を整理しました。

スクロールできます
用語役割できること・特徴
Checkpoint
(モデル本体)
画像生成の土台画風や得意分野を大きく決める中核。この記事で紹介している「Stable Diffusionモデル」は主にこれを指す
LoRA追加学習データ特定のキャラ・画風・服装・ポーズなどを後付けで強化できる軽量モデル
VAE色味・陰影の調整発色・コントラスト・ディテールの出方を左右する仕上げ担当
ControlNet構図・ポーズ制御ポーズ・輪郭・奥行き・手の形などを指定して破綻を抑える
Checkpoint・LoRA・VAE・ControlNetの役割一覧

2025年現在で主流となっているStable Diffusionの使い方は、以下の組み合わせです。

定番構成

  • Checkpoint(モデル)+VAE(最低限の基本構成)
  • +LoRA(2〜3個)(キャラクター・画風・ポーズを細かくコントロール)
  • +ControlNet(構図や手指の破綻を抑え、安定した生成を実現)

この構成により、1つのモデルでも用途に応じた柔軟な表現が可能になります。Stable Diffusion 3.5でも専用ControlNet(Blur / Canny / Depth)が登場しており、従来世代と同様にポーズや輪郭を安定させた細かな制御が可能です。

Stable Diffusionで使えるおすすめモデル

スクロールできます
モデル名ベースモデル得意な画風・用途推奨VAE商用利用可否
yayoi_mixSD1.5系リアル系AI美女(アジア系人物)なし(汎用VAE推奨)条件付き
HimawariMixSD1.5系フラットなアニメビジュアル内蔵条件付き
Anime Pastel DreamSD1.5系パステル調アニメイラスト内蔵条件付き
Waifu DiffusionSD1.5系美少女系アニメ・ラノベ風kl-f8-anime2×
blue_pencilSD1.5系高品質アニメイラストClearVAE
Ghibli DiffusionSD1.5系ジブリ風背景・自然描写なし×
CounterfeitSD1.5系アニメ塗り・ファンタジー美少女専用VAEバージョン依存
Realistic VisionSD1.5系実写風人物・ポートレート内蔵
DeliberateSD1.5系芸術的構図・世界観重視なし
MeinaUnrealSD1.5系2.5Dアニメ調なし(アニメ向け推奨)条件付き
BRA V6SD1.5系リアル系AI美女なし(汎用VAE推奨)条件付き
CityEdgeMixSD1.5系フォトリアリスティック人物内蔵×
DreamShaperSD1.5 / SDXL創造的・ファンタジー表現内蔵条件付き
Stable Diffusion 3.5SD3.5高精度なテキスト理解内蔵条件付き
Stable Cascade独自アーキテクチャ高品質画像生成全般内蔵条件付き
Juggernaut XLSDXL多様なスタイルの高品質生成内蔵条件付き
Stable Diffusionのおすすめモデル一覧

Stable Diffusionのモデルの数は非常に多く、継続的に新しいモデルがリリースされています。その中でも今回は、特に注目すべきモデルをアニメ・イラスト系や写実・リアル系、汎用・多目的、実験的・最新系、それぞれ選出しました。各モデルの推奨VAE、商用利用の可否、得意とする分野について紹介します。

今回解説する事例において、弊社がX(旧Twitter)で発見した参考となるツイートを紹介させていただいております。取り下げなどのご連絡は、contact@weel.co.jp からご連絡ください。

アニメ風・イラスト系モデル

Stable Diffusionには、アニメやイラストに特化したモデルが数多く公開されています。これらのモデルは、線の表現や色使いが特徴的で、マンガ調・パステル調・ジブリ風など幅広いスタイルを再現可能です。キャラクターデザインや同人活動、SNS向けのビジュアル制作に人気があり、初心者から上級者まで幅広く利用されています。

yayoi_mix

  • 推奨VAE:なし
  • 商用利用:一部可能
  • 得意な分野:リアル系AI美女

「yayoi_mix」はリアル系AI美女の生成に特化したモデルです。アジア系の人物を生成するのに適しており、実写に近い画像を生成できるため、AI写真集などでの利用例が多いようです。

推奨VAEは特に指定されていませんので、一般的に使用される汎用VAE(例:vae-ft-mse-840000-ema-pruned)をおすすめします。

このモデルの利用にあたっては、暴力的な表現や児童ポルノ、未成年者の性的な表現などを禁止しています。また、実在する人物に似せた画像を生成し、本人の許可なく公開することも禁止のようです。

  • Hugging Faceからのダウンロードはこちら
  • Civitaiからのダウンロードはこちら

HimawariMix

  • 推奨VAE:不要
  • 商用利用:一部可能
  • 得意な分野:フラットなアニメビジュアル

HimawariMixは、アニメスタイルの画像生成に特化しており、特にフラットなアニメビジュアルの生成に優れています。様々なモデルを組み合わせたことにより、背景や細部の表現力に強みを持っており、アニメアートワークの高品質な生成が可能です。

細部の表現力が高いVAEを内蔵しており、複雑な背景や細かいディテールの表現が可能です。

商用利用については一部可能で、生成した画像の販売を認めています。しかし、Civitaiでの利用やマージモデルの販売、お金を得るためにモデルを画像生成サービスで利用するのは禁止されています。

  • Hugging Faceからのダウンロードはこちら
  • Civitaiからのダウンロードはこちら

Anime Pastel Dream

  • 推奨VAE:不要
  • 商用利用:一部可能
  • 得意な分野:パステル調のアニメイラスト

「Anime Pastel Dream」はパステル調のアートスタイルを好むユーザーや、アニメ風のイラストを生成するのに適しています。特に、アニメの女性キャラクターやマンガのコンセプトアートなどが得意です。

このモデルのVAEはあらかじめ組み込まれており、「Soft-baked vae」と「Hard-baked vae」と呼ばれる2種類のバージョンがあります。商用利用は可能ですが、マージモデルの販売は禁止されています。

  • Hugging Faceからのダウンロードはこちら
  • Civitaiからのダウンロードはこちら

Waifu Diffusion

参考:https://huggingface.co/hakurei/waifu-diffusion
  • 推奨VAE:kl-f8-anime2.ckpt
  • 商用利用:不可
  • 得意な分野:美少女系アニメ、ライトノベル風イラスト、アイドル風キャラクター

アニメ風のキャラクターを高品質に生成したいなら、Waifu Diffusionは必携のモデルです。日本の美少女系イラストに特化し、輪郭や髪の艶、瞳のきらめきまで細かく描写できるのが特徴です。

自然なポーズや服のしわの表現も得意で、二次創作やオリジナルキャラ制作に多用されています。塗りが整っており、SNS投稿でも注目を集めやすい完成度です。

  • Hugging Faceからのダウンロードはこちら

blue_pencil

  • 推奨VAE:ClearVAE
  • 商用利用:可能
  • 得意な分野:ハイクオリティなアニメイラスト

「blue_pencil」はアニメスタイルの女性キャラクターや動物などのイラストに特化しており、細かなディテールやかわいらしいスタイルの表現に適しています。

推奨VAEは「ClearVAE」です。画像の品質を最適化するためには、別途設定する必要があります。このモデルは商用利用が可能です。ユーザーはCreativeML Open RAIL-Mライセンスに基づき、倫理的かつ法的な責任を持ってモデルを使用してください。

  • Hugging Faceからのダウンロードはこちら
  • Civitaiからのダウンロードはこちら

Ghibli Diffusion

参考:https://huggingface.co/nitrosocke/Ghibli-Diffusion
  • 推奨VAE:なし
  • 商用利用:不可
  • 得意な分野:スタジオジブリ風背景、自然描写、心温まるキャラクター表現

ジブリの世界観を再現したいなら、Ghibli Diffusionが最適です。自然の描写や柔らかな色合いに強みを持ち、温かみのある幻想的なビジュアルが作れます。

山や川、木々といった自然描写が特に秀逸で、ファンタジー世界の演出にも活躍するだけでなく、優しい表情のキャラクターも描きやすく、絵本や童話的なイメージにも対応します。

  • Hugging Faceからのダウンロードはこちら

Counterfeit

参考:https://huggingface.co/gsdf/Counterfeit-V2.5
  • 推奨VAE:Counterfeit-V2.5.vae.pt
  • 商用利用:バージョンによって可否が異なる
  • 得意な分野:アニメ塗り、ファンタジー系キャラ、柔らかい表現の美少女

Counterfeitは、アニメ調とリアル感のバランスが絶妙な人気モデルです。柔らかい塗りや滑らかな肌表現が魅力で、幻想的な世界観の表現にも向いています。

特に中間色やパステルカラーの表現が美しく、瞳や背景のぼかし表現も自然で、ファンタジー系の衣装や小物にも対応でき、シーン生成にも活用しやすい点が好評です。

  • Hugging Faceからのダウンロードはこちら
  • Civitaiからのダウンロードはこちら

実写・リアル系モデル

リアル系モデルは、写真のように自然で本物らしい質感を表現できるのが特徴です。人物の顔や表情、風景や建築物の再現度が高く、広告や商品イメージなど商用用途にも活用されています。プロンプト次第で「まるで撮影したような写真」を生成できるため、特にフォトリアルな画像を求めるユーザーに支持されています。

Realistic Vision

  • 推奨VAE:内蔵
  • 商用利用:可能
  • 得意な分野:リアルな人物、実写風ポートレート、自然なライティングの再現

Realistic Visionは、まるで実写のような人物画像を生成できる高精度モデルです。特にポートレートや日本人風のリアル系イラストに強く、SNSや商用制作にも適しています

シワや毛穴まで再現できるレベルのディテールが魅力で、広告ビジュアルやプレゼン資料向けの素材としても高い評価を得ています。光と影のバランスも優秀です。

  • Hugging Faceからのダウンロードはこちら
  • Civitaiからのダウンロードはこちら

Deliberate

参考:https://huggingface.co/XpucT/Deliberate
  • 推奨VAE:なし
  • 商用利用:可能
  • 得意な分野:芸術的構図、感情表現のあるポートレート、世界観重視のシーン

Deliberateは芸術性の高い構図やシーン描写に向いた、表現の幅が広いモデルです。アニメとリアルの中間的なスタイルを得意とし、独自の世界観を表現するのに役立ちます。

ストーリー性を感じさせる絵作りに強く、背景や小物との一体感も魅力の一つで、SNS投稿用のオリジナル作品や、同人系ポスター制作にもおすすめのモデルです。

  • Hugging Faceからのダウンロードはこちら

MeinaUnreal

  • 推奨VAE:なし
  • 商用利用:一部可能
  • 得意な分野:2.5D感のあるアニメイラスト

「MeinaUnreal」は、2.5D感のあるアニメイラストの生成を目標としており、詳細で洗練された画像を生成するのに適しています。

このモデルにおける推奨VAEは特に指定されていませんので、アニメスタイルに適したVAE(例:Anything-v3-Better-VAE)を使用するのが良いでしょう。

商用利用は一部可能で、生成した画像の販売が認められています。しかし、クリエイターのクレジットを入れずにモデルを使用することや、マージモデルの販売、お金を払って画像を生成するサービスでの利用は禁止されています。

  • Hugging Faceからのダウンロードはこちら
  • Civitaiからのダウンロードはこちら

汎用・多目的モデル

汎用モデルは、アニメ風・リアル風のどちらも扱える柔軟性を持ち、幅広いジャンルに対応できるのが強みです。背景・キャラクター・風景・アイテムなど、用途を選ばずバランスよく生成できます。初めてStable Diffusionを使う人や、一つのモデルでさまざまな作風を試したいユーザーにおすすめです。

BRA V6

  • 推奨VAE:なし
  • 商用利用:一部可能
  • 得意な分野:リアル系AI美女

「BRA V6」はリアル系のAI美女に特化しており、特にアジア人の特徴を持つリアルな人物の画像を生成するのに適しています。実写に近い画像が生成できるため、AI写真集などでの利用が多いです​。

推奨VAEは特に指定されていませんので、汎用モデルの「vae-ft-mse-840000-ema-pruned」がおすすめです。商用利用は一部可能で、クリエイターのクレジットを入れずにモデルを使用したり、生成した画像を販売したりすることが認められています。

しかし、Civitaiでの利用やマージモデルの販売、お金を得るためにモデルを画像生成サービスで利用するのは禁止されています。

  • Hugging Faceからのダウンロードはこちら
  • Civitaiからのダウンロードはこちら

CityEdgeMix

  • 推奨VAE:不要
  • 商用利用:不可
  • 得意な分野:フォトリアリスティック

「CityEdgeMix」は、フォトリアリスティックなアジア系の女性の画像生成に特化しています。このモデルは、エロティックな画像(NSFW)とセーフな画像(SFW)の両方を生成できます。

VAEはあらかじめ組み込まれているため、追加の設定は不要です。商用利用には制限があり、CityEdgeMixモデルを使って生成した画像を販売したり、画像を生成するサービスで利用することは禁止されています。

Civitaiからのダウンロードはこちら

DreamShaper

  • 推奨VAE:内蔵
  • 商用利用:条件付きで可能
  • 得意な分野:創造的で夢のような画像

DreamShaperは、その名の通り、夢を形にするモデルです。

ぼんやりしたイメージを鮮明な画像として具現化することができ、現実世界には存在しないファンタジーな世界や未来的な風景を生成するのが得意です。

抽象的な概念や感情を色鮮やかな色彩と形で表現するなど、これまでにない斬新なアイデアで視覚化してくれます。

テキストで指示を出すだけで、素晴らしい画像が生まれるかもしれません。クリエイティブな画像を楽しみたい人にぴったりのモデルと言えるでしょう。

  • DreamShaperのダウンロードはこちら

実験的・最新系モデル

実験的・最新系モデルは、最新技術や大規模学習を取り入れた次世代のStable Diffusionモデルです。高解像度や効率的な画像生成、これまでにない表現力を実現しており、研究開発や新しい表現に挑戦したいクリエイターに注目されています。今後のアップデートや展開も期待される分野です。

Stable Diffusion 3.5(公式ベースモデル)

  • 推奨VAE:内蔵
  • 商用利用:条件付きで可能
  • 得意な分野:高精度なテキスト理解

Stable Diffusion 3.5(SD3.5)は、Stability AIが公開した最新世代の公式ベースモデルです。

テキスト指示の理解力が大幅に向上しており、複雑なプロンプトでも破綻しにくく、リアル系・イラスト系のどちらでも高い完成度の画像を生成できます。

一方で、SD3.5は登場からの期間がまだ短く、SD1.5やSDXLと比べると派生チェックポイント(専用モデル)は少ないのが現状です。

そのため、2025年時点では「特定の画風に特化した完成済みモデル」を探すというよりも、公式のSD3.5ベースモデルを軸に、LoRAを組み合わせて表現を作り込む使い方が主流となっています。

Medium・Large・Large Turboの3種類があるため、お使いのPCスペックや用途に応じて最適なモデルを選びましょう。

  • Stable Diffusion 3.5(Large)のダウンロードはこちら
  • Stable Diffusion 3.5(Large Turbo)のダウンロードはこちら
  • Stable Diffusion 3.5(Medium)のダウンロードはこちら

Stable Cascade

  • 推奨VAE:内蔵
  • 商用利用:条件付きで可能
  • 得意な分野:高品質な画像生成全般

Stable Cascadeは、従来のモデルとは一線を画す3段階の生成プロセスを採用し、驚くほど細やかな表現を可能にしたモデルです。

写真のような精密さから、芸術的な抽象的な表現まで、幅広い画像を生成できます。短い説明文から複雑な画像を作り出す能力が高く、プロのクリエイターからアマチュアまで、多くのユーザーに活用されています。

商用利用も条件付きで認められているので、ビジネスでの活用にもおすすめです。

  • Stable Cascade-base モデルのダウンロードはこちら
  • Stable Cascade-prior モデルのダウンロードはこちら
  • Stable Cascade-controlnet モデルのダウンロードはこちら

Juggernaut XL

  • 推奨VAE:内蔵
  • 商用利用:条件付きで可能
  • 得意な分野:多様なスタイルの高品質画像

Juggernaut XLは、画像生成の万能選手と呼べるモデルで、写真のようなリアルな画像から手描き風のイラストまで、幅広いスタイルが生成できます。

細かい部分まで丁寧に描き込む能力があり、複雑な構図やたくさんの要素が入った画像も得意としています。ユーザーの指示を正確に理解して、イメージ通りの画像を生み出してくれるので、クリエイティブな作業をする際に強力なツールとなること間違いありません。

  • Juggernaut XLのダウンロードはこちら

なお、AIインフルエンサーの作り方について詳しく知りたい方は、下記の記事を合わせてご確認ください。

Stable Diffusionモデルを選ぶポイント

Stable Diffusionで高品質な画像を生成するには、自分の目的に合ったモデルを選ぶことが重要です。得意分野が異なるため、事前のリサーチが欠かせません。ここでは、モデル選定時に注目すべきポイントを解説します。

用途に合ったモデルを選ぶ

まずは、自分が作りたい画像の方向性を明確にすることが大切です。リアルなポートレートを描きたいのか、それともアニメ風のキャラクターを描きたいのかで、選ぶべきモデルが変わります。

  • リアル系:Realistic Vision、Deliberateなど
  • アニメ系:Waifu Diffusion、Counterfeit、NovelAI系など

方向性が決まれば、モデルの性能を最大限に引き出しやすくなり、クオリティの高い出力にもつながります。

2次元イラスト特化型モデルの選び方と特徴

アニメやマンガのようなイラストを生成したい方向けに、2次元イラストに適したモデルの選び方をご説明します。良質な2次元イラストを生成するためには、目的に合ったモデルを選ぶことが重要です。

アニメ調の画像生成では、以下の3つのモデルが特に高い評価を得ています。

  1. HimawariMix
  • キャラクターと背景の両方が丁寧に描写
  • 全体的なバランスが良く、完成度の高い画像の作成
  • 商用利用も一部可能
  1. Anime Pastel Dream
  • かわいらしい雰囲気の画像が得意
  • パステルカラーの表現が美しい
  • アニメの女性キャラクターの作成に向いている
  1. blue_pencil
  • 繊細な表情の表現が得意
  • 細部まで丁寧な描写
  • 動物のイラストも上手に作成

モデルを選ぶときは、各モデルのサンプル画像をよく見て、自分の求めるタッチに近いものを選びましょう。

リアルな日本人画像生成に強いモデルを選ぶ

日本人らしい特徴を持つリアルな画像を生成したい方に、おすすめのモデルとその使い方を解説します。適切なモデルを選ぶことで、自然な日本人の画像を作ることが可能です。

実写のような日本人画像を生成するには、下記の3つのモデルがおすすめです。

  • yayoi_mix(日本人女性の特徴を自然に表現可能)
  • BRA V6(アジア人の顔立ちを正確に捉えているモデル)
  • CityEdgeMix(都会的な雰囲気の画像にできるモデル)

画像生成時のコツとして、プロンプトに「Japanese, realistic, natural lighting(和風、リアル、自然光)」などの具体的な言葉を加えると、より自然な仕上がりになります。

コミュニティサポートの活発さ

人気モデルには多くのユーザーが存在し、SNSやDiscord、フォーラムでの情報共有が活発です。コミュニティが活発であることで、使い方のコツや不具合対処法、プロンプトのテンプレートなど、実践的なノウハウを得やすくなります。

特に初心者にとっては、孤立せずに学べる環境があることは大きな安心材料です。迷ったら、活発なコミュニティのあるモデルを選ぶのも一つの手です。

ライセンスと利用規約の確認

モデルによっては「個人利用のみ可」「商用利用OK」など、利用範囲が明確に分かれています。特に収益化を考えている場合、事前にライセンスを必ず確認しましょう。

モデルページに記載されている使用条件を守らないと、著作権や利用規約違反につながる可能性があります。商用利用が必要な場合は、明示的に許可されているモデルを選ぶのが安全です。

PCスペック(VRAM容量)に対応したモデルを選ぶ

Stable Diffusionは使用するモデルによって必要なVRAM容量が大きく異なります。無理に高性能モデルを選ぶよりも、自分のPCスペックに合ったStable Diffusionモデルを選ぶことが、安定した画像生成への近道です。

VRAM容量
(目安)
おすすめモデル
4〜8GBStable Diffusion 1.5系モデル
8〜16GBStable Diffusion XL(SDXL)系モデル
16GB以上Stable Diffusion 3 / 3.5系モデル
VRAM容量別おすすめモデル

どうしてもPCスペックが足りない場合は、以下のコツを意識してみてください。

スペックが足りない場合に軽く動かすコツ

  • 生成解像度を下げる(例:512×512、768×768)
  • バッチサイズを1にする
  • 不要なControlNetやLoRAを減らす
  • fp16・軽量版モデルを利用する

これらを調整することで、限られたVRAM環境でも安定して画像生成を行えるようになります。

Stable Diffusionでモデルを使ってみた

おすすめモデルでも紹介したように、Stable Diffusionにはアニメ調のものからリアル調のものまで、様々なモデルがありますね。下の画像のプロンプトは同じですが、違うモデルを選択して生成したものです。

どうですか?

同じプロンプトを入力しても、モデルによって生成される画像がガラッと変わったのが分かりますね。さらに、モデルごとに推奨されるプロンプト/ネガティブプロンプトや設定があります。

例えば、先ほど使用したモデルのDivineEleganceMixには以下のような記述がありました。

プロンプトだけでなく、おすすめのサンプラーなど、詳細に書かれていますね。利用しているモデルのサンプルのような画像を生成したい場合は推奨の設定を反映させるようにしましょう。

Stable Diffusionの活用事例

Stable Diffusionは、創作活動のさまざまな場面で活用されています。漫画制作やゲーム開発など、専門的な現場でも実際に利用されており、制作のスピードや効率が大きく変わると注目を集めています。

ここでは、X(旧Twitter)上で見られる具体的な事例をご紹介します。

今回解説する事例において、弊社がX(旧Twitter)で発見した参考となるツイートを紹介させていただいております。取り下げなどのご連絡は、contact@weel.co.jp からご連絡ください。

写真や3Dを手描きコミックに変換できる「RealComic」

この投稿では、「RealComic for Qwen-Edit-2509」というLoRAモデルの活用例が紹介されています。写真や3Dモデルの画像を、まるでプロの手描きのようなコミック風イラストに変換できるのが特徴です。

プロンプトによって内容そのものも変更できる柔軟性があり、「女性をロボットに変換する」といった演出も可能。Speed LoRAに対応しており、生成速度も速く、漫画家やWebtoon制作者にとっては新しい制作ツールとして期待されています。

ゲーム開発現場での背景生成に活用

この投稿では、SRPGのようなアイソメトリック背景をStable Diffusionで自動生成している事例が紹介されています。

これまで時間がかかっていたゲームの背景制作が、大幅に短縮されることで開発コストの削減も可能。ゲーム開発の初期段階からプロトタイプ制作まで、AI画像生成の技術が効率化の強力なサポートになっているようです。

個人クリエイターが使いやすい「Ani fusion」

こちらは「Ani fusion」という、Stable Diffusionをベースとしたモデルを使ってみた感想です。投稿者は初めてでもスムーズに画像生成ができたとコメントしており、機能も豊富で、しっかり学べば漫画制作にも十分応用できると述べています。難しそうな印象を持たれがちなAIツールですが、個人クリエイターでも気軽に試せる手軽さが魅力のモデルです。

Stable Diffusionの商用利用・著作権に関して

Stable Diffusion 1.5系の多くのモデルは、CreativeML OpenRAIL-Mなどのオープンライセンスで提供されており、条件を守れば商用利用も可能です。

一方で、Stable Diffusion 3/3.5系は「Stability AI Community License」で提供されており、年間収益に応じた条件付きの商用利用ルールが定められています。

商用利用する場合は、以下のチェックリストを参照して、利用規約に沿った利用を心がけましょう。

  • モデル配布ページでライセンス表記を確認する
  • 「商用不可」「個人利用のみ」「Dreamlike版OpenRAIL」などの注意書きを必ず読む
  • img2imgで使用する元画像の著作権にも注意する

LoRA・VAEも元モデルのライセンスを引き継ぐ場合があるため、併せて確認が必要です。

ライセンスの確認方法や各ライセンスの詳細は、以下で解説します。

Creative ML OpenRAIL-Mライセンスとは?

Creative ML OpenRAIL-Mライセンスは、Stable DiffusionのようなAIモデルに適用される特殊なライセンスです。モデルの使用者はライセンスに従い、倫理的かつ適法に使用する責任があります。

ただし、使用するモデルによっては商用利用を制限していることがありますので注意してください。

そこで、あらためてHugging FaceとCivitaiでモデルのライセンスを確認する方法について説明します。

Hugging Faceのライセンス確認方法

Hugging Faceのライセンスは、下図の赤枠「creativeml-openrail-m」をクリックすると確認できます。

また、「Model Card」の本文中にも制限事項が記載されていたりしますので、併せて確認するようにしましょう。

Civitaiのライセンス確認方法

Civitaiのライセンスはモデルのページに記載されています。下図の赤枠内にライセンスの種類(大半のモデルは「creativeml-openrail-m」)と、それに加えて制限事項(アイコン)が記載されています。

さらに、アイコンをクリックするとその詳細を確認できます。

日本語に訳すと以下のとおりです。

日本語訳

このモデルは、ユーザーに以下のことを許可します:

  • 作成者のクレジットを記載せずにモデルを使用する
  • 自ら生成した画像を販売する
  • お金を得るために、モデルを画像生成サービスで利用する
  • Civitai上で利用する
  • このモデルを使用したマージを共有する
  • このモデルやこのモデルを使用したマージを販売する
  • マージを共有する際に異なる権限を持つ

当然ですが、バツがついている箇所は禁止している行為です。

ちなみに、追加の制限事項が何もないモデルの場合は、アイコンの表示がありません。どちらのサイトからダウンロードするにしても、モデルを使用する前には必ずライセンスとその制限事項を確認し、適切に遵守することを心がけてください。

Stability AI Community Licenseとは?

Stability AI Community Licenseは、Stable Diffusion 3 / 3.5系モデルに適用されているライセンスです。従来のOpenRAIL系ライセンスとは異なり、利用者や企業の年間収益規模に応じて、商用利用の可否が定められています

スクロールできます
利用者・用途利用条件
個人・非営利利用無料で利用可能
年間収益100万ドル未満の個人・企業原則無料で商用利用可能(申告は必要)
年間収益100万ドル以上の企業有償ライセンスが必要
Stability AI Community Licenseの利用条件まとめ

Stability AI Community Licenseは、法的な解釈や運用判断が絡むため、大企業が本格導入する際は、事前に法務・専門家へ確認することをおすすめします。

なお、商用利用可能な生成AI画像について詳しく知りたい方は、下記の記事を合わせてご確認ください。

Stable Diffusionの導入時の注意点

Stable Diffusionを使い始めるときは、ライセンスや著作権といった法的な部分だけでなく、実際の動作環境にも注意が必要です。環境によってはセーフティフィルターが外れていて、意図しない画像が出てしまうこともあります。使うWebUIや設定次第で挙動が変わるため、どんな安全対策が入っているのかは必ず確認しておきたいポイントです。

LoRAや追加モデルを外部から入れる場合は、どこが配布しているものなのか、ライセンスはどうなっているのかをしっかり見てから使うようにしましょう。出どころが怪しいデータを入れると、うまく動作しなかったり、思わぬリスクにつながったりする可能性があります。

高機能で便利なツールだからこそ、安心して使うための基本的な知識を身につけておくと安心です。

Stable Diffusionの利用料金は?無料と有料の違い

Stable Diffusionそのものは無料で使えますが、利用する環境によっては費用が発生する場合もあります。自分のパソコンにインストールして動かす方法なら追加料金は不要です。ただし、性能が足りないと画像生成に時間がかかることもあり、作業が止まってしまうこともあるでしょう。

クラウドサービス(例:RunwayML や Hugging Face Spaces)を使えば、強力なパソコンがなくても扱えます。こちらは便利な反面、利用回数に上限があったり、有料プランが用意されていたりします。

多くのサービスにはお試し用の無料枠もあります。まずは無料で触ってみて、自分に合うと感じたら有料プランへ切り替えると良いでしょう。

Stable Diffusionモデルについてよくある質問

Stable Diffusionモデルとは何ですか?

Stable Diffusionモデルとは、画像生成の「脳」となるAI学習データです。どのような画像を生成するかを決める役割を持ち、モデルごとに得意分野や表現スタイルが異なります。たとえば、アニメ特化・写真風・ファンタジー風など、目的に応じて最適なモデルを選ぶことが重要です。

Stable Diffusionモデルはどこからダウンロードできますか?

主に Civitai や Hugging Face などのサイトから無料でダウンロードできます。これらのサイトでは、各モデルのサンプル画像やライセンス情報も公開されているため、目的や利用条件に合わせて選びましょう。

モデルの拡張子「.ckpt」と「.safetensors」の違いは?

どちらもStable Diffusionモデルのファイル形式ですが、「.safetensors」 は安全性を高めた新しい形式で、「.ckpt」 よりも読み込みが早く、マルウェア混入のリスクが低いです。そのため現在は「.safetensors」 の使用が推奨されています

VAEとは何ですか?モデルと一緒に使う必要がありますか?

VAE(Variational AutoEncoder)は、画像の色味や明暗を補正するための補助モジュールです。モデル単体でも生成は可能ですが、VAEを組み合わせることでより自然で美しい仕上がりになります。特にアニメ系や写実系のモデルでは、専用のVAEを使うと品質が向上します。

商用利用は可能ですか?

Stable Diffusion 1.5系の多くのモデルは、CreativeML OpenRAIL-M などのオープンライセンスで提供されており、条件を守れば商用利用も可能です。

一方で、Stable Diffusion 3 / 3.5 系モデルはStability AI Community Licenseのもとで提供されており、年間収益に応じて商用利用の可否や条件が定められています。いずれの場合も、モデルごとに利用規約が異なるため、ダウンロード前にCivitaiやHugging Faceのライセンス表記を必ず確認することが重要です。

モデルを切り替えるときの注意点はありますか?

モデルを切り替える際は、同時に使っているVAEやLoRAなどの追加要素が競合しないよう注意が必要です。また、生成結果が大きく変わるため、プロンプト(指示文)の調整も合わせて行うと理想の画像が得やすくなります。

初心者におすすめのStable Diffusionモデルは?

はじめて使う方には、バランスが良く扱いやすい DreamShaperBRA V6 がおすすめです。どちらもアニメ・リアル両方に対応でき、プロンプトの調整次第で多彩なスタイルを試すことができます。

Stable Diffusionのモデルを使いこなそう!

今回はStable Diffusionのモデルについて紹介しました。記事の内容をまとめると、以下のとおりです。

モデルの概要

Stable Diffusionに入れることで、リアル調やアニメ調など、特定のスタイルの画像生成を行えるようになります。

モデルをダウンロードできるサイト

  • Hugging Face
  • Civitai

おすすめのモデル

  • yayoi_mix
  • BRA V6
  • CityEdgeMix
  • Anime Pastel Dream
  • MeinaUnreal
  • blue_pencil
  • Stable Cascade
  • Juggernaut XL
  • DreamShaper
  • Waifu Diffusion
  • Counterfeit
  • Realistic Vision
  • Deliberate
  • Ghibli Diffusion

Stable Diffusionは、プロンプトを入力するだけで、簡単に画像やイラストを作成できる画像生成AIです。無料でアクセスでき、様々なスタイルのモデルがあって楽しいのですが、ライセンスや制限事項はよく確認して使いましょう。

WEELが“失敗しないAI導入”を伴走します。

最後に

いかがだったでしょうか?

「Stable Diffusion」のモデル選択は、生成画像の品質を大きく左右します。最適なモデルの活用で制作の幅を広げてくれます。

株式会社WEELは、自社・業務特化の効果が出るAIプロダクト開発が強みです!

開発実績として、

・新規事業室での「リサーチ」「分析」「事業計画検討」を70%自動化するAIエージェント
・社内お問い合わせの1次回答を自動化するRAG型のチャットボット
・過去事例や最新情報を加味して、10秒で記事のたたき台を作成できるAIプロダクト
・お客様からのメール対応の工数を80%削減したAIメール
・サーバーやAI PCを活用したオンプレでの生成AI活用
・生徒の感情や学習状況を踏まえ、勉強をアシストするAIアシスタント

などの開発実績がございます。

生成AIを活用したプロダクト開発の支援内容は、以下のページでも詳しくご覧いただけます。
➡株式会社WEELのサービスを詳しく見る。

まずは、「無料相談」にてご相談を承っておりますので、ご興味がある方はぜひご連絡ください。
➡︎生成AIを使った業務効率化、生成AIツールの開発について相談をしてみる。

生成AIを社内で活用していきたい方へ
商用利用可能な画像生成AIレポート

「生成AIを社内で活用したい」「生成AIの事業をやっていきたい」という方に向けて、生成AI社内セミナー・勉強会をさせていただいております。

セミナー内容や料金については、ご相談ください。

また、弊社紹介資料もご用意しておりますので、併せてご確認ください。

tamura

監修者田村 洋樹

株式会社WEELの代表取締役として、AI導入支援や生成AIを活用した業務改革を中心に、アドバイザリー・プロジェクトマネジメント・講演活動など多面的な立場で企業を支援している。

これまでに累計25社以上のAIアドバイザリーを担当し、企業向けセミナーや大学講義を通じて、のべ10,000人を超える受講者に対して実践的な知見を提供。上場企業や国立大学などでの登壇実績も多く、日本HP主催「HP Future Ready AI Conference 2024」や、インテル主催「Intel Connection Japan 2024」など、業界を代表するカンファレンスにも登壇している。

タイトルとURLをコピーしました