ComfyUI Setup AI / ComfyUI / 画像生成
← Back to Blog

ComfyUIで
AI画像生成環境を作った日
FLUX.2 Kleinの迷走を超えて、妖精の女の子が降臨するまでの激動ジャーニー

PROLOGUE

ローカルAI画像生成の時代が来た

最近、AI生成画像・動画の進化がすさまじい。クラウドのサービスを使えば手軽に画像が作れるが、課金が積み重なるし、生成内容に制限がある場合も多い。

一方で、自分のパソコンの中でAI画像生成を動かす「ローカル生成」も盛り上がってきた。自前のGPU(画像処理専用チップ)がある環境なら、課金なしで好きなだけ生成できる。

環境:RTX 4090 Laptop(VRAM 16GB)搭載のノートPC。このスペックで何ができるか試してみた。ツールは ComfyUI(ノードベースの画像生成インターフェース。処理のブロックを繋いでワークフローを組む)を使う。

BUILD

Session 1:環境構築とAnima・Illustrious XL

ComfyUIのWindows Portable版(インストール不要で展開するだけで使える版)を公式GitHubから入手。展開してGPU対応の起動ファイルを実行すると、ブラウザで localhost:8188 にアクセスできてテンプレート一覧が表示された。

最初に試したのは AnimaIllustrious XL。どちらもアニメ・イラスト系に強いモデル(AI画像生成の核となるデータ)で、きれいな絵が出た。

TROUBLE

Session 2:FLUX.2 Kleinとの格闘

クラリスの提案で最新モデル FLUX.2 Klein に挑戦した。「量子化版(ファイルサイズを圧縮した版)なら VRAM 16GB でも動くかも」という作戦だ。しかし、ここからトラブルの連鎖が始まった。

TROUBLE 01
GGUFフォーマットに互換性の違いがあった
GGUF(AI モデルの圧縮フォーマット)には「llama.cpp互換版」と「gguf-org独自拡張版」がある。ComfyUIのGGUF対応プラグインが対応しているのは前者のみ。ファイル名が似ていても別物で、間違えると「incompatible」エラーが出る。
TROUBLE 02
テキストエンコーダーのアーキテクチャが違った
FLUX.2 KleinにはMistral(別のAIモデル)をテキストエンコーダー(テキストをAIが理解できる形式に変換する部品)として使おうとしたが、行列サイズが合わないエラーが出た。FLUX.2 Kleinが必要とするのはQwen3 8Bというまた別のモデルだった。モデルとエンコーダーのペアを正確に把握しないといけない。
TROUBLE 03
Qwen3のファイルを入手できなかった
HuggingFace(AIモデルを配布するサービス)からQwen3のファイルを取得しようとしたが、ダウンロードできたのはスケール係数ファイルのみで、フル重みが含まれていなかった。2026年4月時点でFLUX.2 Kleinのエコシステムはまだ整備途中だった。
FLUX.2 Klein は 2026年4月時点でエコシステムが未整備。今は諦めが肝心。
DISCOVERY

Session 3:作戦変更でFLUX.1-devに成功

FLUX.2 Kleinの迷走を断ち切り、実績のある FLUX.1-dev のGGUF版に切り替えた。ComfyUIには組み込みのテンプレートがあり、そこから始めるのが一番速い。

必要なファイルを3つ揃える。モデル本体(約17GB)・テキストエンコーダー2種(clip_l と t5xxl)・VAE(画像の圧縮・展開担当)。これらをComfyUIの所定のフォルダに配置してワークフローを実行。

プロンプト(生成指示)を入力:

masterpiece, best quality, 1girl, fairy, fantasy, glowing wings, forest

緑の森の中に光る翅を持つ妖精の女の子が降臨した。VRAM使用量もギリギリ16GB以内に収まって安定動作を確認。プロンプト1発で画像が生成されたときの感動は本物だった。

INSIGHT

最新モデルより「枯れた実績モデル」から始める

今日最大の教訓はこれだ。最新モデルはエコシステム(ツール・情報・サポートの整備状況)が追いついていないことが多い。必要なファイルが揃っていない、情報が少ない、バグが多い——という状態で詰まり続けてしまう。

一方、FLUX.1-devのような少し前のモデルは情報が豊富で、ComfyUIにテンプレートも用意されている。まず動く状態を作ってから、新しいものに挑戦するほうが結果的に早い。

SUMMARY

ComfyUIをWindowsにローカル導入し、Anima・Illustrious XL・FLUX.1-devの3モデルで画像生成に成功。FLUX.2 Kleinはエコシステム未整備のため断念したが、「最新モデルに飛びつくより枯れた実績モデルから始める」という重要な教訓を得た。

妖精の女の子が降臨したときの感動は本物。次はLoRA(スタイルを追加学習させる仕組み)やimg2img(画像から画像を生成)を試して、UEFNのアセット制作にも活用していきたい。

ALL AI / Gen Tools UEFN × Verse Artwork