AI / ComfyUI / 画像生成
最近、AI生成画像・動画の進化がすさまじい。クラウドのサービスを使えば手軽に画像が作れるが、課金が積み重なるし、生成内容に制限がある場合も多い。
一方で、自分のパソコンの中でAI画像生成を動かす「ローカル生成」も盛り上がってきた。自前のGPU(画像処理専用チップ)がある環境なら、課金なしで好きなだけ生成できる。
環境:RTX 4090 Laptop(VRAM 16GB)搭載のノートPC。このスペックで何ができるか試してみた。ツールは ComfyUI(ノードベースの画像生成インターフェース。処理のブロックを繋いでワークフローを組む)を使う。
ComfyUIのWindows Portable版(インストール不要で展開するだけで使える版)を公式GitHubから入手。展開してGPU対応の起動ファイルを実行すると、ブラウザで localhost:8188 にアクセスできてテンプレート一覧が表示された。
最初に試したのは Anima と Illustrious XL。どちらもアニメ・イラスト系に強いモデル(AI画像生成の核となるデータ)で、きれいな絵が出た。
クラリスの提案で最新モデル FLUX.2 Klein に挑戦した。「量子化版(ファイルサイズを圧縮した版)なら VRAM 16GB でも動くかも」という作戦だ。しかし、ここからトラブルの連鎖が始まった。
FLUX.2 Kleinの迷走を断ち切り、実績のある FLUX.1-dev のGGUF版に切り替えた。ComfyUIには組み込みのテンプレートがあり、そこから始めるのが一番速い。
必要なファイルを3つ揃える。モデル本体(約17GB)・テキストエンコーダー2種(clip_l と t5xxl)・VAE(画像の圧縮・展開担当)。これらをComfyUIの所定のフォルダに配置してワークフローを実行。
プロンプト(生成指示)を入力:
緑の森の中に光る翅を持つ妖精の女の子が降臨した。VRAM使用量もギリギリ16GB以内に収まって安定動作を確認。プロンプト1発で画像が生成されたときの感動は本物だった。
今日最大の教訓はこれだ。最新モデルはエコシステム(ツール・情報・サポートの整備状況)が追いついていないことが多い。必要なファイルが揃っていない、情報が少ない、バグが多い——という状態で詰まり続けてしまう。
一方、FLUX.1-devのような少し前のモデルは情報が豊富で、ComfyUIにテンプレートも用意されている。まず動く状態を作ってから、新しいものに挑戦するほうが結果的に早い。
ComfyUIをWindowsにローカル導入し、Anima・Illustrious XL・FLUX.1-devの3モデルで画像生成に成功。FLUX.2 Kleinはエコシステム未整備のため断念したが、「最新モデルに飛びつくより枯れた実績モデルから始める」という重要な教訓を得た。
妖精の女の子が降臨したときの感動は本物。次はLoRA(スタイルを追加学習させる仕組み)やimg2img(画像から画像を生成)を試して、UEFNのアセット制作にも活用していきたい。