# ローカル画像生成AIのメモ

Published 2025-01-11

MidjourneyDALL·E 3の様な画像生成AIをクラウドではなくローカルで使う方法のメモ。

Stability Matrixをインストールして、ComfyUI(GeForceの場合)かComfyUI-Zluda(Radeonの場合)をバックエンドに選択し、Inferenceから生成するのがおすすめ。

Radeon RX7900XTの場合、特に高速化手法を用いない素の状態で、1024x1024、20 Stepsの画像が1枚あたり7.5秒程度で生成できる。SD1時代は同一プロンプトで何枚も画像を生成して当たりを探す方法だったので生成速度が重要だったが、今はガチャは不要になったので、この程度でも十分実用的と言える。

5枚連続して画像生成した場合の例

got prompt
100%|██████████| 20/20 [00:06<00:00,  2.94it/s]
Prompt executed in 7.35 seconds
got prompt
100%|██████████| 20/20 [00:06<00:00,  2.92it/s]
Prompt executed in 7.46 seconds
got prompt
100%|██████████| 20/20 [00:06<00:00,  2.92it/s]
Prompt executed in 7.52 seconds
got prompt
100%|██████████| 20/20 [00:06<00:00,  2.91it/s]
Prompt executed in 7.42 seconds
got prompt
100%|██████████| 20/20 [00:06<00:00,  2.91it/s]
Prompt executed in 7.53 seconds

モデルはPony系がおすすめ。Flux系は負荷が重く、2D/2.5D系の得意なモデルもまだ少ないので、様子見。

Prefect Pony XL
Prefect Pony XL

# ローカル画像生成AIの使い道

  • カスタムポートレイトが使用可能なゲーム用のポートレイト画像

    RimWorldではModを使用してカスタムポートレイトを表示することができる。Really Custom PortraitsBottom Left Portrait等。

  • チャット用キャラクターのアイコン用画像、立ち絵

    SillyTavernではペルソナやキャラクターにアイコン用画像が設定でき、キャラクターカードとして画像のメタデータに設定を埋め込むことができる。また、ExtensionのExpression Imagesを使用する事でノベルゲームの様にキャラクターの立ち絵を切り替えることができる。