【生成AI】AUTOMATIC1111でメカ生成をテストする最小構成ガイド - tsukimisoba/Blog GitHub Wiki
AUTOMATIC1111でメカ生成をテストする最小構成ガイド
朝から手早く「動く・崩れない」構成でいきましょう。まずは必要最低限で生成できる状態を作り、あとから拡張します。
最小構成の拡張機能とモデル
-
必須拡張機能:
ControlNet(構図・ライン制御の安定化)/After Detailer(顔・パーツのディテール補強)/Tag Autocomplete(プロンプト補助) -
推奨拡張機能(軽量):
Image Browser(生成履歴の確認) -
ベースモデル(最小):
SDXL 1.0 ベースモデル(.safetensors)+必要なら対応VAE
SDXLは質・表現幅が広く、メカの質感(金属、樹脂、塗装)も乗せやすいです。 -
追加(任意):
**LoRA(メカ特化)**は後から追加。まずはベース+ControlNetで「線・パーツ・レンズ効果」を作れるかをテスト。
Sources:
インストールと導入方法(拡張機能・モデル)
WebUIの起動(おさらい)
- 手順:
webui-user.batから初回起動→ブラウザでWebUIにアクセス。必要ならxFormersなど高速化も設定。
Windows向けの起動~アクセス手順の詳細は日本語でまとまっています。
拡張機能の導入
- Availableからインストール:
- Extensions > Availableを開く
- 検索ボックスで「ControlNet」「After Detailer」「Tag Autocomplete」「Image Browser」を検索
- 各拡張の「Install」を押す→InstalledタブでApply and restart UI
- URLから導入(必要時):
- 拡張のGitHubリポジトリURLをExtensions > Install from URLに貼ってInstall→Apply and restart UI。
モデル(SDXL)の導入
- 配置場所:
ダウンロードしたSDXL 1.0 .safetensorsを- ベースモデルは「models/Stable-diffusion」
- VAEは「models/VAE」へ配置
起動後、txt2imgでモデル選択(プルダウン)。
Sources:
導入後の操作(メカ向け最短ワークフロー)
1. txt2imgの基本設定
- モデル選択:
SDXL 1.0を選択。解像度はまず1024×1024(SDXLの標準帯)。 - Samplerとステップ:
DPM++ 2M Karras、ステップ20–30から開始。 - CFGとSeed:
CFG 4.5–6.5、Seed固定で再現検証。 - プロンプト方針:
Positive: 「mechanical, hard-surface, industrial design, panel lines, bolts, brushed metal, anodized aluminum, detailed greebles, articulation」
Negative: 「soft, organic, blurry, low contrast, extra limbs, deformed, oversmooth」
2. ControlNetで「線と構図」を固定
- 有効化:
ControlNetタブで「Enable」「Pixel Perfect」をオン。 - プリプロセッサ/モデル:
- 線の安定化:CannyまたはLineart
- ポーズ/骨格:OpenPose
- 入力:
- ラフ画像や参考線画を「Control Image」に投入
- Weight 0.8–1.0、Guidance Start 0.0 / End 0.8で後半に自由度を少し残す
- 生成:
txt2imgで出力→構図が崩れる場合はWeightを上げるかCFGを微調整。
ControlNet導入・使用の一般フローは拡張記事で整理されています。
3. After Detailerでパーツの精密化
- 使い方:
Scripts > After Detailerを選択。 - 対象領域:
「head/face」を「off」にして、chest/shoulders/jointsなどをcustom boxで指定(メカは顔検出が誤爆しやすいため)。 - 動作:
生成後に指定領域へ高精細リペイント。Denoise 0.25–0.45で素材テクスチャを保ちつつ線を鋭く。
After Detailerの導入・使い方はおすすめ拡張一覧に記載があります。
4. Tag Autocompleteでプロンプト精度を上げる
- 操作:
プロンプト入力欄でTab補完を使い、タグの揺れを防止。 - 方針:
メカ記述は形容詞+材質+工程(「die-cast」「CNC milled」「powder-coated」)で積層して質感を明確化。
5. Image Browserで比較しながら詰める
- 確認:
生成後、Image BrowserでSeed/設定差分を横比較。 - 詰め方:
まずはCFG・ステップを固定し、ControlNetのWeight→denoise→ネガティブの順で一変数ずつ調整。
Sources:
トラブルレスのための微調整ポイント(短時間で効く)
- 金属質感が乗らない:
SamplerをDPM++ SDE Karrasへ変更、Hires.fixで二段目にLatentアップスケール(×1.5–2.0、denoise 0.25–0.35)。 - パネルラインが溶ける:
ControlNetのLineartに切り替え、Endを0.6に下げて後半の自由度を抑える。 - 関節/可動部が破綻:
OpenPoseで関節を明示、ネガティブに「broken joints, misaligned parts」を追加。 - 色が眠い:
VAEを切り替え、プロンプトに「specular highlights, high contrast」を追加。 - 計算が重い:
解像度を896×896に落としてSeed固定で比較→詰めたら1024に戻す。
次の一歩(任意)
- LoRA導入のタイミング:
ベース+ControlNetで線と質感が安定したら、メカ特化LoRAを1つだけ追加して効果検証(重み0.6–0.8から)。 - ワークフローの可視化:
SourceTreeで拡張更新の差分を見える化、設定JSONのバックアップを定期保存(再現性担保)。
必要なら、いまのPCスペックと希望するメカ(リアル寄り/アニメ寄り/大型兵器/人型)を教えてください。最初のプロンプトとControlNet設定をさらに具体化して、Kaoru-sanの好みに合わせます。