【生成AI】AUTOMATIC1111でメカ生成をテストする最小構成ガイド - tsukimisoba/Blog GitHub Wiki

AUTOMATIC1111でメカ生成をテストする最小構成ガイド

朝から手早く「動く・崩れない」構成でいきましょう。まずは必要最低限で生成できる状態を作り、あとから拡張します。


最小構成の拡張機能とモデル

  • 必須拡張機能:
    ControlNet(構図・ライン制御の安定化)/After Detailer(顔・パーツのディテール補強)/Tag Autocomplete(プロンプト補助)

  • 推奨拡張機能(軽量):
    Image Browser(生成履歴の確認)

  • ベースモデル(最小):
    SDXL 1.0 ベースモデル(.safetensors)+必要なら対応VAE
    SDXLは質・表現幅が広く、メカの質感(金属、樹脂、塗装)も乗せやすいです。

  • 追加(任意):
    **LoRA(メカ特化)**は後から追加。まずはベース+ControlNetで「線・パーツ・レンズ効果」を作れるかをテスト。

Sources:


インストールと導入方法(拡張機能・モデル)

WebUIの起動(おさらい)

  • 手順:
    webui-user.batから初回起動→ブラウザでWebUIにアクセス。必要ならxFormersなど高速化も設定。
    Windows向けの起動~アクセス手順の詳細は日本語でまとまっています。

拡張機能の導入

  • Availableからインストール:
    • Extensions > Availableを開く
    • 検索ボックスで「ControlNet」「After Detailer」「Tag Autocomplete」「Image Browser」を検索
    • 各拡張の「Install」を押す→InstalledタブでApply and restart UI
  • URLから導入(必要時):
    • 拡張のGitHubリポジトリURLをExtensions > Install from URLに貼ってInstallApply and restart UI

モデル(SDXL)の導入

  • 配置場所:
    ダウンロードしたSDXL 1.0 .safetensors
    • ベースモデルは「models/Stable-diffusion」
    • VAEは「models/VAE」へ配置
      起動後、txt2imgでモデル選択(プルダウン)。

Sources:


導入後の操作(メカ向け最短ワークフロー)

1. txt2imgの基本設定

  • モデル選択:
    SDXL 1.0を選択。解像度はまず1024×1024(SDXLの標準帯)。
  • Samplerとステップ:
    DPM++ 2M Karras、ステップ20–30から開始。
  • CFGとSeed:
    CFG 4.5–6.5Seed固定で再現検証。
  • プロンプト方針:
    Positive: 「mechanical, hard-surface, industrial design, panel lines, bolts, brushed metal, anodized aluminum, detailed greebles, articulation」
    Negative: 「soft, organic, blurry, low contrast, extra limbs, deformed, oversmooth」

2. ControlNetで「線と構図」を固定

  • 有効化:
    ControlNetタブで「Enable」「Pixel Perfect」をオン。
  • プリプロセッサ/モデル:
    • 線の安定化:CannyまたはLineart
    • ポーズ/骨格:OpenPose
  • 入力:
    • ラフ画像や参考線画を「Control Image」に投入
    • Weight 0.8–1.0Guidance Start 0.0 / End 0.8で後半に自由度を少し残す
  • 生成:
    txt2imgで出力→構図が崩れる場合はWeightを上げるかCFGを微調整。

ControlNet導入・使用の一般フローは拡張記事で整理されています。

3. After Detailerでパーツの精密化

  • 使い方:
    Scripts > After Detailerを選択。
  • 対象領域:
    「head/face」を「off」にして、chest/shoulders/jointsなどをcustom boxで指定(メカは顔検出が誤爆しやすいため)。
  • 動作:
    生成後に指定領域へ高精細リペイント。Denoise 0.25–0.45で素材テクスチャを保ちつつ線を鋭く。

After Detailerの導入・使い方はおすすめ拡張一覧に記載があります。

4. Tag Autocompleteでプロンプト精度を上げる

  • 操作:
    プロンプト入力欄でTab補完を使い、タグの揺れを防止。
  • 方針:
    メカ記述は形容詞+材質+工程(「die-cast」「CNC milled」「powder-coated」)で積層して質感を明確化。

5. Image Browserで比較しながら詰める

  • 確認:
    生成後、Image BrowserでSeed/設定差分を横比較。
  • 詰め方:
    まずはCFG・ステップを固定し、ControlNetのWeightdenoiseネガティブの順で一変数ずつ調整。

Sources:


トラブルレスのための微調整ポイント(短時間で効く)

  • 金属質感が乗らない:
    SamplerをDPM++ SDE Karrasへ変更、Hires.fixで二段目にLatentアップスケール(×1.5–2.0、denoise 0.25–0.35)。
  • パネルラインが溶ける:
    ControlNetのLineartに切り替え、Endを0.6に下げて後半の自由度を抑える。
  • 関節/可動部が破綻:
    OpenPoseで関節を明示、ネガティブに「broken joints, misaligned parts」を追加。
  • 色が眠い:
    VAEを切り替え、プロンプトに「specular highlights, high contrast」を追加。
  • 計算が重い:
    解像度を896×896に落としてSeed固定で比較→詰めたら1024に戻す。

次の一歩(任意)

  • LoRA導入のタイミング:
    ベース+ControlNetで線と質感が安定したら、メカ特化LoRAを1つだけ追加して効果検証(重み0.6–0.8から)。
  • ワークフローの可視化:
    SourceTreeで拡張更新の差分を見える化、設定JSONのバックアップを定期保存(再現性担保)。

必要なら、いまのPCスペックと希望するメカ(リアル寄り/アニメ寄り/大型兵器/人型)を教えてください。最初のプロンプトとControlNet設定をさらに具体化して、Kaoru-sanの好みに合わせます。