より高速な動画生成 - Zuntan03/EasyWanVideo GitHub Wiki
Kijai 版ワークフローで利用できる高速化機能について、オススメ順に紹介します。
SageAttention
インストール周りが面倒 ですが、ほぼ倍速で動作し、悪影響も効果の割には感じていません。
インストールは自動化しました。
SageAttention をインストールできなかった場合は spda
を設定してください。
Skip Layer Guidance
EndFrame 利用時などに、ステップ数を増やさなくても絵が綺麗になるようです。
デフォルトで有効にしていますが、意図せぬ悪影響が出ている可能性はあります。
コンパイル
Geforce RTX 40x0 なら有効にすると高速化します。
Geforce RTX 30x0 の fp8 で利用すると耐え難い精度低下を引き起こすため、非推奨です。
fast_fp16
ExperimentalRtx50x0_CudaNightlyBuildSageAttention.bat
を 導入して、fast_fp16
を設定すると、2割程度の速度向上が見込めます。
生成結果は fp16
と一致はしないようですので、想定外の影響が発生していないかを確認ください(RTX 3060 調べ)。
似た話として quantization
の fp8_e4m3fn_fast
もありますが、こちらも大幅な品質劣化を引き起こすとされています。
BlockSwap
VRAM が溢れない範囲で BlockSwap するレイヤー数を 40 から減らすと高速化します。
VRAM 容量の大きいビデオカードだと高速化の効果が大きくなりますが、12GB での効果は限定的です。
Enhance A Video
絵が綺麗になるそうですが、そうでない場合もあるようですのでデフォルトでは有効にしていません。
効果を確認しながらご利用ください。
TeaCache
計算をスキップすることにより確かに高速化はするのですが、特定の LoRA が極端に効かなくなることがある(かつ予測できない)ようですので、非推奨です。