より高速な動画生成 - Zuntan03/EasyWanVideo GitHub Wiki

Kijai 版ワークフローで利用できる高速化機能について、オススメ順に紹介します。

SageAttention

インストール周りが面倒 ですが、ほぼ倍速で動作し、悪影響も効果の割には感じていません。
インストールは自動化しました。 SageAttention をインストールできなかった場合は spda を設定してください。

Skip Layer Guidance

EndFrame 利用時などに、ステップ数を増やさなくても絵が綺麗になるようです。
デフォルトで有効にしていますが、意図せぬ悪影響が出ている可能性はあります。

コンパイル

Geforce RTX 40x0 なら有効にすると高速化します。
Geforce RTX 30x0 の fp8 で利用すると耐え難い精度低下を引き起こすため、非推奨です。

fast_fp16

ExperimentalRtx50x0_CudaNightlyBuildSageAttention.bat導入してfast_fp16 を設定すると、2割程度の速度向上が見込めます。
生成結果は fp16 と一致はしないようですので、想定外の影響が発生していないかを確認ください(RTX 3060 調べ)。

似た話として quantizationfp8_e4m3fn_fast もありますが、こちらも大幅な品質劣化を引き起こすとされています。

BlockSwap

VRAM が溢れない範囲で BlockSwap するレイヤー数を 40 から減らすと高速化します。
VRAM 容量の大きいビデオカードだと高速化の効果が大きくなりますが、12GB での効果は限定的です。

Enhance A Video

絵が綺麗になるそうですが、そうでない場合もあるようですのでデフォルトでは有効にしていません。
効果を確認しながらご利用ください。

TeaCache

計算をスキップすることにより確かに高速化はするのですが、特定の LoRA が極端に効かなくなることがある(かつ予測できない)ようですので、非推奨です。