Wan 2.2 GGUFの設定

Gemini ちゃんに教えてもらって確認中...嘘もあるからね

 

width = 502 
height = 768 

seed = 0 

high_noise_steps = 2

steps = 4 

cfg_scale = 1 

sampler_name = "uni_pc"

scheduler = "normal"

frames = 40
fps = 16 

use_sage_attention = True

use_flow_shift = True

flow_shift = 3

flow_shift2 = 3

use_high_noise_speed_LoRA = True

high_noise_speed_LoRA_Strength = 1.2

use_low_noise_speed_LoRA = True

low_noise_speed_LoRA_Strength = 1

rel_l1_thresh = 0

start_percent = 0.2

end_percent = 1.0

 

1. Lightning LoRA を「正しく」効かせる設定

Lightning LoRAは、少ないステップで高品質な絵を出すための「蒸留(Distill)」モデルです。このコード上で最優先で確認すべき項目は以下の通りです。

  • steps(ステップ数): Lightning系は 4〜8ステップ が最適です。10を超えると逆に絵が壊れたり、ノイズが乗ることがあります。まずは steps: 6 くらいで固定しましょう。

  • high_noise_speed_LoRA_Strength (Lightx2v): 提示されたコードでは 3 になっていますが、これは少し強すぎるかもしれません。1.0 から 1.5 あたりが、本来のモデルのディテールを壊さず、かつ動きを出す「綺麗」なラインです。

  • cfg_scale: Lightning LoRA使用時は、1.01.5 に設定してください。通常のモデルのように 7.0 とかにすると、色が焼け焦げたようになり、全く綺麗になりません。

2. サンプラーの選択

サンプラーが uni_pc になっていますが、Lightning LoRA(特にWan2.1/2.2系)と相性が良いのは以下です。

  • 推奨: dpmpp_2m_sde  (これらはUniPCよりもテクスチャが滑らかになり、実写的な綺麗さが出やすいです)

  • 速度優先: euler (Lightningの特性上、実はEulerが最も素直なディテールを出すことがあります)

3. フローシフト(Flow Shift)の調整

動画生成モデルにおいて、flow_shift は「どれだけノイズを除去する力をステップごとに配分するか」を決めます。

  • use_flow_shift: True に設定。

  • flow_shift: Wanモデルの場合、デフォルトの 3.0 付近が最も「破綻が少なく綺麗」です。8 など高い値にすると、動きは激しくなりますが、造形が崩れやすくなります。


high_noise_steps(最初の高ノイズ段階のステップ数)の最適な値は、**「どれだけ元の画像や構図を維持したいか、あるいはAIにダイナミックな動きを任せたいか」**のバランスで決まります。

総ステップが 4〜6 の場合、以下の設定を基準にするのがベストです。


推奨値:1〜2 ステップ

結論から言うと、1 または 2 が最も安定します。

  • high_noise_steps = 1 の場合:

    • 特徴: 元の画像の構図(I2Vの場合)を非常に強く維持します。

    • 向いているケース: 顔の造形を崩したくない、あるいは静かな動き(髪が揺れる、まばたきするなど)を求めている時。

  • high_noise_steps = 2 の場合:

    • 特徴: 動き(Motion)がよりダイナミックになります。

    • 向いているケース: 激しいアクション、カメラワークの変化、魔法のようなエフェクトなど、大きな変化が欲しい時。


 

1. 「ヌルヌル動かす」ための調整

動画がカクついたり、動きが小さいと感じる場合は、AIが「次のフレームをどう描くか」の自由度を少し広げてあげます。

  • high_noise_steps2 に固定: 最初の大きな動きを決める時間を確保します。

  • flow_shift5.0 ~ 7.0 へ上げる: 数値が高いほど、初期ステップで「ノイズを大きく動かす」力が働きます。

  • guidance_scale (high noise stage) を 1.2 ~ 1.5 に上げる: 初期段階でのプロンプトへの忠実度(動きの指示など)を強めます。

  • プロンプトに動詞を盛る: dynamic motion, fast movement, fluid animation などのキーワードを先頭に置くと、LoRAが「動かすモード」に入りやすくなります。


2. 「写真のような解像感」を出すための調整

「ボヤけ」や「塗り絵感」を消して、ディテールをカリッとさせる設定です。

  • low_noise_speed_LoRA_Strength (Pusa/Lightning) を 0.8 ~ 1.0 に抑える: 後半のLoRAが強すぎると、ディテールが「平均化」されてボヤけます。あえて少し弱めることで、モデル本来の緻密な描き込みを引き出します。

  • cfg_scale1.0 ぴったりにする: Lightning系においてCFGを上げると、輪郭にジャギーが出たり色が濁ったりします。1.0 が最も「写真としての階調」が綺麗に出ます。

  • sampler_name を  euler にする: uni_pc は速いですが、質感が少しマット(ツヤ消し)になりがちです。dpmpp_3m_sde の方が肌の質感や光の反射がリアルに出ます。

  • ネガティブプロンプトの整理: bad quality, low quality 以外に、blurry, soft focus を強調して入れると、ピントが合ったような描写になりやすいです。

 

yuki

初めての作業で調べた事、困った時の解決方法を記録するブログ。 主なテーマは、パソコン、プログラミング、カメラ、DTM、スピリチュアル、化学物質過敏症

コメントを投稿

Please Select Embedded Mode To Show The Comment System.*