Add option to train TE MLP layers only[再] by maruo555 · Pull Request #13 · maruo555/sd-scripts

maruo555 · 2025-05-23T17:16:29Z

add --te_mlp_fc_only option to sdxl_train_network.py
patch training routine to restrict Text Encoder LoRA layers to CLIPMLP

本家の「Fix missing text encoder attn modules
kohya-ss#1964
で直る前の状態にしたいときのオプション。

解説（日本語）

sdxl_train_network.py に新しいオプション --te_mlp_fc_only が追加されました。
このフラグが指定されると、Text Encoder で LoRA により学習する対象モジュールが CLIPMLP のみとなります。

追加された処理では、引数 network_module で指定されたネットワークモジュールを動的に import し、そこに定義されている LoRANetwork.TEXT_ENCODER_TARGET_REPLACE_MODULE を ["CLIPMLP"] に上書きしています。
これによって、通常は "CLIPAttention" や "CLIPSdpaAttention" も対象となるところが、CLIPMLP のみが置き換え対象となり、mlp_fc1 / mlp_fc2 の層だけが学習されるようになります。
LoRA の既定の対象モジュールは networks/lora.py で定義されており、デフォルトでは ["CLIPAttention", "CLIPSdpaAttention", "CLIPMLP"] となっています。

CLI 引数としては、parser に以下のオプションが追加されています。
--te_mlp_fc_only
これを指定して学習を実行すると、Text Encoder のうち mlp_fc1 と mlp_fc2 だけに LoRA 層が挿入され、他の self_attn_* 系の層は学習対象になりません。
元の LoRA 実装では target リストに含まれるモジュールだけが変換されるため、この変数を変更するだけで目的の動作が実現できます。 mlp_fc1 と mlp_fc2 だけを学習させることができます。

こんな時は MLP のみをおすすめ

キャラクター LoRA を“画風 LoRA とマージ” して使う予定
→ Attention 部分まで重ねると干渉しやすいので、MLP のみが安全
プロンプトが短め（固有名詞＋属性語くらい）
→ 単語重みの再スケールだけで十分表現できる場合が多い
スマホ GPU や VRAM 8 GB 以下環境で推論
→ 軽量 LoRA の方がロードも高速

逆に Attention + MLP を残した方が良いケース
• 複雑な情景指示を 1 行プロンプトで完結させたい
• 「タグの重複・順序」を細かく弄って表情／視線を調整する
•ControlNet なしでポーズを頑張りたい (TE Attention の変調が効くこと有)

fix_te_mlp_fc_only

2c6c328

maruo555 changed the title ~~fix_te_mlp_fc_only~~ Add option to train TE MLP layers only[再] May 23, 2025

maruo555 merged commit 33ffcdf into maruo-main May 23, 2025

maruo555 deleted the fix_te_mlp_fc_only branch May 23, 2025 17:30

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Add option to train TE MLP layers only[再]#13

Add option to train TE MLP layers only[再]#13
maruo555 merged 1 commit intomaruo-mainfrom
fix_te_mlp_fc_only

maruo555 commented May 23, 2025 •

edited

Loading

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

1 participant

Conversation

maruo555 commented May 23, 2025 • edited Loading Uh oh! There was an error while loading. Please reload this page.

Uh oh!

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

1 participant

maruo555 commented May 23, 2025 •

edited

Loading