iroiroLoRA / FramePack_LoRAReadme.txt
3v324v23's picture
upload 2025/05/15
9869bc5
■このファイルについて
FramePackの基幹モデルで作成したLoRAの説明書です
FramePackの基幹モデルおよびf1(musubi-tuner or FramePack-eichi)のみ確認しています。
学習にはmusubi-tunerを使用しています
学習設定は以下で回しています、参考まで(グラボは5090を使用)
・dataset.tomlの記述は以下
[general]
resolution = [640,640]
caption_extension = ".txt"
batch_size = 1
enable_bucket = true
bucket_no_upscale = false
[[datasets]]
max_frames = 109
frame_extraction = "full"
num_repeats =5
・学習コマンドは以下
accelerate launch --num_cpu_threads_per_process 1 fpack_train_network.py --dit %dit_path% --vae %vae_path% --text_encoder1 %text_encoder1_path% --text_encoder2 %text_encoder2_path% --image_encoder %image_encoder_path% --dataset_config %config_path% --flash_attn --split_attn --mixed_precision bf16 --fp8_base --fp8_scaled --blocks_to_swap 16 --optimizer_type adamw8bit --learning_rate 1e-3 --gradient_checkpointing --timestep_sampling shift --weighting_scheme none --discrete_flow_shift 3.0 --max_data_loader_n_workers 2 --persistent_data_loader_workers --network_module networks.lora_framepack --network_dim 32 --max_train_epochs 5 --save_every_n_epochs 1 --seed 42 --output_dir %output_path% --output_name %output_name%
・動画素材数は35~55程度。fps30、フレーム数は37~109overまで色々(大半109以上)
・2次元と2.5次元素材のみ使用
・タグは1フレーム目の画像でtagger、自然言語なし
・--blocks_to_swap 16は5090用設定です。数字を増やせばVRAM24GBでも十分学習できると思います
・--dynamo_backend INDUCTOR --dynamo_mode defaultは速度向上が見られず
・--learning_rate 2e-4で学習したところ、ほぼ学ばなかったため1e-3に変更
・--vanilla_samplingも試しましたが、明るさがちらつくようになっていくためそちらの学習は止めました
・5090でおよそ3000steps、10時間ほどかかります。
・--fp8_base --fp8_scaledを抜いてbf16で学習すると、何故か明らかに精度が落ちたため、fp8の2つを設定して学習しています
 (生成はfp8にしていないにもかからわず)
・projectile_cum_fpack_i2vからは--f1を使用して学習しています
 max_framesも999とし、最大200frame程度までを使用しています
・生成解像度を上げるとLoRAの効きが悪くなるように思われます
■sex_cross-section_bulge_fpack_i2v
断面図抽挿LoRA
anal/vaginal,cross-sectionで呼び出し
性行為と断面図部分を連動して動かします
腰振りと断面図でのペニスの動きのきれいな連動はガチャ要素です
コマ数が少なめの動画でも学習しているためか、ややアニメにカクつきがみられます
cross-sectionが無い画像でただの抽挿LoRAとしても一応使用できそうです
■horse_stomach_bulge_fpack_i2v_v3
馬姦腹ボコLoRA
anal/vaginal ,horse, stomach bulge, bestialityで呼び出し
馬のペニスによる抽挿と腹ボコを出します
抽挿と腹ボコのきれいな連動はガチャ要素です
たまに動きの出ない動画が生成されますが、だいたいはシードガチャで動き出すと思います
馬の体が画面外大半の場合、動いたときにやや貧相なケースもあります
■anal_cum_in_ass_fpack_i2v
アナル中出しLoRA
anal,cum in assで呼び出し
ペニスや触手にてアナル中出しを行い、精液が漏れるさまを描写します
強度1だと精液の飛沫が強く出過ぎると思うので、0.5~0.7など強度を下げたほうがいい感じかなと思われます
■projectile_cum_fpack_i2v
射精ぶっかけLoRA
projectile cum,bukkakeで呼び出し
ペニスから大量に射精し、女性にぶっかけます
乱交画像の場合、竿役にぶっかけてしまう事もあるので要注意です
ペニスが無い画像だと(ある画像でも稀に)女性の腹あたりから大量射精することもあり、暴れん坊なLoRAです
penis projectile cumとしたほうが打率が上がるかもしれません
強度1だと精液の飛沫が強く出過ぎると思うので、0.3~0.5など強度を下げたほうがいい感じかなと思われます
動画期間中ずっと射精するクセがあり、ぶっかけというよりかは射出みたいな感じが出やすいです
ここから以下はf1モデルで学習しています
■tentacle_pit_fpack
触手空間LoRA
tentacle pitで呼び出し
挿入している触手はもとより、周辺の触手もうねうねさせるよう学習させています
hunyuanの同種LoRAと比較すると動きが一段良いかと思います
■projectile_cum_fpack_v4
射精ぶっかけ改LoRA
projectile cum,bukkakeで呼び出し
ペニスから大量に射精し、女性にぶっかけます
強度1でもきちんとぶっかける事を目的として素材再選定して作成しています
0.5~0.6ぐらいに下げるとかなり射出感がなく精液垂れ流し的な感じになると思います
excessive cum. finally numerous cum on face and numerous cum on hair.なども追加すると、最終的なぶっかけ量が増すかと思います
(cum on clothesなども効くと思いますが、服にだけぶっかけるケースが増えるような気がします)