新グラボのおかげで、GoogleColab使わずにDB学習できるようになったのはうれしいのですが、なぜかできたモデルファイルがColabで作ったやつより良くないんですよねぇ(´・ω・`)
とりあえず試行錯誤中ですがやっていく中でトラブった点とか忘れないようメモ書き。なお、内容の正確性は保証しませんw
■CreateModel
・stable-diffusion-webui>models>dreamboothの下に入力した名称のフォルダができる。
・名称にはハイフンやアンダーバーなど記号の類は使えない。全角にしても同じ。入っていた場合は取り除かれた形でフォルダが作成される。記号じゃなければひらがなとかも大丈夫。
・同じ名称が既にあった場合はファイルが上書きされるが、正規化画像などCreateModelのときに作成しないファイルは残ったままになるので、そのまま学習をポチすると古い正規化画像で学習されるポイ。名称に使えない文字が含まれていて結果的に同じ名称になった場合も同様なので名前決めは要注意。
■TrainModel
・TrainingWizardはよくわかんないけど。設定が変わるのが面倒なので使わなくていいんじゃないかなw
・クォリティとか気にしなくて、とりあえずあいうぉのキャラ描いてくれればいい( ゚Д゚)って感じなら、大部分の項目は初期値でいい気がする。
とりあえず、赤枠は必須。黄枠はうまく使えばきれいになるけど、きれい=似てるではないのでとりあえずは空欄でいいのかも。
・TrainingStepは画像枚数x100~200あればよさそう。現在のモデルの状態に加える数なので、学習用元画像5枚として、最初の学習でTrainingStep500で作って描かせてみて、不満なら次にTrainingStepを250にしてもう一度学習ポチすれば、750(画像一枚当たり150)のモデルができる。(数字はモデルの後ろに自動的に付けられる。)
・InstancePrompt。photo of なんとか。なんとかの部分は2ワードでユニークな単語。
とりあえず試行錯誤中ですがやっていく中でトラブった点とか忘れないようメモ書き。なお、内容の正確性は保証しませんw
■CreateModel
・stable-diffusion-webui>models>dreamboothの下に入力した名称のフォルダができる。
・名称にはハイフンやアンダーバーなど記号の類は使えない。全角にしても同じ。入っていた場合は取り除かれた形でフォルダが作成される。記号じゃなければひらがなとかも大丈夫。
・同じ名称が既にあった場合はファイルが上書きされるが、正規化画像などCreateModelのときに作成しないファイルは残ったままになるので、そのまま学習をポチすると古い正規化画像で学習されるポイ。名称に使えない文字が含まれていて結果的に同じ名称になった場合も同様なので名前決めは要注意。
■TrainModel
・TrainingWizardはよくわかんないけど。設定が変わるのが面倒なので使わなくていいんじゃないかなw
・クォリティとか気にしなくて、とりあえずあいうぉのキャラ描いてくれればいい( ゚Д゚)って感じなら、大部分の項目は初期値でいい気がする。
とりあえず、赤枠は必須。黄枠はうまく使えばきれいになるけど、きれい=似てるではないのでとりあえずは空欄でいいのかも。
・TrainingStepは画像枚数x100~200あればよさそう。現在のモデルの状態に加える数なので、学習用元画像5枚として、最初の学習でTrainingStep500で作って描かせてみて、不満なら次にTrainingStepを250にしてもう一度学習ポチすれば、750(画像一枚当たり150)のモデルができる。(数字はモデルの後ろに自動的に付けられる。)
・InstancePrompt。photo of なんとか。なんとかの部分は2ワードでユニークな単語。
# "instance_prompt": "photo of ukj person",
# "class_prompt": "photo of a person",
GoogleColab用のプログラムのコメント欄だとこんな感じになってるんですけど、解説サイトによっては"photo of "とか無かったり、1ワードで書いてるところもあっていまいちよくわからないです。
とりあえず、InstancePromptにaiw girl、ClassPromptにgirlで概ねうまくいってるポイのですが、さっき黄枠で囲った設定項目のClassification Image Negative Promptも影響してるようで、ネガティブプロンプトが入るとなんか髪型や目の特徴的な部分すら似てない感じになるんですよね。正規化画像が偏るとかなのかしらん?
一方、WD1.3だとネガティブプロンプトありの方がイメージに近そうな感じなんですが、光咲はいまいちだったものの、命はANYでもそれなりに認識できる感じでしたのでアイドルによってモデルの向き不向きもあるようですね。
とりあえず、InstancePromptにaiw girl、ClassPromptにgirlで概ねうまくいってるポイのですが、さっき黄枠で囲った設定項目のClassification Image Negative Promptも影響してるようで、ネガティブプロンプトが入るとなんか髪型や目の特徴的な部分すら似てない感じになるんですよね。正規化画像が偏るとかなのかしらん?
一方、WD1.3だとネガティブプロンプトありの方がイメージに近そうな感じなんですが、光咲はいまいちだったものの、命はANYでもそれなりに認識できる感じでしたのでアイドルによってモデルの向き不向きもあるようですね。
今使ってるネガティブプロンプトがANY向きじゃないとかもありそうですし、キャラごとのネガティブプロンプト中身とかまだまだ試行錯誤が必要ですね。
ということで今はこんな基準でやってます。
ーとりあえず photo of はなしで。
ーWDはネガティブプロンプトあり、 ANYはなしで学習
ということで今はこんな基準でやってます。
ーとりあえず photo of はなしで。
ーWDはネガティブプロンプトあり、 ANYはなしで学習
ー学習がいまいちのキャラは
①学習用画像を増やす(普段は4くらい→10数枚)
(反転以外のもの。アップを入れたり全身を入れたり。背景はあまり気にしない。)
②STEPを増やす(1枚あたり200→400)
などで対応
・Total Number of Class/Reg Images
①学習用画像を増やす(普段は4くらい→10数枚)
(反転以外のもの。アップを入れたり全身を入れたり。背景はあまり気にしない。)
②STEPを増やす(1枚あたり200→400)
などで対応
・Total Number of Class/Reg Images
Google Colab用の初期値を参考に50にしてます。
・学習元画像の背景とか枚数とか
TIのときは背景ない方が良いらしいけど、DBはよくわからないです。学習時の設定で背景が異常に影響を受けたことがあったので、基本は白がいいかなと思ってましたが、今は背景付きも普通に混ぜてます。(特に出番の少ないアイドルw)
枚数は2枚だとちょっとつらい感じだったので4-5枚から材料があれば10枚強使ってます。異常に特殊なポーズや視点のやつは避けた方が無難そう。人外が増えます。(でも面白いのもできたりするw)
・学習元画像の背景とか枚数とか
TIのときは背景ない方が良いらしいけど、DBはよくわからないです。学習時の設定で背景が異常に影響を受けたことがあったので、基本は白がいいかなと思ってましたが、今は背景付きも普通に混ぜてます。(特に出番の少ないアイドルw)
枚数は2枚だとちょっとつらい感じだったので4-5枚から材料があれば10枚強使ってます。異常に特殊なポーズや視点のやつは避けた方が無難そう。人外が増えます。(でも面白いのもできたりするw)