聞で音声AIの話が書いてあったので、気になって調べてみたところ
画像生成と似たような感じで使えそうなやつを見つけたので早速試してみることに。

インストールは、公式っぽいところから
f23752c7a8f5c6f88d6902c64dd03c72
ファイルをダウンロードして展開して、
3f3148cabca902a29900b4bd208c5fd8
go-web.batを実行するだけ。
a975dcc4afaa96fac0b9adee03cbc8c2
例によって青警告が出ますが、詳細を開いて強制実行w
77ab3b30aa8b0255070e3cbb57520da3
なんか一行でてだけで止まってしまったのでこれだけ?( ゚Д゚)と思いましたが、しばらく待つと、
a8e62729f0ce48d59f45f413cb58ab23
少し表示が増えて、
e3c1c7e81b3284f1d4c791a425d03b88
ブラウザが起動しました(゚∀゚)
りあえず何が作ってみようとトレーニングタブへ移動。
f7fd30ffd35ca4eae8bc74012de41449

適当な音声データを用意して【ワンクリックトレーニング】をポチリ。
wikiを参考にしたので、いじったのは、【モデル名】、【トレーニング用フォルダのパス】、【エポックごとの保存頻度】5→20、【最新のckptファイルのみを保存】いいえ→はい、くらいです。
学習用音声は5秒程度のWAVデータ。
25f2f66dc529fd11f652556e864a867c
作成されたモデルはwightsフォルダの下にありました。
、この作ったやつはどうつかうんだ?と思ったら、RVCってなんか喋らせるソフトじゃなくてボイスチェンジャーらしいwww
ということで何かの音声ファイルを変換しないとダメなんですけど、まずはあいうぉのタイトルコールで試してみました。
ちなみに変換方法は一部ややこしいとこもあったので、youtubeを参考にしました。
4分くらいからが変換方法の説明になってます。
して変換した結果がコレ↓

変換前ははるちぃかな?さて誰に変換したでしょうか?



うファイル名で丸わかりですけどwなっちですw
たぶんこれわかるひとはいないんじゃない?w
やはり5秒程度だときびしいんですかねー。
時間が取れたらもう少し試してみようかなぁ。