[論文メモ] Speech Representation Disentanglement with Adversarial Mutual Information Learning for One-shot Voice Conversion

arxiv.org INTERSPEECH 2022間違っているかもしれないので注意。ピッチやコンテンツなどを相互情報量を最小化することによって分離させOne-shot Voice Conversionの精度を向上させる。Voice Conversion(VC)の精度向上のためには発話に含まれるピッチやコンテ…

2022-08-16

[論文メモ] TGAVC: IMPROVING AUTOENCODER VOICE CONVERSION WITH TEXT-GUIDED AND ADVERSARIAL TRAINING

論文読み voice conversion

AutoencoderベースのVoice Conversionの改良arxiv.orgAutoVCはボトルネック部分の大きさを調整することで話者情報とコンテンツ情報を分離させるVoice Conversion(VC)手法で非常にシンプルで良いのだが、VAEのような制約がない分結果がそこまで良くない。こ…

2022-08-03

[論文メモ] Prioritized Training on Points that are learnable, Worth Learning, and Not Yet Learnt

論文メモ ICML2022

arxiv.org ICML2022 間違っているかもしれないので注意。巨大なデータセットに関する学習の高速化方法を提案最近はWebで集めた巨大なデータセットで学習するモデルが増えている(GPT-3やCLIPなど)。データセットが大きい分、学習にも一ヶ月やそれ以上の時間…

にんひどりんはんのう

日々のメモ

2022-08-01から1ヶ月間の記事一覧

[論文メモ] Speech Representation Disentanglement with Adversarial Mutual Information Learning for One-shot Voice Conversion

[論文メモ] TGAVC: IMPROVING AUTOENCODER VOICE CONVERSION WITH TEXT-GUIDED AND ADVERSARIAL TRAINING

[論文メモ] Prioritized Training on Points that are learnable, Worth Learning, and Not Yet Learnt