说明:语音100
目标
不要依赖非商业许可的数据集
足够小,可以在普通PC,Raspberry Pi或智能手机上运行。
数据
JSUT以女性声音录制10个小时。
CSS10是14小时以男性声音录制的视频。
JVS是0.1小时的录制时间。
参考
声优统计コーパス
CSS10
深度演讲3
Tacotron 2
Tacotron
Tacotron 3
Tacotron 3
梅洛创(Mellotron)
深度语音3
世界
OpenJTALK
月ノ美兎さんの音声合成ツール(文字转语音)
<weixin_42153615> 上传 | 大小:16kb