Flowtron:一种基于自回归流的网络,用于文本到梅尔谱图的合成
拉斐尔·瓦莱(Rafael Valle),史凯文(Kevin Shih),瑞安·普伦格(Ryan Prenger)和布莱恩·卡坦扎罗
在我们最近的我们提出了Flowtron:一种基于自回归流的生成网络,用于文本到语音的合成,并控制语音变化和样式转换。 Flowtron借鉴了Autoregressive Flows的真知灼见,并对,以提供高质量和富有表现力的mel谱图合成。通过最大程度地提高训练数据的可能性来优化Flowtron,