说明: 说话人识别系统在嘈杂的环境中性能会大大降低,为了处理这个强大的限制,我们的目标是直接在i向量空间中去除i向量的噪声部分。我们的方法提供了仅在i矢量提取水平下操作的优点,使系统的其他步骤不变。应用最大后验(MAP)程序以获得干净版本的噪声i矢量,利用关于干净的i向量分布的先验知识。为了执行该MAP估计,对干净的噪声i向量分布进行高斯假设。我们显示出与基准系统相比,所提出的方法的效率是以相对较高的计算成本为代价获得的。最后提出一些想法来改进这方面的内容
<grace123321> 在 上传 | 大小:275456