说话人识别系统
EEC201最终项目
团队成员:钱伟泰,Ata Vafi
抽象的
该项目建立了一个依靠少量样本的说话人识别系统。它主要具有3个阶段的流水线:(1)特征提取(2)特征学习(3)说话人识别。在特征提取阶段,使用海明窗尺寸为256的短时傅立叶变换(STFT)。然后将20个滤波器用于MFCC以生成20维训练向量。在特征提取之后,使用矢量量化和k均值聚类来学习这些特征。在使用陷波滤波器生成更多噪声数据集之前,该系统在训练集上达到100%的精度,在测试集上达到100%的精度。
介绍
方法
首