文件名称:
AutoSpeech:[InterSpeech 2020]“自动语音-源码
开发工具:
文件大小: 182kb
下载次数: 0
上传时间: 2021-03-20
详细说明:AutoSpeech:用于说话人识别的神经体系结构搜索
本文的代码
丁少金*,陈天龙*,龚新宇,查微微,王章阳
概述
基于卷积神经网络(CNN)的说话人识别系统通常是使用现成的主干网构建的,例如VGG-Net或ResNet。但是,这些主干最初是用于图像分类的,因此可能自然不适合说话人识别。由于手动探索设计空间的复杂性过高,我们提出了第一种用于说话人识别任务的神经体系结构搜索方法,称为AutoSpeech 。我们在上的评估结果表明,从提议的方法衍生的CNN架构明显优于基于VGG-M,ResNet-18和ResNet-34骨干的当前说话人识别系统,同时具有较低的模型复杂性。
结果
我们提出的方法优于基于VGG-M,ResNet-18和ResNet-34主干的说话人识别系统。详细的比较可以在我们的论文中找到。
方法
前1名
能源效率
参数
预训练模型
VGG-M
80.50
10.20
6
(系统自动生成,下载前可以参看下载内容)
下载文件列表
相关说明
- 本站资源为会员上传分享交流与学习,如有侵犯您的权益,请联系我们删除.
- 本站是交换下载平台,提供交流渠道,下载内容来自于网络,除下载问题外,其它问题请自行百度。
- 本站已设置防盗链,请勿用迅雷、QQ旋风等多线程下载软件下载资源,下载后用WinRAR最新版进行解压.
- 如果您发现内容无法下载,请稍后再次尝试;或者到消费记录里找到下载记录反馈给我们.
- 下载后发现下载的内容跟说明不相乎,请到消费记录里找到下载记录反馈给我们,经确认后退回积分.
- 如下载前有疑问,可以通过点击"提供者"的名字,查看对方的联系方式,联系对方咨询.