点数信息
www.dssz.net
注册会员
|
设为首页
|
加入收藏夹
您好,欢迎光临本网站!
[请登录]
!
[注册会员]
!
首页
移动开发
云计算
大数据
数据库
游戏开发
人工智能
网络技术
区块链
操作系统
模糊查询
热门搜索:
源码
Android
整站
插件
识别
p2p
游戏
算法
更多...
在线客服QQ:632832888
当前位置:
资源下载
搜索资源 - Speech-Enhancement-源码
下载资源分类
移动开发
开发技术
课程资源
网络技术
操作系统
安全技术
数据库
行业
服务器应用
存储
信息化
考试认证
云计算
大数据
跨平台
音视频
游戏开发
人工智能
区块链
在结果中搜索
所属系统
Windows
Linux
FreeBSD
Unix
Dos
PalmOS
WinCE
SymbianOS
MacOS
Android
开发平台
Visual C
Visual.Net
Borland C
CBuilder
Dephi
gcc
VBA
LISP
IDL
VHDL
Matlab
MathCAD
Flash
Xcode
Android STU
LabVIEW
开发语言
C/C++
Pascal
ASM
Java
PHP
Basic/ASP
Perl
Python
VBScript
JavaScript
SQL
FoxBase
SHELL
E语言
OC/Swift
文件类型
源码
程序
CHM
PDF
PPT
WORD
Excel
Access
HTML
Text
资源分类
搜索资源列表
LAVSE:适用于Lite视听语音增强的Python代码-源码
Lite视听语音增强(Interspeech 2020) 介绍 这是的PyTorch实现。 我们还将一些预处理后的样本数据(包括增强的结果)放入此存储库中。 TMSV的LAVSE使用的数据集(台湾汉语语音与视频)发布。 如果您发现对研究有用的代码,请引用以下论文。 inproceedings{chuang2020lite, title={Lite Audio-Visual Speech Enhancement}, author={Chuang, Shang-Yi and Tsao
所属分类:
其它
发布日期:2021-03-09
文件大小:9mb
提供者:
weixin_42138545
Speech-Enhancement-源码
言语增强 文件DCUnet.ipynb源自的程序。 已进行了一些修改,以使该程序可以在2021年2月在Colab的版本上运行。具体地说,笔记本电脑使用以下程序包: torchaudio == 0.5.0a0 + 738ccba tqdm == 4.56.2 numpy == 1.19.2 pesq == 0.0.2 scipy == 1.4.1 matplotlib == 3.3.1 火炬== 1.5.1 DCUnet16.ipynb:在16kHz波形文件上进行训练和测试DCUn
所属分类:
其它
发布日期:2021-03-06
文件大小:1mb
提供者:
weixin_42097189
《PHASEN:A Phase and Harmonics-Aware Speech Enhancement Network》Pytorch代码学习
PHASEN结构 源码地址:https://github.com/huyanxin/phasen PHASEN是一个双流网络,其中幅值流和相位流分别专门用于幅值和相位预测。幅值流主要由卷积操作,频域变换模块(FTB,后文介绍)以及双向 LSTM 组成,而相位流为纯卷积网络。强度流的预测结果为幅值掩膜 M,其取值为正的实数,相位流的预测结果是相位谱。 具体细节不一一介绍,直接从每个模块的代码入手。 输入Input PHASEN的输入是cmp_spec = self.stft(inputs),即计
所属分类:
其它
发布日期:2021-01-20
文件大小:288kb
提供者:
weixin_38693524
speech-enhancement-dns-comparison:语音增强深度学习架构比较-源码
用于单通道语音增强的深噪声抑制模型的比较评估 考虑到视频会议系统和流传输工具的日益增加的使用,具有计算有效和有效的语音增强器变得有利和必要。 Microsoft DNS挑战极大地促进了该领域的创新,但仍有很大的改进空间。 这项工作比较了此挑战中提出的两种用于语音增强的深度学习模型:NSNet2和双信号转换LSTM网络(DTLN)。 在基于混响时间RT60和信噪比(SNR)规范的两种对比条件下,分别使用两个数据集和三种不同的以语音质量为中心的措施对这两种模型进行了比较:语音质量的感知评估(PESQ
所属分类:
其它
发布日期:2021-03-29
文件大小:109mb
提供者:
weixin_42168745
awesome-speech-enhancement:语音增强\语音分离\声源定位-源码
很棒的语音增强 语音前端列表,例如语音增强\语音分离\声源定位 语音分离 Tasnet:时域音频分离网络,用于实时单通道语音分离 Conv-TasNet:用于语音分离的超越理想的时频屏蔽 双路径RNN:用于时域单通道语音分离的高效长序列建模 DANet:用于单通道语音分离的深层吸引网络(DANet) TAC端到端麦克风排列和数目不变的多通道语音分离 uPIT进行语音分离:使用发声级PIT进行语音分离 LSTM_PIT_Speech_Separation 深度集群 小行星:
所属分类:
其它
发布日期:2021-03-20
文件大小:4kb
提供者:
weixin_42126865