搜索资源 - Speech-Enhancement-源码 - 点数信息

点数信息

注册会员 | 设为首页 | 加入收藏夹

您好，欢迎光临本网站！[请登录] ！[注册会员]！

热门搜索： 源码 Android 整站插件识别 p2p 游戏算法更多...

在线客服QQ:632832888

当前位置：

搜索资源 - Speech-Enhancement-源码

下载资源分类

移动开发

开发技术

课程资源

网络技术

操作系统

安全技术

数据库

行业

服务器应用

存储

信息化

考试认证

云计算

大数据

跨平台

音视频

游戏开发

人工智能

区块链

资源分类

搜索资源列表

LAVSE:适用于Lite视听语音增强的Python代码-源码
Lite视听语音增强（Interspeech 2020）介绍这是的PyTorch实现。我们还将一些预处理后的样本数据（包括增强的结果）放入此存储库中。 TMSV的LAVSE使用的数据集（台湾汉语语音与视频）发布。如果您发现对研究有用的代码，请引用以下论文。 inproceedings{chuang2020lite, title={Lite Audio-Visual Speech Enhancement}, author={Chuang, Shang-Yi and Tsao
所属分类：其它
- 发布日期：2021-03-09
- 文件大小：9mb
- 提供者：weixin_42138545

Speech-Enhancement-源码
言语增强文件DCUnet.ipynb源自的程序。已进行了一些修改，以使该程序可以在2021年2月在Colab的版本上运行。具体地说，笔记本电脑使用以下程序包： torchaudio == 0.5.0a0 + 738ccba tqdm == 4.56.2 numpy == 1.19.2 pesq == 0.0.2 scipy == 1.4.1 matplotlib == 3.3.1 火炬== 1.5.1 DCUnet16.ipynb：在16kHz波形文件上进行训练和测试DCUn
所属分类：其它
- 发布日期：2021-03-06
- 文件大小：1mb
- 提供者：weixin_42097189

《PHASEN:A Phase and Harmonics-Aware Speech Enhancement Network》Pytorch代码学习
PHASEN结构源码地址：https://github.com/huyanxin/phasen PHASEN是一个双流网络，其中幅值流和相位流分别专门用于幅值和相位预测。幅值流主要由卷积操作，频域变换模块（FTB，后文介绍）以及双向 LSTM 组成，而相位流为纯卷积网络。强度流的预测结果为幅值掩膜 M，其取值为正的实数，相位流的预测结果是相位谱。具体细节不一一介绍，直接从每个模块的代码入手。输入Input PHASEN的输入是cmp_spec = self.stft(inputs)，即计
所属分类：其它
- 发布日期：2021-01-20
- 文件大小：288kb
- 提供者：weixin_38693524

speech-enhancement-dns-comparison:语音增强深度学习架构比较-源码
用于单通道语音增强的深噪声抑制模型的比较评估考虑到视频会议系统和流传输工具的日益增加的使用，具有计算有效和有效的语音增强器变得有利和必要。 Microsoft DNS挑战极大地促进了该领域的创新，但仍有很大的改进空间。这项工作比较了此挑战中提出的两种用于语音增强的深度学习模型：NSNet2和双信号转换LSTM网络（DTLN）。在基于混响时间RT60和信噪比（SNR）规范的两种对比条件下，分别使用两个数据集和三种不同的以语音质量为中心的措施对这两种模型进行了比较：语音质量的感知评估（PESQ
所属分类：其它
- 发布日期：2021-03-29
- 文件大小：109mb
- 提供者：weixin_42168745

awesome-speech-enhancement:语音增强\语音分离\声源定位-源码
很棒的语音增强语音前端列表，例如语音增强\语音分离\声源定位语音分离 Tasnet：时域音频分离网络，用于实时单通道语音分离 Conv-TasNet：用于语音分离的超越理想的时频屏蔽双路径RNN：用于时域单通道语音分离的高效长序列建模 DANet：用于单通道语音分离的深层吸引网络（DANet） TAC端到端麦克风排列和数目不变的多通道语音分离 uPIT进行语音分离：使用发声级PIT进行语音分离 LSTM_PIT_Speech_Separation 深度集群小行星：
所属分类：其它
- 发布日期：2021-03-20
- 文件大小：4kb
- 提供者：weixin_42126865