您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. LAVSE:适用于Lite视听语音增强的Python代码-源码

  2. Lite视听语音增强(Interspeech 2020) 介绍 这是的PyTorch实现。 我们还将一些预处理后的样本数据(包括增强的结果)放入此存储库中。 TMSV的LAVSE使用的数据集(台湾汉语语音与视频)发布。 如果您发现对研究有用的代码,请引用以下论文。 inproceedings{chuang2020lite, title={Lite Audio-Visual Speech Enhancement}, author={Chuang, Shang-Yi and Tsao
  3. 所属分类:其它

  1. Speech-Enhancement-源码

  2. 言语增强 文件DCUnet.ipynb源自的程序。 已进行了一些修改,以使该程序可以在2021年2月在Colab的版本上运行。具体地说,笔记本电脑使用以下程序包: torchaudio == 0.5.0a0 + 738ccba tqdm == 4.56.2 numpy == 1.19.2 pesq == 0.0.2 scipy == 1.4.1 matplotlib == 3.3.1 火炬== 1.5.1 DCUnet16.ipynb:在16kHz波形文件上进行训练和测试DCUn
  3. 所属分类:其它

  1. 《PHASEN:A Phase and Harmonics-Aware Speech Enhancement Network》Pytorch代码学习

  2. PHASEN结构 源码地址:https://github.com/huyanxin/phasen PHASEN是一个双流网络,其中幅值流和相位流分别专门用于幅值和相位预测。幅值流主要由卷积操作,频域变换模块(FTB,后文介绍)以及双向 LSTM 组成,而相位流为纯卷积网络。强度流的预测结果为幅值掩膜 M,其取值为正的实数,相位流的预测结果是相位谱。 具体细节不一一介绍,直接从每个模块的代码入手。 输入Input PHASEN的输入是cmp_spec = self.stft(inputs),即计
  3. 所属分类:其它

    • 发布日期:2021-01-20
    • 文件大小:288kb
    • 提供者:weixin_38693524
  1. speech-enhancement-dns-comparison:语音增强深度学习架构比较-源码

  2. 用于单通道语音增强的深噪声抑制模型的比较评估 考虑到视频会议系统和流传输工具的日益增加的使用,具有计算有效和有效的语音增强器变得有利和必要。 Microsoft DNS挑战极大地促进了该领域的创新,但仍有很大的改进空间。 这项工作比较了此挑战中提出的两种用于语音增强的深度学习模型:NSNet2和双信号转换LSTM网络(DTLN)。 在基于混响时间RT60和信噪比(SNR)规范的两种对比条件下,分别使用两个数据集和三种不同的以语音质量为中心的措施对这两种模型进行了比较:语音质量的感知评估(PESQ
  3. 所属分类:其它

    • 发布日期:2021-03-29
    • 文件大小:109mb
    • 提供者:weixin_42168745
  1. awesome-speech-enhancement:语音增强\语音分离\声源定位-源码

  2. 很棒的语音增强 语音前端列表,例如语音增强\语音分离\声源定位 语音分离 Tasnet:时域音频分离网络,用于实时单通道语音分离 Conv-TasNet:用于语音分离的超越理想的时频屏蔽 双路径RNN:用于时域单通道语音分离的高效长序列建模 DANet:用于单通道语音分离的深层吸引网络(DANet) TAC端到端麦克风排列和数目不变的多通道语音分离 uPIT进行语音分离:使用发声级PIT进行语音分离 LSTM_PIT_Speech_Separation 深度集群 小行星:
  3. 所属分类:其它