您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 语音识别技术文章.rar

  2. 第一部分 基本理论 第2章 听觉机理和汉语语音基础 2. 1 概述 2.2 听觉机理和心理 2.2.1 语音听觉器官的生理结构 2.2.2 语音听觉的心理 2.3 发音的生理机构与过程 2.4 汉语语音基本特性 2.4. 1 元音和辅音 2.4.2 声母和韵母 2.4.3 音调(字调) 2.4.4 音节(字)构成 2.4.5 汉语的波形特征 2.4.6 音的频谱特性 2.4.7 辅音的频谱特性 2.4.8 汉语语音的韵律特征 2.5 小结 参考文献 第3章 语音信号处理方法--时域处理 3.1
  3. 所属分类:其它

    • 发布日期:2011-05-12
    • 文件大小:5mb
    • 提供者:wangjunhui1984
  1. 应用HTK搭建语音拨号系统(有说明文件和实例代码)

  2. 应用HTK搭建语音拨号系统:苏统华,哈尔滨工业大学人工智能研究室。 该系统能够识别连续说出的数字串和若干组姓名。建模是针对子词(sub-word, eg. 音素),具有一定的可扩充性。当加入一个新名字时,只需修改发音词典和任务语法即可。模型为连续混合高斯输出,运用语音决策树聚类形成的绑定状态式三音素。
  3. 所属分类:C

    • 发布日期:2013-12-11
    • 文件大小:8mb
    • 提供者:ygyan521
  1. 决策树状态绑定学习笔记一

  2. 这是我最近整理的Kaldi决策树状态绑定的学习笔记,分享给大家,有什么错误的话欢迎指正。:)
  3. 所属分类:讲义

    • 发布日期:2017-04-04
    • 文件大小:999kb
    • 提供者:u010731824
  1. Kaldi决策树状态绑定学习笔记二

  2. 这是我最近整理的Kaldi决策树状态绑定的学习笔记,分享给大家,欢迎大家免费下载,有什么错误的话欢迎您的批评指正。这个笔记主要讲如何自动生成问题集。:)
  3. 所属分类:讲义

    • 发布日期:2017-04-05
    • 文件大小:1mb
    • 提供者:u010731824
  1. Kaldi决策树状态绑定学习笔记

  2. 这里面包含我整理的Kaldi决策树状态绑定学习笔记。分四部分,第一个讲如何累积构建决策树和自动生成问题集所需的统计量;第二个讲如何自动生成问题集;第三个讲EventMap及其派生类、roots文件;第四个讲如何构建决策树。
  3. 所属分类:讲义

    • 发布日期:2017-04-08
    • 文件大小:5mb
    • 提供者:u010731824
  1. Kaldi三音素GMM学习笔记

  2. 在这个笔记中,我会首先介绍表示HMM的类HmmTopology和TransitionModel,然后介绍三音素GMM训练脚本train_deltas.sh用到的几个程序,这几个程序与单音素GMM的不同或者只在三音素GMM训练中出现。与GMM相关的其余部分请参考单音素GMM学习笔记。
  3. 所属分类:讲义

    • 发布日期:2017-04-13
    • 文件大小:1mb
    • 提供者:u010731824
  1. TIMIT语音数据库

  2. IMIT语料库包括一些与话语句子相关的文件,除了语音波形文件(.wav)外,还包括对应的句子内容(.txt),经过时间对齐(time-aligned)的单词内容(.wrd),经过时间对齐(time-aligned)的音素内容(.phn)三种类型的文件。
  3. 所属分类:深度学习

    • 发布日期:2017-09-28
    • 文件大小:6mb
    • 提供者:xiao7732
  1. 用Java实现语音引擎

  2. 用Java实现语音引擎,语音引擎的工作原理是把细小的声音样本连接起来,每一个样本都是人的语言发音(英语)的一个最小单位。这些声音样本称为音素(allophone)。每一个因素对应一个、二个或者三个字母。
  3. 所属分类:Java

    • 发布日期:2017-11-13
    • 文件大小:120kb
    • 提供者:u010629028
  1. TORGO-ASR-源码

  2. 使用TORGO数据集进行语音处理 有关使用Kaldi进行韵律性语音识别和说话者识别的教程。 所使用的数据由多伦多大学免费提供。 说话者由于脑瘫或肌萎缩性侧索硬化症而导致语言障碍。 这项运动的目标 建立用于语音识别的基于kaldi的GMM​​-HMM声学模型。 提高对受损语音的识别精度(数据增强,超参数调整等) 使用GMM-HMM模型中的路线训练DNN-HMM声学模型。 通过i向量执行说话者识别/识别。 栏目 第1部分: 第2部分: 第3部分: GMM-HMM声学模型 DNN-HMM声学
  3. 所属分类:其它

    • 发布日期:2021-03-09
    • 文件大小:110kb
    • 提供者:weixin_42107165
  1. 多基元及韵律参数匹配的维吾尔语语音合成方法

  2. 音节是维吾尔语的最小发音单元,所以大部分维吾尔语语音合成系统以音节作为基本的合成单元,但维吾尔语中音节数量很大,语料库很难保证覆盖所有的音节样本,这会导致合成语音不稳定和不连续。为解决合成语音不稳定的情况,提出了结合单音素和三音素两个不同基元的单元挑选算法。通过在单元挑选模块中加入韵律参数相匹配的方法选出最佳韵律匹配的单元并解决了合成语音不连续的情况。实验结果表明,提出的方法有效地解决了合成语音不稳定和不连续的现象,从而提高了合成语音的自然度。
  3. 所属分类:其它

  1. 土耳其形态:土耳其语的两级形态分析仪-源码

  2. 土耳其形态 土耳其语的两级形态分析仪。 这不是Google的官方产品。 组件 此实现由三层组成: 词汇表: 该层包括覆盖面很广的,可对其进行手动注释并针对词性和音素异常进行验证。 它们旨在用于构建土耳其语自然语言处理工具,例如形态分析仪。 我们提供的基本词典集包括用于注释的202,202个单词的词汇项目。 标签集和注释方案在进行了描述。 形态策略: 该层包括,这些定义以类似于AT&T FSM格式的自定义格式实现(唯一的不同是,我们可以将字符串用作状态名称和每个过渡的输入/输出标签,而
  3. 所属分类:其它

    • 发布日期:2021-02-03
    • 文件大小:474kb
    • 提供者:weixin_42116705
  1. TensorflowASR:集成了Tensorflow 2版本的端到端语音识别模型,并且RTF(实时率)在0.1左右Tensorflow 2中最先进的自动语音识别-源码

  2. TensorflowASR 集成了Tensorflow 2版本的端到端语音识别模型,和RTF(实时率)在0.1左右 目前集成了中文的CTC \ Transducer \ LAS三种结构 当前还在开发阶段 欢迎使用并反馈bug |中文版 梅尔层 参照librosa库,用TF2实现了语音频谱特征提取的层,这样在跨平台部署时会更加容易。 使用: am_data.yml use_mel_layer: True mel_layer_type: Melspectrogram #Spectrogram t
  3. 所属分类:其它

  1. 多基元及韵律参数匹配的维吾尔语语音合成方法

  2. 音节是维吾尔语的最小发音单元,所以大部分维吾尔语语音合成系统以音节作为基本的合成单元,但维吾尔语中音节数量很大,语料库很难保证覆盖所有的音节样本,这会导致合成语音不稳定和不连续。为解决合成语音不稳定的情况,提出了结合单音素和三音素两个不同基元的单元挑选算法。通过在单元挑选模块中加入韵律参数相匹配的方法选出最佳韵律匹配的单元并解决了合成语音不连续的情况。实验结果表明,提出的方法有效地解决了合成语音不稳定和不连续的现象,从而提高了合成语音的自然度。
  3. 所属分类:其它