您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. GMM,HMM的语音识别,说话人识别源码

  2. 该压缩包中包含一个完整的语音识别程序,代码使用matlab实现,使用了经典的GMM,HMM模型。附件中还包含完整的说明文档,介绍了一些基本原理,和该源码的使用方法。是语音识别入门必读源码之一。该源码只需要很小的改动就可以用来做说话人识别。 :}
  3. 所属分类:其它

    • 发布日期:2011-05-10
    • 文件大小:2mb
    • 提供者:pfa2008
  1. 语音识别技术文章.rar

  2. 第一部分 基本理论 第2章 听觉机理和汉语语音基础 2. 1 概述 2.2 听觉机理和心理 2.2.1 语音听觉器官的生理结构 2.2.2 语音听觉的心理 2.3 发音的生理机构与过程 2.4 汉语语音基本特性 2.4. 1 元音和辅音 2.4.2 声母和韵母 2.4.3 音调(字调) 2.4.4 音节(字)构成 2.4.5 汉语的波形特征 2.4.6 音的频谱特性 2.4.7 辅音的频谱特性 2.4.8 汉语语音的韵律特征 2.5 小结 参考文献 第3章 语音信号处理方法--时域处理 3.1
  3. 所属分类:其它

    • 发布日期:2011-05-12
    • 文件大小:5mb
    • 提供者:wangjunhui1984
  1. 基于MFCC的GMM的语音识别

  2. 语音识别的Matlab代码,提取的特征为Mel频率倒谱系数,采用的方法为高斯混合模型
  3. 所属分类:其它

    • 发布日期:2013-03-10
    • 文件大小:1mb
    • 提供者:wgs1024
  1. 语音识别 语种识别

  2. 语音识别 语种识别
  3. 所属分类:IT管理

    • 发布日期:2013-07-25
    • 文件大小:3mb
    • 提供者:u010628240
  1. 基于GMM的孤立词语音识别

  2. 基于GMM的孤立词语音识别 word说明 带有源代码
  3. 所属分类:讲义

    • 发布日期:2015-06-24
    • 文件大小:4mb
    • 提供者:u010673367
  1. Speech Recognition_Columbia(哥大最新语音识别讲义)

  2. 哥伦比亚大学2016年春季语音识别讲义,覆盖GMM, HMM, 声学模型,语言模型,模型稳健性,深度学习的语音识别等最新知识面
  3. 所属分类:讲义

    • 发布日期:2016-11-26
    • 文件大小:56mb
    • 提供者:xibro
  1. 基于MATLAB的语音识别GMM

  2. 用MATLAB编程的GMM模型,在语音识别中发挥很大作用,采用的方法为高斯混合模型
  3. 所属分类:其它

  1. 语音识别领域所有有价值的论文合集

  2. 语音识别关键论文合集,Automatic Speech Recognition has been investigated for several decades, and speech recognition models are from HMM-GMM to deep neural networks today. It's very necessary to see the history of speech recognition by this awesome paper roadm
  3. 所属分类:深度学习

    • 发布日期:2018-05-01
    • 文件大小:9kb
    • 提供者:zuoph
  1. 孤立词语音识别.zip

  2. 基于GMM-HMM的孤立词语音识别系统,内含训练和测试数据,是1-10的数字的音频,测试数据也是1-10,当然你可以自己改,只要改了标签即可。运行需要安装hmmlearn,scipy,numpy
  3. 所属分类:机器学习

    • 发布日期:2020-05-12
    • 文件大小:1mb
    • 提供者:lxhdy12345
  1. 语音识别视频.txt

  2. 李琳山老师的语音识别课程,特别适合语音识别入门。 该视频包括了所有跟语音识别相关的技术、算法,HMM、GMM、声学模型、语言模型、wfst等等到包括在内。
  3. 所属分类:机器学习

    • 发布日期:2019-12-27
    • 文件大小:75byte
    • 提供者:lixf071213
  1. HTK BOOK 语音识别

  2. HMM GMM 声学模型 语言模型 语音识别入门基础 HTK is a toolkit for building Hidden Markov Models (HMMs). HMMs can be used to model any time series and the core of HTK is similarly general-purpose.
  3. 所属分类:深度学习

    • 发布日期:2020-11-21
    • 文件大小:2mb
    • 提供者:u013498583
  1. 隐马尔可夫模型与语音识别

  2. 文章目录前言隐马尔可夫(HMM)马尔可夫链隐马尔可夫HMM中的语音识别(孤立词)HMM 语音识别过程GMM总结参考文献 前言 隐马尔科夫链结合语言识别,在细节上,涉及到的知识挺多,没有一定的时间投入难以很好的去把握。这篇文章只想借着自己的一小段时间学习,从整体上,理一下HMM在ASR的应用过程,不想去探究其中的具体细节。文中的图片基本截取自参考文献中的内容。 隐马尔可夫(HMM) 马尔可夫链 马尔可夫链描述了当前状态与下一个状态的转换关系,如图中所示,天气有三种状态,晴天,阴天,下雨。 马尔可
  3. 所属分类:其它

  1. speech-to-text:混合语言语音识别系统; 混合(GMM + NNet)模型; 卡尔迪+凯拉斯-源码

  2. 混合语言语音识别 来自团队: 当中国学生在各州学习时,我们发现自己的说话习惯发生了变化-英文单词和短语很容易滑入汉语句子中。 我们非常感到需要具有能够处理多语言语音到文本翻译的消息传递应用程序。 因此,在此任务中,我们将开发此功能-使用深度学习架构(DNN,CNN,LSTM)构建模型,以将多语言音频(在同一句子中具有中英文)正确地翻译成文本。 - 表中的内容: 目录说明 代码开关: 包含用于构建系统的脚本 描述: LDC2015S04,我们的数据集描述 笔记: 我们关于Kaldi相关t
  3. 所属分类:其它

  1. 基于两层GMM结构的VTS特征补偿,可实现鲁棒的语音识别

  2. 基于两层GMM结构的VTS特征补偿,可实现鲁棒的语音识别
  3. 所属分类:其它

    • 发布日期:2021-03-08
    • 文件大小:837kb
    • 提供者:weixin_38713061
  1. 基于特征空间非线性流形的语音识别声学模型

  2. 从语音信号声学特征空间的非线性流形结构特点出发,利用流形上的压缩感知原理,构建新的语音识别声学模型。将特征空间划分为多个局部区域,对每个局部区域用一个低维的因子分析模型进行近似,从而获得混合因子分析模型。将这些相关状态的观测矢量限定在该非线性低维流形结构上,推导得到其观测概率模型。最终,每个状态由一个服从稀疏约束的权重矢量和几个个服从标准正态分布的低维局部因子矢量所决定。文中指定了局部区域潜在维数的确定顺序及模型参数的迭代估计算法。基于RM语料库的连续语音识别实验表明,在传统的高斯混合模型(GM
  3. 所属分类:其它

    • 发布日期:2021-03-07
    • 文件大小:593kb
    • 提供者:weixin_38713801
  1. HMM+GMM语音识别技术详解级PMTK3中的实例-附件资源

  2. HMM+GMM语音识别技术详解级PMTK3中的实例-附件资源
  3. 所属分类:互联网

    • 发布日期:2021-03-05
    • 文件大小:106byte
    • 提供者:weixin_42202716
  1. 基于特征电话说话人子空间的说话人自适应语音识别方法

  2. 本征音子说话人自适应算法在自适应数据量充足时可以取得很好的自适应效果,但在自适应数据量不足时会出现严重的过拟合现象。首先引入基于隐马尔可夫模型-高斯混合模型(HMM-GMM)的语音识别系统中本征音子说话人自我的算法适应的基本原理。其次通过约会说话人子空间对不同说话人的本征音子矩阵间的相关性信息进行建模;然后通过估计说话人相关坐标矢量得到一种新的本征音子说话人子空间自适应算法。最后将本征音子说话人子空间自适应算法与传统说话人子空间自适应算法进行了对比。自适应算法比例,该算法在自适应数据量极少时能提
  3. 所属分类:其它

    • 发布日期:2021-03-04
    • 文件大小:334kb
    • 提供者:weixin_38738528
  1. HMM+GMM语音识别技术详解级PMTK3中的实例-附件资源

  2. HMM+GMM语音识别技术详解级PMTK3中的实例-附件资源
  3. 所属分类:互联网

    • 发布日期:2021-03-02
    • 文件大小:23byte
    • 提供者:weixin_42183453
  1. 详解卷积神经网络(CNN)在语音识别中的应用

  2. 总结目前语音识别的发展现状,dnn、rnn/lstm和cnn算是语音识别中几个比较主流的方向。2012年,微软邓力和俞栋老师将前馈神经网络FFDNN(FeedForwardDeepNeuralNetwork)引入到声学模型建模中,将FFDNN的输出层概率用于替换之前GMM-HMM中使用GMM计算的输出概率,引领了DNN-HMM混合系统的风潮。长短时记忆网络(LSTM,LongShortTermMemory)可以说是目前语音识别应用最广泛的一种结构,这种网络能够对语音的长时相关性进行建模,从而提高
  3. 所属分类:其它

    • 发布日期:2021-02-25
    • 文件大小:397kb
    • 提供者:weixin_38702726
  1. kaldi-gstreamer-server:基于Kaldi工具包和GStreamer框架的实时全双工语音识别服务器-源码

  2. Kaldi GStreamer服务器 这是基于Kaldi工具包和GStreamer框架并以Python实现的实时全双工实时语音识别服务器。 广告 塔林工业大学正在寻找一名从事语音识别的博士生,重点是轻度代码转换的语音(例如,芬兰语包含很多英语技术术语)。 。 注意! 该职位仍然开放! 特征 基于websocket的全双工通信:语音进入,出现部分假设(考虑Android的语音输入) 高度可扩展:服务器由主组件和工作程序组成; 每个并发识别会话需要一名工作人员; 可以独立于远程计算机上的主机启
  3. 所属分类:其它

    • 发布日期:2021-02-23
    • 文件大小:233mb
    • 提供者:weixin_42134117
« 12 3 »