您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 说话人识别系统的研究毕业论文

  2. 本文基于传统的LPC倒谱特征和KC复杂性特征建立了一个说话人确认系统, 采用了YOHOspeakerverifiea:ion数据库,Enroll阶段:采用238说话人4个 session每个Sessi。n有10个语音样本数据,Verify阶段:采用138说话人10 个Session每个session有4个语音样本数据,训练模板和测试该说话人确认系 统,取得了较好的说话人确认效果。
  3. 所属分类:专业指导

    • 发布日期:2009-05-17
    • 文件大小:3145728
    • 提供者:nuonuo103
  1. 一种修正的倒谱公式及其在说话人识别中的应用

  2. 介绍倒谱参数的特点,推导计算LPC倒谱的递推公式
  3. 所属分类:专业指导

    • 发布日期:2009-10-22
    • 文件大小:221184
    • 提供者:zhy951723
  1. 基于高斯混合模型的说话人识别

  2. 由于在人的话音频谱中,低频和较高频段含有较多说话人的个性信息,本文提出一种 LPC 倒谱的改进算法用于与文本无关的说话人识别。该改进算法通过话音频谱的各频段进行加权, 突出说话人的个性信息,从而使说话人更易于区分。
  3. 所属分类:其它

    • 发布日期:2010-12-10
    • 文件大小:171008
    • 提供者:benben0413
  1. 基于HMM和ANN的语音识别方法

  2. 本文对现有的语音识别技术发展现状进行了分析,首先介绍了语 音识别的基本理论,包括语音信号的预处理、端点检测和特征提取。 在此基础上,介绍了三个有效语音识别特征参数—线性预测编码系数 LPC、线性预测倒谱系数LPCC和美尔频率倒谱系数MFCC的具体提 取方法,其次分别讨论了隐马尔可夫模型HMM和人工网络模型ANN 在语音识别中的具体应用,介绍了它们各自的模型训练与识别算法, 最后针对HMM具有很强的对时间归整能力和ANN具有很强的分类 能力,利用它们各自的优点把HMM和ANN结合起来,实验证明,
  3. 所属分类:其它

    • 发布日期:2011-04-18
    • 文件大小:1048576
    • 提供者:virtualwolf
  1. 语音识别技术文章.rar

  2. 第一部分 基本理论 第2章 听觉机理和汉语语音基础 2. 1 概述 2.2 听觉机理和心理 2.2.1 语音听觉器官的生理结构 2.2.2 语音听觉的心理 2.3 发音的生理机构与过程 2.4 汉语语音基本特性 2.4. 1 元音和辅音 2.4.2 声母和韵母 2.4.3 音调(字调) 2.4.4 音节(字)构成 2.4.5 汉语的波形特征 2.4.6 音的频谱特性 2.4.7 辅音的频谱特性 2.4.8 汉语语音的韵律特征 2.5 小结 参考文献 第3章 语音信号处理方法--时域处理 3.1
  3. 所属分类:其它

    • 发布日期:2011-05-12
    • 文件大小:5242880
    • 提供者:wangjunhui1984
  1. 说话人识别系统

  2. 这是一个说话人识别系统,特征是LPC倒谱系数,文件包含11个训练和测试语音素材,采样率为12.5kHz,用11个素材测试识别率可以达到100%,但是通过录音进行测试,有时候会出现错误。
  3. 所属分类:电信

    • 发布日期:2012-12-12
    • 文件大小:613376
    • 提供者:yueyucanyang
  1. 共振峰提取

  2. 目前的提取语音共振峰的方法比较多,常用的方法有倒谱法、LPC谱估计法、LPC倒谱法,但没有一种方法是十分完美的,为 了系统的深入的研究共振峰的提取,本文对同一帧语音信号进行了不同方法的共振峰提取实验仿真,给出了具体的共振峰频率数 据,同时对不同方法的优缺点进行了科学的、深入的研究分析,用Matlab 对算法进行仿真实现,实验结果表明共振峰的提取方案中 LPCC倒谱法避免了一般同态处理中对复对数的麻烦,可以较为理想的实现对共振峰的提取。
  3. 所属分类:专业指导

    • 发布日期:2014-03-17
    • 文件大小:3145728
    • 提供者:u014169458
  1. 基于MATLAB的语音识别算法研究

  2. 本论文介绍了双门限语音端点检测理论, 研究了语音特征参数地提取过程, 特征参数包括:线性预测系数(LPC)、线性预测倒谱系数(LPCC)和Mel频率倒 频系数(MFCC)。并研究了3种不同的语音识别算法:DTW算法、VQ算法和HMM算 法。 并且在MATLAB环境中提取了孤立字语音 (十个数字0~9的汉语发音) 的LPCC、 MFCC特征参数,用它们配合上述3种语音识别算法实现了对这些孤立字语音的识 别。
  3. 所属分类:电信

    • 发布日期:2014-09-06
    • 文件大小:2097152
    • 提供者:hdpsy21
  1. 基于信息熵和神经网络的语音端点检测算法研究

  2. 这篇论文先介绍了语音信号处理的一些背景知识,包括语音信号的特点、数字化和预处理等;然后简要描述了几种较为常见的VAD算法:基于短时能量和过零率的端点检测算法、基于LPC倒谱特征的VAD算法、基于HMM模型的VAD算法和频带方差检测法;然后详细讲述了信息熵的概念,并给出了音频幅度熵和谱熵的计算方法,描述了基于信息熵的音频端点检测算法,并给出了试验结果;最后讲述了神经网络的一些背景知识,并结合信息熵与神经网络(MLP)进行VAD的试验,给出了实验结果。
  3. 所属分类:专业指导

    • 发布日期:2016-07-18
    • 文件大小:4194304
    • 提供者:xiaoxio006
  1. 声控小车的设计与制作

  2. 声控小车 说明文件,原代码见压缩包 framenum为所分的帧数; ident(int *snd,int length)中,snd为一段语音的指针,length为该段语音所含的采样点数; CLPC lpc(snd,length)中参数同上; 铁伟涛的程序是先计算过零率,再分帧计算倒谱系数。计算倒谱系数的程序已经修改,现在需要修改的是计算过零率的程序和DTW算法程序。另外,程序中settimer()的参数中为什么回设为200呢? 找到音头音尾后,采样点会存入sndbuffer中,采样点的个数存入
  3. 所属分类:其它

    • 发布日期:2009-02-27
    • 文件大小:462848
    • 提供者:dcj19870122
  1. 声音控制小车(C++)

  2. framenum为所分的帧数; ident(int *snd,int length)中,snd为一段语音的指针,length为该段语音所含的采样点数; CLPC lpc(snd,length)中参数同上; 铁伟涛的程序是先计算过零率,再分帧计算倒谱系数。计算倒谱系数的程序已经修改,现在需要修改的是计算过零率的程序和DTW算法程序。另外,程序中settimer()的参数中为什么回设为200呢? 找到音头音尾后,采样点会存入sndbuffer中,采样点的个数存入sndLength中。 在WaveI
  3. 所属分类:其它

    • 发布日期:2009-03-03
    • 文件大小:466944
    • 提供者:zzffir
  1. 语音识别的MATLAB实现

  2. 语音识别的MATLAB实现 声控小车结题报告 小组成员:关世勇 吴庆林 一、 项目要求: 声控小车是科大华为科技制作竞赛命题组的项目,其要求是编写一个语言识别程序并适当改装一个小型机动车,使之在一个预先不知道具体形状的跑道上完全由声控来完成行驶比赛。跑道上可以有坡面,坑, 障碍等多种不利条件,小车既要具有较快的速度,也要同时具有较强的灵活性,能够克服上述条件。 二、 项目分析: 由于小车只要求完成跑道上的声控行驶,所以我们可以使用简单的单音命令来操作,如“前”、“后”、“左”、“右”等。 由于
  3. 所属分类:其它

    • 发布日期:2009-03-03
    • 文件大小:567296
    • 提供者:u012130076
  1. 用于语音动画合成的语音特征提取和聚类技术

  2. 在基于图像的人脸语音动画合成过程中,为了保证音频帧和视频帧的精确映射关系,需要提取鲁棒的语音信号特征参数,并对特征参数聚类。本文介绍了直接从原始语音信号中提取LPC复倒谱及短时能量组成特征矢量的方法,以及对特征矢量进行聚类的方法。
  3. 所属分类:其它

    • 发布日期:2020-10-26
    • 文件大小:95232
    • 提供者:weixin_38565480
  1. Speech-Processing-Basic-Concepts:基本概念-源码

  2. 语音处理基本概念 基本概念:发音语音–语音的发展和分类;声学语音学–语音产生的声学;审查数字信号处理概念;语音分析的短时傅立叶变换,滤波器组和LPC方法技术:特征,特征提取和模式比较:对数频谱距离,倒谱距离,加权倒频谱距离和滤波,似然失真,使用翘曲频率标度的频谱失真,LPC,PLP和MFCC系数都是统计和感知语音失真度量。多个时间–对齐路径,动态时间扭曲以及时间对齐和规范化注释 如何使用python将.mp3转换为.wav pip安装pydub 点安装软件-属性-常见 ** pip安装ffm
  3. 所属分类:其它

    • 发布日期:2021-03-22
    • 文件大小:22528
    • 提供者:weixin_42097508