您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 基于VQ的说话人自动识别系统的实现.

  2. 文中以语音信号的&’(倒谱系数、!倒谱系数、基音周期和!基音周期的混合特征参数作为 识别说话人的特征,运用)*技术实现了说话人自动识别。在"#个说话人,"+##个汉语数字和单词语音 的语音库上进行了系统的识别实验,其中单音节语音的平均识别率达到了$!,,双音节语音达到了$%- %.,,四音节语音达到了
  3. 所属分类:专业指导

    • 发布日期:2010-04-12
    • 文件大小:28672
    • 提供者:babiwangwang
  1. FPGA和Nios软核的语音识别系统

  2. :嵌入式语音识别的应用还是比较少,主要还是通过DSP 实现,而且准确率还不是太高。提出一种基于FPGA 和NiosII 软核 处理器的嵌入式语音识别系统的设计方案。系统以EP2C35 Cyclone II 芯片和NiosII 处理器为基础,采用软硬件结合的设计方式, 共同完成语音识别的设计。系统结合改进的端点检测方法,提取线性预测倒谱系数(LPCC)的音频信号特征,采用IP 核硬件实现动 态时间规整(DTW)的识别算法,能达到较高的识别准确率。
  3. 所属分类:硬件开发

    • 发布日期:2010-08-24
    • 文件大小:502784
    • 提供者:hujorpen
  1. 端点检测 相关硕士论文

  2. 噪声环境中基于HMM模型的语音信号端点检测方法 强噪声环境下语音信号端点检测方法研究 带噪语音端点检测方法的研究 基于倒谱特征的带噪语音端点检测 语音信号端点检测算法研究
  3. 所属分类:其它

    • 发布日期:2010-11-11
    • 文件大小:7340032
    • 提供者:xyx361100238
  1. 作为说话人识别特征参量的MFCC的提取过程

  2. 作为说话人识别特征参量的MFCC的提取过程,Mel频率倒谱系数(MFCC)是语音信号的 频域参数,它是一种基于人耳对语音频率的非线形感 知特征的描述
  3. 所属分类:嵌入式

    • 发布日期:2012-03-01
    • 文件大小:186368
    • 提供者:dcdos139
  1. 共振峰提取

  2. 目前的提取语音共振峰的方法比较多,常用的方法有倒谱法、LPC谱估计法、LPC倒谱法,但没有一种方法是十分完美的,为 了系统的深入的研究共振峰的提取,本文对同一帧语音信号进行了不同方法的共振峰提取实验仿真,给出了具体的共振峰频率数 据,同时对不同方法的优缺点进行了科学的、深入的研究分析,用Matlab 对算法进行仿真实现,实验结果表明共振峰的提取方案中 LPCC倒谱法避免了一般同态处理中对复对数的麻烦,可以较为理想的实现对共振峰的提取。
  3. 所属分类:专业指导

    • 发布日期:2014-03-17
    • 文件大小:3145728
    • 提供者:u014169458
  1. 声控小车的设计与制作

  2. 声控小车 说明文件,原代码见压缩包 framenum为所分的帧数; ident(int *snd,int length)中,snd为一段语音的指针,length为该段语音所含的采样点数; CLPC lpc(snd,length)中参数同上; 铁伟涛的程序是先计算过零率,再分帧计算倒谱系数。计算倒谱系数的程序已经修改,现在需要修改的是计算过零率的程序和DTW算法程序。另外,程序中settimer()的参数中为什么回设为200呢? 找到音头音尾后,采样点会存入sndbuffer中,采样点的个数存入
  3. 所属分类:其它

    • 发布日期:2009-02-27
    • 文件大小:462848
    • 提供者:dcj19870122
  1. 声音控制小车(C++)

  2. framenum为所分的帧数; ident(int *snd,int length)中,snd为一段语音的指针,length为该段语音所含的采样点数; CLPC lpc(snd,length)中参数同上; 铁伟涛的程序是先计算过零率,再分帧计算倒谱系数。计算倒谱系数的程序已经修改,现在需要修改的是计算过零率的程序和DTW算法程序。另外,程序中settimer()的参数中为什么回设为200呢? 找到音头音尾后,采样点会存入sndbuffer中,采样点的个数存入sndLength中。 在WaveI
  3. 所属分类:其它

    • 发布日期:2009-03-03
    • 文件大小:466944
    • 提供者:zzffir
  1. 语音解锁MATLAB程序

  2. mfcc特征全称为Mel频率倒谱系数(Mel-Frequency Ceptral Coefficients,MFCC),它能够反映人对语音的感知特性。为什么能反映人对语音的基本感知呢?根据人耳听觉机理的研究发现,人耳对不同频率的声波有不同的听觉敏感度。从200Hz到5000Hz的语音信号对语音的清晰度影响对大。两个响度不等的声音作用于人耳时,则响度较高的频率成分的存在会影响到对响度较低的频率成分的感受,使其变得不易察觉,这种现象称为掩蔽效应。由于频率较低的声音在内耳蜗基底膜上行波传递的距离大于频
  3. 所属分类:其它

    • 发布日期:2018-09-08
    • 文件大小:104448
    • 提供者:qq_32015827
  1. 提取时域特征

  2. 在多数的现代语音识别系统中,人们都会用到时域域特征。梅尔频率倒谱系数(MFCC),首先计算信号的功率谱,然后用滤波器和离散余弦变换的变换来提取特征。
  3. 所属分类:深度学习

    • 发布日期:2019-05-05
    • 文件大小:635
    • 提供者:suofen9703
  1. 语音情感识别(matlab源代码).zip

  2. 语音中准确的情绪识别对于智能医疗、智能娱乐和其他智能服务等应用程序非常重要。由于汉语语言的复杂性,汉语语音的高精度动作识别具有挑战性。本文探讨了如何提高语音情感识别的准确性,包括语音信号特征提取和情感分类方法。从语音样本中提取五种特征:梅尔频率倒谱系数(mfcc)、音调、共振峰、短期过零率和短期能量
  3. 所属分类:深度学习

    • 发布日期:2019-05-28
    • 文件大小:31744
    • 提供者:weixin_43763037
  1. voice_analysis.m

  2. 在MATLAB中,对WAV格式的语音信号进行分析。其中包括宽带、窄带语谱图分析、音素片段的共振峰分析,倒谱基音估计等
  3. 所属分类:其它

    • 发布日期:2020-06-27
    • 文件大小:2048
    • 提供者:weixin_46091902
  1. 基于MATLAB和Python实现MFCC特征参数提取

  2. 1、MFCC概述 在语音识别(Speech Recognition)和话者识别(Speaker Recognition)方面,最常用到的语音特征就是梅尔倒谱系数(Mel-scale FrequencyCepstral Coefficients,简称MFCC)。根据人耳听觉机理的研究发现,人耳对不同频率的声波有不同的听觉敏感度。从200Hz到5000Hz的语音信号对语音的清晰度影响较大。两个响度不等的声音作用于人耳时,则响度较高的频率成分的存在会影响到对响度较低的频率成分的感受,使其变得不易察觉,
  3. 所属分类:其它

    • 发布日期:2020-12-31
    • 文件大小:206848
    • 提供者:weixin_38702110
  1. Speech-Processing-Basic-Concepts:基本概念-源码

  2. 语音处理基本概念 基本概念:发音语音–语音的发展和分类;声学语音学–语音产生的声学;审查数字信号处理概念;语音分析的短时傅立叶变换,滤波器组和LPC方法技术:特征,特征提取和模式比较:对数频谱距离,倒谱距离,加权倒频谱距离和滤波,似然失真,使用翘曲频率标度的频谱失真,LPC,PLP和MFCC系数都是统计和感知语音失真度量。多个时间–对齐路径,动态时间扭曲以及时间对齐和规范化注释 如何使用python将.mp3转换为.wav pip安装pydub 点安装软件-属性-常见 ** pip安装ffm
  3. 所属分类:其它

    • 发布日期:2021-03-22
    • 文件大小:22528
    • 提供者:weixin_42097508
  1. Speaker-Recognition-System:EEC 201最终项目-源码

  2. 说话人识别系统 团队:视听 珍妮弗·达卡奈(Majeia Reagle) EEC 201最终项目 抽象的 该项目演示了如何使用数字信号处理来创建一个系统,该系统通过使用梅尔频率倒谱系数(MFCC)提取独特的语音特征来自动识别说话者,并演示了LBG算法的有效性。每个扬声器的MFCC功能都是使用LBG算法(K均值聚类)计算的,该算法生成最初以一个质心开始的代码本。该系统首先通过创建密码本来训练识别每个说话者,然后通过确定最接近每个说话者的距离进行测试。系统识别出的扬声器精度为97.2%。 介绍 通
  3. 所属分类:其它

    • 发布日期:2021-03-19
    • 文件大小:1048576
    • 提供者:weixin_42151599
  1. CoviDSP-源码

  2. CoviDSP :speaker_high_volume: :studio_microphone: 最终项目:说话人识别系统 详细说明: Howard Kao-hkao [at] ucdavis [dot] edu William Orozco-worozco [在] ucdavis [点] edu EEC201-加州大学戴维斯分校。 2021年冬季季度 A.引言 该项目的目的是建立一个自动的说话人识别系统。 通过对信号应用傅立叶变换,从输入语音中提取特征,然后获得梅尔频率倒谱系数(M
  3. 所属分类:其它

    • 发布日期:2021-03-17
    • 文件大小:1048576
    • 提供者:weixin_42133861
  1. 基于音素后验概率和层次凝聚聚类算法的音素边界检测

  2. 提出了一种基于音素后验概率和层次凝聚聚类算法的音素边界检测方法。该方法首先利用改进的TRAP结构提取语音信号的帧级音素后验概率;然后,运用层次凝聚聚类算法将提取的音素后验概率进行聚类分析;最后根据其全部的最小损失函数值获取阈值,并通过此阈值决定聚类数目和音素边界。实验证明:该方法具有较好的检测性能,且相对于梅尔倒谱参数(MFCC),音素后验概率更为适合音素边界的检测。
  3. 所属分类:其它

    • 发布日期:2021-03-16
    • 文件大小:320512
    • 提供者:weixin_38702110
  1. 一种结合SS,MFCC和PMC技术的去噪方法

  2. 为提高语音识别系统在噪声情况下的识别率,提出了一种融合信号级去噪,参数级去噪,模型级去噪的方法。首先用谱减法对带噪的语音信号进行去噪,再利用梅尔倒谱系数(MFCC)对处理后的语音信号进行特征提取,最后经过并行模型结合处理法(PMC)处理得到较高识别率的语音信号。
  3. 所属分类:其它

    • 发布日期:2021-02-25
    • 文件大小:835584
    • 提供者:weixin_38692184
  1. Python提取频域特征知识点浅析

  2. 在多数的现代语音识别系统中,人们都会用到频域特征。梅尔频率倒谱系数(MFCC),首先计算信号的功率谱,然后用滤波器和离散余弦变换的变换来提取特征。本文重点介绍如何提取MFCC特征。 首先创建有一个Python文件,并导入库文件:     from scipy.io import wavfile     from python_speech_features import mfcc, logfbank     import matplotlib.pylab as plt1、首先创建有一个Pytho
  3. 所属分类:其它

    • 发布日期:2021-01-20
    • 文件大小:397312
    • 提供者:weixin_38692928
« 1 2 3»