您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 数字语音信号处理1111

  2. 前言 语音信号处理是研究用数字信号处理技术和语音学知识对语音信号进行处理的新兴的学科,是目前发展最为迅速的信息科学研究领域的核心技术之一。通过语音传递信息是人类最重要、最有效、最常用和最方便的交换信息形式。同时,语言也是人与机器之间进行通信的重要工具,它是一种理想的人机通信方式,因而可为信息处理系统建立良好的人机交互环境,进一步推动计算机和其他智能机器的应用,提高社会的信息化程度。 语音信号处理是一门新兴的学科,同时又是综合性的多学科领域和涉及面很广的交叉学科。虽然从事这一领域研究的人员主要来
  3. 所属分类:硬件开发

    • 发布日期:2011-03-06
    • 文件大小:1mb
    • 提供者:c429375860
  1. 上海华镇电子语音识别解决方案_3.0

  2. 自动控制,1 单位介绍...................................................................................................................................1 1.1 上海华镇电子科技有限公....司.....................................................................................
  3. 所属分类:嵌入式

    • 发布日期:2013-04-01
    • 文件大小:406kb
    • 提供者:u010119790
  1. 声学语音处理 python 源码

  2. 声学语音处理的python源码 ,包括各种语音滤波处理,gammotan滤波,特征提取等
  3. 所属分类:其它

    • 发布日期:2014-04-13
    • 文件大小:45kb
    • 提供者:linjiebelfast
  1. 梁家恩:面向移动互联网的智能语音云

  2. “DNN深度神经网络建模”值得开发者关注,DNN深度神经网络建模是从2009年开始爆发的应用,但在学界从06年就开始应用。全世界主流的语音识别系统均基于5个框架:1.特征提取、2.统计声学模型、3.发音词典、4. 统计语言模型、5. 识别编码器。
  3. 所属分类:讲义

    • 发布日期:2014-05-29
    • 文件大小:1mb
    • 提供者:admin
  1. 基于非负张量分解的音频分类方法

  2. 为了提高音频数据分类正确率,提出一种通过非负张量分解(NTF)的分类方法. 音频信号经过预处理后, 提取声学特征和感知特征参数,然后构建非负的 3 阶音频张量,其各阶分别对应特征、帧、样本;其次,通过 NTF 得到每一类音频的核张量与因子矩阵,让测试样本构建的张量与各类型音频的因子矩阵的转置进行张量乘,得到对 核张量的近似;最后,通过 Frobenius 范数进行相似性度量,完成分类. 使用古典音乐、流行音乐、语音、噪声 4 种 类型的音频数据测试分类效果. 结果表明,平均分类正确率在 85%
  3. 所属分类:算法与数据结构

    • 发布日期:2017-11-11
    • 文件大小:241kb
    • 提供者:puppet_love
  1. 鲁棒语音识别中声学特征的提取

  2. 02年的博士论文,非常系统的语音识别资料 为适应鲁棒语音识别的要求,研究新的声学特征提取方法和声学特征的鲁棒性处理方法,使其具备更强的区分能力和对恶劣环境的抗干扰能力,同时这种处理方法应该是简单、高效的
  3. 所属分类:专业指导

    • 发布日期:2009-01-14
    • 文件大小:622kb
    • 提供者:icheckit
  1. 深度学习IEEE最新论文

  2. 语音识别主要作用就是把一段语音信号转换成相对应的文本信息,系统主要由声学特征提取、语言模型、声学模型和解码器等组成。训练识别的过程是从原始波形语音数据中提取的声学特征经过训练得到声学模型,与发声词典、语言模型组成网络,对新来的语音提取特征,经过声学模型表示,通过维特比解码得出识别结果。
  3. 所属分类:深度学习

    • 发布日期:2018-02-05
    • 文件大小:2mb
    • 提供者:zyk1060513882
  1. mfcc——Mel frequency cepstrum coefficient

  2. 该方法对声学信号的特征提取十分有效,可广泛用于航空航天、建筑机械、土木工程、健康监测
  3. 所属分类:机器学习

    • 发布日期:2018-10-31
    • 文件大小:2kb
    • 提供者:qq_28955703
  1. 基于神经网络的统计参数语音合成方法研究_胡亚军.caj

  2. 本文围绕基于神经网络的统计参数语音合成方法,从基于深度学习的频谱 表征和声学模型构建两个方面开展研究工作。在频谱表征方面,将深度学习模 型引入频谱特征提取过程,分别提出了基于深度信念网络(DeepBeliefNetwork, DBN)、卷积神经网络(ConvolutionalNeuralNetwork,CNN)以及二值隐层深度自 编码器(DeepAuto-EncoderwithBinarydistributedhiddenunits,BDAE)的频谱表
  3. 所属分类:机器学习

    • 发布日期:2019-09-27
    • 文件大小:7mb
    • 提供者:tomclus006
  1. 基于PAD模型的级联分类情感语音识别

  2. 针对声学特征(韵律特征和MFCC特征)对情感语音的分类识别性能不理想的问题,提出了一种将声学特征与情感语音PAD数据相结合的级联分类方法用于情感语音识别。首先提取情感语音的声学特征,对特征分别单独识别与组合识别,对比建立最优特征集合。然后将声学特征组合与情感语音PAD数据相结合,分两步逐级地判断出输入语音所属的情感类型。该方法在TYUT2.0情感语音数据库上得到了较好的结果,情感分类识别率相较于传统声学特征的分类识别率提高了15.4%.
  3. 所属分类:其它

    • 发布日期:2020-04-20
    • 文件大小:233kb
    • 提供者:weixin_38680340
  1. sidekit使用说明.rar

  2. SIDEKIT旨在提供执行说话人识别所需的整个工具链。 可用的主要工具包括:声学特征提取(LPCC、MFCC、VAD、CMS、CMVN),模型(GMM、PLDA)等的使用参数
  3. 所属分类:Python

    • 发布日期:2020-03-30
    • 文件大小:1mb
    • 提供者:qq_41970292
  1. 医疗电子中的跌倒检测在远程健康监管系统中的应用案例

  2. 随着社会老龄化的不断发展,预期到2030年空巢老年人家庭的比例将达到90%,届时我国老年人家庭将空巢化。据统计,在65岁以上的老年人群中,每年有超过1/3的人都有跌倒经历,2/3老年人意外死亡都是由跌倒引起的,而在75岁以上老人中这个比例更是高达70%.   跌倒检测是远程健康监护系统中家庭终端的一种实现方式,涉及多个领域,包括信号采集与处理,信号特征提取,数据传输等方面的研究。跌倒检测技术有很多,从信号获取的渠道进行分类,可将跌倒检测技术分为三类:基于视频图像的跌倒检测,该方法不足之处在于它
  3. 所属分类:其它

    • 发布日期:2020-10-20
    • 文件大小:65kb
    • 提供者:weixin_38570278
  1. 基于声学方法的流化床React器结块特征提取与预警

  2. 基于声学方法的流化床React器结块特征提取与预警
  3. 所属分类:其它

  1. Speech-Processing-Basic-Concepts:基本概念-源码

  2. 语音处理基本概念 基本概念:发音语音–语音的发展和分类;声学语音学–语音产生的声学;审查数字信号处理概念;语音分析的短时傅立叶变换,滤波器组和LPC方法技术:特征,特征提取和模式比较:对数频谱距离,倒谱距离,加权倒频谱距离和滤波,似然失真,使用翘曲频率标度的频谱失真,LPC,PLP和MFCC系数都是统计和感知语音失真度量。多个时间–对齐路径,动态时间扭曲以及时间对齐和规范化注释 如何使用python将.mp3转换为.wav pip安装pydub 点安装软件-属性-常见 ** pip安装ffm
  3. 所属分类:其它

    • 发布日期:2021-03-22
    • 文件大小:22kb
    • 提供者:weixin_42097508
  1. 基于共振峰特征的长时间打sn相关信号分析

  2. 打nor是阻塞性睡眠呼吸暂停低通气综合征(OSAHS)患者的典型症状, 促使许多研究人员专注于如何通过声信号分析方法诊断这种疾病。 作为一种非侵入性方法,声学诊断比黄金标准的多导睡眠图(PSG)为受试者带来了更加舒适和便捷的体验。 但是,医生对OSAHS患者在较长时间内发现上呼吸道(UA)的变化提出了更高的要求。 共振峰特征在指示UA的结构变化方面具有良好的性能,可以将其视为打s模型中的共振。 本文提出了一种基于共振峰特征的长时间打of相关信号分析方法(SRS)。 提取前三个共振峰频率(F1,F
  3. 所属分类:其它

    • 发布日期:2021-03-10
    • 文件大小:466kb
    • 提供者:weixin_38556394
  1. msc-thesis-call-detection:使用机器学习检测夜间迁徙期间的鸟叫-源码

  2. msc_thesis_call_detection 使用机器学习在夜间迁移过程中检测鸟叫: 一种基于森林的随机方法,用于自动检测音频记录中的夜间航班呼叫(NFC)。 NFC的检测被认为是二进制分类任务,因此,连续的音频记录被分成短的声音片段。 训练随机森林分类器的目的是区分声音片段中是否存在NFC。 为此,从声音片段中提取声学特征。 这些用作随机森林的输入。 通过将录音分组并应用“一出一出”交叉验证程序来评估其性能。 进一步将随机森林分类器的性能与通过将即用型BirdVoxDetect应用于
  3. 所属分类:其它

    • 发布日期:2021-03-09
    • 文件大小:555kb
    • 提供者:weixin_42153691
  1. 基于声学方法的流化床React器结块特征提取与预警

  2. 作者研究了可听声发射在乙烯聚合流化床React器中监测颗粒团聚的潜在用途,并在本文中进行了报道。 比较了正常信号和团聚信号之间的功率谱质心偏移,并确认了声信号的能量分布在团聚条件下发生了变化。 在此基础上,通过小波包分解(WPD)分解声信号,并将每个子带的能量比设置为声纹。 随后,引入主成分分析(PCA)以减少特征向量的维数。 此外,基于正常信号,可以通过支持向量数据描述(SVDD)创建聚集警告模型,以避免由于缺乏聚集样本而导致描述准确性下降。 最后,设计了一个合适的报警率(AR)参数,以解决由
  3. 所属分类:其它

  1. 基于GRBAS量表的多维声学分析用于语音质量评估

  2. 尽管语音质量的感知评估被认为是检查正常和病理性语音质量的黄金标准,但听众之间和听众之间的变异性仍然很高。 这是许多混淆因素的结果,例如听众的感知偏见,听众的经历和所使用的评分表类型。 当前,自动客观评估为诊断病理性声音提供了非常有用的工具。 声学分析可以作为确定烦躁症严重程度的有用补充工具。 本研究旨在通过使用基于众所周知的GRBAS量表的多维声学测量来开发语音质量的补充自动评估系统。 包括梅尔频率倒谱系数,声门噪声激励比,声部褶皱激励比在内的共65个维量度构成了一组特征。 另外,为了减少提供特
  3. 所属分类:其它

    • 发布日期:2021-03-05
    • 文件大小:149kb
    • 提供者:weixin_38576045
  1. MusicScienceData:音乐和科学项目的示例数据-源码

  2. 音乐科学数据 MusicScienceData是一个R包,它提供示例数据集,适合探索音乐和科学研究中的基本分析(相关性,均值比较等)。 有一些行为数据,包括音轨中的情感表达等级,和弦中的librosa python ,音轨的音乐注释以及通过librosa python脚本从同一文件中提取的一些声学特征。 安装 该软件包的开发版本可以通过以下方式从安装: # install.packages("devtools") devtools :: install_github( " tuomaseero
  3. 所属分类:其它

    • 发布日期:2021-03-03
    • 文件大小:113kb
    • 提供者:weixin_42131705
  1. 基于堆叠去噪自动编码器的鲁棒声学特征提取方法

  2. 基于堆叠去噪自动编码器的鲁棒声学特征提取方法
  3. 所属分类:其它

    • 发布日期:2021-03-02
    • 文件大小:325kb
    • 提供者:weixin_38680671
« 12 »