您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 实现了盲信号语音分割

  2. 改程序实现了盲信号的分离功能,测试时运用了两端非线性的语音合成,结果显示分离效果不错!
  3. 所属分类:其它

    • 发布日期:2009-11-19
    • 文件大小:1mb
    • 提供者:lvchenglin
  1. 语音信号处理端点检测算法

  2. 语音信号处理的论文,对语音进行端点分割,语音的特征提取,包含了经典和最新的方法。
  3. 所属分类:其它

  1. 汉语语音识别中的一种音节分割方法.PDF

  2. 汉语语音识别研究中,识别单元的选取是很重要的。随着大词汇量连续语音识别研究的发展,越来越多汉语语音 ,提出了音节的重叠音素分割策略,并利用小波方法实现 了音节的分割,实验证明该方法分割准确可靠
  3. 所属分类:专业指导

    • 发布日期:2010-04-21
    • 文件大小:202kb
    • 提供者:gszchltwth
  1. 自动连续语音的盲音节分割.pdf

  2. 自动连续语音的 音节分割.自动连续语音的 音节分割.pdf
  3. 所属分类:专业指导

    • 发布日期:2010-04-24
    • 文件大小:319kb
    • 提供者:gszchltwth
  1. 声音分割工具箱 (audioseg toolkit)

  2. audioseg是一个音频分割工具箱,使用C语音开发,支持Linux系统。 audioseg is a toolkit dedicated to audio segmentation and indexing, i.e. dedicated to segmenting a stream of audio descr iptors, or features, into segments of the same nature. In particular, audioseg provides to
  3. 所属分类:其它

    • 发布日期:2011-04-07
    • 文件大小:1mb
    • 提供者:daoshangren
  1. 合成普通话wav,语音模块

  2. 软件简介: 语音软件王是一款把文字转换为语音的软件,本软件可以把输入框内的文字转换为WAV文件,让你轻松的播放出来,还可以按行把一段文章分成多个WAV文件,这在编程,聊天,做网站及做幻灯等工作用,都是比较有用的. 操作方法: 注意:请先安装Microsoft_TTS_51_chs.msi 1,选择语音,请选择中文男声,如果没有这个选项,请您先下载"下载中文语音包" 2,转换文字,打开软件后,把要转换的文字复制到输入框内,点转换就可以把文字转换为WAV文件了,WAV文件保存在程序目录下的WAV文
  3. 所属分类:Java

    • 发布日期:2012-01-18
    • 文件大小:2mb
    • 提供者:s2009201625
  1. speaker segmentation and clustering语音分割聚类

  2. 语音分割与语音聚类 speaker segmentation and clustering
  3. 所属分类:互联网

    • 发布日期:2016-11-02
    • 文件大小:460kb
    • 提供者:wh357589873
  1. 一种两步判决的说话人分割算法

  2. 一种两步判决的说话人分割算法
  3. 所属分类:互联网

    • 发布日期:2016-11-02
    • 文件大小:610kb
    • 提供者:wh357589873
  1. 基于说话人的音频分割与聚类

  2. 李稀敏,洪青阳,黄晓丹 (厦门大学智能科学与技术系,福建 厦门 361005) 说话人分割与聚类主要应用于两个方面的问题,一方面可以用于自动语音识别的说话人自适 应;另一方面可用于说话人检索和富文本转录。主要包括三个过程:有效语音检测、说话人分割以及说 话人聚类。本文主要就这三个方面展开叙述,全面地介绍了各类算法。
  3. 所属分类:互联网

    • 发布日期:2016-11-04
    • 文件大小:819kb
    • 提供者:wh357589873
  1. 说话人聚类源码(pyaudioAnalysis)

  2. audio feature extraction, classification, segmentation and applications 语音特征提取 分类 分割 应用
  3. 所属分类:互联网

    • 发布日期:2016-11-06
    • 文件大小:58mb
    • 提供者:wh357589873
  1. C# 分隔WAV文件,将一段汉语语音分割成为单字

  2. 语音识别技术的第一步是将连续的声音切片,这个代码用了最简单粗暴的方法,根据音量的大小,简单切分,前提是要知道这段语音中包含了多少个字。可以支撑不同采样率,不同位数,不同声道的各种WAV格式。
  3. 所属分类:C#

    • 发布日期:2017-08-05
    • 文件大小:95kb
    • 提供者:darou1000
  1. 语音分割_语音质量客观打分工具(mos_pesq)

  2. # MOS-PESQ The project is a tool that can get MOS(PESQ) score for the voice. PESQ measure: ------------- Usage of the PESQ objective measure is as follows: [pesq_mos]=pesq(cleanfile.wav,enhanced.wav) where 'cleanfile.wav' contains the clean speech f
  3. 所属分类:其它

  1. 语音情绪识别,声纹识别

  2. 本课题的研究内容主要是呼叫中心电话语音分割和客服代表语音情绪检 测,主要内容如下: (1)绪论,主要讲述说话者语音分割和情绪识别的国内外研究现状。介绍各研究者所用的方法和结论以及存在的问题。 (2)语音特征提取,主要讲述语音的物理模型,以及基于此模型的特征种类和 提取方法。是本研究的基础。 (3)话者分割和聚类,主要讲述语音分割的内容和方,重点介绍了基于距离和 模型的分割聚类方法,并有相关实验分析。 (4)客服代表情绪检测,主要讲述语音识别的特征提取,选择以及模型的选择, 重点介绍了 SVM
  3. 所属分类:机器学习

    • 发布日期:2018-08-16
    • 文件大小:1mb
    • 提供者:qq_17816517
  1. python语音切割供大家参考,非常简单的语音切割例子。

  2. 可供大家参考,非常简单的语音切割例子。供大家参考,非常简单的语音切割例子。供大家参考,非常简单的语音切割例子。
  3. 所属分类:机器学习

    • 发布日期:2020-01-22
    • 文件大小:3kb
    • 提供者:tuooopc
  1. 一种基于卷积神经网络和简单循环单元的语音情感识别方法.pdf

  2. 发明专利说明书。本发明公布了一种基于卷积神经网络和简 单循环单元的语音情感识别方法。首先,提取出 语音中的谱图特征及其一阶差分和二阶差分,组 合成三维特征。将这些特征在时间轴上分割成固 定的片段数,并使用在ImageNet数据集上初始化 参数的Alexnet网络
  3. 所属分类:深度学习

    • 发布日期:2020-06-09
    • 文件大小:557kb
    • 提供者:phytle0
  1. MATLAB车牌识别语音播报停车场应用系统.zip

  2. 平台:MATLAB;流程:车牌定位,字符分割,车牌识别;算法:车牌定位【边缘检测】,字符分割【连通域法】,车牌识别【模板匹配或者bp神经网络,cnn卷积神经网络】;含GUI界面;特殊功能:语音播报,库外识别,计时计费,停车场应用场景;附送资料:开题,提纲,技术文档等。
  3. 所属分类:软件测试

    • 发布日期:2020-08-03
    • 文件大小:1mb
    • 提供者:matlab1998_vx
  1. 车牌识别(含GUI,语音播报).zip

  2. 一个完整的车牌识别系统闭应包括车辆检测、图像采集、图像预处理、车牌定位、字符分割、字符识别等单元。当车辆到达触发图像采集单元时,系统采集当前的视频图像。车辆识别单元对图像进行处理,定位出牌照位置,再将车牌中的字符分割出来进行识别,然后组成车牌号码输出。车牌识别系统原理如图l所示。
  3. 所属分类:专业指导

  1. MATLAB多算法车牌识别[出入库,计时计费,库内外判别,语音播报,GUI界面].zip

  2. MATLAB车牌识别部分: ①图像预处理:在整个车牌识别系统中,由于采集进来的图像为真彩图,再加上实际采集环境的影响以及采集硬件等原因,图像质量并不高,其背景和噪声会影响字符的正确分割。和识别,所以在进行车牌分割和识别处理之前,需要先对车牌图像进行图像预处理操作。 ②车牌定位:首先对车牌的二值图片进行形态学滤波,使车牌区域形成一个连通区域,然后根据车牌的先验知识对所得到的连通区域进行筛选,获取车牌区域的具体位置,完成从图片中提取车牌的任务。 ③车牌分割:首先对车牌进行水平投影,去除水平边框;再对
  3. 所属分类:其它

    • 发布日期:2020-08-02
    • 文件大小:1mb
    • 提供者:Threexiu
  1. tscb:使用Google API的简单音频转录,录制和语音命令包-源码

  2. 转录教程: 要使用,首先将WAV格式的音频文件放入resources文件夹。然后,运行init [file_name].wav初始化转录器。最后,运行transcribe来转录文本。要转录另一段文本,请运行purge ,并替换.wav文件,然后重复上述过程。您可以使用setter方法来自定义源目录或缓冲区目录。 Tscb的命令列表: init [file_name].wav通过将音频分割为1分钟大小的块来初始化音频。这是为了遵守Google API的规定。 transcribe使用转录成文本
  3. 所属分类:其它

    • 发布日期:2021-03-19
    • 文件大小:15kb
    • 提供者:weixin_42099087
  1. kaldi-gstreamer-server:基于Kaldi工具包和GStreamer框架的实时全双工语音识别服务器-源码

  2. Kaldi GStreamer服务器 这是基于Kaldi工具包和GStreamer框架并以Python实现的实时全双工实时语音识别服务器。 广告 塔林工业大学正在寻找一名从事语音识别的博士生,重点是轻度代码转换的语音(例如,芬兰语包含很多英语技术术语)。 。 注意! 该职位仍然开放! 特征 基于websocket的全双工通信:语音进入,出现部分假设(考虑Android的语音输入) 高度可扩展:服务器由主组件和工作程序组成; 每个并发识别会话需要一名工作人员; 可以独立于远程计算机上的主机启
  3. 所属分类:其它

    • 发布日期:2021-02-23
    • 文件大小:233mb
    • 提供者:weixin_42134117
« 12 3 4 5 6 »