您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. LBG矢量量化C/C++语言实现(可执行)

  2. 对照书上实现了LBG适量量化的算法,共享一下。 LBG是经典的矢量量化算法,通过对训练集的分析,生成矢量量化使用的码本。 实现过程简单明了,就一个CPP文件。 typedef struct _tTSVector { //training set vector double data[VEC_DEM]; //vector data int cluster; //cluster belong to }tTSVector; typedef struct _tCBVector { //code boo
  3. 所属分类:C

    • 发布日期:2010-08-23
    • 文件大小:4kb
    • 提供者:clodpoll
  1. 神经网络程序代码初学者

  2. 第一部分是模式识别的一些预处理知识,包括: 图像压缩的例子:行程编码算法RCL 手写体数据变换成像素位图的算法, 另外在这一章中的细化算法是与Chapt6中的特征提取结合在了一起 第二部分涉及有监督学习的前馈网络 ALOPEX算法:即模式提取算法,它把神经网络的学习过程看作 最优化问题的随机并行算法。与反向传播算法相比, 在大范围的信噪比情况下,ALOPEX算法有更好的抗噪声性能 另一个优点是计算简单,可以用高速大规模集成电路来实现 BackProp算法:经典的B-P算法(呵呵,很多人想要的么
  3. 所属分类:其它

    • 发布日期:2010-11-22
    • 文件大小:465kb
    • 提供者:lyz031608
  1. 基于倒谱基音混合参数话者识别程序

  2. 基于VC++的说话人识别程序,提取的特征参数是MEL倒谱系数,使用的方法是矢量量化
  3. 所属分类:C++

    • 发布日期:2008-03-20
    • 文件大小:884kb
    • 提供者:xing20044725
  1. 数字语音信号处理1111

  2. 前言 语音信号处理是研究用数字信号处理技术和语音学知识对语音信号进行处理的新兴的学科,是目前发展最为迅速的信息科学研究领域的核心技术之一。通过语音传递信息是人类最重要、最有效、最常用和最方便的交换信息形式。同时,语言也是人与机器之间进行通信的重要工具,它是一种理想的人机通信方式,因而可为信息处理系统建立良好的人机交互环境,进一步推动计算机和其他智能机器的应用,提高社会的信息化程度。 语音信号处理是一门新兴的学科,同时又是综合性的多学科领域和涉及面很广的交叉学科。虽然从事这一领域研究的人员主要来
  3. 所属分类:硬件开发

    • 发布日期:2011-03-06
    • 文件大小:1mb
    • 提供者:c429375860
  1. 说话人识别完整源码

  2. 说话人识别,矢量量化(VQ),特征提取(MFCC),GUI界面,完整C源码,可运行。
  3. 所属分类:C

    • 发布日期:2015-01-15
    • 文件大小:4mb
    • 提供者:u012424642
  1. 乘积量化代码

  2. 乘积量化(PQ)算法为的是加快图像的检索速度,它是一种检索算法,在矢量量化(Vector Quantization,VQ)的基础上发展而来。
  3. 所属分类:机器学习

  1. 11.1 基于矢量量化(VQ)的说话人识别实验.rar

  2. 基于matlab的矢量量化(VQ)的说话人识别实验,有语音
  3. 所属分类:其它

    • 发布日期:2019-10-17
    • 文件大小:1mb
    • 提供者:jac_ll
  1. 基于矢量量化的图像压缩

  2. 矢量量化(VQ)实际上就是一种逼近的形式,它的思想和“四舍五入”有异曲同工之妙,都是用一个和一个数最接近的整数来近似表示这个数。VQ问题可以这样描述:给定一个已知统计属性的矢量源(也就是训练样本集,每一个样本是一个矢量)和一个失真测度。还给定了码矢的数量(也就是我们要把这个矢量空间划分为多少部分,或者说量化为多少种值),然后寻找一个具有最小平均失真度(数据压缩,肯定是失真越小越好)的码书和空间的划分。
  3. 所属分类:电信

    • 发布日期:2020-05-03
    • 文件大小:3kb
    • 提供者:wws_2017
  1. 基于矢量量化(VQ)的说话人识别实验

  2. 基于矢量量化(VQ)的说话人识别实验 训练过程: 从训练语音中提取特征矢量,得到特征矢量集合 通过LGB算法生成码本 重复训练进化 存储码本
  3. 所属分类:深度学习

    • 发布日期:2020-03-24
    • 文件大小:1mb
    • 提供者:qq_45047246
  1. 嵌入式系统/ARM技术中的一种基于EZW改进算法的图像压缩方法探讨

  2. 近年来,随着更大面阵的图像传感器(包括红外和可见光)的应用,图像生成设备的输出数据率越来越高,而数据存取及传输信道带宽相对较窄,这两者的矛盾越来越尖锐。如何实时对高输出数据率的图像进行压缩始终是当前图像压缩领域研究的难点也是重点。目前已研究出的一些压缩方法,都存在不同程度的局限性,如DPCM压缩率不高;矢量量化(VQ)的计算复杂度随着维数的上升而急剧增加;而JPEG是迄今广为使用的国际压缩标准,但在量化误差较大时会产生方块效应。20世纪80年代在傅里叶变换基础上发展起来的小波变换,有效实现了信号
  3. 所属分类:其它

    • 发布日期:2020-10-23
    • 文件大小:324kb
    • 提供者:weixin_38748769
  1. 基于FPGA的关键词识别系统实现(二)

  2. 5 系统整体硬件实现与性能分析   在实现上述分模块的基础上,通过对各模块的组合实现了帧压缩模块,然后通过接口逻辑将语音帧压缩模块与HMM识别模块组合成完整的关键词识别系统.   5.1 语音帧压缩模块实现   由于隐马尔可夫模块HMM的输入数据是VQ 矢量量化标号序列,为了获得多帧语音的矢量量化标号,需要不断循环执行帧输出.特征参数提取以及VQ 矢量量化等三个模块,直到将所有的语音帧压缩为VQ 编号.因此本文提出了帧压缩模块的架构,该模块主要包括帧输出模块.MFCC 特征参数提取模块.V
  3. 所属分类:其它

    • 发布日期:2020-10-20
    • 文件大小:187kb
    • 提供者:weixin_38744207
  1. 说话人识别系统中VQ判决模块的FPGA实现

  2. 目前,基于PC或DSP的系统其处理能力无法满足海量语音信号高速处理需求的增长。本文分析了VQ(矢量量化)搜索算法的硬件实现复杂度,针对说话人识别过程中运算量最大、耗时最长的判决过程,提出了一种基于标签的说话人判决模型实现方案。该设计用FPGA实现,可对多路电话信道说话人进行实时判决识别。
  3. 所属分类:其它

    • 发布日期:2020-10-26
    • 文件大小:326kb
    • 提供者:weixin_38706603
  1. 基于音频到图像小波变换和矢量量化的音频中的数据隐藏

  2. 本文提出了一种基于音频到图像小波变换(A2IWT)和矢量量化(VQ)的数字音频中隐藏信息的新方法。 在我们的方案中,首先通过利用小波变换并重新采样系数将掩盖音频信号转换为图像,然后使用基于VQ的图像隐写方案将秘密数据嵌入到获得的图像中,最后将图像合并在一起剩下的小波系数被逆变换回隐身音频信号。 实验结果表明,该方案是有效的。
  3. 所属分类:其它

    • 发布日期:2021-03-16
    • 文件大小:250kb
    • 提供者:weixin_38610012
  1. 基于VQ索引共现图的彩色图像检索

  2. 通过从图像的矢量量化(VQ)索引表中构造特殊图形,然后提取其拓扑特性,提出了一种新型的图像检索功能。 在检索之前,根据大型训练集设计了三个Y,Cb和Cr分量大小为256的VQ码本,该训练集包括具有不同大小和各种外观的彩色图像。 对于每个输入的彩色图像,它在YCbCr空间中分为三个独立的成分图像。 对于每个分量图像,我们将其分为4×4块,并根据相应的代码本对其进行编码,以获得VQ索引表,其索引被视为图形的节点。 然后,我们通过对每个可能的索引对的水平和垂直出现次数进行计数,来构建水平VQ索引同时出
  3. 所属分类:其它

    • 发布日期:2021-03-16
    • 文件大小:411kb
    • 提供者:weixin_38649838
  1. 基于VQ指标差分编码的大容量可逆信息隐藏算法

  2. 随着计算机和互联网技术的发展,我们面临着涉及信息安全和版权保护的严峻问题,因此提出了信息隐藏技术来应对这些问题。 可逆信息隐藏通常旨在保护军事,医学或法律多媒体文档。 常规的可逆信息隐藏方法主要在空间,DCT和DWT域中执行。 最近,提出了一些基于矢量量化(VQ)的可逆数据隐藏方案。 然而,它们的主要缺点是隐藏能力低和隐秘图像质量低。 为了部分解决这些问题,本文通过对VQ索引执行特殊的差分编码操作,为VQ压缩图像提出了一种新颖的可逆信息隐藏方案。 在隐藏过程中,考虑到要嵌入的当前水印位,基于四种
  3. 所属分类:其它

    • 发布日期:2021-03-10
    • 文件大小:349kb
    • 提供者:weixin_38599231
  1. 音频检索的潜在主题模型

  2. 潜在主题模型(例如潜在Dirichlet分配(LDA))已设计用于文本处理,并且在音频相关处理的任务中也得到了证明。 LDA背后的主要思想是假设每个文档的单词都来自主题的混合体,每个主题都是词汇表上的多项式分布。 将原始LDA应用于连续数据处理时,首先需要通过矢量量化(VQ)生成字样单元。 这种数据离散化通常会导致信息丢失。 为了克服这种不足,本文介绍了一种新的主​​题模型,即高斯-LDA,用于音频检索。 在提出的模型中,我们考虑了连续发射概率,即高斯分布而不是多项式分布。 这个新的主题模型跳过
  3. 所属分类:其它

    • 发布日期:2021-03-04
    • 文件大小:637kb
    • 提供者:weixin_38599545
  1. 基于FPGA的关键词识别系统实现(二)

  2. 5 系统整体硬件实现与性能分析   在实现上述分模块的基础上,通过对各模块的组合实现了帧压缩模块,然后通过接口逻辑将语音帧压缩模块与HMM识别模块组合成完整的关键词识别系统.   5.1 语音帧压缩模块实现   由于隐马尔可夫模块HMM的输入数据是VQ 矢量量化标号序列,为了获得多帧语音的矢量量化标号,需要不断循环执行帧输出.特征参数提取以及VQ 矢量量化等三个模块,直到将所有的语音帧压缩为VQ 编号.因此本文提出了帧压缩模块的架构,该模块主要包括帧输出模块.MFCC 特征参数提取模块.V
  3. 所属分类:其它

    • 发布日期:2021-01-20
    • 文件大小:226kb
    • 提供者:weixin_38712279
  1. 说话人识别完整源码

  2. 说话人识别,矢量量化(VQ),特征提取(MFCC),GUI界面,完整C源码,可运行。 说话人识别,矢量量化(VQ),特征提取(MFCC),GUI界面,完整C源码,可运行。
  3. 所属分类:C

    • 发布日期:2021-04-01
    • 文件大小:4mb
    • 提供者:liqibiao666