您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. MIR工具常用代码 用于检索 分析

  2. MIR工具常用代码 用于检索 分析 节奏 曲调 音频相关的信息
  3. 所属分类:专业指导

    • 发布日期:2009-12-12
    • 文件大小:739kb
    • 提供者:willwill85
  1. 基于内容的音频检索技术研究与系统实现

  2. 硕士论文,比较综合,对.wav音频进行特征提取,用分层分割算法,提高识别的准确性;针对不同的音频例子表示方法,分析了基于内容的音频检索原型系统,具有良好可扩展性
  3. 所属分类:IT管理

    • 发布日期:2011-12-30
    • 文件大小:1mb
    • 提供者:wyhyhf
  1. 基于音频语谱图像识别的广告检索

  2. 随着中国广播电视事业的快速发展,对广播电视进行广告监测的重要性越来越突出。该文提出了一种基于音频语谱图像识别的广告检索方法,该方法把每个广告片段的音频转换成语谱图像,并通过boosting训练算法,从中提取可区分的、适合索引的特征以训练分类器。检索时,通过特征对齐,采用基于期望最大化(expectation maximization,EM)的迭代方法识别最匹配的广告
  3. 所属分类:IT管理

    • 发布日期:2011-12-30
    • 文件大小:225kb
    • 提供者:wyhyhf
  1. 基于内容的音频检索研究

  2. 基于内容的音频检索研究
  3. 所属分类:网络基础

    • 发布日期:2013-03-21
    • 文件大小:1mb
    • 提供者:taylorfan0418
  1. 一种音频指纹论文

  2. 一种音频检索技术,里面有对计算音频指纹、检索指纹进行描述。
  3. 所属分类:其它

    • 发布日期:2014-02-14
    • 文件大小:640kb
    • 提供者:zcanoe
  1. 网上多媒体信息分析与检索-庄越挺等

  2. 网上多媒体信息分析与检索 庄越挺 潘云鹤 吴飞 语言识别 本书较系统地讲述了网上多媒体分析与检索技术。全书共 6 部分,分 18 章,分别讲述了基于内容的 图像检索、视频结构化与视频检索、基于内容的音频检索、多媒体融合分析与检索、网上多媒体信息检索系统等内容,涉及的媒体类型除文本外,还包括图像、视频、音频及三维图形。本书层次分明,内容详实,理论分析与算法实践相结合,力求实用。 本书可作为高等院校计算机科学、图书情报等专业的研究生或高年级本科生的技术资料或教学用书,对广大从事模式识别和多媒体分析
  3. 所属分类:嵌入式

  1. 基于说话人的音频分割与聚类

  2. 李稀敏,洪青阳,黄晓丹 (厦门大学智能科学与技术系,福建 厦门 361005) 说话人分割与聚类主要应用于两个方面的问题,一方面可以用于自动语音识别的说话人自适 应;另一方面可用于说话人检索和富文本转录。主要包括三个过程:有效语音检测、说话人分割以及说 话人聚类。本文主要就这三个方面展开叙述,全面地介绍了各类算法。
  3. 所属分类:互联网

    • 发布日期:2016-11-04
    • 文件大小:819kb
    • 提供者:wh357589873
  1. 音频检索工具C#版

  2. 该程序可以分析音频文件的各种波形、频率、振幅等特征,可应用于多媒体音频文件检索,简单实用。
  3. 所属分类:C#

    • 发布日期:2018-07-23
    • 文件大小:392kb
    • 提供者:wanghuaqiu
  1. 修改后的蜻蜓fm电脑版音频批量下载软件(如有会员也可下会员内容)

  2. 可下的音频文件码率比较低,电脑版提供什么就下什么。 自己修正了原作者的代码,修改如下: 1、输入时的麻烦,不用在整个输入网址了,对于在命令行模式打字不熟和ctrl+v不可用的福音 2、下载时的断点续传问题。以前每次运行后中间不小心断了,再次开始还是从第一个下载。这回会对本地进行检索比对文件大小,同一批音频接着下,已下过的忽略掉。
  3. 所属分类:编解码

    • 发布日期:2020-03-01
    • 文件大小:6mb
    • 提供者:qq_39972887
  1. 基于支持向量机的音频分类与分割.pdf

  2. 音频分类与分割是提取音频结构与语义内容的重要手段,是基于内容的音频、视频检索和分析的基础。支持向量机是一种有效的统计学习方法。
  3. 所属分类:机器学习

    • 发布日期:2020-02-04
    • 文件大小:218kb
    • 提供者:qq_15804521
  1. 基于C#与Matlab集成的音频分类系统设计与实现

  2. 基于C#与Matlab集成的音频分类系统设计与实现,杨会云,郑继明,音频分类是基于内容的音频检索一个很重要的环节,因此音频分类系统的建立显得尤为重要。本文提出了采用COM组件实现Matlab与C#的混合�
  3. 所属分类:其它

    • 发布日期:2020-01-22
    • 文件大小:247kb
    • 提供者:weixin_38608378
  1. 听歌识曲--用python实现一个音乐检索器的功能

  2. 本篇文章中主要介绍了用python实现一个音乐检索器,类似于QQ音乐的摇一摇识曲,有兴趣的同学可以了解一下。
  3. 所属分类:其它

    • 发布日期:2020-09-21
    • 文件大小:383kb
    • 提供者:weixin_38631389
  1. 基于内容的音频检索系统的前端抗噪技术

  2. 1.引言   基于内容的音频检索指通过音频特征分析,对不同音频数据赋以不同语义,使具有相同语义的音频在听觉上保持相似。该技术在许多领域都有极大应用价值。在检索系统中一种常见情形是将安静环境下训练的模型应用于实际有背景噪声的环境。尤其在哼唱输入的情况下,噪声不可避免,因此噪声背景环境中的音频识别技术一直备受关注。本文给出一个将音频增强和音频检索系统相连接的抗噪声音频检索系统,重点分析基于内容的音频检索系统的前端抗噪技术。   2  系统平台的建立   基于内容的音频检索系统运用多媒体信息处理
  3. 所属分类:其它

    • 发布日期:2020-11-05
    • 文件大小:113kb
    • 提供者:weixin_38597889
  1. 模拟技术中的全媒体数字音频网的设计

  2. 以数字音频矩阵为核心的架构,将现代数字音频处理技术与先进的计算机多媒体网络技术相结合,实现广播信息采集、加工制作、播出传输、终端接收以及整理存储、编目、检索、交换和服务的数字一体化,是数字化发展的必然趋势,是现代广播技术发展的方向。图1即是这种全媒体数字广播系统的解决方案,出色的音质、海量的内容、便捷的接收,可选择的服务等成为构建新一代广播技术的发展核心。 图1 全媒体数字广播系统   1 系统的综合功能和构成   1)统一的综合数字信息管理平台(数字化管理)   综合数字信息管理平
  3. 所属分类:其它

    • 发布日期:2020-11-03
    • 文件大小:234kb
    • 提供者:weixin_38540782
  1. information-retrieval:信息检索和高级信息检索课程的材料-源码

  2. Innopolis大学的信息检索 该存储库汇总了阅读材料,实验室模板,数据集和其他电子资源,可用于了解搜索,推荐和其他IR内容。 读 在2021年,仍然是这既是好老。 这就是为什么这本书是必读的原因,因为它涵盖了所有必要的主题。 但是不幸的是,它是在多媒体检索,推荐系统和机器学习成为常见的地方之前写的。 潜在空间近似是一个重要主题,您可以参考 , 和讨论。 索引是搜索的血液系统。 位于理论的第0级。 在较高的位置,您会发现NSW和图。 在搜索树中,不要忘记阅读有关。 有关现代倒排索引的信息,
  3. 所属分类:其它

    • 发布日期:2021-03-25
    • 文件大小:160mb
    • 提供者:weixin_42163404
  1. 迈向基于语义的高效异构传输媒体大数据检索

  2. 在用于智能运输的媒体检索系统中,媒体数据的多样性和异构性已成为最关键的特征之一。不同格式的文档可能会表达相似的语义信息,因此,搜索反映用户意图的文档已成为一项至关重要的任务。为了解决这个问题,本文提出了一种新颖的基于语义的异构运输媒体检索(TMR)方法来提高性能。 TMR支持通过使用一种媒体类型来检索各种媒体类型(如图像,视频,音频和文本)的功能。首先,从用户注释和自动学习中提取语义字段,以表达用户的意图。其次,本体用于表示媒体的语义域,本体表示的语义信息与媒体文档数据一起保存。第三,描述语义字
  3. 所属分类:其它

  1. 基于Daubechies小波的稳健音频指纹识别,用于基于内容的音频检索

  2. 所属分类:其它

    • 发布日期:2021-03-16
    • 文件大小:384kb
    • 提供者:weixin_38732519
  1. 音频检索的潜在主题模型

  2. 潜在主题模型(例如潜在Dirichlet分配(LDA))已设计用于文本处理,并且在音频相关处理的任务中也得到了证明。 LDA背后的主要思想是假设每个文档的单词都来自主题的混合体,每个主题都是词汇表上的多项式分布。 将原始LDA应用于连续数据处理时,首先需要通过矢量量化(VQ)生成字样单元。 这种数据离散化通常会导致信息丢失。 为了克服这种不足,本文介绍了一种新的主​​题模型,即高斯-LDA,用于音频检索。 在提出的模型中,我们考虑了连续发射概率,即高斯分布而不是多项式分布。 这个新的主题模型跳过
  3. 所属分类:其它

    • 发布日期:2021-03-04
    • 文件大小:637kb
    • 提供者:weixin_38599545
  1. ffmpeg-php:FFmpegPHP是ffmpeg-php库的纯OO PHP端口,它是用C编写的。它添加了易于使用的面向对象的API,用于访问和检索视频和音频文件中的信息。 它具有将电影文件中的帧作为图像返回的方法,可以使用PHP的图像

  2. FFmpegPHP FFmpegPHP是库的纯OO PHP端口(用C编写)。 它添加了易于使用的面向对象的API,用于访问和检索视频和音频文件中的信息。 它具有用于将电影文件中的帧作为图像返回的方法,可以使用PHP图像函数对其进行操作。 这对于从影片自动创建缩略图图像非常有效。 FFmpegPHP对于报告音频文件(mp3,wma ...)的持续时间和比特率也很有用。 FFmpegPHP可以访问ffmpeg支持的许多视频格式(mov,avi,mpg,wmv ...) 替代ffmpeg-php
  3. 所属分类:其它

  1. 一种面向基于内容视频检索的音频场景分割方法

  2. 视频数据中的音频流包含了丰富的语义信息.在基于内容的视频检索中,对音频信息的分析是不可分割的一部分.本文主要讨论基于内容的音频场景分割,分析各种音频特征及提取方法,并在此基础上提出一种新的音频流分割方法,根据六种音频类型(语音、音乐、静音、环境音、纯语音、音乐背景下的语音和环境音背景下的语音)的音频特征对视频数据中的音频流分割音频场景.实验证明该方法是有效的,在保证一定的分割精度的同时,准确率和查全率都得到了较大的提高.
  3. 所属分类:其它

    • 发布日期:2021-02-23
    • 文件大小:445kb
    • 提供者:weixin_38697123
« 12 3 4 5 6 7 8 9 10 »