您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 音乐流派分类:该项目旨在使用多个模型基于音频样本和不同的可视化技术对音乐流派进行分类,以理解数据-源码

  2. 音乐流派分类 关于该项目 该项目旨在使用多种模型基于音频样本和不同的可视化技术对音乐流派进行分类,以理解数据。 该项目的灵感来自上的代码,该代码实现了K-Nearest Neighbor方法来解决此问题。 这是该项目的起点。 数据集: : 笔记本电脑 从音频样本中提取梅尔频率倒谱系数(MFCC)。 包括K-最近邻方法对流派进行分类(来自 )。 比较了具有不同K值的模型的准确性。 使用颜色图可视化的梅尔频率倒谱系数,以更好地理解数据并获得关于MFCC的更直观的视角。 比较了不同类型的MF
  3. 所属分类:其它

    • 发布日期:2021-02-22
    • 文件大小:4194304
    • 提供者:weixin_42160645
  1. 呼吸音分类-源码

  2. [进行中]呼吸音分类 呼吸声的各种特征在不同程度上有助于分类表示,例如音调质心,频谱对比度,色谱图,梅尔频率谱图,梅尔频率倒谱系数和短期傅里叶变换。 我们建议使用深度学习方法(即卷积神经网络)来发现呼吸音分类的潜在多个特征的功效和效率。 这可能有助于在大流行期间为COVID-19初步筛查开发新颖的数据驱动模型。 研究呼吸声的多种特征也可能填补临床数据和筛查方法之间的空白。 [TBD](麻省理工学院开发了一种通过听咳嗽来检测Covid-19的AI模型(论文解释))[ ] 他的YouTube频道
  3. 所属分类:其它

    • 发布日期:2021-02-14
    • 文件大小:1048576
    • 提供者:weixin_42114046
  1. Music_Genre_mood_Predictor_NN:深度学习项目-使用Keras对音乐文件的流派和心情进行分类(来自免费的声音库),准确而Swift-源码

  2. 播放列表推荐者-预测音频文件的流派和风格 帮助音乐网站准确预测流派和情绪的辅助模型。 如今,一切都与个性化有关,这增加了使用音乐信息检索(MIR)中的深度学习领域进行的研究和完成的工作数量。 音乐的价位和流派在音乐推荐系统中起着重要的作用。 该项目旨在通过使用-CNN,RCNN,CNN-LSTM和CNN-GRU等模型来帮助音乐网站准确识别音频文件的类型和价。 数据与功能 通过从免费音乐档案(FMA)中提取30秒的音乐音频来创建数据集。 它包括“摇滚”,“流行”,“民间”,“乐器”和“电子”五种
  3. 所属分类:其它

    • 发布日期:2021-02-14
    • 文件大小:78848
    • 提供者:weixin_42097208
  1. Automatic speech emotion recognition based on modulation spectral features

  2. 本文采用调制频谱特征来自动识别人的语音中的情感信息。受人耳听觉系统启发,语音信号通过听觉滤波器组以及调制滤波器组得到长时频域-时域表示,从而获得 声学频率和时域调制频率的信息,进而提取出调制频谱特征。通过将该特征在演员表演的德语Berlin语音库和采集自真实生活的中文情感语音库上进行语音情 感分类实验,发现该特征与传统的短时频谱特征,如梅尔频率倒谱系数和感知线性预测系数相比,具有良好的性能和应用前景。
  3. 所属分类:其它

    • 发布日期:2021-02-09
    • 文件大小:565248
    • 提供者:weixin_38606897
  1. aubio:用于音频和音乐分析的库-源码

  2. 奥比奥 aubio是标记音乐和声音的库。 它收听音频信号并尝试检测事件。 例如,敲击鼓时,音符的频率是多少,节奏的旋律是什么节奏。 它的功能包括在每次攻击之前对声音文件进行分段,执行音高检测,敲击节拍并从现场音频中产生Midi流。 aubio提供了几种算法和例程,包括: 几种发作检测方法 不同的音高检测方法 速度跟踪和节拍检测 MFCC(梅尔频率倒谱系数) FFT和相位声码器 上/下采样 数字滤波器(低通,高通等) 频谱滤波 瞬态/稳态分离 声音文件读写访问 音乐应用程序的各种数学实
  3. 所属分类:其它

    • 发布日期:2021-01-31
    • 文件大小:568320
    • 提供者:weixin_42139042
  1. 咳嗽信号处理:从音频中提取特征的不同方法和技术-源码

  2. 咳嗽信号处理(csp) 咳嗽信号处理的微观框架 贡献与支持 产品特点 频谱图特征提取 连续功能 咳嗽事件检测 消除噪音,咳嗽声无声的实验 应用不同类型的过滤器 音频增强技术 功能编号 功能名称 描述 1个 过零率 在特定帧持续时间内信号的符号变化率。 2 能源 信号值的平方和,由相应的帧长标准化。 3 能量熵 子帧的归一化能量的熵。 它可以解释为突变的度量。 4 双谱得分(BGS) 信号的三阶频谱称为双频谱。 5 非高斯分数(NGS) NGS给出了给定数据段的非高斯度量。
  3. 所属分类:其它

    • 发布日期:2021-01-30
    • 文件大小:28311552
    • 提供者:weixin_42115074
  1. 基于单类支持向量机的异常声音检测

  2. 提出基于单类支持向量机的异常声音在线检测算法。该算法针对公共场合正常的环境声音,训练一个单类支持向量机模型,用来判断声音是否属于正常的环境声音,若不是则属于需要进一步识别的异常声音。采用窗长2秒的滑动窗对声音进行分窗,对每一个窗内的声音分帧并提取梅尔倒谱系数,短时能量,频谱质心,短时平均过零率等特征。采用基于帧之间互相关系数的方法对声音自动分段。最后对分段声音的判别结果进行中值滤波。当有连续多个帧被判别为异常时判定有异常声音出现。最后检验了算法在地铁背景条件下六类异常声音的漏检率和每小时误检次数
  3. 所属分类:其它

    • 发布日期:2021-01-27
    • 文件大小:968704
    • 提供者:weixin_38558246
  1. 基于语音静音段特征的手机来源识别方法

  2. 手机来源识别已成为多媒体取证领域重要的热点问题。提出了一种基于语音静音段特征的手机来源识别方法,该方法先通过使用自适应端点检测算法得到语音的静音段;然后将静音段的梅尔频谱系数(MFC)的均值作为分类特征;最后结合 WEKA 平台的CfsSubsetEval评价函数按照最佳优先(BestFirst)搜索进行特征选择,并采用支持向量机(SVM)对手机来源进行识别。实验部分对23款主流型号的手机进行了分类,结果表明所提特征具有较好的分类性能,在TIMIT数据库和自建的CKC-SD数据库上,平均识别准确
  3. 所属分类:其它

    • 发布日期:2021-01-19
    • 文件大小:818176
    • 提供者:weixin_38568031
« 1 2 3 4»