您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 特征提取及分类源码

  2. 音乐特征提取及分类源码,有qtdesign
  3. 所属分类:Python

    • 发布日期:2016-07-23
    • 文件大小:103kb
    • 提供者:chen0ming123
  1. Speech-Processing-Basic-Concepts:基本概念-源码

  2. 语音处理基本概念 基本概念:发音语音–语音的发展和分类;声学语音学–语音产生的声学;审查数字信号处理概念;语音分析的短时傅立叶变换,滤波器组和LPC方法技术:特征,特征提取和模式比较:对数频谱距离,倒谱距离,加权倒频谱距离和滤波,似然失真,使用翘曲频率标度的频谱失真,LPC,PLP和MFCC系数都是统计和感知语音失真度量。多个时间–对齐路径,动态时间扭曲以及时间对齐和规范化注释 如何使用python将.mp3转换为.wav pip安装pydub 点安装软件-属性-常见 ** pip安装ffm
  3. 所属分类:其它

    • 发布日期:2021-03-22
    • 文件大小:22kb
    • 提供者:weixin_42097508
  1. surfboard:Novoic的音频特征提取库-源码

  2. 一个用于现代音频特征提取的Python包 有关贡献,引用,许可(包括商业许可)和取得联系的信息,请参阅 。 我们的文档可以在找到。我们的论文可以在找到。 如果您有任何疑问或建议,请加入我们的! :person_surfing:安装 :person_surfing: 使用pip安装 pip install surfboard 或者, 克隆仓库: git clone https://github.com/novoic/surfboard.git 导航到存储库: cd surfboard 安装pip
  3. 所属分类:其它

    • 发布日期:2021-03-19
    • 文件大小:595kb
    • 提供者:weixin_42146274
  1. FastSpeech2:微软“ FastSpeech 2”的实现-源码

  2. FastSpeech 2-PyTorch实施 这是Microsoft文本到语音系统的PyTorch实现。该项目基于。随意使用/修改代码。 FastSpeech 2有多个版本。此实现与更相似,后者使用F0值作为音高特征。另一方面,通过连续小波变换提取的音高频谱图在中用作音高特征。 更新 2021/2/26:支持英语和普通话TTS 2021/2/26:支持多扬声器TTS(AISHELL-3和LibriTTS) 2021/2/26:支持MelGAN和HiFi-GAN声码器 音频样本 此实现生成的
  3. 所属分类:其它

    • 发布日期:2021-03-18
    • 文件大小:130mb
    • 提供者:weixin_42133861
  1. Speaker-Recognition-System:EEC201最终项目-源码

  2. 说话人识别系统 EEC201最终项目 团队成员:钱伟泰,Ata Vafi 抽象的 该项目建立了一个依靠少量样本的说话人识别系统。它主要具有3个阶段的流水线:(1)特征提取(2)特征学习(3)说话人识别。在特征提取阶段,使用海明窗尺寸为256的短时傅立叶变换(STFT)。然后将20个滤波器用于MFCC以生成20维训练向量。在特征提取之后,使用矢量量化和k均值聚类来学习这些特征。在使用陷波滤波器生成更多噪声数据集之前,该系统在训练集上达到100%的精度,在测试集上达到100%的精度。 介绍 方法 首
  3. 所属分类:其它

    • 发布日期:2021-03-18
    • 文件大小:278kb
    • 提供者:weixin_42117224
  1. CoviDSP-源码

  2. CoviDSP :speaker_high_volume: :studio_microphone: 最终项目:说话人识别系统 详细说明: Howard Kao-hkao [at] ucdavis [dot] edu William Orozco-worozco [在] ucdavis [点] edu EEC201-加州大学戴维斯分校。 2021年冬季季度 A.引言 该项目的目的是建立一个自动的说话人识别系统。 通过对信号应用傅立叶变换,从输入语音中提取特征,然后获得梅尔频率倒谱系数(M
  3. 所属分类:其它

  1. Spotify_Recommendation_System:使用Spotify API构建音乐推荐系统-源码

  2. Spotify推荐系统 作者:阿迪娜·斯坦曼(Adina Steinman) 目标:使用Spotify API构建音乐推荐系统 业务问题 该项目的目的是为新的音乐流媒体平台构建推荐系统。 首先,建立了一个分类模型,以解决冷启动问题,并具有一种为新用户生成评分的机制。 接下来,创建了一个基于SVD的模型,以根据用户现有的首选项和歌曲评级为用户提供推荐的歌曲。 这将使该平台能够构建适合个人口味的播放列表,并希望通过这种个性化的歌曲推荐方法赢得新客户。 数据采集 使用Spotipy包装器从Spotif
  3. 所属分类:其它

    • 发布日期:2021-03-06
    • 文件大小:20mb
    • 提供者:weixin_42133861
  1. essentia_music:尝试essentia; 实时音频标记和特征提取-源码

  2. essentia_music 体验精华素; 实时音频标记和特征提取
  3. 所属分类:其它

  1. ctc-process:CTC流程模型-源码

  2. ctc进程 使用CTC和VAE的组合训练ASR系统,该系统允许进行非自回归的端到端预测。 安装 运行python setup.py develop 数据准备 使用来自Kaldi的DNN预先配置来预处理数据并从数据集中提取音频特征。 对于WSJ,您需要下载以下语料库: LDC93S6B LDC94S13B 训练 运行wsj_train.py或librispeech_train.py --config配置文件,请参阅conf目录中的示例文件。 --model-dir目录,用于保存/加载/恢
  3. 所属分类:其它

    • 发布日期:2021-02-20
    • 文件大小:371kb
    • 提供者:weixin_42138545
  1. 音频特征提取-源码

  2. 音频特征提取
  3. 所属分类:其它

    • 发布日期:2021-02-19
    • 文件大小:588mb
    • 提供者:weixin_42120550
  1. 我的AI-源码

  2. 我的AI 随着发展的Swift,机器很快将需要在更高层次上了解我们,以便它们真正有用。 理解人类的很大一部分是通过情感。 我们进行了各种实验,在最终模型中,我们从人类语音记录中提取了8个音频特征(225个值)用于情感识别。 我们使用在4个音频数据集(RAVDESS,TESS,SAVEE,SER-v4)上训练的深度卷积神经网络。 我们的女性模型识别出8种情绪的准确度为94%,而男性模型则识别出8种情绪的准确度为89-90%。 通常,情感识别在AI的未来中具有很大的潜在适用性。 它可用于从客户
  3. 所属分类:其它

  1. vybhav72954-源码

  2. !你好,世界 这边 :telescope: 我目前正在从事音频特征提取,情绪检测,情绪分类 :seedling: 我目前正在学习机器学习,前端开发,区块链,OpenCV,MERN :eyes: 我知道的东西: Python,Flask,C / C ++,Javascr ipt(React,Typescr ipt),Bash,基本前端 :people_with_bunny_ears: 我正在寻找音频特征提取方面的合作伙伴 :thinking_face: 我正在寻找有关机器学习,DJan
  3. 所属分类:其它

  1. 频谱化:Insight DE项目-音频处理平台-源码

  2. 解压缩音频文件以快速进行ML探索 目录 概述 音频数据在现代世界中无处不在,并且对各种各样的行业和应用具有很高的价值。 许多公司依靠将机器学习算法应用于各种音频数据集而获得的见解。 尽管许多此类应用程序基于已定义的摘要统计信息,但较新的深度学习方法依赖于处理尽可能多的数据特征。 Spectralize是一个平台,旨在将常见音频文件处理和解压缩为完全索引的频谱特征,从而可以快速用于分析和ML探索。 工程设计 处理管道 Spectralize基于Python,实现Spark数据帧,并将数据从AWS
  3. 所属分类:其它

    • 发布日期:2021-02-14
    • 文件大小:351kb
    • 提供者:weixin_42160645
  1. pyAudioProcessing:音频特征提取和分类-源码

  2. pyAudioProcessing 一个基于Python的库,用于将音频数据处理为特征并构建机器学习模型。 入门 克隆项目并进行设置 git clone gitgithub.com:jsingh811/pyAudioProcessing.git pip install -e . 通过运行获取需求 pip install -r requirements/requirements.txt 选择项 功能选项: 您可以选择mfcc , gfcc或gfcc,mfcc功能从音频文件中提取。 分类器选项:
  3. 所属分类:其它

    • 发布日期:2021-02-13
    • 文件大小:21mb
    • 提供者:weixin_42171208
  1. 音频处理数据:特征提取的结果,来自雨林声音数据集的数据-源码

  2. 雨林声音数据集(已处理) 在完成的特征提取结果
  3. 所属分类:其它

    • 发布日期:2021-02-13
    • 文件大小:15kb
    • 提供者:weixin_42115513
  1. pyAudioAnalysis:Python音频分析库:特征提取,分类,分段和应用-源码

  2. 一个用于音频特征提取,分类,分段和应用程序的Python库 此文档包含常规信息。 单击以获取完整的Wiki。 有关音频数据处理的更通用介绍,请阅读 新闻 [2020-09-12]阅读 ,以了解音频特征提取,分类和分段的理论和实践。 中特刊,截止日期:2020年11月30日 [2019-11-19]主要的lib重构。 请在文档中报告任何问题或不一致之处。 出 python脚本,用于实时记录和分析音频数据 [2018-08-12] pyAudioAnalysis现在已移植到Python 3 一般
  3. 所属分类:其它

    • 发布日期:2021-02-04
    • 文件大小:74mb
    • 提供者:weixin_42128558
  1. deep-audioviz-experiments:深度学习驱动的音频可视化-源码

  2. 深度音频可视化实验 更新:我们的论文已经发表在Springer的Multimedia Tools and Applications中。 阅读 按照惯例,音频可视化是使用“数字信号处理”中的技术创建的。 该方法限于手动设计音频功能的能力。 我们通过在有监督和无监督学习设置中使用卷积深度神经网络体系结构来解决此问题,以从歌曲中提取特征,并探索几种将提取的音频特征映射到用于驱动音频可视化的视觉参数的技术。 我们已经证明了使用自动编码器生成与音乐动态且同步的可视化效果,并进一步探索了用于提高可视化效果质
  3. 所属分类:其它

  1. audio_steganalysis_ml:基于传统手工功能设计的音频隐写分析-源码

  2. 具有手工特征设计的音频隐写分析(统计机器学习) 基于统计机器学习算法的音频隐写分析。 // 作者: 电子邮件: 希望我们能有一个愉快的沟通。 该项目是我们最近基于统计机器学习进行音频隐写分析的工作的实现,您还可以通过该平台设计自己的算法。 档案 ID 文件 功能 1个 应用 音频隐写分析和隐写发现 2 batch_scr ipt 所有批处理脚本,用于特征提取,培训,测试等 3 数据处理 用于QMDCT系数提取和数据集构建的工具 4 feature_extract 用于特征提取的
  3. 所属分类:其它

  1. 调谐器:使用XGBoost梯度增强来预测歌曲流派-源码

  2. 调谐器 使用梯度增强分类从音频功能预测歌曲类型。 音频功能和元数据来自 。 使用提取音频特征。 要进行预处理,请使用python preprocess.py 。 要执行交叉验证,请使用python classify.py 。
  3. 所属分类:其它

    • 发布日期:2021-02-04
    • 文件大小:252kb
    • 提供者:weixin_42164534
  1. 咳嗽信号处理:从音频中提取特征的不同方法和技术-源码

  2. 咳嗽信号处理(csp) 咳嗽信号处理的微观框架 贡献与支持 产品特点 频谱图特征提取 连续功能 咳嗽事件检测 消除噪音,咳嗽声无声的实验 应用不同类型的过滤器 音频增强技术 功能编号 功能名称 描述 1个 过零率 在特定帧持续时间内信号的符号变化率。 2 能源 信号值的平方和,由相应的帧长标准化。 3 能量熵 子帧的归一化能量的熵。 它可以解释为突变的度量。 4 双谱得分(BGS) 信号的三阶频谱称为双频谱。 5 非高斯分数(NGS) NGS给出了给定数据段的非高斯度量。
  3. 所属分类:其它

    • 发布日期:2021-01-30
    • 文件大小:27mb
    • 提供者:weixin_42115074
« 12 3 »