您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. kaldi最新源码

  2. github上面的最新kaldi源码下载,主要运行在kaldi平台,实现语音识别系统的搭建等等。
  3. 所属分类:深度学习

    • 发布日期:2018-12-26
    • 文件大小:13mb
    • 提供者:qq_21592871
  1. kaldi自由说训练好的模型

  2. 利用从网上下载的kaldi源码和语音数据,训练好的支持自由说的模型,是模型,模型,模型! 不是源码,也不是其他的语音资源文件,需要的朋友可以下载下来,结合kaldi中eg5/aishell/s5的例子使用!
  3. 所属分类:Linux

    • 发布日期:2020-07-08
    • 文件大小:174mb
    • 提供者:wanhuijuan
  1. hbsmsz-源码

  2. 初始回购... 0.网站; 360渲染; webrtc;低延迟; rist / quic / srt; mediasoup网站构建和部署完成[完成] GPURender / XRDesktop [] lvs + trafficserver + nginx + django [] keepalive + virtrualIP [] kms + ms + janus [] gstc + gstd [] 360audio / WAP [] kaldi / nnstreamer []
  3. 所属分类:其它

    • 发布日期:2021-03-19
    • 文件大小:644kb
    • 提供者:weixin_42134168
  1. torgo-源码

  2. TORGO数据集的GMM-HMM声学模型 基于脚本,但为了简化和教授Kaldi而进行了修改。
  3. 所属分类:其它

    • 发布日期:2021-03-19
    • 文件大小:184kb
    • 提供者:weixin_42180863
  1. kaldi-offline-transcriber:使用Kaldi的爱沙尼亚语离线转录系统-源码

  2. Kaldi离线转录器 更新 2018-10-31 引入了一种新的JSON格式,用于保存所有信息,以转录(说话者,单词,时间) 字幕现在分为较短的部分 TRS文件现在包含转弯而没有发音中断 2018-09-12 更新了扬声器ID型号 2018-08-31 添加了用于使用爱沙尼亚模型构建Docker映像的Dockerfile,还提供了预构建的映像,请参见。 2018-08-21 更改了说话人ID系统,以使用Kaldi的本地i-vector评分。 这意味着Tensorflow和Keras不再
  3. 所属分类:其它

  1. speech-to-text:混合语言语音识别系统; 混合(GMM + NNet)模型; 卡尔迪+凯拉斯-源码

  2. 混合语言语音识别 来自团队: 当中国学生在各州学习时,我们发现自己的说话习惯发生了变化-英文单词和短语很容易滑入汉语句子中。 我们非常感到需要具有能够处理多语言语音到文本翻译的消息传递应用程序。 因此,在此任务中,我们将开发此功能-使用深度学习架构(DNN,CNN,LSTM)构建模型,以将多语言音频(在同一句子中具有中英文)正确地翻译成文本。 - 表中的内容: 目录说明 代码开关: 包含用于构建系统的脚本 描述: LDC2015S04,我们的数据集描述 笔记: 我们关于Kaldi相关t
  3. 所属分类:其它

  1. see-civil-源码

  2. Gatsby + Netlify CMS入门 注意:此入门程序使用 。 此仓库包含一个示例网站,该网站使用和 : 。 它通过使用Git作为单一事实来源来遵循,并使用进行连续部署和CDN分发。 先决条件 节点(我建议使用v8.2.0或更高版本) 入门(推荐) Netlify CMS可以在任何前端Web环境中运行,但最快的试用方法是通过Netlify在预先配置的启动站点上运行它。 这里的示例是Kaldi咖啡公司模板(改编自 )。 使用下面的按钮来构建和部署自己的存储库副本: 单击该按钮后,您
  3. 所属分类:其它

    • 发布日期:2021-03-10
    • 文件大小:10mb
    • 提供者:weixin_42160398
  1. TORGO-ASR-源码

  2. 使用TORGO数据集进行语音处理 有关使用Kaldi进行韵律性语音识别和说话者识别的教程。 所使用的数据由多伦多大学免费提供。 说话者由于脑瘫或肌萎缩性侧索硬化症而导致语言障碍。 这项运动的目标 建立用于语音识别的基于kaldi的GMM​​-HMM声学模型。 提高对受损语音的识别精度(数据增强,超参数调整等) 使用GMM-HMM模型中的路线训练DNN-HMM声学模型。 通过i向量执行说话者识别/识别。 栏目 第1部分: 第2部分: 第3部分: GMM-HMM声学模型 DNN-HMM声学
  3. 所属分类:其它

    • 发布日期:2021-03-09
    • 文件大小:110kb
    • 提供者:weixin_42107165
  1. pika:基于Pytorch和(Py)Kaldi的轻量级语音处理工具包-源码

  2. PIKA:基于Pytorch和(Py)Kaldi的轻量级语音处理工具包 PIKA是基于Pytorch和(Py)Kaldi的轻量级语音处理工具包。 第一个版本侧重于端到端语音识别。 我们使用作为深度学习引擎,使用进行数据格式化和特征提取。 主要特点 即时数据扩充和特征提取加载程序 TDNN变压器编码器以及基于卷积和变压器的解码器模型结构 RNNT训练和批量解码 带有外部Ngram FST的RNNT解码(即时记录,aka浅层融合) RNNT最低贝叶斯风险(MBR)培训 用于RNNT的LAS前向和后
  3. 所属分类:其它

    • 发布日期:2021-03-08
    • 文件大小:95kb
    • 提供者:weixin_42166105
  1. kaldi-源码

  2. 具有Netlify身份的Netlify CMS的Hugo模板 这是内置一个小型企业模板和 ,设计和开发 , 。 入门 使用我们的部署按钮来获取您自己的存储库副本。 这将设置运行CMS所需的一切: GitHub帐户中包含代码的新存储库 全面持续部署到Netlify的全球CDN网络 使用Netlify身份控制用户并进行访问 使用Netlify CMS管理内容 初始构建完成后,您可以邀请自己作为用户。 转到新站点中的“身份”选项卡,单击“邀请”,然后向自己发送邀请。 现在您已经准备就绪,可以开
  3. 所属分类:其它

    • 发布日期:2021-03-07
    • 文件大小:21mb
    • 提供者:weixin_42176612
  1. kaldi-active-grammar:具有语法的Python Kaldi语音识别,可以在解码时动态将其设置为activeinactive-源码

  2. 卡尔迪主动语法 具有语法的Python Kaldi语音识别,可以在解码时动态设置有效/无效 开发了Python软件包,以便使用自动语音识别引擎在语音识别框架中实现对计算机应用程序的基于上下文的命令和控制。 [ GitHub与(仅)我的GitHub赞助者捐款相匹配。] 通常,Kaldi解码图是整体的,需要昂贵的前期离线编译,并且在解码期间是静态的。 卡尔迪(Kaldi)的新语法框架允许将多个具有非终结符的独立语法分别编译并在解码时动态地拼接在一起,但是所有语法始终处于活动状态并且能够被识别。
  3. 所属分类:其它

    • 发布日期:2021-02-28
    • 文件大小:191kb
    • 提供者:weixin_42152298
  1. kaldi-gstreamer-server:基于Kaldi工具包和GStreamer框架的实时全双工语音识别服务器-源码

  2. Kaldi GStreamer服务器 这是基于Kaldi工具包和GStreamer框架并以Python实现的实时全双工实时语音识别服务器。 广告 塔林工业大学正在寻找一名从事语音识别的博士生,重点是轻度代码转换的语音(例如,芬兰语包含很多英语技术术语)。 。 注意! 该职位仍然开放! 特征 基于websocket的全双工通信:语音进入,出现部分假设(考虑Android的语音输入) 高度可扩展:服务器由主组件和工作程序组成; 每个并发识别会话需要一名工作人员; 可以独立于远程计算机上的主机启
  3. 所属分类:其它

    • 发布日期:2021-02-23
    • 文件大小:233mb
    • 提供者:weixin_42134117
  1. onssen:开源语音分离和增强库-源码

  2. ONSSEN:开源语音分离和增强库 Onssen,发音为温泉,是一个基于PyTorch的库,用于语音分离,语音增强或语音样式转换。 发展计划: 提供用于数据,模型和评估的模板类 将模型移到单独的文件夹(即Kaldi样式) 重现分数并上传预训练的模型 在线分离的完成推断方法 2020-04-20更新: 添加深度聚类的评估方法 在深度聚类中使用W_ {MR}权重 小改动 支持机型 深度聚类 奇美拉网 嵌合体++ 相位估算网络 带有恢复层的语音增强 支持的数据集 Wsj0-2mix( )
  3. 所属分类:其它

    • 发布日期:2021-02-21
    • 文件大小:50kb
    • 提供者:weixin_42146086
  1. ctc-process:CTC流程模型-源码

  2. ctc进程 使用CTC和VAE的组合训练ASR系统,该系统允许进行非自回归的端到端预测。 安装 运行python setup.py develop 数据准备 使用来自Kaldi的DNN预先配置来预处理数据并从数据集中提取音频特征。 对于WSJ,您需要下载以下语料库: LDC93S6B LDC94S13B 训练 运行wsj_train.py或librispeech_train.py --config配置文件,请参阅conf目录中的示例文件。 --model-dir目录,用于保存/加载/恢
  3. 所属分类:其它

    • 发布日期:2021-02-20
    • 文件大小:371kb
    • 提供者:weixin_42138545
  1. kc-kali-silat-源码

  2. Gatsby + Netlify CMS入门 注意:此入门程序使用 。 此回购包含使用和 : 构建的示例商业网站。 它通过使用Git作为单一事实来源来遵循,并使用进行连续部署和CDN分发。 先决条件 节点(我建议使用v8.2.0或更高版本) 入门(推荐) Netlify CMS可以在任何前端Web环境中运行,但是尝试它的最快方法是通过Netlify在预先配置的启动站点上运行它。 这里的示例是Kaldi咖啡公司模板(改编自 )。 使用下面的按钮来构建和部署自己的存储库副本: 单击该按钮后,
  3. 所属分类:其它

  1. 对话:STT-NLP-TTS堆栈-源码

  2. 在Python中玩STT-NLP-TTS堆栈 STT 使用Vanilla Vosk离线版,这是一种自动语音识别API,它使用Kaldi工具包作为后端并用于模型开发,是用C ++构建的。 链接: : Google,IBM和其他大型企业中有许多在线API。 其他离线选项包括Mozilla的Deepspeech,百度的Deepspeech 2.0,EESEN,纯Kaldi。 到目前为止,最好的葡萄牙语免费离线模型是Vosk。 自然语言处理 使用 TTS 使用 一些灵感来自这里: :
  3. 所属分类:其它

  1. ivector-xvector:在kaldi下提取xvector和ivector-源码

  2. Kaldi用于ivector和xvector的摘要 文件清单 ivector/ conf/ :为mfcc和vad配置文件 wav/ :测试音频(您也可以使用自己的wav路径,请参阅步骤1 ) 仅支持flac(安装flac),wav和sph(安装sph2pipe) model_3000h/ :预训练模型 enroll.sh :主进程enroll.sh data/ :保存提取的特征(已生成文件) utt2spk, wav.scp通过make_data.py生成两个文件 spk2utt :从
  3. 所属分类:其它

    • 发布日期:2021-02-05
    • 文件大小:550kb
    • 提供者:weixin_42134234
  1. idlak:Idlak语音合成工具包的官方主页-源码

  2. Idlak语音合成工具包 这是Idlak的官方自述文件。 这是[ASR工具包Kaldi]( )的分支,并添加了各种工具和示例以使其适用于“文本到语音”。 Idlak是一个在Kaldi内构建端到端参数化TTS系统的项目,该系统将以相同的Apache 2许可证进行分发。 它包含一个健壮的前端,语音构建工具,语音分析实用程序和适用于参数合成的DNN工具。 它还在idlak-egs / tts_tangle_arctic / s2中包含一个使用Idlak作为端到端TTS系统的示例。 请注意,kal
  3. 所属分类:其它

    • 发布日期:2021-02-05
    • 文件大小:55mb
    • 提供者:weixin_42114580
  1. 卡尔迪:卡尔迪-阿斯卡尔迪是卡尔迪项目的官方所在地-源码

  2. Kaldi语音识别工具包 要构建工具箱:请参阅./INSTALL 。 这些说明对UNIX系统(包括各种Linux)有效。 达尔文和Cygwin(尚未在UNIX的更多“外来”品种上进行测试)。 有关Windows安装说明(不包括Cygwin),请参见windows/INSTALL 。 要运行示例系统构建,请参见egs/README.txt 如果您遇到问题(并且可能会遇到),请不要犹豫与开发人员联系(请参阅下文)。 除了特定的问题之外,请让我们知道项目的某些方面是否可以改进,感到困惑等,以及您最
  3. 所属分类:其它

    • 发布日期:2021-02-05
    • 文件大小:17mb
    • 提供者:weixin_42125770
  1. pytorch-kaldi:pytorch-kaldi是用于开发最新的DNNRNN混合语音识别系统的项目。 DNN部分由pytorch管理,而特征提取,标签计算和解码则通过kaldi工具箱执行-源码

  2. PyTorch-Kaldi语音识别工具包 PyTorch-Kaldi是一个开放源代码存储库,用于开发最新的DNN / HMM语音识别系统。 DNN部分由PyTorch管理,而特征提取,标签计算和解码则由Kaldi工具包执行。 该存储库包含PyTorch-Kaldi工具箱的最新版本(PyTorch-Kaldi-v1.0)。 要查看以前的版本(PyTorch-Kaldi-v0.1),。 如果使用此代码或其一部分,请引用以下文章: M. Ravanelli,T。Parcollet,Y。Bengi
  3. 所属分类:其它

    • 发布日期:2021-02-05
    • 文件大小:362kb
    • 提供者:weixin_42168750
« 12 »