搜索资源 - kaldi-源码 - 点数信息

点数信息

注册会员 | 设为首页 | 加入收藏夹

您好，欢迎光临本网站！[请登录] ！[注册会员]！

热门搜索： 源码 Android 整站插件识别 p2p 游戏算法更多...

在线客服QQ:632832888

当前位置：

搜索资源 - kaldi-源码

下载资源分类

移动开发

开发技术

课程资源

网络技术

操作系统

安全技术

数据库

行业

服务器应用

存储

信息化

考试认证

云计算

大数据

跨平台

音视频

游戏开发

人工智能

区块链

资源分类

搜索资源列表

kaldi最新源码
github上面的最新kaldi源码下载，主要运行在kaldi平台，实现语音识别系统的搭建等等。
所属分类：深度学习
- 发布日期：2018-12-26
- 文件大小：13mb
- 提供者：qq_21592871

kaldi自由说训练好的模型
利用从网上下载的kaldi源码和语音数据，训练好的支持自由说的模型，是模型，模型，模型！不是源码，也不是其他的语音资源文件，需要的朋友可以下载下来，结合kaldi中eg5/aishell/s5的例子使用！
所属分类：Linux
- 发布日期：2020-07-08
- 文件大小：174mb
- 提供者：wanhuijuan

hbsmsz-源码
初始回购... 0.网站； 360渲染; webrtc;低延迟； rist / quic / srt; mediasoup网站构建和部署完成[完成] GPURender / XRDesktop [] lvs + trafficserver + nginx + django [] keepalive + virtrualIP [] kms + ms + janus [] gstc + gstd [] 360audio / WAP [] kaldi / nnstreamer []
所属分类：其它
- 发布日期：2021-03-19
- 文件大小：644kb
- 提供者：weixin_42134168

torgo-源码
TORGO数据集的GMM-HMM声学模型基于脚本，但为了简化和教授Kaldi而进行了修改。
所属分类：其它
- 发布日期：2021-03-19
- 文件大小：184kb
- 提供者：weixin_42180863

kaldi-offline-transcriber:使用Kaldi的爱沙尼亚语离线转录系统-源码
Kaldi离线转录器更新 2018-10-31 引入了一种新的JSON格式，用于保存所有信息，以转录（说话者，单词，时间）字幕现在分为较短的部分 TRS文件现在包含转弯而没有发音中断 2018-09-12 更新了扬声器ID型号 2018-08-31 添加了用于使用爱沙尼亚模型构建Docker映像的Dockerfile，还提供了预构建的映像，请参见。 2018-08-21 更改了说话人ID系统，以使用Kaldi的本地i-vector评分。这意味着Tensorflow和Keras不再
所属分类：其它
- 发布日期：2021-03-11
- 文件大小：3mb
- 提供者：weixin_42137022

speech-to-text:混合语言语音识别系统；混合（GMM + NNet）模型；卡尔迪+凯拉斯-源码
混合语言语音识别来自团队：当中国学生在各州学习时，我们发现自己的说话习惯发生了变化-英文单词和短语很容易滑入汉语句子中。我们非常感到需要具有能够处理多语言语音到文本翻译的消息传递应用程序。因此，在此任务中，我们将开发此功能-使用深度学习架构（DNN，CNN，LSTM）构建模型，以将多语言音频（在同一句子中具有中英文）正确地翻译成文本。 - 表中的内容：目录说明代码开关：包含用于构建系统的脚本描述： LDC2015S04，我们的数据集描述笔记：我们关于Kaldi相关t
所属分类：其它
- 发布日期：2021-03-11
- 文件大小：1gb
- 提供者：weixin_42109732

see-civil-源码
Gatsby + Netlify CMS入门注意：此入门程序使用。此仓库包含一个示例网站，该网站使用和：。它通过使用Git作为单一事实来源来遵循，并使用进行连续部署和CDN分发。先决条件节点（我建议使用v8.2.0或更高版本）入门（推荐） Netlify CMS可以在任何前端Web环境中运行，但最快的试用方法是通过Netlify在预先配置的启动站点上运行它。这里的示例是Kaldi咖啡公司模板（改编自）。使用下面的按钮来构建和部署自己的存储库副本：单击该按钮后，您
所属分类：其它
- 发布日期：2021-03-10
- 文件大小：10mb
- 提供者：weixin_42160398

TORGO-ASR-源码
使用TORGO数据集进行语音处理有关使用Kaldi进行韵律性语音识别和说话者识别的教程。所使用的数据由多伦多大学免费提供。说话者由于脑瘫或肌萎缩性侧索硬化症而导致语言障碍。这项运动的目标建立用于语音识别的基于kaldi的GMM-HMM声学模型。提高对受损语音的识别精度（数据增强，超参数调整等）使用GMM-HMM模型中的路线训练DNN-HMM声学模型。通过i向量执行说话者识别/识别。栏目第1部分：第2部分：第3部分： GMM-HMM声学模型 DNN-HMM声学
所属分类：其它
- 发布日期：2021-03-09
- 文件大小：110kb
- 提供者：weixin_42107165

pika:基于Pytorch和（Py）Kaldi的轻量级语音处理工具包-源码
PIKA：基于Pytorch和（Py）Kaldi的轻量级语音处理工具包 PIKA是基于Pytorch和（Py）Kaldi的轻量级语音处理工具包。第一个版本侧重于端到端语音识别。我们使用作为深度学习引擎，使用进行数据格式化和特征提取。主要特点即时数据扩充和特征提取加载程序 TDNN变压器编码器以及基于卷积和变压器的解码器模型结构 RNNT训练和批量解码带有外部Ngram FST的RNNT解码（即时记录，aka浅层融合） RNNT最低贝叶斯风险（MBR）培训用于RNNT的LAS前向和后
所属分类：其它
- 发布日期：2021-03-08
- 文件大小：95kb
- 提供者：weixin_42166105

kaldi-源码
具有Netlify身份的Netlify CMS的Hugo模板这是内置一个小型企业模板和，设计和开发，。入门使用我们的部署按钮来获取您自己的存储库副本。这将设置运行CMS所需的一切： GitHub帐户中包含代码的新存储库全面持续部署到Netlify的全球CDN网络使用Netlify身份控制用户并进行访问使用Netlify CMS管理内容初始构建完成后，您可以邀请自己作为用户。转到新站点中的“身份”选项卡，单击“邀请”，然后向自己发送邀请。现在您已经准备就绪，可以开
所属分类：其它
- 发布日期：2021-03-07
- 文件大小：21mb
- 提供者：weixin_42176612

kaldi-active-grammar：具有语法的Python Kaldi语音识别，可以在解码时动态将其设置为activeinactive-源码
卡尔迪主动语法具有语法的Python Kaldi语音识别，可以在解码时动态设置有效/无效开发了Python软件包，以便使用自动语音识别引擎在语音识别框架中实现对计算机应用程序的基于上下文的命令和控制。 [ GitHub与（仅）我的GitHub赞助者捐款相匹配。] 通常，Kaldi解码图是整体的，需要昂贵的前期离线编译，并且在解码期间是静态的。卡尔迪（Kaldi）的新语法框架允许将多个具有非终结符的独立语法分别编译并在解码时动态地拼接在一起，但是所有语法始终处于活动状态并且能够被识别。
所属分类：其它
- 发布日期：2021-02-28
- 文件大小：191kb
- 提供者：weixin_42152298

kaldi-gstreamer-server：基于Kaldi工具包和GStreamer框架的实时全双工语音识别服务器-源码
Kaldi GStreamer服务器这是基于Kaldi工具包和GStreamer框架并以Python实现的实时全双工实时语音识别服务器。广告塔林工业大学正在寻找一名从事语音识别的博士生，重点是轻度代码转换的语音（例如，芬兰语包含很多英语技术术语）。。注意！该职位仍然开放！特征基于websocket的全双工通信：语音进入，出现部分假设（考虑Android的语音输入）高度可扩展：服务器由主组件和工作程序组成；每个并发识别会话需要一名工作人员；可以独立于远程计算机上的主机启
所属分类：其它
- 发布日期：2021-02-23
- 文件大小：233mb
- 提供者：weixin_42134117

onssen：开源语音分离和增强库-源码
ONSSEN：开源语音分离和增强库 Onssen，发音为温泉，是一个基于PyTorch的库，用于语音分离，语音增强或语音样式转换。发展计划：提供用于数据，模型和评估的模板类将模型移到单独的文件夹（即Kaldi样式）重现分数并上传预训练的模型在线分离的完成推断方法 2020-04-20更新：添加深度聚类的评估方法在深度聚类中使用W_ {MR}权重小改动支持机型深度聚类奇美拉网嵌合体++ 相位估算网络带有恢复层的语音增强支持的数据集 Wsj0-2mix（）
所属分类：其它
- 发布日期：2021-02-21
- 文件大小：50kb
- 提供者：weixin_42146086

ctc-process：CTC流程模型-源码
ctc进程使用CTC和VAE的组合训练ASR系统，该系统允许进行非自回归的端到端预测。安装运行python setup.py develop 数据准备使用来自Kaldi的DNN预先配置来预处理数据并从数据集中提取音频特征。对于WSJ，您需要下载以下语料库： LDC93S6B LDC94S13B 训练运行wsj_train.py或librispeech_train.py --config配置文件，请参阅conf目录中的示例文件。 --model-dir目录，用于保存/加载/恢
所属分类：其它
- 发布日期：2021-02-20
- 文件大小：371kb
- 提供者：weixin_42138545

kc-kali-silat-源码
Gatsby + Netlify CMS入门注意：此入门程序使用。此回购包含使用和：构建的示例商业网站。它通过使用Git作为单一事实来源来遵循，并使用进行连续部署和CDN分发。先决条件节点（我建议使用v8.2.0或更高版本）入门（推荐） Netlify CMS可以在任何前端Web环境中运行，但是尝试它的最快方法是通过Netlify在预先配置的启动站点上运行它。这里的示例是Kaldi咖啡公司模板（改编自）。使用下面的按钮来构建和部署自己的存储库副本：单击该按钮后，
所属分类：其它
- 发布日期：2021-02-17
- 文件大小：1mb
- 提供者：weixin_42130862

对话：STT-NLP-TTS堆栈-源码
在Python中玩STT-NLP-TTS堆栈 STT 使用Vanilla Vosk离线版，这是一种自动语音识别API，它使用Kaldi工具包作为后端并用于模型开发，是用C ++构建的。链接：： Google，IBM和其他大型企业中有许多在线API。其他离线选项包括Mozilla的Deepspeech，百度的Deepspeech 2.0，EESEN，纯Kaldi。到目前为止，最好的葡萄牙语免费离线模型是Vosk。自然语言处理使用 TTS 使用一些灵感来自这里： :
所属分类：其它
- 发布日期：2021-02-14
- 文件大小：2kb
- 提供者：weixin_42144707

ivector-xvector：在kaldi下提取xvector和ivector-源码
Kaldi用于ivector和xvector的摘要文件清单 ivector/ conf/ ：为mfcc和vad配置文件 wav/ ：测试音频（您也可以使用自己的wav路径，请参阅步骤1 ）仅支持flac（安装flac），wav和sph（安装sph2pipe） model_3000h/ ：预训练模型 enroll.sh ：主进程enroll.sh data/ ：保存提取的特征（已生成文件） utt2spk, wav.scp通过make_data.py生成两个文件 spk2utt ：从
所属分类：其它
- 发布日期：2021-02-05
- 文件大小：550kb
- 提供者：weixin_42134234

idlak：Idlak语音合成工具包的官方主页-源码
Idlak语音合成工具包这是Idlak的官方自述文件。这是[ASR工具包Kaldi]（）的分支，并添加了各种工具和示例以使其适用于“文本到语音”。 Idlak是一个在Kaldi内构建端到端参数化TTS系统的项目，该系统将以相同的Apache 2许可证进行分发。它包含一个健壮的前端，语音构建工具，语音分析实用程序和适用于参数合成的DNN工具。它还在idlak-egs / tts_tangle_arctic / s2中包含一个使用Idlak作为端到端TTS系统的示例。请注意，kal
所属分类：其它
- 发布日期：2021-02-05
- 文件大小：55mb
- 提供者：weixin_42114580

卡尔迪：卡尔迪-阿斯卡尔迪是卡尔迪项目的官方所在地-源码
Kaldi语音识别工具包要构建工具箱：请参阅./INSTALL 。这些说明对UNIX系统（包括各种Linux）有效。达尔文和Cygwin（尚未在UNIX的更多“外来”品种上进行测试）。有关Windows安装说明（不包括Cygwin），请参见windows/INSTALL 。要运行示例系统构建，请参见egs/README.txt 如果您遇到问题（并且可能会遇到），请不要犹豫与开发人员联系（请参阅下文）。除了特定的问题之外，请让我们知道项目的某些方面是否可以改进，感到困惑等，以及您最
所属分类：其它
- 发布日期：2021-02-05
- 文件大小：17mb
- 提供者：weixin_42125770

pytorch-kaldi：pytorch-kaldi是用于开发最新的DNNRNN混合语音识别系统的项目。 DNN部分由pytorch管理，而特征提取，标签计算和解码则通过kaldi工具箱执行-源码
PyTorch-Kaldi语音识别工具包 PyTorch-Kaldi是一个开放源代码存储库，用于开发最新的DNN / HMM语音识别系统。 DNN部分由PyTorch管理，而特征提取，标签计算和解码则由Kaldi工具包执行。该存储库包含PyTorch-Kaldi工具箱的最新版本（PyTorch-Kaldi-v1.0）。要查看以前的版本（PyTorch-Kaldi-v0.1），。如果使用此代码或其一部分，请引用以下文章： M. Ravanelli，T。Parcollet，Y。Bengi
所属分类：其它
- 发布日期：2021-02-05
- 文件大小：362kb
- 提供者：weixin_42168750

« 12 »