您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 神经机器翻译:这个项目是由我在Coding Ninjas实习时完成的。 这是一个端到端的机器学习项目-源码

  2. 神经机器翻译器 这个项目是我在Coding Ninjas实习时完成的。 它将英语翻译成法语。 我的bleu评分达到67%。 介绍 神经机器翻译(NMT)是使用关节神经网络模型将一种语言翻译成另一种语言的任务。 NMT模型通常由将源句子编码为固定长度向量的编码器组成,解码器从该向量中生成翻译。 这个问题可以看作是一个预测问题,在给定源语言单词序列作为输入的情况下,任务是预测目标语言单词的输出序列。 数据集来自 ,您可以根据选择的源语言和目标语言在不同的文件中制表符分隔双语句子对。 对于此项
  3. 所属分类:其它

    • 发布日期:2021-03-02
    • 文件大小:31744
    • 提供者:weixin_42160278
  1. 深度学习利器:TensorFlow与NLP模型

  2. 自然语言处理(简称NLP),是研究计算机处理人类语言的一门技术,NLP技术让计算机可以基于一组技术和理论,分析、理解人类的沟通内容。传统的自然语言处理方法涉及到了很多语言学本身的知识,而深度学习,是表征学习(representationlearning)的一种方法,在机器翻译、自动问答、文本分类、情感分析、信息抽取、序列标注、语法解析等领域都有广泛的应用。2013年末谷歌发布的word2vec工具,将一个词表示为词向量,将文字数字化,有效地应用于文本分析。2016年谷歌开源自动生成文本摘要模型及
  3. 所属分类:其它

    • 发布日期:2021-02-25
    • 文件大小:696320
    • 提供者:weixin_38546817
  1. UnsupervisedMT:基于短语和神经的无监督机器翻译-源码

  2. 无监督机器翻译 该存储库包含以下示例中提供的无监督PBSMT和NMT模型的原始实现: (EMNLP 2018)。 注意:对于NMT方法,我们建议您看一下和相关的GitHub存储库 ,其中包含更好的模型和更有效的无监督机器翻译实现。 NMT实现支持: 三种机器翻译架构(seq2seq,biLSTM +注意,Transformer) 能够跨模型/语言共享任意数量的参数 去噪自动编码器培训 并行数据训练 反向并行数据训练 动态多线程生成反向并行数据 以及原始论文中未使用的其他功能(留作以后的工作
  3. 所属分类:其它

    • 发布日期:2021-02-25
    • 文件大小:272384
    • 提供者:weixin_42132354
  1. 阿里巴巴机器翻译团队:将TVM引入TensorFlow中以优化GPU上的神经机器翻译

  2. 本文于阿里云,神经机器翻译(NMT)是自动翻译的端到端方法,这个方法具有克服传统短语翻译系统缺点的潜力。神经机器翻译(NMT)是自动翻译的端到端方法,这个方法具有克服传统短语翻译系统缺点的潜力。最近,阿里巴巴集团正在为全球电子商务部署NMT服务。目前,我们正在利用Transformer[1]作为我们NMT系统的主要骨干,因为它对于经典的基于RNN/LSTM模型的高效离线训练具有较高的准确度,因此它成为了系统的核心。尽管Transformer对于离线训练阶段很友好,因为它在时间跨度上打破了依赖性,
  3. 所属分类:其它

    • 发布日期:2021-02-25
    • 文件大小:527360
    • 提供者:weixin_38697063
  1. 用RNN训练语言模型生成文本

  2. 本文来自于简书,本文通过介绍LanguageModel,怎么实现以及应用,诠释了如何用RNN建立LanguageModel生成文本。LanguageModel是NLP的基础,是语音识别,机器翻译等很多NLP任务的核心。参考:实际上是一个概率分布模型P,对于语言里的每一个字符串S给出一个概率P(S)。我们先训练一个语言模型,然后用它来生成句子。感兴趣的话可以去这里看完整代码。我们要做的是,用RNN通过隐藏层的反馈信息来给历史数据xt,xt?1,...,x1建模。例如,输入一个起始文本:'inpal
  3. 所属分类:其它

    • 发布日期:2021-02-24
    • 文件大小:262144
    • 提供者:weixin_38652058
  1. 融合语态特征的日英层次短语翻译模型

  2. 针对不同语种的被动和可能语态的句法结构差异影响机器翻译质量的问题, 提出融合语态特征的最大熵翻译模型。首先从日语端分出被动语态、可能语态和其他语态, 然后从英语端对被动和可能语态进一步分类, 抽取双语特征训练最大熵规则分类模型, 将语态特征融合到对数线性模型中以改善翻译模型。提高解码器在翻译被动语态和可能语态时规则选择的准确性。实验结果表明, 该方法可以有效地改善日英统计机器翻译的句法结构调序和词汇翻译, 提升被动语态和可能语态句子的翻译质量。
  3. 所属分类:其它

    • 发布日期:2021-02-24
    • 文件大小:520192
    • 提供者:weixin_38660579
  1. 【中文】【吴恩达课后编程作业】Course 5 - 序列模型 - 第三周作业 - 机器翻译与触发词检测.zip

  2. 【中文】【吴恩达课后编程作业】Course 5 - 序列模型 - 第三周作业 - 机器翻译与触发词检测.zip
  3. 所属分类:其它

    • 发布日期:2021-02-23
    • 文件大小:219152384
    • 提供者:weixin_42204303
  1. 从英语到德语的翻译:使用长短期记忆(LSTM)网络的英语到德语的神经机器翻译(NMT)模型。 机器翻译是自然语言处理中的一项重要任务,不仅可用于将一种语言翻译成另一种语言,而且还可用于消除歧义(例如,确定“银行”一词是指金融银行,还是指河岸

  2. 从英语到德语的翻译:使用长短期记忆(LSTM)网络的英语到德语的神经机器翻译(NMT)模型。 机器翻译是自然语言处理中的一项重要任务,不仅可用于将一种语言翻译成另一种语言,而且还可用于消除歧义(例如,确定“银行”一词是指金融银行,还是指河岸土地)
  3. 所属分类:其它

    • 发布日期:2021-02-23
    • 文件大小:16384
    • 提供者:weixin_42117340
  1. 词性标记:在此笔记本中,您将使用石榴库为通用标记集的部分词性标记构建隐藏的Markov模型。 隐藏的马尔可夫模型已经能够在真实文本语料库上使用较大的标签集来实现> 96%的标签准确性。 隐藏的马尔可夫模型也已用于语音识别和语音生成,机

  2. 词性标记 在此笔记本中,您将使用石榴库为通用标签集的语音标签建立隐藏的马尔可夫模型。 隐藏的马尔可夫模型已经能够在真实文本语料库上使用较大的标签集来实现> 96%的标签准确性。 隐藏的马尔可夫模型也已用于语音识别和语音生成,机器翻译,生物信息学的基因识别以及用于计算机视觉的人体手势识别等。
  3. 所属分类:其它

    • 发布日期:2021-02-18
    • 文件大小:135168
    • 提供者:weixin_42122988
  1. NLP_theory_implementation:我的学习笔记和自然语言处理(NLP)模型的代码实现。 项目包括文本分类,神经机器翻译,问答,诗歌生成等-源码

  2. NLP理论与实现 此回购包含我的学习笔记和NLP模型的Python实现 资料夹结构 . ├── large_files # Data files ├── markdown # Study notes and images ├── notebooks # Python implementation of NLP models └── README.md (注意:对于markdown
  3. 所属分类:其它

    • 发布日期:2021-02-14
    • 文件大小:12582912
    • 提供者:weixin_42143221
  1. 论文:机器翻译的数学方法:对机器翻译的方法和基础及其在简单机器翻译器构建中的应用的研究-源码

  2. 论文 机器翻译的数学方法 南威尔士大学毕业论文研究,数学理学士(2020年) 研究机器翻译的方法和基本原理及其在构建简单机器翻译器中的应用。 README_FILEGUIDE.txt包含有关此项目中文件的完整指南。 简要指南: 3种翻译模型 翻译质量计划 Web驱动程序程序员(用于翻译的数据收集)
  3. 所属分类:其它

    • 发布日期:2021-02-13
    • 文件大小:26214400
    • 提供者:weixin_42178963
  1. 基于混合策略的高质量英汉机器翻译引擎设计

  2. 随着全球化进程的加快,人们对机器翻译性能要求的日益增高,基于单一方法的机器翻译系统其质量很难满足人们需求。鉴于不同的机器翻译方法之间存在着优势互补的特点,因而将不同方法结合,成为提高机器翻译质量的合理途径。本文提出了一种构建高质量的混合机器翻译引擎的方法,以传统的基于实例、规则和模板的多引擎机器翻译系统为基础,深层次地结合了统计机器翻译方法。使用统计学方法挖掘语料库并提取双语资源来扩展系统知识库。通过对齐两种机器翻译系统的译文结果,进行词汇替换,使用统计语言模型评分,来改善短语搭配和译文流利度。
  3. 所属分类:其它

    • 发布日期:2021-02-09
    • 文件大小:453632
    • 提供者:weixin_38638163
  1. PaddleNLP:基于PaddlePaddle 2.0的NLP核心库和模型动物园-源码

  2. 简体中文| 简介 PaddleNLP 2.0具有丰富的模型库,简洁易用的API与高性能的分布式训练的能力,可以为飞轮开发者提升文本建模效率,并提供基于Padddle 2.0的NLP领域最佳实践。 特性 丰富的模型库 涵盖了NLP主流应用相关的前沿模型,包括中文词向量,预训练模型,词法分析,文本分类,文本匹配,文本生成,机器翻译,通用对话,问答系统等,更多详细介绍请查看。 简洁易用的API 深度兼容飞轮2.0的高层API体系,提供可替换的文本建模模块,可大幅度减少数据处理,组网,训练互换的代码开发
  3. 所属分类:其它

    • 发布日期:2021-02-07
    • 文件大小:2097152
    • 提供者:weixin_42146086
  1. nmt-keras:使用Keras进行神经机器翻译-源码

  2. NMT-凯拉斯 Keras的神经机器翻译。 图书馆文件: 注意递归神经网络NMT模型 变压器NMT模型 功能(除了完整的Keras宇宙外):。 :red_exclamation_mark: 多GPU训练(仅适用于Tensorflow)。 。 。 在线学习和交互式神经机器翻译(INMT)。 请参阅。 注释输入序列上的注意力模型。 支持 注意机制。 还支持双重随机注意(来自公式14) 偷看的解码器:先前生成的字是当前时间步的输入。 波束搜索解码。 集成解码( )。 具有长
  3. 所属分类:其它

    • 发布日期:2021-02-06
    • 文件大小:2097152
    • 提供者:weixin_42136791
  1. nlp-journey:与自然语言处理有关的文档,文件和代码,包括主题模型,单词嵌入,命名实体识别,文本分类,文本生成,文本相似性,机器翻译)等。 所有代码均已实现intensorflow 2.0-源码

  2. NLP旅程 全部在tensorflow 2.0中实现, 1.基础 2.书籍( 代码:txqx) 图形模型手册。 深度学习。 神经网络和深度学习。 语音和语言处理。 3.论文 01)变压器纸 BERT:用于语言理解的深度双向变压器的预训练。 GPT-2:语言模型是无监督的多任务学习者。 Transformer-XL:Transformer-XL:超出固定长度上下文的注意力语言模型。 XLNet:用于语言理解的通用自回归预训练。 RoBERTa:稳健优化的BERT预训练方法。 D
  3. 所属分类:其它

    • 发布日期:2021-02-06
    • 文件大小:5242880
    • 提供者:weixin_42103587
  1. OpenNMT-tf:使用TensorFlow进行神经机器翻译和序列学习-源码

  2. OpenNMT-tf OpenNMT-tf是使用TensorFlow 2的通用序列学习工具包。虽然神经机器翻译是主要的目标任务,但它的设计目的是更普遍地支持: 序列到序列的映射 序列标记 序列分类 语言建模 该项目以生产为导向,。 主要特点 模块化模型架构 用代码描述模型,以允许训练自定义架构和覆盖默认行为。 例如,以下实例定义了具有2个串联输入特征,自注意编码器和共享其输入和输出嵌入的注意RNN解码器的序列模型序列: opennmt . models . SequenceToSequen
  3. 所属分类:其它

    • 发布日期:2021-02-05
    • 文件大小:278528
    • 提供者:weixin_42099942
  1. zhihu:此存储库包含我的个人专栏中的源代码(https:zhuanlan.zhihu.comzhaoyeyu),该源代码是使用Python 3.6实现的。 包括自然语言处理和计算机视觉项目,例如文本生成,机器翻译,深度卷积GAN和其他实

  2. 简介 该Repo内容为知乎专栏《机器不学习》的源代码。 专栏地址: : 代码框架 TensorFlow 包含内容 1.anna_lstm 基于RNN(LSTM)对《安娜卡列尼娜》英文文本的学习,实现一个字符等级的生成器。 文章地址: 2.略图 实现skip-gram算法的Word2Vec,基于对英语语言料的训练,模型学的各个单词的嵌入向量。 文章地址: 3.generate_lyrics 基于RNN实现歌词生成器。 4.basic_seq2seq 基于RNN Encoder-Decoder
  3. 所属分类:其它

    • 发布日期:2021-02-05
    • 文件大小:169869312
    • 提供者:weixin_42116672
  1. THUMT:清华自然语言处理集团开发的开源神经机器翻译工具包-源码

  2. THUMT:神经机器翻译的开源工具包 内容 介绍 机器翻译是一种自然语言处理任务,旨在自动使用计算机翻译自然语言。 最近几年见证了端到端神经机器翻译的飞速发展,这已成为实际MT系统中的新主流方法。 THUMT是由开发的用于神经机器翻译的开源工具包。 THUMT的网站是: ://thumt.thunlp.org/。 在线演示 THUMT的在线演示可从。 涉及的语言包括古代汉语,阿拉伯语,中文,英语,法语,德语,印尼语,日语,葡萄牙语,俄语和西班牙语。 实作 THUMT当前具有三个主要实现:
  3. 所属分类:其它

    • 发布日期:2021-02-04
    • 文件大小:58368
    • 提供者:weixin_42134051
  1. seq2seq:PyTorch中注意神经机器翻译的最小Seq2Seq模型-源码

  2. 迷你seq2seq 在PyTorch中注意神经机器翻译的最小Seq2Seq模型。 此实现重点在于以下功能: 用于其他项目的模块化结构 最少的代码可读性 充分利用批次和GPU。 此实现依赖于来最大程度地减少数据集管理和预处理部分。 型号说明 编码器:双向GRU 解码器:具有注意机制的GRU 注意: 要求 GPU和CUDA Python3 火炬 火炬文本 空间 麻木 智慧(可选) 通过这样做下载令牌生成器: python -m spacy download de python -
  3. 所属分类:其它

    • 发布日期:2021-02-04
    • 文件大小:6144
    • 提供者:weixin_42131618
  1. MTBook:《机器翻译:基础与模型》肖桐朱靖波着-机器翻译:基础和模型-源码

  2. MTBook:《机器翻译:基础与模型》肖桐朱靖波着-机器翻译:基础和模型
  3. 所属分类:其它

    • 发布日期:2021-02-04
    • 文件大小:30408704
    • 提供者:weixin_42120275
« 1 2 3 4 56 7 8 9 10 ... 15 »