您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 超牛逼的自然语言处理论文和代码

  2. Research on Issues of Translation Selection for Phrase and Structure in Statistical Machine Translation_hezhongjun_phd thesis 2008.pdf Research on domain adaptation in Statistical Machine Translation_caojie_master thesis 2010.pdf Research on Statist
  3. 所属分类:电子商务

    • 发布日期:2012-01-30
    • 文件大小:104mb
    • 提供者:wtzmax
  1. 语料库双语处理工具

  2. The program for de-alignment is attached below. To use the program, do the following: 1. Make a new folder on your machine; 2. Download and unzip the program file named dealigner.pl into that foler; 3. Copy the file of translation units exported fro
  3. 所属分类:其它

    • 发布日期:2013-05-02
    • 文件大小:440byte
    • 提供者:u010495320
  1. BFSU ParaConc

  2. 1、 该软件只支持ANSI编码文本,不支持Unicode编码文本。 2、 汉语文本可不进行分词处理。 3、 中英文文本文件要求分别以*.ZH.txt和*.EN.txt方式命名。 4、 数据文件必须严格行对齐,如包含空行也必须达到文本对应,即平行文件的对应行都是空的。软件不能智能自动对齐语料。 5、 软件支持正则表达式检索。 6、 软件默认支持英文词形还原检索(lemmatized search),如,检索go,可得到含有go、goes、went、going、gone等的平行句对。去除lemma
  3. 所属分类:其它

    • 发布日期:2015-09-21
    • 文件大小:4mb
    • 提供者:wufuhehe
  1. 平行语料库,用于机器翻译等的预处理语料。

  2. 汉英双语语料和德英双语语料,可以用来训练NMT模型,谨供学术实验用
  3. 所属分类:机器学习

    • 发布日期:2018-04-24
    • 文件大小:372kb
    • 提供者:wzz555
  1. 平行语料,用于机器翻译等的预处理语料

  2. 平行语料库,用于机器翻译等的预处理语料。 汉英双语语料和德英双语语料,可以用来训练NMT模型,谨供学术实验用
  3. 所属分类:深度学习

    • 发布日期:2018-05-02
    • 文件大小:930kb
    • 提供者:wzz555
  1. 中英双语对照语料

  2. 鉴于大家要求发布了中英双文对照语料,大概有百兆以上,大家可以拿来试试。
  3. 所属分类:深度学习

    • 发布日期:2018-05-29
    • 文件大小:21mb
    • 提供者:qq_32113189
  1. 中英双语语料 59W数据1

  2. 中英双语语料 59W。一部分,互联网收集与整理,数据已去重!
  3. 所属分类:机器学习

    • 发布日期:2018-12-27
    • 文件大小:166mb
    • 提供者:weixin_43815160
  1. 最新新闻中英语料,可以用来测试翻译系统

  2. 最新新闻语料,为中英双语,可以训练翻译系统。新闻包括各种类别。
  3. 所属分类:机器学习

    • 发布日期:2018-12-29
    • 文件大小:57mb
    • 提供者:xurichenjian
  1. 双语语料库处理

  2. The program for de-alignment is attached below. To use the program, do the following: 1. Make a new folder on your machine; 2. Download and unzip the program file named dealigner.pl into that foler; 3. Copy the file of translation units exported fro
  3. 所属分类:其它

    • 发布日期:2013-05-02
    • 文件大小:440byte
    • 提供者:u010495320
  1. 基于跨语言语料库的汉语和老挝语单词分布

  2. 单词表示是自然语言处理的基础研究内容。目前,单语言单词的分布式表示在一些神经概率语言(NPL)研究中显示出令人满意的应用效果,而对于跨语言单词的分布式表示,研究很少。在国内外。 针对这两种语言中名词和动词的分布相似性的问题,我们通过弱监督学习扩展法等方法将互译的单词,同义词,上位词嵌入中文语料库中,从而在跨语言环境中实现了老挝单词分布。学中文和老挝。 我们利用之前学习的跨语言单词的分布式表示来计算双语文本的相似度,并对汉语和老挝的混合文本语料库进行分类,实验结果表明该建议对这两个任务具有令人满意
  3. 所属分类:其它

    • 发布日期:2021-03-14
    • 文件大小:432kb
    • 提供者:weixin_38719643
  1. 汉维医疗平行语料库构建及特征分析

  2. 面对稀缺、专业性强的汉维双语医疗平行语料库建设,本文探索数据采集、标准化、去噪、自动录入方法,进行语料库特征分析,并根据语料数据特性,设计语料库网页检索系统。目前已建成110多万字、2.6万句汉语医疗语料,3000句对汉维双语对齐语料,不仅对构建中小型语料库有参考价值,而且奠定了医疗自然语言处理研究基础,尤其汉维双语对齐语料,将促进机器翻译技术在医疗领域突破,对新疆边远地区无汉语表达能力的少数民族群众获得医疗救助搭建桥梁。
  3. 所属分类:其它

  1. 带转移学习的低资源神经机器翻译

  2. 在过去的几年中,在大量的双语语料库中,神经机器翻译取得了巨大的成功。 但是,它不适用于资源匮乏的语言对。 为了解决这个问题,我们提出了一种转移学习方法,可以提高低资源机器翻译的BLEU分数。 首先,我们利用具有注意力机制的编解码器框架来训练一个具有大语言对的神经机器翻译模型,然后利用训练模型的一些参数来初始化另一个具有较少双语并行语料库的神经机器翻译模型。 我们的实验表明,该方法通过权重调整和再训练可以在低资源机器翻译中获得出色的性能。 在IWSLT2015越南语-英语翻译任务中,我们的模型可以
  3. 所属分类:其它

    • 发布日期:2021-03-02
    • 文件大小:134kb
    • 提供者:weixin_38732463
  1. 通过权重共享改善资源不足的神经机器翻译

  2. 摘要:近年来,在大量的双语语料库中,神经机器翻译(NMT)取得了巨大的成功。 但是,对于资源匮乏的语言而言,它的效果要差得多。 为了缓解这一问题,我们提出了两种可以提高低资源NMT系统性能的方法。 第一种方法利用解码器的权重分配来增强低资源NMT系统的目标语言模型。 第二种方法是使用跨语言嵌入和源句子表示空间共享,以增强低资源NMT的编码器。 我们的实验表明,与基线系统相比,该方法在低资源神经机器翻译上可以获得明显的改进。 在IWSLT2015越南语-英语翻译任务上,我们的模型可以将翻译质量平均
  3. 所属分类:其它

    • 发布日期:2021-03-02
    • 文件大小:359kb
    • 提供者:weixin_38709100
  1. 用于双语科技术语对齐的汉维文可比语料库构建

  2. 用于双语科技术语对齐的汉维文可比语料库构建
  3. 所属分类:其它

    • 发布日期:2021-03-01
    • 文件大小:440kb
    • 提供者:weixin_38663036
  1. 基于伪平行语料库的双语主动学习关系分类

  2. 基于伪平行语料库的双语主动学习关系分类
  3. 所属分类:其它

    • 发布日期:2021-02-26
    • 文件大小:327kb
    • 提供者:weixin_38705788
  1. 基于随机行走N步的汉语复述短语获取方法

  2. 在利用大规模双语语料获取复述知识方面, 传统的基于\枢轴" 方法只能考虑两步以内的复述现象. 本文针对已有方法的局限性, 对不同语言之间互为翻译的短语对构建翻译关系图, 提出基于随机行走N 步的复述获取算法, 改进已有方法以获取更多潜在的复述知识. 本文描述了由汉英短语翻译表构建翻译关系图的方法、基于N 步的随机行走算法和基于期望步数的复述短语可信度计算方法. 同时, 本文提出面向多语言对的翻译关系图扩展方法. 在NTCIR 汉英和英日双语平行语料上进行了实验与评测, 并与传统方法进行了对比.
  3. 所属分类:其它

  1. Aspire:Aspire是一种翻译对齐工具,可基于机器翻译从源文本和目标文本创建翻译记忆库-源码

  2. Aspire:基于MT的双语语料库校正器 从双语内容创建翻译记忆库 Aspire是一种翻译对齐工具,可基于机器翻译从源文本和目标文本创建翻译记忆库。 Aspire可以用作Web应用程序或命令行程序。 每个实现都有自己的功能和局限性。 向往作为网络应用 安全警告 确保通过修改apsire_web_app\users.py添加和更改用户名和密码。 密码将显示在代码中。 该Web应用程序默认在lacalhost上运行。 如果需要使该应用程序可公开访问,则有责任在用户与本地应用程序之间建立安全连接(H
  3. 所属分类:其它

    • 发布日期:2021-02-19
    • 文件大小:522kb
    • 提供者:weixin_42173218
  1. 子句对齐及其在专利统计机器翻译中的应用

  2. 针对专利文献句子偏长的特点,将统计机器翻译中的训练语料进行子句切割获取双语的子句序列,再采用统计和规则相结合的策略来生成子句对齐,建立基于简单子句的双语语料来重新训练统计机器翻译系统,在一定程度上改善了原有双语训练语料中的短语对齐和词对齐,可以更为深入地利用平行语料中蕴含的翻译信息,应用于专利统计机器翻译中,在NTCIR-9的测试集上进行实验比较,获得较为满意的翻译效果。
  3. 所属分类:其它

    • 发布日期:2021-02-11
    • 文件大小:980kb
    • 提供者:weixin_38529436
  1. 构建和剖析中英三元组可比语料库

  2. 由于受到翻译腔的影响,中英平行语料库存在固有的扭斜的语言模型。显然,用这样的语料库训练的机器翻译、跨语言检索等自然语言处理系统也承袭了扭斜的语言模型,严重影响到应用系统的性能。为了克服平行语料库固有的缺陷,本文提出了构建和剖析中英三元组可比语料库的技术研究。这项研究采用可比语料库和语言自动剖析技术,使用统计和规则相结合的方法,对由本族英语、中式英语和标准中文三元素所组成的三元组可比语料库中的本族英语和中式英语进行统计分析。在此基础上,利用n-元词串、关键词簇等自动抽取技术挖掘基于本族语言模型的双
  3. 所属分类:其它

    • 发布日期:2021-02-09
    • 文件大小:416kb
    • 提供者:weixin_38601878
  1. 1492-源码

  2. 1492:濒危语言 语言正在以惊人的速度消失。 6500种语言中大多数语言的语言权利正处于灭绝的危险中。信息和通信技术(ICT)在保护濒临灭绝的语言方面发挥着关键作用;作为信息通信技术的最终用途,值得一提的是自然语言处理,因为自本世纪以来,缺乏这种支持阻碍了扫盲并阻碍了互联网和任何电子媒介的使用。第一步是构建资源,例如语音语料库,单语语料库,双语语料库,词典。这些资源允许构建用于自然语言处理的语言工具。自动语音识别(ASR),翻译器(NMT),文本转语音(TTS)等一些工具有助于打破语言障碍并振
  3. 所属分类:其它

« 12 »