您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 超牛逼的自然语言处理论文和代码

  2. Research on Issues of Translation Selection for Phrase and Structure in Statistical Machine Translation_hezhongjun_phd thesis 2008.pdf Research on domain adaptation in Statistical Machine Translation_caojie_master thesis 2010.pdf Research on Statist
  3. 所属分类:电子商务

    • 发布日期:2012-01-30
    • 文件大小:104mb
    • 提供者:wtzmax
  1. 语料库双语处理工具

  2. The program for de-alignment is attached below. To use the program, do the following: 1. Make a new folder on your machine; 2. Download and unzip the program file named dealigner.pl into that foler; 3. Copy the file of translation units exported fro
  3. 所属分类:其它

    • 发布日期:2013-05-02
    • 文件大小:440byte
    • 提供者:u010495320
  1. 平行语料库,用于机器翻译等的预处理语料。

  2. 汉英双语语料和德英双语语料,可以用来训练NMT模型,谨供学术实验用
  3. 所属分类:机器学习

    • 发布日期:2018-04-24
    • 文件大小:372kb
    • 提供者:wzz555
  1. 平行语料,用于机器翻译等的预处理语料

  2. 平行语料库,用于机器翻译等的预处理语料。 汉英双语语料和德英双语语料,可以用来训练NMT模型,谨供学术实验用
  3. 所属分类:深度学习

    • 发布日期:2018-05-02
    • 文件大小:930kb
    • 提供者:wzz555
  1. 统计自然语言处理

  2. 统计自然语言处理是一本很好的书籍,是一本很基础的书籍目录 序二 第2版前宣 第1版前言 第1章绪论 11基本概念 1.1.1语言学与语音学 2自然语言处理 11.3关于“理解”的标准 1,2自然语言处理研究的内容和面临的困难 1,2,1自然语言处理研宄的内容 1,22自然语言处理涉及的几个层次 1.2.3自然语言处理面临的困难 13自然语言处理的基本方法及其发展 13,1自然语言处理的基本方汏 3,2自然语言处理的发展 14自然语言处理的研究现状 本书的内容安挂 第2章顸备知识 2,1概率论基本
  3. 所属分类:Python

    • 发布日期:2019-03-04
    • 文件大小:24mb
    • 提供者:weixin_34749051
  1. 双语语料库处理

  2. The program for de-alignment is attached below. To use the program, do the following: 1. Make a new folder on your machine; 2. Download and unzip the program file named dealigner.pl into that foler; 3. Copy the file of translation units exported fro
  3. 所属分类:其它

    • 发布日期:2013-05-02
    • 文件大小:440byte
    • 提供者:u010495320
  1. 基于跨语言语料库的汉语和老挝语单词分布

  2. 单词表示是自然语言处理的基础研究内容。目前,单语言单词的分布式表示在一些神经概率语言(NPL)研究中显示出令人满意的应用效果,而对于跨语言单词的分布式表示,研究很少。在国内外。 针对这两种语言中名词和动词的分布相似性的问题,我们通过弱监督学习扩展法等方法将互译的单词,同义词,上位词嵌入中文语料库中,从而在跨语言环境中实现了老挝单词分布。学中文和老挝。 我们利用之前学习的跨语言单词的分布式表示来计算双语文本的相似度,并对汉语和老挝的混合文本语料库进行分类,实验结果表明该建议对这两个任务具有令人满意
  3. 所属分类:其它

    • 发布日期:2021-03-14
    • 文件大小:432kb
    • 提供者:weixin_38719643
  1. 汉维医疗平行语料库构建及特征分析

  2. 面对稀缺、专业性强的汉维双语医疗平行语料库建设,本文探索数据采集、标准化、去噪、自动录入方法,进行语料库特征分析,并根据语料数据特性,设计语料库网页检索系统。目前已建成110多万字、2.6万句汉语医疗语料,3000句对汉维双语对齐语料,不仅对构建中小型语料库有参考价值,而且奠定了医疗自然语言处理研究基础,尤其汉维双语对齐语料,将促进机器翻译技术在医疗领域突破,对新疆边远地区无汉语表达能力的少数民族群众获得医疗救助搭建桥梁。
  3. 所属分类:其它

  1. 基于归纳学习和汉字汉字映射表的汉日命名实体对等提取方法

  2. 命名实体翻译等效项提取在机器翻译(MT)和跨语言信息检索(CLIR)中起着至关重要的作用。 传统方法通常基于大规模并行或可比语料库。 但是,这些研究的适用性受到限制,主要是因为缺乏所需规模的平行语料库,特别是对于中文和日文的语言对。 在本文中,我们提出了一种基于中文和日文特征的方法,该方法基于单语语料库中的归纳学习(IL),自动提取中日命名实体(NE)的翻译对等词。 该方法采用中文汉字和日语汉字映射表(HKMT)来计算日语和汉语之间NE实例的相似性。 然后,通过从中文和日语的高相似性NE实例中提
  3. 所属分类:其它

    • 发布日期:2021-03-12
    • 文件大小:384kb
    • 提供者:weixin_38742421
  1. 构建和剖析中英三元组可比语料库

  2. 由于受到翻译腔的影响,中英平行语料库存在固有的扭斜的语言模型。显然,用这样的语料库训练的机器翻译、跨语言检索等自然语言处理系统也承袭了扭斜的语言模型,严重影响到应用系统的性能。为了克服平行语料库固有的缺陷,本文提出了构建和剖析中英三元组可比语料库的技术研究。这项研究采用可比语料库和语言自动剖析技术,使用统计和规则相结合的方法,对由本族英语、中式英语和标准中文三元素所组成的三元组可比语料库中的本族英语和中式英语进行统计分析。在此基础上,利用n-元词串、关键词簇等自动抽取技术挖掘基于本族语言模型的双
  3. 所属分类:其它

    • 发布日期:2021-02-09
    • 文件大小:416kb
    • 提供者:weixin_38601878
  1. 1492-源码

  2. 1492:濒危语言 语言正在以惊人的速度消失。 6500种语言中大多数语言的语言权利正处于灭绝的危险中。信息和通信技术(ICT)在保护濒临灭绝的语言方面发挥着关键作用;作为信息通信技术的最终用途,值得一提的是自然语言处理,因为自本世纪以来,缺乏这种支持阻碍了扫盲并阻碍了互联网和任何电子媒介的使用。第一步是构建资源,例如语音语料库,单语语料库,双语语料库,词典。这些资源允许构建用于自然语言处理的语言工具。自动语音识别(ASR),翻译器(NMT),文本转语音(TTS)等一些工具有助于打破语言障碍并振
  3. 所属分类:其它