您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 一万句中英平行语料库,不用预处理

  2. 平行语料库,用于机器翻译等大数据处理,有需要的可以下来用,可以直接用,不用全角半角变换
  3. 所属分类:其它

    • 发布日期:2015-07-01
    • 文件大小:859kb
    • 提供者:tim_c
  1. NiuTrans中英平行语料库10万句

  2. NiuTrans的开源中英平行语料库,可以用来训练机器翻译。
  3. 所属分类:互联网

    • 发布日期:2017-05-01
    • 文件大小:45mb
    • 提供者:lucygill
  1. 中英平行语料库

  2. 一万句对齐的中英文平行语料库,用于机器翻译,问答系统等模型的预处理语料。
  3. 所属分类:深度学习

    • 发布日期:2017-10-23
    • 文件大小:1mb
    • 提供者:csdnyaping
  1. 中英平行语料

  2. UN parallel corpus. 15,886,041 lines casia2015: 1,050,000 lines casict2015: 2,036,833 lines datum2015: 1,000,003 lines datum2017: 1,999,968 lines NEU2017: 2,000,000 lines
  3. 所属分类:深度学习

    • 发布日期:2018-04-12
    • 文件大小:1kb
    • 提供者:yanwenduo
  1. NiuTrans中英平行语料库10万句

  2. NiuTrans的开源中英平行语料库,可以用来训练机器翻译。
  3. 所属分类:互联网

    • 发布日期:2018-04-18
    • 文件大小:45mb
    • 提供者:weixin_41402244
  1. NiuTrans中英平行语料库10万句

  2. NiuTrans的开源中英平行语料库,可以用来训练机器翻译。
  3. 所属分类:互联网

    • 发布日期:2018-04-28
    • 文件大小:45mb
    • 提供者:a342424534
  1. NiuTrans中英平行语料库10万句

  2. NiuTrans的开源中英平行语料库,可以用来训练机器翻译。
  3. 所属分类:互联网

    • 发布日期:2018-05-08
    • 文件大小:45mb
    • 提供者:zhao199876
  1. NiuTrans中英平行语料库10万句

  2. NiuTrans的开源中英平行语料库,可以用来训练机器翻译。
  3. 所属分类:互联网

    • 发布日期:2018-05-18
    • 文件大小:45mb
    • 提供者:s5042220
  1. NiuTrans中英平行语料库10万句

  2. NiuTrans的开源中英平行语料库,可以用来训练机器翻译。
  3. 所属分类:互联网

    • 发布日期:2018-06-12
    • 文件大小:45mb
    • 提供者:yr123456yr
  1. NiuTrans中英平行语料库10万句

  2. NiuTrans的开源中英平行语料库,可以用来训练机器翻译。
  3. 所属分类:互联网

    • 发布日期:2018-06-22
    • 文件大小:45mb
    • 提供者:weixin_42498878
  1. NiuTrans中英平行语料库10万句

  2. NiuTrans的开源中英平行语料库,可以用来训练机器翻译。
  3. 所属分类:互联网

    • 发布日期:2018-08-09
    • 文件大小:45mb
    • 提供者:longru1744
  1. NiuTrans中英平行语料库10万句

  2. NiuTrans的开源中英平行语料库,可以用来训练机器翻译。
  3. 所属分类:互联网

    • 发布日期:2018-08-16
    • 文件大小:45mb
    • 提供者:zimo366
  1. NiuTrans中英平行语料库10万句

  2. NiuTrans的开源中英平行语料库,可以用来训练机器翻译。
  3. 所属分类:互联网

    • 发布日期:2018-08-23
    • 文件大小:45mb
    • 提供者:mlunwen
  1. 中英平行语料库.zip

  2. 中英文平行语料库,用于机器翻译,问答系统等模型的预处理语料
  3. 所属分类:深度学习

    • 发布日期:2019-07-19
    • 文件大小:3mb
    • 提供者:vip_v
  1. 中英平行语料库(八万对,句粒度)

  2. 共8400多对中英语句,已预处理,中文用jieba分了词,标点符号没问题,保存于en-zh.csv,分隔符是制表符\t(不是默认逗号)。 句粒度,但有不少长句,裁剪后5w对也够用。 原始数据集也在包中,其中en-zh_News.tmx有一部分句子有问题,(en-zh.csv丢弃了有问题的句子),如果必要建议不要直接使用该文件。 另外附赠我对语料的预处理文件(propressor.py),以及数据集(pytorch的Dataset)等相关的实现(LangData.py)。 如果又可以改善的地方,
  3. 所属分类:深度学习

    • 发布日期:2019-08-11
    • 文件大小:35mb
    • 提供者:weixin_42127182
  1. 中英平行语料50000句.rar

  2. 语料来源为WMT18,本资源包含中英文的平行语料50000句,以及简单预处理后的文件。中文预处理:去除标点、数字,分词;英文预处理:去除标点、数字,大小写转换。可以用来做简单的神经机器翻译练习使用。
  3. 所属分类:互联网

    • 发布日期:2020-04-30
    • 文件大小:7mb
    • 提供者:risan95
  1. 中英平行语料(共20万句)可用于训练机器翻译

  2. 中文英文的平行语料,来源于niutrans语料,总共20万句(中文10万英文10万),该语料可用于机器翻译等的训练。
  3. 所属分类:深度学习

  1. 平行语料-中英数据对齐清洗

  2. 针对中英数据对齐的清洗,提高对齐质量,附带代码包含对中英序号不匹配,长数字不匹配等问题进行清洗!
  3. 所属分类:互联网

  1. 中英平行语料(白皮书,可以用于机器翻译,主题提取)

  2. 中英平行语料(白皮书,可以用于机器翻译,主题提取)
  3. 所属分类:机器学习

    • 发布日期:2020-11-07
    • 文件大小:2mb
    • 提供者:qq_45063244
  1. 构建和剖析中英三元组可比语料库

  2. 由于受到翻译腔的影响,中英平行语料库存在固有的扭斜的语言模型。显然,用这样的语料库训练的机器翻译、跨语言检索等自然语言处理系统也承袭了扭斜的语言模型,严重影响到应用系统的性能。为了克服平行语料库固有的缺陷,本文提出了构建和剖析中英三元组可比语料库的技术研究。这项研究采用可比语料库和语言自动剖析技术,使用统计和规则相结合的方法,对由本族英语、中式英语和标准中文三元素所组成的三元组可比语料库中的本族英语和中式英语进行统计分析。在此基础上,利用n-元词串、关键词簇等自动抽取技术挖掘基于本族语言模型的双
  3. 所属分类:其它

    • 发布日期:2021-02-09
    • 文件大小:416kb
    • 提供者:weixin_38601878
« 12 »