点数信息
www.dssz.net
注册会员
|
设为首页
|
加入收藏夹
您好,欢迎光临本网站!
[请登录]
!
[注册会员]
!
首页
移动开发
云计算
大数据
数据库
游戏开发
人工智能
网络技术
区块链
操作系统
模糊查询
热门搜索:
源码
Android
整站
插件
识别
p2p
游戏
算法
更多...
在线客服QQ:632832888
当前位置:
资源下载
搜索资源 - 中英平行语料
下载资源分类
移动开发
开发技术
课程资源
网络技术
操作系统
安全技术
数据库
行业
服务器应用
存储
信息化
考试认证
云计算
大数据
跨平台
音视频
游戏开发
人工智能
区块链
在结果中搜索
所属系统
Windows
Linux
FreeBSD
Unix
Dos
PalmOS
WinCE
SymbianOS
MacOS
Android
开发平台
Visual C
Visual.Net
Borland C
CBuilder
Dephi
gcc
VBA
LISP
IDL
VHDL
Matlab
MathCAD
Flash
Xcode
Android STU
LabVIEW
开发语言
C/C++
Pascal
ASM
Java
PHP
Basic/ASP
Perl
Python
VBScript
JavaScript
SQL
FoxBase
SHELL
E语言
OC/Swift
文件类型
源码
程序
CHM
PDF
PPT
WORD
Excel
Access
HTML
Text
资源分类
搜索资源列表
一万句中英平行语料库,不用预处理
平行语料库,用于机器翻译等大数据处理,有需要的可以下来用,可以直接用,不用全角半角变换
所属分类:
其它
发布日期:2015-07-01
文件大小:859kb
提供者:
tim_c
NiuTrans中英平行语料库10万句
NiuTrans的开源中英平行语料库,可以用来训练机器翻译。
所属分类:
互联网
发布日期:2017-05-01
文件大小:45mb
提供者:
lucygill
中英平行语料库
一万句对齐的中英文平行语料库,用于机器翻译,问答系统等模型的预处理语料。
所属分类:
深度学习
发布日期:2017-10-23
文件大小:1mb
提供者:
csdnyaping
中英平行语料
UN parallel corpus. 15,886,041 lines casia2015: 1,050,000 lines casict2015: 2,036,833 lines datum2015: 1,000,003 lines datum2017: 1,999,968 lines NEU2017: 2,000,000 lines
所属分类:
深度学习
发布日期:2018-04-12
文件大小:1kb
提供者:
yanwenduo
NiuTrans中英平行语料库10万句
NiuTrans的开源中英平行语料库,可以用来训练机器翻译。
所属分类:
互联网
发布日期:2018-04-18
文件大小:45mb
提供者:
weixin_41402244
NiuTrans中英平行语料库10万句
NiuTrans的开源中英平行语料库,可以用来训练机器翻译。
所属分类:
互联网
发布日期:2018-04-28
文件大小:45mb
提供者:
a342424534
NiuTrans中英平行语料库10万句
NiuTrans的开源中英平行语料库,可以用来训练机器翻译。
所属分类:
互联网
发布日期:2018-05-08
文件大小:45mb
提供者:
zhao199876
NiuTrans中英平行语料库10万句
NiuTrans的开源中英平行语料库,可以用来训练机器翻译。
所属分类:
互联网
发布日期:2018-05-18
文件大小:45mb
提供者:
s5042220
NiuTrans中英平行语料库10万句
NiuTrans的开源中英平行语料库,可以用来训练机器翻译。
所属分类:
互联网
发布日期:2018-06-12
文件大小:45mb
提供者:
yr123456yr
NiuTrans中英平行语料库10万句
NiuTrans的开源中英平行语料库,可以用来训练机器翻译。
所属分类:
互联网
发布日期:2018-06-22
文件大小:45mb
提供者:
weixin_42498878
NiuTrans中英平行语料库10万句
NiuTrans的开源中英平行语料库,可以用来训练机器翻译。
所属分类:
互联网
发布日期:2018-08-09
文件大小:45mb
提供者:
longru1744
NiuTrans中英平行语料库10万句
NiuTrans的开源中英平行语料库,可以用来训练机器翻译。
所属分类:
互联网
发布日期:2018-08-16
文件大小:45mb
提供者:
zimo366
NiuTrans中英平行语料库10万句
NiuTrans的开源中英平行语料库,可以用来训练机器翻译。
所属分类:
互联网
发布日期:2018-08-23
文件大小:45mb
提供者:
mlunwen
中英平行语料库.zip
中英文平行语料库,用于机器翻译,问答系统等模型的预处理语料
所属分类:
深度学习
发布日期:2019-07-19
文件大小:3mb
提供者:
vip_v
中英平行语料库(八万对,句粒度)
共8400多对中英语句,已预处理,中文用jieba分了词,标点符号没问题,保存于en-zh.csv,分隔符是制表符\t(不是默认逗号)。 句粒度,但有不少长句,裁剪后5w对也够用。 原始数据集也在包中,其中en-zh_News.tmx有一部分句子有问题,(en-zh.csv丢弃了有问题的句子),如果必要建议不要直接使用该文件。 另外附赠我对语料的预处理文件(propressor.py),以及数据集(pytorch的Dataset)等相关的实现(LangData.py)。 如果又可以改善的地方,
所属分类:
深度学习
发布日期:2019-08-11
文件大小:35mb
提供者:
weixin_42127182
中英平行语料50000句.rar
语料来源为WMT18,本资源包含中英文的平行语料50000句,以及简单预处理后的文件。中文预处理:去除标点、数字,分词;英文预处理:去除标点、数字,大小写转换。可以用来做简单的神经机器翻译练习使用。
所属分类:
互联网
发布日期:2020-04-30
文件大小:7mb
提供者:
risan95
中英平行语料(共20万句)可用于训练机器翻译
中文英文的平行语料,来源于niutrans语料,总共20万句(中文10万英文10万),该语料可用于机器翻译等的训练。
所属分类:
深度学习
发布日期:2020-02-15
文件大小:7mb
提供者:
weixin_42014622
平行语料-中英数据对齐清洗
针对中英数据对齐的清洗,提高对齐质量,附带代码包含对中英序号不匹配,长数字不匹配等问题进行清洗!
所属分类:
互联网
发布日期:2019-10-12
文件大小:2kb
提供者:
weixin_45742817
中英平行语料(白皮书,可以用于机器翻译,主题提取)
中英平行语料(白皮书,可以用于机器翻译,主题提取)
所属分类:
机器学习
发布日期:2020-11-07
文件大小:2mb
提供者:
qq_45063244
构建和剖析中英三元组可比语料库
由于受到翻译腔的影响,中英平行语料库存在固有的扭斜的语言模型。显然,用这样的语料库训练的机器翻译、跨语言检索等自然语言处理系统也承袭了扭斜的语言模型,严重影响到应用系统的性能。为了克服平行语料库固有的缺陷,本文提出了构建和剖析中英三元组可比语料库的技术研究。这项研究采用可比语料库和语言自动剖析技术,使用统计和规则相结合的方法,对由本族英语、中式英语和标准中文三元素所组成的三元组可比语料库中的本族英语和中式英语进行统计分析。在此基础上,利用n-元词串、关键词簇等自动抽取技术挖掘基于本族语言模型的双
所属分类:
其它
发布日期:2021-02-09
文件大小:416kb
提供者:
weixin_38601878
«
1
2
»