点数信息
www.dssz.net
注册会员
|
设为首页
|
加入收藏夹
您好,欢迎光临本网站!
[请登录]
!
[注册会员]
!
首页
移动开发
云计算
大数据
数据库
游戏开发
人工智能
网络技术
区块链
操作系统
模糊查询
热门搜索:
源码
Android
整站
插件
识别
p2p
游戏
算法
更多...
在线客服QQ:632832888
当前位置:
资源下载
搜索资源 - 语料库
下载资源分类
移动开发
开发技术
课程资源
网络技术
操作系统
安全技术
数据库
行业
服务器应用
存储
信息化
考试认证
云计算
大数据
跨平台
音视频
游戏开发
人工智能
区块链
在结果中搜索
所属系统
Windows
Linux
FreeBSD
Unix
Dos
PalmOS
WinCE
SymbianOS
MacOS
Android
开发平台
Visual C
Visual.Net
Borland C
CBuilder
Dephi
gcc
VBA
LISP
IDL
VHDL
Matlab
MathCAD
Flash
Xcode
Android STU
LabVIEW
开发语言
C/C++
Pascal
ASM
Java
PHP
Basic/ASP
Perl
Python
VBScript
JavaScript
SQL
FoxBase
SHELL
E语言
OC/Swift
文件类型
源码
程序
CHM
PDF
PPT
WORD
Excel
Access
HTML
Text
资源分类
搜索资源列表
Brown Corpus(Brown Corpus 布朗语料库)-数据集
布朗语料库是美国英语的首个文本语料库,它取自不同主题的报纸文本、书籍以及政府文件,包含 1,014,312 个单词的它主要用于语言建模。 cats.csv brown-meta.json brown.csv Brown Corpus 布朗语料库_datasets.txt Brown Corpus 布朗语料库_brown_datasets.zip
所属分类:
其它
发布日期:2021-03-19
文件大小:9437184
提供者:
weixin_38631738
斯坦福自然语言推理(SNLI)语料库-数据集
SNLI语料库(1.0版)是一个570k人工编写的英语句子对的集合,这些句子对经过手动标记以实现平衡分类,并带有enume,矛盾和中性标签,支持自然语言推理(NLI)的任务,也称为识别文本蕴涵(RTE)。可用于探索知识图谱推理、长短期记忆神经网络。数据集来自斯坦福自然语言处理小组 。 斯坦福自然语言推理(SNLI)语料库_datasets.txt 斯坦福自然语言推理(SNLI)语料库_datasets.zip
所属分类:
其它
发布日期:2021-03-19
文件大小:94371840
提供者:
weixin_38623707
National Institute of the Korean Language Corpus 国家韩语语料库研究所-数据集
对于自然语言处理和语言学家来说,单词在语言中出现的频率是重要的信息。在自然语言处理中,非常频繁的单词往往比不太频繁的单词具有更少的信息,并且在预处理过程中经常被删除。该数据集包含有关韩语的频率信息,有8000万人使用。对于每个项目,都提供了频率(它在语料库中出现的次数)及其相对于其他引理的相对等级。 borrowings.csv frequency.csv frequency-by-jamo.csv frequency-by-syllable.csv frequency-long.cs
所属分类:
其它
发布日期:2021-03-18
文件大小:724992
提供者:
weixin_38749895
通过从网页中提取文本来构建用于藏文自然语言处理的大规模文本语料库
通过从网页中提取文本来构建用于藏文自然语言处理的大规模文本语料库
所属分类:
其它
发布日期:2021-03-18
文件大小:1048576
提供者:
weixin_38690407
新闻和广播网站的藏文文字资源收集和语料库建设
新闻和广播网站的藏文文字资源收集和语料库建设
所属分类:
其它
发布日期:2021-03-18
文件大小:1048576
提供者:
weixin_38650508
新闻语料库中的藏语未知单词识别功能,用于支持基于词典的藏语单词
新闻语料库中的藏语未知单词识别功能,用于支持基于词典的藏语单词
所属分类:
其它
发布日期:2021-03-18
文件大小:750592
提供者:
weixin_38682242
SpanishParaphraseCorpora:西班牙语手动释义语料库-源码
:page_with_curl: 西班牙释义语料库 西班牙语手动释义语料库 寿司语料库 该旨在评估整个文本或单个句子中一对文本之间的相似性,并评估不同的相似性度量。 它围绕与Sushi有关的西班牙博客文章的主题构建。 一些志愿者(本科生,研究生和博士生)被要求有意地改写或改写本文。 根据规则,文章的解释是在两个层次上进行的: 低级:仅词汇变化 高级:词汇,句法,文本或话语组织的变体以及句子的融合或分隔。 无释义:与寿司相关的主题和来源与原始文章相同的文本。 No Sushi:收集了与原始
所属分类:
其它
发布日期:2021-03-17
文件大小:5242880
提供者:
weixin_42176612
使用基于语料库的同义词库进行文本分类
使用基于语料库的同义词库进行文本分类
所属分类:
其它
发布日期:2021-03-17
文件大小:104448
提供者:
weixin_38553681
E.A. Poe's corpus of short stories E. A. 坡的短篇小说语料库-数据集
埃德加·艾伦·坡的短篇小说语料库在表格格式与附加数据 preprocessed_data.csv
所属分类:
其它
发布日期:2021-03-16
文件大小:730112
提供者:
weixin_38733875
语料库自然标注信息与中文分词应用研究(英文)
以中文分词为应用目标,将大规模语料库上存在的自然标注信息分为显性标注信息与隐性标注信息,分别考察了它们的分布和对大数据集上语言计算的影响。结果表明,两者都直接或间接地表达了作者对语言的分割意志,因而对分词具有积极的影响。通过词语抽取测试,发现在缺乏丰富显性标注信息的文本中,来自语言固有规律的自然标注信息对字符串有着强大的分割性能。
所属分类:
其它
发布日期:2021-03-16
文件大小:1018880
提供者:
weixin_38550334
generic_search:通用搜索引擎工具,可以对存储在内存中的语料库进行快速的模糊匹配-源码
通用搜索 通用搜索引擎工具,可以对存储在内存中的语料库进行快速的模糊匹配 它被设计为易于使用的搜索引擎,可以对其进行训练并将其应用于任何语料库。 它使用gensim训练语料库的矢量模型,使用bm25训练矢量的权重,并使用nsmlib创建数学索引。 完成此操作后,用户可以键入查询,并且将返回原始语料库的n个最匹配的元素。 快速开始 设置示例如下。 请注意,对于大问题,您可以将矢量化程序,矢量化语料库和索引保存到文件中,以防止需要重新生成它们。 from generic_search . engi
所属分类:
其它
发布日期:2021-03-15
文件大小:8192
提供者:
weixin_42143806
基于跨语言语料库的汉语和老挝语单词分布
单词表示是自然语言处理的基础研究内容。目前,单语言单词的分布式表示在一些神经概率语言(NPL)研究中显示出令人满意的应用效果,而对于跨语言单词的分布式表示,研究很少。在国内外。 针对这两种语言中名词和动词的分布相似性的问题,我们通过弱监督学习扩展法等方法将互译的单词,同义词,上位词嵌入中文语料库中,从而在跨语言环境中实现了老挝单词分布。学中文和老挝。 我们利用之前学习的跨语言单词的分布式表示来计算双语文本的相似度,并对汉语和老挝的混合文本语料库进行分类,实验结果表明该建议对这两个任务具有令人满意
所属分类:
其它
发布日期:2021-03-14
文件大小:442368
提供者:
weixin_38719643
汉维医疗平行语料库构建及特征分析
面对稀缺、专业性强的汉维双语医疗平行语料库建设,本文探索数据采集、标准化、去噪、自动录入方法,进行语料库特征分析,并根据语料数据特性,设计语料库网页检索系统。目前已建成110多万字、2.6万句汉语医疗语料,3000句对汉维双语对齐语料,不仅对构建中小型语料库有参考价值,而且奠定了医疗自然语言处理研究基础,尤其汉维双语对齐语料,将促进机器翻译技术在医疗领域突破,对新疆边远地区无汉语表达能力的少数民族群众获得医疗救助搭建桥梁。
所属分类:
其它
发布日期:2021-03-14
文件大小:1048576
提供者:
weixin_38746574
ESearch:结合文本语料库和结构化知识进行开放域实体搜索
ESearch:结合文本语料库和结构化知识进行开放域实体搜索
所属分类:
其它
发布日期:2021-03-14
文件大小:655360
提供者:
weixin_38640985
LIN-127:在LIN 127中完成的项目(文本处理和语料库语言学家)-源码
LIN-127:在LIN 127中完成的项目(文本处理和语料库语言学家)
所属分类:
其它
发布日期:2021-03-13
文件大小:74752
提供者:
weixin_42097508
code-switch-resource:NodeJS,Mongo(Monk),ExpressJS,pug + jQuery网页,用于语料库存储和分析-源码
code-switch-resource:NodeJS,Mongo(Monk),ExpressJS,pug + jQuery网页,用于语料库存储和分析
所属分类:
其它
发布日期:2021-03-13
文件大小:26624
提供者:
weixin_42122986
融合概念对齐信息的中文 AMR语料库的构建
融合概念对齐信息的中文 AMR语料库的构建
所属分类:
其它
发布日期:2021-03-12
文件大小:899072
提供者:
weixin_38626032
语义角色注释的更简单有效的框架:来自中国AMR语料库的证据
语义角色注释的更简单有效的框架:来自中国AMR语料库的证据
所属分类:
其它
发布日期:2021-03-12
文件大小:587776
提供者:
weixin_38520192
基于可比语料库的汉维语术语抽取研究中的主要难点
基于可比语料库的汉维语术语抽取研究中的主要难点
所属分类:
其它
发布日期:2021-03-12
文件大小:524288
提供者:
weixin_38692202
METIC:从语料库输入多实例实体
METIC:从语料库输入多实例实体
所属分类:
其它
发布日期:2021-03-12
文件大小:1048576
提供者:
weixin_38685857
«
1
2
...
4
5
6
7
8
9
10
11
12
13
14
...
50
»