您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. Brown Corpus(Brown Corpus 布朗语料库)-数据集

  2. 布朗语料库是美国英语的首个文本语料库,它取自不同主题的报纸文本、书籍以及政府文件,包含 1,014,312 个单词的它主要用于语言建模。 cats.csv brown-meta.json brown.csv Brown Corpus 布朗语料库_datasets.txt Brown Corpus 布朗语料库_brown_datasets.zip
  3. 所属分类:其它

    • 发布日期:2021-03-19
    • 文件大小:9437184
    • 提供者:weixin_38631738
  1. 斯坦福自然语言推理(SNLI)语料库-数据集

  2. SNLI语料库(1.0版)是一个570k人工编写的英语句子对的集合,这些句子对经过手动标记以实现平衡分类,并带有enume,矛盾和中性标签,支持自然语言推理(NLI)的任务,也称为识别文本蕴涵(RTE)。可用于探索知识图谱推理、长短期记忆神经网络。数据集来自斯坦福自然语言处理小组 。 斯坦福自然语言推理(SNLI)语料库_datasets.txt 斯坦福自然语言推理(SNLI)语料库_datasets.zip
  3. 所属分类:其它

    • 发布日期:2021-03-19
    • 文件大小:94371840
    • 提供者:weixin_38623707
  1. National Institute of the Korean Language Corpus 国家韩语语料库研究所-数据集

  2. 对于自然语言处理和语言学家来说,单词在语言中出现的频率是重要的信息。在自然语言处理中,非常频繁的单词往往比不太频繁的单词具有更少的信息,并且在预处理过程中经常被删除。该数据集包含有关韩语的频率信息,有8000万人使用。对于每个项目,都提供了频率(它在语料库中出现的次数)及其相对于其他引理的相对等级。 borrowings.csv frequency.csv frequency-by-jamo.csv frequency-by-syllable.csv frequency-long.cs
  3. 所属分类:其它

    • 发布日期:2021-03-18
    • 文件大小:724992
    • 提供者:weixin_38749895
  1. 通过从网页中提取文本来构建用于藏文自然语言处理的大规模文本语料库

  2. 通过从网页中提取文本来构建用于藏文自然语言处理的大规模文本语料库
  3. 所属分类:其它

    • 发布日期:2021-03-18
    • 文件大小:1048576
    • 提供者:weixin_38690407
  1. 新闻和广播网站的藏文文字资源收集和语料库建设

  2. 新闻和广播网站的藏文文字资源收集和语料库建设
  3. 所属分类:其它

    • 发布日期:2021-03-18
    • 文件大小:1048576
    • 提供者:weixin_38650508
  1. 新闻语料库中的藏语未知单词识别功能,用于支持基于词典的藏语单词

  2. 新闻语料库中的藏语未知单词识别功能,用于支持基于词典的藏语单词
  3. 所属分类:其它

    • 发布日期:2021-03-18
    • 文件大小:750592
    • 提供者:weixin_38682242
  1. SpanishParaphraseCorpora:西班牙语手动释义语料库-源码

  2. :page_with_curl: 西班牙释义语料库 西班牙语手动释义语料库 寿司语料库 该旨在评估整个文本或单个句子中一对文本之间的相似性,并评估不同的相似性度量。 它围绕与Sushi有关的西班牙博客文章的主题构建。 一些志愿者(本科生,研究生和博士生)被要求有意地改写或改写本文。 根据规则,文章的解释是在两个层次上进行的: 低级:仅词汇变化 高级:词汇,句法,文本或话语组织的变体以及句子的融合或分隔。 无释义:与寿司相关的主题和来源与原始文章相同的文本。 No Sushi:收集了与原始
  3. 所属分类:其它

    • 发布日期:2021-03-17
    • 文件大小:5242880
    • 提供者:weixin_42176612
  1. 使用基于语料库的同义词库进行文本分类

  2. 使用基于语料库的同义词库进行文本分类
  3. 所属分类:其它

    • 发布日期:2021-03-17
    • 文件大小:104448
    • 提供者:weixin_38553681
  1. E.A. Poe's corpus of short stories E. A. 坡的短篇小说语料库-数据集

  2. 埃德加·艾伦·坡的短篇小说语料库在表格格式与附加数据 preprocessed_data.csv
  3. 所属分类:其它

    • 发布日期:2021-03-16
    • 文件大小:730112
    • 提供者:weixin_38733875
  1. 语料库自然标注信息与中文分词应用研究(英文)

  2. 以中文分词为应用目标,将大规模语料库上存在的自然标注信息分为显性标注信息与隐性标注信息,分别考察了它们的分布和对大数据集上语言计算的影响。结果表明,两者都直接或间接地表达了作者对语言的分割意志,因而对分词具有积极的影响。通过词语抽取测试,发现在缺乏丰富显性标注信息的文本中,来自语言固有规律的自然标注信息对字符串有着强大的分割性能。
  3. 所属分类:其它

    • 发布日期:2021-03-16
    • 文件大小:1018880
    • 提供者:weixin_38550334
  1. generic_search:通用搜索引擎工具,可以对存储在内存中的语料库进行快速的模糊匹配-源码

  2. 通用搜索 通用搜索引擎工具,可以对存储在内存中的语料库进行快速的模糊匹配 它被设计为易于使用的搜索引擎,可以对其进行训练并将其应用于任何语料库。 它使用gensim训练语料库的矢量模型,使用bm25训练矢量的权重,并使用nsmlib创建数学索引。 完成此操作后,用户可以键入查询,并且将返回原始语料库的n个最匹配的元素。 快速开始 设置示例如下。 请注意,对于大问题,您可以将矢量化程序,矢量化语料库和索引保存到文件中,以防止需要重新生成它们。 from generic_search . engi
  3. 所属分类:其它

    • 发布日期:2021-03-15
    • 文件大小:8192
    • 提供者:weixin_42143806
  1. 基于跨语言语料库的汉语和老挝语单词分布

  2. 单词表示是自然语言处理的基础研究内容。目前,单语言单词的分布式表示在一些神经概率语言(NPL)研究中显示出令人满意的应用效果,而对于跨语言单词的分布式表示,研究很少。在国内外。 针对这两种语言中名词和动词的分布相似性的问题,我们通过弱监督学习扩展法等方法将互译的单词,同义词,上位词嵌入中文语料库中,从而在跨语言环境中实现了老挝单词分布。学中文和老挝。 我们利用之前学习的跨语言单词的分布式表示来计算双语文本的相似度,并对汉语和老挝的混合文本语料库进行分类,实验结果表明该建议对这两个任务具有令人满意
  3. 所属分类:其它

    • 发布日期:2021-03-14
    • 文件大小:442368
    • 提供者:weixin_38719643
  1. 汉维医疗平行语料库构建及特征分析

  2. 面对稀缺、专业性强的汉维双语医疗平行语料库建设,本文探索数据采集、标准化、去噪、自动录入方法,进行语料库特征分析,并根据语料数据特性,设计语料库网页检索系统。目前已建成110多万字、2.6万句汉语医疗语料,3000句对汉维双语对齐语料,不仅对构建中小型语料库有参考价值,而且奠定了医疗自然语言处理研究基础,尤其汉维双语对齐语料,将促进机器翻译技术在医疗领域突破,对新疆边远地区无汉语表达能力的少数民族群众获得医疗救助搭建桥梁。
  3. 所属分类:其它

    • 发布日期:2021-03-14
    • 文件大小:1048576
    • 提供者:weixin_38746574
  1. ESearch:结合文本语料库和结构化知识进行开放域实体搜索

  2. ESearch:结合文本语料库和结构化知识进行开放域实体搜索
  3. 所属分类:其它

    • 发布日期:2021-03-14
    • 文件大小:655360
    • 提供者:weixin_38640985
  1. LIN-127:在LIN 127中完成的项目(文本处理和语料库语言学家)-源码

  2. LIN-127:在LIN 127中完成的项目(文本处理和语料库语言学家)
  3. 所属分类:其它

    • 发布日期:2021-03-13
    • 文件大小:74752
    • 提供者:weixin_42097508
  1. code-switch-resource:NodeJS,Mongo(Monk),ExpressJS,pug + jQuery网页,用于语料库存储和分析-源码

  2. code-switch-resource:NodeJS,Mongo(Monk),ExpressJS,pug + jQuery网页,用于语料库存储和分析
  3. 所属分类:其它

    • 发布日期:2021-03-13
    • 文件大小:26624
    • 提供者:weixin_42122986
  1. 融合概念对齐信息的中文 AMR语料库的构建

  2. 融合概念对齐信息的中文 AMR语料库的构建
  3. 所属分类:其它

    • 发布日期:2021-03-12
    • 文件大小:899072
    • 提供者:weixin_38626032
  1. 语义角色注释的更简单有效的框架:来自中国AMR语料库的证据

  2. 语义角色注释的更简单有效的框架:来自中国AMR语料库的证据
  3. 所属分类:其它

    • 发布日期:2021-03-12
    • 文件大小:587776
    • 提供者:weixin_38520192
  1. 基于可比语料库的汉维语术语抽取研究中的主要难点

  2. 基于可比语料库的汉维语术语抽取研究中的主要难点
  3. 所属分类:其它

    • 发布日期:2021-03-12
    • 文件大小:524288
    • 提供者:weixin_38692202
  1. METIC:从语料库输入多实例实体

  2. METIC:从语料库输入多实例实体
  3. 所属分类:其它

    • 发布日期:2021-03-12
    • 文件大小:1048576
    • 提供者:weixin_38685857
« 1 2 ... 4 5 6 7 8 910 11 12 13 14 ... 50 »