您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. msra(命名实体语料)

  2. msra(命名实体语料),sighan bakeoff 2006 命名实体识别的语料库,
  3. 所属分类:深度学习

    • 发布日期:2018-04-17
    • 文件大小:2097152
    • 提供者:qq_38913452
  1. msra公开命名实体训练语料

  2. msra公开命名实体训练语料,具体文档见压缩包,可以用于训练命名识别识别
  3. 所属分类:机器学习

    • 发布日期:2018-06-04
    • 文件大小:2097152
    • 提供者:qq_25807909
  1. sighan 2006 MSRA命名实体语料(BIO格式)

  2. 2006年sighan命名实体识别任务语料,MSRA提供。已经转成BIO格式,可直接用于NER训练
  3. 所属分类:深度学习

    • 发布日期:2018-08-31
    • 文件大小:7340032
    • 提供者:qiaobot
  1. msra实体识别与分词语料

  2. msra语料包括实体识别(NER)和分词(seg)已标注数据,包括已标注的训练集和测试集,实体识别采用BIO标注,分词采用BM1M2MES六标注
  3. 所属分类:机器学习

    • 发布日期:2019-04-21
    • 文件大小:5242880
    • 提供者:allan2222
  1. Chinese NER data MSRA 中文命名实体识别语料

  2. 中 B-ORG 共 I-ORG 中 I-ORG 央 I-ORG 致 O 中 B-ORG 国 I-ORG 致 I-ORG 公 I-ORG 党 I-ORG 十 I-ORG 一 I-ORG 大 I-ORG 的 O 贺 O 词 O 各 O 位 O 代 O 表 O Tag | Meaning O Not part of a named entity B-PER Beginning character of a person name I-PER Non-beginning character of a
  3. 所属分类:深度学习

    • 发布日期:2019-09-30
    • 文件大小:3145728
    • 提供者:sinat_24070543
  1. 自然语言处理--MSRA语料库

  2. 自然语言处理--MSRA语料库
  3. 所属分类:深度学习

    • 发布日期:2021-03-25
    • 文件大小:7340032
    • 提供者:qq_35679464
  1. msra(命名实体语料) BIO schema.zip

  2. 2006年,微软亚洲研究院(Microsoft Research Asia, MSRA)发布的BIO格式标注语料,共计46365条。
  3. 所属分类:深度学习

    • 发布日期:2021-03-16
    • 文件大小:6291456
    • 提供者:YWP_2016
  1. ChineseNER:中文命名实体识别,实体抽取,tensorflow,pytorch,BiLSTM + CRF-源码

  2. 中文NER 本项目使用 python 2.7 张量流1.7.0 火炬0.4.0 对命名实体识别不了解的可以先看一下这篇。顺便求star〜 这是最简单的一个命名实体识别BiLSTM + CRF模型。 数据 数据文件夹中有三个开源数据集可以使用,玻森数据( ),1998年人民日报标注数据,MSRA微软亚洲研究院开源数据。其中,boson数据集有6种实体类型,人民日报语料和MSRA一般只提取人名,地名,组织名三种实体类型。 先运行数据中的python文件处理数据,供模型使用。 张量流版 开始训练
  3. 所属分类:其它

    • 发布日期:2021-02-06
    • 文件大小:13631488
    • 提供者:weixin_42107491
  1. CLUEDatasetSearch:搜索所有中文NLP数据集,附常用英文NLP数据集-源码

  2. CLUEDatasetSearch 中英文NLP数据集。可以点击。 您可以通过贡献你的力量。上传五个或以上数据集信息并审核通过后,该同学可以作为项目贡献者,并显示出来。 如果数据集有问题,欢迎提出问题。 所有数据集均压缩网络,只做整理供大家提取方便,如果有缺陷等问题,请及时联系我们删除。 内尔 ID 标题 更新日期 数据集提供者 许可 说明 关键字 类别 论文地址 备注 1个 2017年5月 北京极目云健康科技有限公司 数据统计其云医院平台的真实电子病历数据,共计800条(个别病人单次就诊记录)
  3. 所属分类:其它

    • 发布日期:2021-02-03
    • 文件大小:711680
    • 提供者:weixin_42116650
  1. HanLP:中文分词词性标注命名实体识别依存句法分析语义依存分析新词发现用自动生成的摘要进行文本分类聚类拼音简繁转换自然语言处理-源码

  2. HanLP:汉语言处理 || || 面向生产环境的多语种自然语言处理工具包,基于PyTorch和TensorFlow 2.x双引擎,目标是普及落地最前沿的NLP技术。HanLP实现功能完善,性能高效,架构清晰,语料时新,可自定义的特点。 穿越世界上最大的多语言种语料库,HanLP2.1支持包括简繁中英日俄法德内部的104种语言上的10种联合任务:分词(粗分,细分2个标准,强制,合并,校正3种),词性标注(PKU,863,CTB,UD四套词性规范),命名实体识别(PKU,MSRA,OntoNot
  3. 所属分类:其它

    • 发布日期:2021-02-03
    • 文件大小:775168
    • 提供者:weixin_42134054
  1. 基于改进深度置信网络的中文实体检测

  2. 实体检测是自然语言处理的一个研究热点,是从无结构的文本中检测出命名实体。深度置信网络(Deep Belief Nets,DBN)的核心组件为受限玻尔兹曼机(Restricted Boltzmann Machine,RBM),RBM的训练传统采用对比散度准则(Contrastive Divergence,CD),但CD是对数似然梯度有偏差的近似。为此,提出基于平均对比散度准则(Average Contrastive Divergence,ACD)训练的DBN的实体检测模型,利用MSRA语料库作训练
  3. 所属分类:其它

    • 发布日期:2021-01-12
    • 文件大小:1048576
    • 提供者:weixin_38679651