您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. stanford-postagger.jar

  2. 对英文单词的词性标注 自然语言处理相关资源还有english-left3words-distsim.tagger见我的上传资源
  3. 所属分类:专业指导

    • 发布日期:2014-01-18
    • 文件大小:2mb
    • 提供者:u013508264
  1. 复旦NLP工具

  2. 这是一个复旦大学计算机学院开发的开源中文自然语言处理(NLP)工具包 Fudan NLP里包含中文分词、关键词抽取、命名实体识别、词性标注、时间词抽取、语法分析等功能,对搜索引擎、文本分析等极为有价值。
  3. 所属分类:互联网

    • 发布日期:2014-08-14
    • 文件大小:1mb
    • 提供者:waterdrip2007
  1. NLP常用开源地址

  2. 提供NLP常用开源地址,涉及到词性标注 句法分析 依存分析 命名实体识别 语义角色标注 UIMA等开源地址
  3. 所属分类:深度学习

    • 发布日期:2017-10-18
    • 文件大小:19kb
    • 提供者:ggf0101
  1. 中文词性标注

  2. 中文词性标注的科普文章,小标记集。词性标注除了使用《现代汉语语法信息词典》中的26 个词类标记 (名词n、时间词t、处所词s、方位词f、数词m、量词q、区别词b、代词r、动词v、形 容词a、状态词z、副词d、介词p、连词c、助词u、语气词y、叹词e、拟声词o、成语i、 习用语l、简称j、前接成分h、后接成分k、语素g、非语素字x、标点符号w)外,增加 了以下3 类标记:①专有名词的分类标记,即人名nr,地名ns,团体机关单位名称nt,其 他专有名词nz;②语素的子类标记,即名语素Ng,动语素V
  3. 所属分类:机器学习

    • 发布日期:2018-04-13
    • 文件大小:295kb
    • 提供者:weixin_41808886
  1. 国标863词性标注集

  2. 国标863词性标注集,ltp使用的词性标注集,有利于自然语言处理的分析。
  3. 所属分类:机器学习

    • 发布日期:2018-07-06
    • 文件大小:410kb
    • 提供者:qq_36182996
  1. nlp工具 word2vec nltk textblob crf++ 机器人 中文翻译 繁体转简体 关键词 主题 命名体识别 分词 聚类 词性标注 词向量

  2. 本资源属于代码类,是一些nlp工具的使用 nlp 工具 word2vec nltk textblob crf++ (1)机器人 (2)中文翻译,及繁体转简体 (3)关键词提取,主题提取,摘要提取 (4)命名体识别 (5)分词 (6)情感分析,正负类分析 (7)近义词,同义词,句子相似性 (8)聚类,监督,无监督 (9)词性标注 (10)词向量提取
  3. 所属分类:机器学习

    • 发布日期:2018-07-20
    • 文件大小:1mb
    • 提供者:u013378306
  1. 微软亚研的中文分词、词性标注和命名实体识别语料

  2. 微软亚研的中文分词、词性标注和命名实体识别语料,包括训练和验证集,xml格式,方便使用,机器学习、信息检索以及NLP领域的研究人员使用来训练模型
  3. 所属分类:机器学习

    • 发布日期:2018-10-17
    • 文件大小:4mb
    • 提供者:u010732327
  1. 词性标注说明_128601491.pdf

  2. NLP词性标注说明,人民日报标注语料库格式说明例子说明
  3. 所属分类:机器学习

    • 发布日期:2019-09-06
    • 文件大小:27kb
    • 提供者:zhang1034490826
  1. nlp词性标注demo

  2. nlp词性标注pos tag的demo含训练集, 将英文句子的词性标注,并解释词性例如trying to keep pace with rival Time magazine 运行结果为 word: trying result: VBG explain: Verb, gerund or present participle 动名词和现在分词 ----------------------------- word: to result: TO explain: to 作为介词或不定式格式 -----
  3. 所属分类:互联网

    • 发布日期:2020-06-09
    • 文件大小:461kb
    • 提供者:howard789
  1. nlp_windows_exe_ui:python3.6-制作一个包含NLP基本功能系统(Windows exe)自然语言处理系统。系统功能:分词,词性标注,关键词提取,文本分类-源码

  2. nlp_windows_exe_ui 介绍 python3.6-制作一个包含NLP基本功能系统(Windows exe)自然语言处理系统。系统功能:分词,词性标注,关键字提取,文本分类;由于要打包成exe的关系,我将原本的项目的多一个文件的集成到一个python文件(合并文件)里,只保留了使用该系统所需要的函数,方便打包,通俗地讲就是,生成生成词向量过程,装袋过程,模型训练过程的,以及一些中间步骤的程序代码,这些有些涉及很多库的,这些打包进去。但是整个项目里的东西是完整的(包括数据) 运行这个系
  3. 所属分类:其它

    • 发布日期:2021-03-15
    • 文件大小:20mb
    • 提供者:weixin_42129113
  1. ark-tweet-nlp:CMU ARK Twitter词性标注器-源码

  2. ark-tweet-nlp:CMU ARK Twitter词性标注器
  3. 所属分类:其它

    • 发布日期:2021-02-19
    • 文件大小:12mb
    • 提供者:weixin_42117224
  1. pattern.nlp:R包,用于对荷兰语法语英语德语德语意大利语执行情感分析和词性标注-源码

  2. pattern.nlp:R包,用于对荷兰语法语英语德语德语意大利语执行情感分析和词性标注
  3. 所属分类:其它

    • 发布日期:2021-02-05
    • 文件大小:30kb
    • 提供者:weixin_42120275
  1. lac:百度NLP:分词,词性标注,命名实体识别,词首-源码

  2. 工具介绍 LAC全称中文的词法分析,是百度自然语言处理部研发的一种联合的词法分析工具,实现中文分词,词性标注,专名识别等功能。该工具具有以下特点和优势: 效果好:通过深度学习模型联合学习分词,词性标注,专名识别任务,单词索引,整体效果F1值超过0.91,词性标注F1值超过0.94,专名识别F1值超过0.85,效果领先。 效率高:精简模型参数,结合Paddle预测库的性能优化,CPU单线程性能达800QPS,效率领先。 可定制:实现简单可控的干预机制,精确匹配用户字典对模型进行干预。 调用便捷:支
  3. 所属分类:其它

  1. Qutuf:Qutuf(قُطُوْف):阿拉伯语形态分析仪和词性标注器作为专家系统-源码

  2. 阿拉伯语形态分析仪(带词干分析器)和词性标注器 Qutuf(Quetuf):阿拉伯语形态分析仪(包括词根提取和根提取),以及作为专家系统的词性标注器。 现在可通过作为实验性Web服务使用。 Qutuf旨在成为阿拉伯语NLP(自然语言处理)框架的核心 在Qutuf,已经确定并实施了一些新概念。 类似于在预处理阶段的“第一规范化”和“第二规范化”文本形式,以及在词性标记任务中的“过早标记”和“过期标记”。 此外,POS标记被设计和实现为基于规则的专家系统。 基于形态特征标签集构建的POS标签集已
  3. 所属分类:其它

    • 发布日期:2021-02-03
    • 文件大小:10mb
    • 提供者:weixin_42153615
  1. Jiayan:甲言,专注于古代汉语(古汉语古文文言文文言)处理的NLP工具包,支持文言词库合成,分词,词性标注,断句和标点。Jiayan是为古典汉语设计的工具包,支持词典构建。 ,标记,POS标记,句子分段和标点符号-源码

  2. 甲言Jiayan 简介 甲言,取“Oracle言”之意,是一种专注于古汉语处理的NLP工具包。目前通用的汉语NLP工具均以现代汉语为核心语料,对古代汉语的处理效果很差(详见)。本项目的初衷,便是辅助古汉语信息处理,帮助有志于挖掘古文化矿藏的古汉语学者,爱好者等更好的地分析和利用文言资料,从“文化遗产”中创造出“文化新产”。当前版本支持,,,和五项功能,更多功能正在开发中。 功能 利用无监督的双,以及左右进行文言词库自动生成。 利用无监督,无词典的和进行古汉语自动分词。 利用词库合成功能产生的文言
  3. 所属分类:其它

    • 发布日期:2021-02-03
    • 文件大小:217kb
    • 提供者:weixin_42137022
  1. NLP工具::face_savoring_food:本项目推进通过Tensorflow基于BiLSTM + CRF实现中文分词,词性标注,命名实体识别(NER)-源码

  2. NLP工具 本项目初步通过Tensorflow基于BiLSTM + CRF实现字符级序列标注模型。 功能: 1,对未登录字(词)识别能力 2,Http接口 3,可快速实现分词,词性标注,NER,SRL等序列标注模型 欢迎各位大佬吐槽。 说明 环境配置:创建新的conda环境 $ conda env create -f environment.yaml 语料处理 不同标注语料格式不同,需要额外处理,在示例/DataPreprocessing.ipynb中提供了人民日报2014准备过程(该语料集
  3. 所属分类:其它

    • 发布日期:2021-02-03
    • 文件大小:29kb
    • 提供者:weixin_42165018
  1. Macropodus:自然语言处理工具Macropodus,基于Albert + BiLSTM + CRF深度学习网络架构,中文分词,词性标注,命名实体识别,新词发现,关键词,文本摘要,文本相似度,科学计算器,中文数字阿拉伯NLP的工具(工

  2. Macropodus是一个以Albert + BiLSTM + CRF网络架构为基础,用大量中文语料训练的自然语言处理工具包。将提供中文分词,词性标注,命名实体识别,关键词提取,文本摘要,新词发现,文本相似度,计算器,数字转换,拼音转换,繁简转换等常见的NLP功能。 目录 安装 注意事项默认不安装nlg-yongzhuo, 如果需要该功能自行安装; 默认不指定numpy, pandas, scikit-learn版本, 过高或者过低的版本可能不支持 标准版本的依赖包详见 requirements
  3. 所属分类:其它

  1. xmnlp:小明NLP:提供中文分词,词性标注,拼写检查,文本转拼音,情感分析,文本摘要,偏旁部首-源码

  2. / xmnlp / 小明NLP —轻量级中文自然语言处理工具 轻量级中文自然语言处理工具包 v 0.2.3 RIP 0.2.3版是xmnlp最后一个兼容Python 2.7的版本 功能概览 中文分词和词性标注 支持繁体 支持自定义词典 中文拼写检查 文本摘要&关键词提取 情感分析 文本转拼音 获取汉字偏旁部首 安装使用 安装方式 方式一 pip install xmnlp 方式二 git clone https://github.com/SeanLee97/xmnlp.git cd /path
  3. 所属分类:其它

    • 发布日期:2021-02-03
    • 文件大小:23mb
    • 提供者:weixin_42178963
  1. Introduction-NLP:HanLP作者的新书《自然语言处理入门》详细笔记!业界良心之作,书中不是枯燥无味的公式罗列,甚至用白话分解的通俗易懂的算法模型。从基本概念出发,逐步介绍中文分词,词性标注,命名实体识别,信息删除,文本聚类,

  2. 简介-自然语言处理 汉良作者何晗老师的新书《自然语言处理入门》详细的笔记!业界良心之作,书中不是枯燥无味的公式罗列,甚至用白话分解的通俗易懂的算法模型。从基本概念出发,逐步介绍中文分词,词性标注,命名实体识别,信息删除,文本聚类,文本分类,句法分析这几个热门问题的算法原理与工程实现。 本项目初步帮助更多同路人能够快速的掌握NLP的专业知识,理清知识要点,在工作中发挥作用的作用。以书本为主,记录本人学习此书的心路历程,总结和笔记。 机器学习与深度学习请转至本人项目: HanLP项目: 思维导
  3. 所属分类:其它

  1. HanLP:中文分词词性标注命名实体识别依存句法分析语义依存分析新词发现用自动生成的摘要进行文本分类聚类拼音简繁转换自然语言处理-源码

  2. HanLP:汉语言处理 || || 面向生产环境的多语种自然语言处理工具包,基于PyTorch和TensorFlow 2.x双引擎,目标是普及落地最前沿的NLP技术。HanLP实现功能完善,性能高效,架构清晰,语料时新,可自定义的特点。 穿越世界上最大的多语言种语料库,HanLP2.1支持包括简繁中英日俄法德内部的104种语言上的10种联合任务:分词(粗分,细分2个标准,强制,合并,校正3种),词性标注(PKU,863,CTB,UD四套词性规范),命名实体识别(PKU,MSRA,OntoNot
  3. 所属分类:其它

    • 发布日期:2021-02-03
    • 文件大小:757kb
    • 提供者:weixin_42134054
« 12 3 »