您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. JE中文分词je-analysis-1.5.1.jar

  2. 1.5.1 —— 2006-01-22 修正细粒度分词错误的问题 1.5.0 —— 2007-01-18 全面支持Lucene 2.0 增强了词典维护的API 增加了商品编码的匹配 增加了Mail地址的匹配 实现了词尾消歧算法第二层的过滤 整理优化了词库 1.4.0 —— 2006-08-21 增加词典的动态扩展能力 1.3.3 —— 2006-07-23 修正无法多次增加词典的问题 1.3.2 —— 2006-07-03 修正细粒度分词错误的问题 1.3.1 —— 2006-0 6-23 修
  3. 所属分类:其它

    • 发布日期:2009-04-28
    • 文件大小:871kb
    • 提供者:tiancen2001
  1. IKAnalyzer1.4分词

  2. IKAnalyzer是一个基于Lucene的中文分词库,最新V1.4版的改进包括 1.修订特定情况下数量词切分造成指针越界异常的 BUG 2.进一步优化算法效率 3.优化词典 4.对英文和数词进行分割处理 IKAnalyzer基于lucene2.0版本API开发,实现了以词典分词为基础的正反向全切分算法,是Lucene Analyzer接口的实现
  3. 所属分类:其它

    • 发布日期:2009-07-04
    • 文件大小:848kb
    • 提供者:sxd147635549
  1. IKAnalyzer分词

  2. IKAnalyzer基于lucene2.0版本API开发,实现了以词典分词为基础的正反向全切分算法。其中提供的分词算法有:最大全切分,细粒度全切分。
  3. 所属分类:其它

    • 发布日期:2007-09-27
    • 文件大小:848kb
    • 提供者:cuiyan3327
  1. 有序HASH(Trie)树 win32 SDK V2.0

  2. 1、SDK开发包包括:动态库、头文件、开发手册、产品手册、解决方案、demo等。 2、有序HASH(Trie)树SDK中的API支持以下功能 1)插入节点 2)精确删除节点 3)正向模糊匹配 4)反向模糊匹配 5)精确查询节点 6)获取头(尾)节点 7)删除头(尾)节点 8)排序 9)支持多级树 10)支持强大的查询节点功能 。。。。。。 3、基于有序HASH(Trie)树SDK可以开发以下功能 1)查询 2)分类统计 3)集合(交集、并集)运算 4 )快速排序 5)前缀匹配 6)中文分词 7
  3. 所属分类:其它

    • 发布日期:2009-10-24
    • 文件大小:635kb
    • 提供者:freeland008
  1. IKAnalyzer3.1.6GA完整包

  2. IK Analyzer 是一个开源的,基于java 语言开发的轻量级的中文分词工具包。从2006 年12 月推出1.0 版开始, IKAnalyzer 已经推出了3 个大版本。最初,它是以开源项目 Luence 为应用主体的,结合词典分词和文法分析算法的中文分词组件。新版本的IK Analyzer 3.0 则发展为面向Java 的公用分词组件,独立于Lucene 项目,同时提供了对 Lucene 的默认优化实现。 该资源包涵用户手册,API及包
  3. 所属分类:Java

    • 发布日期:2010-01-21
    • 文件大小:1mb
    • 提供者:wuqinghang1126
  1. ICTCLAS 中文分词

  2. 中文词法分析是中文信息处理的基础与关键。中国科学院计算技术研究所在多年研究工作积累的基础上,研制出了汉语词法分析系统ICTCLAS(Institute of Computing Technology, Chinese Lexical Analysis System),主要功能包括中文分词;词性标注;命名实体识别;新词识别;同时支持用户词典。我们先后精心打造五年,内核升级6次,目前已经升级到了ICTCLAS3.0。ICTCLAS3.0分词速度单机996KB/s,分词精度98.45%,API不超过
  3. 所属分类:嵌入式

    • 发布日期:2010-05-10
    • 文件大小:5mb
    • 提供者:GenesisBoy
  1. 中科院中文分词ictclaszyfc-v2009.zip

  2. 一、ICTCLAS简介   中文词法分析是中文信息处理的基础与关键。中国科学院计算技术研究所在多年研究工作积累的基础上,研制出了汉语词法分析系统ICTCLAS(Institute of Computing Technology, Chinese Lexical Analysis System),主要功能包括中文分词;词性标注;命名实体识别;新词识别;同时支持用户词典。我们先后精心打造五年,内核升级6次,目前已经升级到了ICTCLAS3.0。ICTCLAS3.0分词速度单机996KB/s,分词精
  3. 所属分类:嵌入式

  1. 中科院分词系统(基于入侵检测系统)

  2. 中文词法分析是中文信息处理的基础与关键。中国科学院计算技术研究所在多年研究工作积累的基础上,研制出了汉语词法分析系统ICTCLAS(Institute of Computing Technology, Chinese Lexical Analysis System),主要功能包括中文分词;词性标注;命名实体识别;新词识别;同时支持用户词典。我们先后精心打造五年,内核升级6次,目前已经升级到了ICTCLAS3.0。ICTCLAS3.0分词速度单机996KB/s,分词精度98.45%,API不超过
  3. 所属分类:嵌入式

    • 发布日期:2010-11-15
    • 文件大小:9mb
    • 提供者:quhao3100590
  1. 中文分词器

  2. Lucene是apache组织的一个用java实现全文搜索引擎的开源项目。 其功能非常的强大,api也很简单。总得来说用Lucene来进行建立 和搜索和操作数据库是差不多的(有点像),Document可以看作是 数据库的一行记录,Field可以看作是数据库的字段。用lucene实 现搜索引擎就像用JDBC实现连接数据库一样简单
  3. 所属分类:Java

    • 发布日期:2011-11-02
    • 文件大小:1mb
    • 提供者:jun08139
  1. ICTCLAS 中科院 分词系统

  2. 中文词法分析是中文信息处理的基础与关键。中国科学院计算技术研究所在多年研究工作积累的基础上,研制出了汉语词法分析系统ICTCLAS(Institute of Computing Technology, Chinese Lexical Analysis System),主要功能包括中文分词;词性标注;命名实体识别;新词识别;同时支持用户词典。我们先后精心打造五年,内核升级6次,目前已经升级到了ICTCLAS3.0。ICTCLAS3.0分词速度单机996KB/s,分词精度98.45%,API不超过
  3. 所属分类:Java

    • 发布日期:2011-11-14
    • 文件大小:8mb
    • 提供者:lopohui1
  1. IKAnalyzer分词中文API

  2. IKAnalyzer中文分词器 使用手册.pdf
  3. 所属分类:Java

    • 发布日期:2012-02-08
    • 文件大小:487kb
    • 提供者:woshiyangqiang
  1. 中文分词系统ICTCLAS

  2. 中文词法分析是中文信息处理的基础与关键。中国科学院计算技术研究所在多年研究工作积累的基础上,研制出了汉语词法分析系统ICTCLAS(Institute of Computing Technology, Chinese Lexical Analysis System),主要功能包括中文分词;词性标注;命名实体识别;新词识别;同时支持用户词典。我们先后精心打造五年,内核升级6次,目前已经升级到了ICTCLAS3.0。ICTCLAS3.0分词速度单机996KB/s,分词精度98.45%,API不超过
  3. 所属分类:Web开发

    • 发布日期:2012-03-06
    • 文件大小:8mb
    • 提供者:huangsong_265
  1. mmseg4j-1.8.5.chm帮助文档API

  2. mmseg4j-1.8.5中文分词器API
  3. 所属分类:Java

    • 发布日期:2013-09-23
    • 文件大小:128kb
    • 提供者:ql215098933
  1. Lucene中文分词组件 JE-Analysis 1.5.1

  2. 发布于:http://www.jesoft.cn/posts/list/5.page 1.5.1 —— 2006-01-22 修正细粒度分词错误的问题 1.5.0 —— 2007-01-18 全面支持Lucene 2.0 增强了词典维护的API 增加了商品编码的匹配 增加了Mail地址的匹配 实现了词尾消歧算法第二层的过滤 整理优化了词库 1.4.0 —— 2006-08-21 增加词典的动态扩展能力 1.3.3 —— 2006-07-23 修正无法多次增加词典的问题 1.3.2 —— 200
  3. 所属分类:其它

    • 发布日期:2007-01-22
    • 文件大小:871kb
    • 提供者:diystar
  1. 中文分词工具word-1.0,Java实现的中文分词组件多种基于词典的分词算法

  2. word分词是一个Java实现的中文分词组件,提供了多种基于词典的分词算法,并利用ngram模型来消除歧义。 能准确识别英文、数字,以及日期、时间等数量词,能识别人名、地名、组织机构名等未登录词。 同时提供了Lucene、Solr、ElasticSearch插件。 分词使用方法: 1、快速体验 运行项目根目录下的脚本demo-word.bat可以快速体验分词效果 用法: command [text] [input] [output] 命令command的可选值为:demo、text、file
  3. 所属分类:Java

    • 发布日期:2014-11-05
    • 文件大小:10mb
    • 提供者:love_hachi
  1. word中文分词 文档 中文CHM

  2. word 分词chm 中文版
  3. 所属分类:Java

    • 发布日期:2017-06-16
    • 文件大小:83kb
    • 提供者:qq_24209665
  1. 使用Discuz关键词服务器实现PHP中文分词

  2. 不同于使用自己的服务器进行分词,Discuz!在线中文分词服务是基于API返回分词结果的。在项目中,我们只需要一个函数即可方便地进行分词、关键词提取。以下是根据Discuz!在线分词服务API写的函数,测试可正常运行:复制代码 代码如下:/** * DZ在线中文分词 * param $title string 进行分词的标题 * param $content string 进行分词的内容 * param $encode string API返回的数据编码 * return  array 得到的关
  3. 所属分类:其它

    • 发布日期:2020-12-18
    • 文件大小:41kb
    • 提供者:weixin_38680393
  1. iOS中自带超强中文分词器的实现方法

  2. 说明 在处理文本的时候,第一步往往是将字符串进行分词,得到一个个关键词。苹果从很早就开始支持中文分词了,而且我们几乎人人每天都会用到,回想一下,在使用手机时,长按一段文字,往往会选中按住位置的一个词语,这里就是一个分词的绝佳用例,而iOS自带的分词效果非常棒,大家可以自己平常注意观察一下,基本对中文也有很好的效果。而这个功能也开放了API供开发者调用,我试用了一下,很好用! 效果如下: 实现 其实苹果给出了完整的API,想要全面了解的可以直接看文档:CFStringTokenizer Refe
  3. 所属分类:其它

    • 发布日期:2021-01-04
    • 文件大小:98kb
    • 提供者:weixin_38646645
  1. 麻将:开源中文分词工具包,中文分词Web API,Lucene中文分词,中英文混合分词-源码

  2. 麻将中文分词 简介 麻将一直是广受欢迎的传统娱乐活动,字牌的组合千变万化。汉字的组合也是变化多端,麻将这个项目希望能从汉字组合中发现汉语的秘密,为自然语言处理提供好的中文分词工具。 麻将是基于Scala的语言实现的中文分词软件包。这个项目的核心是最大概率分词,整个项目专为搜索引擎,文本信息抽取和自然语言处理设计,参考我来实现。性能优异,速度快。整个分词包易于使用,测试覆盖率高。 在线展示 :链接 ,您可以自己测试它的功能。有任何问题,可以发邮件至: 。 分词歧义解决方案 分词的方法有很多,现
  3. 所属分类:其它

    • 发布日期:2021-02-05
    • 文件大小:14mb
    • 提供者:weixin_42097533
  1. HanLP:中文分词词性标注命名实体识别依存句法分析语义依存分析新词发现用自动生成的摘要进行文本分类聚类拼音简繁转换自然语言处理-源码

  2. HanLP:汉语言处理 || || 面向生产环境的多语种自然语言处理工具包,基于PyTorch和TensorFlow 2.x双引擎,目标是普及落地最前沿的NLP技术。HanLP实现功能完善,性能高效,架构清晰,语料时新,可自定义的特点。 穿越世界上最大的多语言种语料库,HanLP2.1支持包括简繁中英日俄法德内部的104种语言上的10种联合任务:分词(粗分,细分2个标准,强制,合并,校正3种),词性标注(PKU,863,CTB,UD四套词性规范),命名实体识别(PKU,MSRA,OntoNot
  3. 所属分类:其它

    • 发布日期:2021-02-03
    • 文件大小:757kb
    • 提供者:weixin_42134054
« 12 3 4 5 »