您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. pymmseg -python分词模块

  2. python分词模块,基于mmseg算法编写,核心代码c++,提供python接口
  3. 所属分类:Python

    • 发布日期:2009-07-18
    • 文件大小:1mb
    • 提供者:tyanly
  1. 中文分词包

  2. 采用MMseg算法实现的中文分词器,特色是是使用搜狗词库
  3. 所属分类:Java

    • 发布日期:2012-12-26
    • 文件大小:2mb
    • 提供者:lee_xiong
  1. jcseg java中文分词

  2. friso是使用c语言开发的一个中文分词器,使用流行的mmseg算法实现。完全基于模块化设计和实现,可以很方便的植入到其他程序中,例如:MySQL,PHP等。
  3. 所属分类:C

    • 发布日期:2013-01-04
    • 文件大小:841kb
    • 提供者:yangjian8801
  1. 文本挖掘tmSVM开源项目包含Python和Java两种版本带参考文档

  2. 文本挖掘tmSVM开源项目集成libSVM和liblinear包含Python和Java两种版本带PDF源码参考文档 简介 文本挖掘无论在学术界还是在工业界都有很广泛的应用场景。而文本分类是文本挖掘中一个非常重要的手段与技术。现有的分类技术都已经非常成熟,SVM、KNN、Decision Tree、AN、NB在不同的应用中都展示出较好的效果,前人也在将这些分类算法应用于文本分类中做出许多出色的工作。但在实际的商业应用中,仍然有很多问题没有很好的解决,比如文本分类中的高维性和稀疏性、类别的不平衡
  3. 所属分类:Python

    • 发布日期:2014-02-23
    • 文件大小:3mb
    • 提供者:vcfriend
  1. mmseg4j-1.9.1.zip

  2. mmseg4j用Chih-Hao Tsai 的MMSeg算法实现的中文分词器,并实现lucene的analyzer和solr的TokenizerFactory以方便在Lucene和Solr中使用。 MMSeg 算法有两种分词方法:Simple和Complex,都是基于正向最大匹配。Complex加了四个规则过虑。官方说:词语的正确识别率达到了 98.41%。
  3. 所属分类:Java

    • 发布日期:2014-03-02
    • 文件大小:1mb
    • 提供者:u013842649
  1. friso中文分词1.6版

  2. friso是使用c语言开发的一个开源的中文分词器,使用流行的mmseg算法实现。完全基于模块化设计和实现,可以很方便的植入到其他程序中,例如:MySQL,PHP等。
  3. 所属分类:C

    • 发布日期:2014-06-11
    • 文件大小:2mb
    • 提供者:u013226064
  1. Jcseg开发帮助文档

  2. Jcseg开发帮助文档,jcseg是使用Java开发的一个开源中文分词器,使用流行的mmseg算法实现,并且提供了最高版本的lucene-4.x和最高版本solr-4.x的分词接口.
  3. 所属分类:Java

    • 发布日期:2014-06-18
    • 文件大小:338kb
    • 提供者:mengxinyu5490
  1. mmseg4j-1.9.1

  2. mmseg4j用Chih-Hao Tsai 的MMSeg算法实现的中文分词器,并实现lucene的analyzer和solr的TokenizerFactory以方便在Lucene和Solr中使用。 MMSeg 算法有两种分词方法:Simple和Complex,都是基于正向最大匹配。Complex加了四个规则过虑。官方说:词语的正确识别率达到了 98.41%。mmseg4j已经实现了这两种分词算法。
  3. 所属分类:Java

    • 发布日期:2014-07-04
    • 文件大小:2mb
    • 提供者:fala888888
  1. mmseg4j-1.8.5 .zip

  2. mmseg4j 用 Chih-Hao Tsai 的 MMSeg 算法(http://technology.chtsai.org/mmseg/ )实现的中文分词器,并实现 lucene 的 analyzer 和 solr 的TokenizerFactory 以方便在Lucene和Solr中使用。
  3. 所属分类:Java

    • 发布日期:2014-11-27
    • 文件大小:2mb
    • 提供者:zha_penfee
  1. MMSeg 算法分词

  2. 开源地址 https://github.com/chenlb/mmseg4j-core mmseg4j core 使用 Chih-Hao Tsai 的 MMSeg 算法(http://technology.chtsai.org/mmseg/ )实现的中文分词器。 MMSeg 算法有两种分词方法:Simple和Complex,都是基于正向最大匹配。Complex 加了四个规则过虑。官方说:词语的正确识别率达到了 98.41%。mmseg4j 已经实现了这两种分词算法。
  3. 所属分类:Java

    • 发布日期:2015-06-11
    • 文件大小:686kb
    • 提供者:bojie5744
  1. jcseg-1.9.7.zip

  2. Jcseg是基于mmseg算法的一个轻量级开源中文分词器,同时集成了关键字提取,关键短语提取,关键句子提取和文章自动摘要等功能,并且提供了最新版本的lucene, solr, elasticsearch的分词接口, Jcseg自带了一个 jcseg.properties文件用于快速配置而得到适合不同场合的分词应用,例如:最大匹配词长,是否开启中文人名识别,是否追加拼音,是否追加同义词等! PS:压缩包中含有jcseg-core-1.9.7.jar、jcseg-analyzer-1.9.7.ja
  3. 所属分类:Java

    • 发布日期:2015-12-17
    • 文件大小:804kb
    • 提供者:li277967151
  1. Coreseek LibMMSeg中文分词包 mmseg-3.2.14.tar

  2. LibMMSeg 是Coreseek.com为 Sphinx 全文搜索引擎设计的中文分词软件包,其在GPL协议下发行的中文分词法,采用Chih-Hao Tsai的MMSEG算法。
  3. 所属分类:互联网

    • 发布日期:2017-03-30
    • 文件大小:5mb
    • 提供者:cjq1126247054
  1. 中文分词算法技术分享PPT

  2. 本文档是技术分享的PPT,详解深入讲解了三种中文分词算法,包知ik、mmseg、hanlp。文档中还分析了ik的岐义消除规则相关代码,以及hanlp最短路径算法原理及代码实现。
  3. 所属分类:算法与数据结构

    • 发布日期:2017-07-27
    • 文件大小:364kb
    • 提供者:zhaojianting
  1. 分词器mmseg4j 1.9.0.jar

  2. mmseg4j用Chih-Hao Tsai 的MMSeg算法实现的中文分词器,并实现lucene的analyzer和solr的TokenizerFactory以方便在Lucene和Solr中使用。 MMSeg 算法有两种分词方法:Simple和Complex,都是基于正向最大匹配。Complex加了四个规则过虑。官方说:词语的正确识别率达到了 98.41%。mmseg4j已经实现了这两种分词算法。
  3. 所属分类:Java

    • 发布日期:2018-05-14
    • 文件大小:682kb
    • 提供者:qq1330178722
  1. jcseg分词需要的jar

  2. jcseg是使用Java开发的一个开源的中文分词器,使用流行的mmseg算法实现。是一款独立的分词组件,不是针对lucene而开发,但是提供了最新版本的lucene和solr分词接口。jcseg目前最高版本jcseg目前最高版本jcseg目前最高版本jcseg目前最高版本jcseg是使用Java开发的一个开源的中文分词器,使用流行的mmseg算法实现。
  3. 所属分类:Android

    • 发布日期:2018-06-25
    • 文件大小:124kb
    • 提供者:zhenzhengnu9282
  1. 分词所需要的jar文件

  2. jcseg是使用Java开发的一个开源的中文分词器,使用流行的mmseg算法实现。是一款独立的分词组件,不是针对lucene而开发,但是提供了最新版本的lucene和solr分词接口。
  3. 所属分类:Java

  1. jcseg-core-1.9.7.jar

  2. 基于mmseg算法的一个轻量级开源中文分词器: Jcseg-1.9.7: 1. 词库优化:增加新词,去掉一些无用词,部分词条词性优化。 2. 增加文章关键字提取:基于textRank算法。 3. 增加文章关键短语提取:基于textRank算法。 4. 增加文章关键句子/文章摘要提取:基于BM25+textRank算法。 5. 增加jcseg-server模块:嵌入jetty,提供了一个高性能的服务器,给关键字提取,关键短语提取,关键句子提取,文章摘要提取,中文分词都提供了restful api,
  3. 所属分类:Java

    • 发布日期:2018-09-12
    • 文件大小:217kb
    • 提供者:silver98
  1. jcseg,Jcseg 是基于 mmseg 算法的一个轻量级中文分词器,同时集成了关键字提取,关键短语提取,关键句子提取和文章自动摘要等功能,并且提供了一个基于 Jetty 的 web 服务器,方便各大语言直接 http 调用,同时提供了最

  2. Jcseg是基于 mmseg 算法的一个轻量级中文分词器,同时集成了关键字提取,关键短语提取,关键句子提取和文章自动摘要等功能,并且提供了一个基于 Jetty 的 web 服务器,方便各大语言直接 http 调用,同时提供了最新版本的 lucene, solr, elasticsearch 的分词接口!Jcseg自带了一个 jcseg.properties 文件用于快速配置而得到适合不同场合的分词应用,例如:最大匹配词长,是否开启中文人名识别,是否追加拼音,是否追加同义词等!
  3. 所属分类:其它

  1. jcseg:Jcseg是用Java开发的轻量级NLP框架。 提供基于MMSEG算法的CJK和英语细分,并基于TEXTRANK算法实现关键词提取,关键句提取,摘要提取。 Jcseg具有内置的http服务器和用于最新lucene,solr,el

  2. Jcseg是什么? Jcseg是基于mmseg算法的一个轻量级中文分词器,同时集成了关键字提取,关键在于提取,关键句提取和文章自动摘要等功能,并提供了一个基于Jetty的web服务器,方便各大语言直接Jcseg自带了一个jcseg.properties文件用于快速配置而得到适合不同场合的分词应用,例如:最大匹配词长,是否开启中文人名识别,是否追加拼音,是否追加名词等! Jcseg核心功能: 中文分词:mmseg算法+ Jcseg独创的优化算法,七种切分模式。 关键字提取:基于textRank算
  3. 所属分类:其它

  1. friso:高性能中文令牌生成器,基于ANSI C开发的MMSEG算法,同时支持GBK和UTF-8字符集。完全基于模块化实现,可以轻松嵌入其他程序中,例如:MySQL,PostgreSQL,PHP等-源码

  2. Friso是什么? Friso是使用c语言开发的一种开源的高级中文分词器,使用流行的mmseg算法实现。完全基于建模设计和实现,可以很方便的植入其他程序中,例如:MySQL,PHP,并提供无需修改即可在各种平台下编译使用,加载完20万的词条,内存占用稳定为14.5M。 Friso核心功能: 中文分词:mmseg算法+ Friso独创的优化算法,各种切分模式。 关键字提取:基于textRank算法。 关键语法提取:基于textRank算法。 关键句子提取:基于textRank算法。 Friso中
  3. 所属分类:其它

« 12 »