您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 搜索引擎的分词列表Lucene-stopwords.rar

  2. 在开发apache的lucene框架的时候,如果你要编写自己的分析器的话,就要考虑到停止词的处理。
  3. 所属分类:Java

    • 发布日期:2009-10-10
    • 文件大小:3072
    • 提供者:xuchengfeifei
  1. 使用IK Analyzer实现中文分词之Java实现(包含所有工具包)

  2. 1、lucene-core-3.6.0.jar 2、IKAnalyzer2012.jar(主jar包) 3、IKAnalyzer.cfg.xml(分词器扩展配置文件) 4、stopword.dic(停止词典) 5、IkSegmentation.java(样例类)
  3. 所属分类:Java

    • 发布日期:2015-03-30
    • 文件大小:3145728
    • 提供者:luozhipeng2011
  1. 使用IK Analyzer实现中文分词之Java实现

  2. 1、lucene-core-3.6.0.jar 2、IKAnalyzer2012.jar(主jar包) 3、IKAnalyzer.cfg.xml(分词器扩展配置文件) 4、stopword.dic(停止词典) 5.IkSegmentation.java(示例代码)
  3. 所属分类:Java

    • 发布日期:2015-03-30
    • 文件大小:3145728
    • 提供者:luozhipeng2011
  1. tfidf特征提取

  2. 代码对10个txt文件进行分词、去除停止词,并提取每个词的tfidf特征值输出
  3. 所属分类:Java

    • 发布日期:2015-10-22
    • 文件大小:1048576
    • 提供者:u014675586
  1. Lucene.Net+盘古分词Demo

  2. Lucene.Net+盘古分词是一个常见的中文信息检索组合。但是随着盘古分词停止更新,与Lucene.Net3.0无法兼容。为了使得大家少走弯路,本人利用Lucene.Net2.9+盘古分词2.3搭建了一个Demo
  3. 所属分类:C#

    • 发布日期:2016-11-13
    • 文件大小:18874368
    • 提供者:fps189
  1. IKAnalyzer分词器jar包,支持同义词、扩展词和停止词

  2. 自己打包并经过测试的,IKAnalyzerSolrFactory这个类是jdk1.6编辑的,需要高版本的可自己改。同义词可在core的conf里面单独配置,扩展词和停止词在应用的WEB-INF下classes里面配置。
  3. 所属分类:Java

    • 发布日期:2017-04-14
    • 文件大小:1048576
    • 提供者:redshose
  1. 常用中文停用词

  2. 常用的中文停用词,停止词,stopword
  3. 所属分类:Python

    • 发布日期:2017-05-08
    • 文件大小:20480
    • 提供者:suibianshen2012
  1. chineseStopWords.txt

  2. 在中文网站里面其实也存在大量的stop word。比如,我们前面这句话,“在”、“里面”、“也”、“的”、“它”、“为”这些词都是停止词。这些词因为使用频率过高,几乎每个网页上都存在,所以搜索引擎开发人员都将这一类词语全部忽略掉。
  3. 所属分类:Python

    • 发布日期:2017-08-20
    • 文件大小:3072
    • 提供者:longai1567
  1. 屏幕取词 win98 xp

  2. 屏幕取词 使用 nhw32.dll 主要引出两个函数: 1. DWORD WINAPI BL_SetFlag32(UINT nFlag, HWND hNotifyWnd, int MouseX, int MouseY) 功能: 启动或停止取词。 参数: nFlag [输入] 指定下列值之一: GETWORD_ENABLE: 开始取词。在重画被取单词区域前设置此标志。nhw32.dll是通过 重画单词区域,截取TextOutA, TextOutW, ExtTextOutA, ExtTextOut
  3. 所属分类:其它

    • 发布日期:2008-12-12
    • 文件大小:137216
    • 提供者:fengkuangfj
  1. IKanalyzer约2000个常用停止词库

  2. 近期整理的IKAnalyzer中文停用词列表,大约有2000多个词,希望可以帮到大家,下载希望给个好评,谢谢
  3. 所属分类:Java

    • 发布日期:2018-07-25
    • 文件大小:6144
    • 提供者:tomakemyself
  1. 停止词 stopwords

  2. 写豆瓣评论爬虫用的停止词,基本上与网上大部分资源相近。
  3. 所属分类:Python

    • 发布日期:2018-01-28
    • 文件大小:20480
    • 提供者:qq_38597315
  1. 中文分词器工具包下载(配置+Jar包)

  2. IK配置+两个Jar包,实现与Solr 7.2.1版本的对接,对中文语句进行分词处理,可自行扩展词库字段ext.dict以及停止词字典dict
  3. 所属分类:Web开发

    • 发布日期:2018-02-06
    • 文件大小:1048576
    • 提供者:appleyk
  1. sphinx coreseek停止词

  2. sphinx coreseek 停止词 常用一些的停用词,避免大数据索引
  3. 所属分类:其它

    • 发布日期:2018-02-13
    • 文件大小:16384
    • 提供者:zhy38191
  1. 分词中文停止词词典

  2. 分词 中文 停止词 词典 分词 中文 停止词 词典 分词 中文 停止词 词典 分词 中文 停止词 词典
  3. 所属分类:机器学习

    • 发布日期:2018-02-25
    • 文件大小:13312
    • 提供者:q97012791
  1. 中文 停止词 stopwords

  2. 中文 停止词 stopwords 中文 停止词 stopwords 中文 停止词 stopwords
  3. 所属分类:其它

    • 发布日期:2018-02-28
    • 文件大小:15360
    • 提供者:anyao112233
  1. 中文停止词库

  2. 特整理中文停止词如下,方便开发。中文文本分词中先参考了官方给出的示例,官方给出的示例主要是对一条文本进行全分词和精确分词。
  3. 所属分类:Python

    • 发布日期:2018-12-25
    • 文件大小:15360
    • 提供者:qq_22821275
  1. 自然语言处理常用的停止词

  2. 自然语言处理常用的停止词
  3. 所属分类:深度学习

    • 发布日期:2019-04-12
    • 文件大小:21504
    • 提供者:lizibaopeng
  1. 搜索引擎无用词 停用词 stopWord.xlsx

  2. 搜索引擎开发中有一类词叫停止词,是由英文单词:stopword翻译过来的,原来在英语里面会遇到很多a,the,or等使用频率很多的字或词,常为冠词、介词、副词或连词等。如果搜索引擎要将这些词都索引的话,那么几乎每个网站都会被索引,也就是说工作量巨大。可以毫不夸张的说句,只要是个英文网站都会用到a或者是the。那么这些英文的词跟我们中文有什么关系呢? 在中文网站里面其实也存在大量的stopword,我们称它为停止词。比如,我们前面这句话,“在”、“里面”、“也”、“的”、“它”、“为”这些词都是停
  3. 所属分类:其它

    • 发布日期:2020-02-13
    • 文件大小:25600
    • 提供者:qq_16454809
  1. 中文停止词列表

  2. 中文停止词列表,包含常用的停止词。编码为UTF-8
  3. 所属分类:教育

    • 发布日期:2013-07-01
    • 文件大小:10240
    • 提供者:jameshaper
  1. C#分词公共类完整版

  2. C#分词技术公共的api类,C#分词公共类完整版:数据缓存函数,读取文本,写入文本,载入词典,判断字符串是否在制定字符数组中,检测中文字符,格式化字符串,得到分词结果,移除停止词等等方法
  3. 所属分类:C#

    • 发布日期:2020-10-09
    • 文件大小:16384
    • 提供者:oPinBoFenDou
« 12 3 4 5 6 7 »