您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. Yard中文分词系统V0.1.1版

  2. Yard中文分词系统采用改进了的正向最大匹配算法,利用双字哈希进行词典组织解决了中文分词中最长词带来的分词效率低下问题。 本次发布的版本为0.1.1版能对中文词组进行完美的切分同时利用词组的词频和词性解决了歧义划分的问题,但是对人名、地名、组织名、英文、数字等还不能进行很好的切分,在下一个版本中将解决这些问题。中文词典应用了搜狗实验室提供的互联网词库。纯java编写源码和词典在附件中可以下载。本软件为开源软件你可以进行任何修改以适应你的需求,如果你加入了新功能请发送一份副本给我,我们一同完善改
  3. 所属分类:其它

    • 发布日期:2009-06-16
    • 文件大小:1048576
    • 提供者:Soul_fly
  1. 文本分类之词频统计(分词、词干提取、去停用词、计算词频,有界面)

  2. 主要是读取文本,然后进行分词、词干提取、去停用词、计算词频,有界面,很实用
  3. 所属分类:专业指导

    • 发布日期:2010-05-12
    • 文件大小:72704
    • 提供者:xiangxiangqin
  1. seo优化工具-中文分词工具

  2. seo优化工具-中文分词工具,有利于seo优化,检查seo是否合理。
  3. 所属分类:Java

    • 发布日期:2010-05-16
    • 文件大小:984064
    • 提供者:wangguofei9527
  1. 灵柩软件 可用于汉语分词处理

  2. LJParser文本搜索与挖掘开发平台的十大功能: 1. 全文精准检索 支持文本、数字、日期、字符串等各种数据类型,多字段的高效搜索,支持AND/OR/NOT以及NEAR邻近等查询语法,支持维语、藏语、蒙语、阿拉伯、韩语等多种少数民族语言的检索。可以无缝地与现有文本处理系统与数据库系统融合。 2. 新词发现: 从文件集合中挖掘出内涵的新词语列表,可以用于用户专业词典的编撰;还可以进一步编辑标注,导入分词词典中,从而提高分词系统的准确度,并适应新的语言变化。 3. 分词标注: 对原始语料进行分词
  3. 所属分类:Web开发

    • 发布日期:2010-11-05
    • 文件大小:688128
    • 提供者:zhangguoqiang52
  1. 飞达鲁长尾词查询2.4

  2. 在1.2的基础上做了比较大的调整。所以称为2.0了。 主要是根据网友建议作出了以下新功能: 1、自动保存查询结果。此功能大概是有的网友需要在查询的同时使用其他采集工具或者什么来使用这些长尾词。所以我加了它。方便有这方便需求的朋友。可以设置自动保存的间隔时间、自动保存到哪里! 2、多词查询。此功能我想还是很有必要的,比如:瘦身、减肥,他们都是代表一个意思,那么2个词一起查是不是更能查到相关的长尾词呢? 3、鼠标右键直接到搜索长尾词。此功能作用说大也不大,但是加上以后网友可以直接就去搜索了。很是方
  3. 所属分类:专业指导

    • 发布日期:2010-11-11
    • 文件大小:1048576
    • 提供者:zzzsx5903
  1. 基于C#的分词系统,还能去标点和单字词

  2. C#,分词.基于C#的分词系统,还能去标点和单字词
  3. 所属分类:C#

    • 发布日期:2011-02-28
    • 文件大小:5242880
    • 提供者:cxmcxt123
  1. 基于lucene的去词、禁词、搜索等操作

  2. 里面有lucene的一般核心操作,包括代码,说明等
  3. 所属分类:Java

    • 发布日期:2011-06-12
    • 文件大小:25165824
    • 提供者:liweiminlilin
  1. 英文文本词根还原+去停用词小工具

  2. 英文文本词根还原+去停用词小工具,非常好用
  3. 所属分类:其它

    • 发布日期:2011-10-11
    • 文件大小:7340032
    • 提供者:ssq19841015
  1. 汉语文本自动分词算法

  2. 最牛的分词算法,可直接应用 :分析了中文分词词典的机制,提出了一种改进的整词分词字典结构,并针对机械分词算法的特点,将其与概率算法相结 合,探讨了一种中文自动分词概率算法。采用哈希及二分法对词典进行分词匹配。实验表明,该算法具有较高的分词效率和准确 率,对于消去歧义词也有较好的性能。
  3. 所属分类:其它

    • 发布日期:2012-03-30
    • 文件大小:293888
    • 提供者:zmzbs123
  1. 正向最大匹配算法(根据给定的词去匹配)

  2. 基于词典的正向最大匹配中文分词算法,能实现中英文数字混合分词。比如能分出这样的词:bb霜、3室、乐phone、touch4、mp3、T恤 第一次写中文分词程序,欢迎拍砖。
  3. 所属分类:C++

    • 发布日期:2012-05-05
    • 文件大小:384000
    • 提供者:xzwweiyi
  1. 停用词集合

  2. 常用的停用词 用于数据挖掘时滤去停用词 从而能更准确的计算词频
  3. 所属分类:其它

    • 发布日期:2012-09-17
    • 文件大小:1024
    • 提供者:suyuan6634
  1. 搜狗最新词库(已经去重)

  2. 词库包括200W左右的最新词,把这个词库作为搜索引擎分词的标准。
  3. 所属分类:Java

    • 发布日期:2013-05-20
    • 文件大小:28311552
    • 提供者:rtghbnm
  1. c语言代码,去停用词

  2. 这个主要是应用在搜索引擎,搜索的时候一般略过停用词,这个程序实现的就是根据停用词表滤除文档中的停用词
  3. 所属分类:C/C++

    • 发布日期:2013-06-12
    • 文件大小:1024
    • 提供者:u011046520
  1. IKAnalyzer中文分词包

  2. 我在博客中使用的中文分词包,大家也可以去官网上取下
  3. 所属分类:Android

    • 发布日期:2013-07-08
    • 文件大小:4194304
    • 提供者:u010370871
  1. c# 分词替换过滤

  2. 对句子进行分词 用每个词去匹配预先定义好的词库 采用树形结构一个单词一个单词的去匹配词句 每个单词找到的词 用来去替换句子中的先有词
  3. 所属分类:C#

    • 发布日期:2013-07-24
    • 文件大小:134144
    • 提供者:gfgdfgsdfgsg
  1. pscws23-20081221.tar.bz2【中文分词】

  2. php中文分词 ===== PSCWS23 - 说明文档 ===== $Id: readme.txt,v 1.3 2008/12/21 04:37:59 hightman Exp $ [ 关于 PSCWS23 ] PSCWS23 是由 hightman 于 2006 年开发的纯 PHP 代码实现的简易中文分词系统第二和第三版的简称。 PSCWS 是英文 PHP Simple Chinese Words Segmentation 的头字母缩写,它是 SCWS 项目的前身。 现 SCWS 已作为
  3. 所属分类:PHP

    • 发布日期:2013-09-08
    • 文件大小:2097152
    • 提供者:yao__shun__yu
  1. 中文 分词 -- 同义词大全整理

  2. 同义词的处理方法: 作者Attilax 艾龙, EMAIL:1466519819@qq.com 来源:attilax的专栏 地址:http://blog.csdn.net/attilax 去重复 去反意词 合并多词条 a,b>>> a,b,c,d,... tonitsi1_deduli_deFei.txt 14797条词条 tonitsi1_deduli_deFei_join.txt 大概6734条词条 参考: │ 0两万同义词大全.txt │ 1伪原创同义词库(13000条
  3. 所属分类:其它

    • 发布日期:2013-11-25
    • 文件大小:95232
    • 提供者:attilax
  1. java lucene 实现分词和词干抽取

  2. 用java实现的,利用了lucene里面的standardAnalyzer分析器实现的分词,可以去停用词,再利用波特算法实现 词干提取 最后排序 和词频统计输出
  3. 所属分类:Java

    • 发布日期:2014-03-14
    • 文件大小:3072
    • 提供者:u010204922
  1. 酷q词库加强版

  2. 这是一个可以加强酷q词库的,省了您耗费精力去设计酷q的词库,里面内容多多哦。
  3. 所属分类:管理软件

    • 发布日期:2014-06-17
    • 文件大小:967680
    • 提供者:qq_16598881
  1. 海峰五笔词库

  2. 海峰五笔词库 共27060条词条 常用词组 需要的童鞋可以去下载
  3. 所属分类:其它

    • 发布日期:2014-07-03
    • 文件大小:429056
    • 提供者:qq_17199377
« 12 3 4 5 6 7 8 9 10 ... 37 »