您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 搜狗最新文本分类语料库

  2. 搜狗最新文本分类语料库,对于研究中文分词的有帮助
  3. 所属分类:专业指导

    • 发布日期:2009-06-09
    • 文件大小:166kb
    • 提供者:yuanzhen84
  1. Yard中文分词系统V0.1.1版

  2. Yard中文分词系统采用改进了的正向最大匹配算法,利用双字哈希进行词典组织解决了中文分词中最长词带来的分词效率低下问题。 本次发布的版本为0.1.1版能对中文词组进行完美的切分同时利用词组的词频和词性解决了歧义划分的问题,但是对人名、地名、组织名、英文、数字等还不能进行很好的切分,在下一个版本中将解决这些问题。中文词典应用了搜狗实验室提供的互联网词库。纯java编写源码和词典在附件中可以下载。本软件为开源软件你可以进行任何修改以适应你的需求,如果你加入了新功能请发送一份副本给我,我们一同完善改
  3. 所属分类:其它

    • 发布日期:2009-06-16
    • 文件大小:1mb
    • 提供者:Soul_fly
  1. 中文分词词库 带词频 词性 将近30万

  2. 包含了三级地名、名胜、重要山川河流、一万左右的成语。由于一部分词来自搜狗互联网词库,有些词明显是拼写时常连着拼而不是词。
  3. 所属分类:专业指导

    • 发布日期:2011-02-25
    • 文件大小:7mb
    • 提供者:maxsource
  1. 中文分词词库整理.rar

  2. 30万 中文分词词库,42537条伪原创词库,dict.txt,fingerDic.txt,httpcws_dict.txt,out.txt,百度分词词库.txt,词库地址.txt,词库下载地址.txt,四十万汉语大词库.txt,四十万可用搜狗txt词库.txt,搜狗词库方法.txt,五笔词库.TXT 解压密码为:www.5eyi.com 想省资源分可以到http://www.5eyi.com/download-sphinx-chinese-word-lexicon-collected/下载
  3. 所属分类:其它

    • 发布日期:2011-09-05
    • 文件大小:6mb
    • 提供者:logken
  1. sougou分词词库

  2. sougou 分词词库下载 中文分词 最好用的分词词库
  3. 所属分类:C#

    • 发布日期:2011-12-30
    • 文件大小:888kb
    • 提供者:colin__
  1. 中文 分词 搜狗 词库

  2. 搜狗的词库,虽然时间老,但是还是不错的,分词开发可以参考一下
  3. 所属分类:其它

    • 发布日期:2012-04-12
    • 文件大小:1mb
    • 提供者:outiantaxi
  1. sogou-dic-utf8搜狗词库

  2. 搜狗中文词库 用于中文分词,是utf-8格式的,比较好用。
  3. 所属分类:其它

    • 发布日期:2012-10-30
    • 文件大小:828kb
    • 提供者:suiyi0721
  1. 中文分词包

  2. 采用MMseg算法实现的中文分词器,特色是是使用搜狗词库
  3. 所属分类:Java

    • 发布日期:2012-12-26
    • 文件大小:2mb
    • 提供者:lee_xiong
  1. 中文 分词 词库 整理

  2. 30万 中文分词词库,42537条伪原创词库,dict.txt,fingerDic.txt,httpcws_dict.txt,out.txt,百度分词词库.txt,词库地址.txt,词库下载地址.txt,四十万汉语大词库.txt,四十万可用搜狗txt词库.txt,搜狗词库方法.txt,五笔词库.TXT 解压密码为:www.5eyi.com
  3. 所属分类:其它

    • 发布日期:2013-07-03
    • 文件大小:6mb
    • 提供者:mwzit
  1. 搜狗实验室词典

  2. 词库比较全,可以用于基于机械分词的小型中文分词系统
  3. 所属分类:其它

    • 发布日期:2014-03-07
    • 文件大小:2mb
    • 提供者:itinchina
  1. sogou-dic-utf8 zip words.dic 搜狗词库

  2. 用于solr搜索 mmseg4j分词 搜狗词库 words.dic ------------------\jar\sogou-dic-utf8\data\words.dic
  3. 所属分类:Java

    • 发布日期:2014-06-13
    • 文件大小:888kb
    • 提供者:u013250327
  1. 28万词库,中文分词

  2. 多个词库的去重整理,28万超全词库,excel表整理完毕,留有词性分辨栏,可自行处理。 中文分词词库,42537条伪原创词库,dict.txt,fingerDic.txt,httpcws_dict.txt,out.txt,百度分词词库.txt,词库地址.txt,词库下载地址.txt,四十万汉语大词库.txt,四十万可用搜狗txt词库.txt,搜狗词库方法.txt,五笔词库.TXT
  3. 所属分类:互联网

    • 发布日期:2015-08-05
    • 文件大小:3mb
    • 提供者:icycho
  1. solr6.0中IK分词需要的资料

  2. solr6.0需要的IK分词资料,其中包括IK分词的jar和配置文件还有搜狗词库
  3. 所属分类:Java

    • 发布日期:2016-06-01
    • 文件大小:16mb
    • 提供者:linzhiqiang0316
  1. 搜狗分类词库(2016)

  2. 词库的各分类数据(已去重)来源于搜狗,考虑到各行各业需要的分词规则不同,故没有合并,需要的可以下载下来自行合并
  3. 所属分类:专业指导

    • 发布日期:2016-10-16
    • 文件大小:48mb
    • 提供者:enough520
  1. 搜狗分类词库(2016修正v1)

  2. 词库的各分类数据(修正上一版数据重复问题)来源于搜狗,考虑到各行各业需要的分词规则不同,故没有合并,需要的可以下载下来自行合并
  3. 所属分类:专业指导

    • 发布日期:2016-10-17
    • 文件大小:35mb
    • 提供者:enough520
  1. 最新中文分词词库整理

  2. 最新中文分词词库整理,中文分词,词库,四十万可用搜狗txt词库,30万 中文分词词库,百度分词词库,四十万汉语大词库
  3. 所属分类:PHP

    • 发布日期:2017-09-12
    • 文件大小:6mb
    • 提供者:huijucn
  1. 11款开放中文分词引擎测试数据

  2. benchmark 人工标注“标准答案” origin 标注原始数据 news 新闻数据 weibo 微博数据 auto_comments 汽车论坛数据 food_comments 餐饮点评数据 itp_cloud 语言云 jieba 结巴分词 pangu 盘古分词 paoding 庖丁解牛分词器 qcloud 腾讯文智 sina 新浪云 sogou 搜狗分词
  3. 所属分类:深度学习

    • 发布日期:2017-12-29
    • 文件大小:2mb
    • 提供者:xujin18
  1. 11款开放中文分词引擎测试数据

  2. 11款开放中文分词引擎测试数据 benchmark 人工标注“标准答案” origin 标注原始数据 news 新闻数据 weibo 微博数据 auto_comments 汽车论坛数据 food_comments 餐饮点评数据 itp_cloud 语言云 jieba 结巴分词 pangu 盘古分词 paoding 庖丁解牛分词器 qcloud 腾讯文智 sina 新浪云 sogou 搜狗分词
  3. 所属分类:机器学习

    • 发布日期:2018-04-12
    • 文件大小:2mb
    • 提供者:bleadge
  1. 搜狗分类词库(2018)

  2. 2016年上传过搜狗12个分类词库,两年没更新了,今天用程序重新跑了下数据获取到2018最新的数据,导出为txt格式,方便大家做分词用,我不生成词,我只是词的搬运工,版权归搜狗公司所有。
  3. 所属分类:专业指导

    • 发布日期:2018-09-01
    • 文件大小:37mb
    • 提供者:enough520
  1. 中文分词词库

  2. 中文分词词库、百度分词词库、词库地址、四十万汉语大词库、四十万可用搜狗txt词库、搜狗词库方法、五笔词库等词库。
  3. 所属分类:其它

    • 发布日期:2013-05-06
    • 文件大小:7mb
    • 提供者:zhangkun_w
« 12 3 4 »