您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. MM2中文分词软件,可添加新词到词库中

  2. 中文分词软件,可以添加新词,适合初学者研究。
  3. 所属分类:专业指导

    • 发布日期:2009-06-14
    • 文件大小:2097152
    • 提供者:orangelv
  1. Yard中文分词系统V0.1.1版

  2. Yard中文分词系统采用改进了的正向最大匹配算法,利用双字哈希进行词典组织解决了中文分词中最长词带来的分词效率低下问题。 本次发布的版本为0.1.1版能对中文词组进行完美的切分同时利用词组的词频和词性解决了歧义划分的问题,但是对人名、地名、组织名、英文、数字等还不能进行很好的切分,在下一个版本中将解决这些问题。中文词典应用了搜狗实验室提供的互联网词库。纯java编写源码和词典在附件中可以下载。本软件为开源软件你可以进行任何修改以适应你的需求,如果你加入了新功能请发送一份副本给我,我们一同完善改
  3. 所属分类:其它

    • 发布日期:2009-06-16
    • 文件大小:1048576
    • 提供者:Soul_fly
  1. 中文分词软件,支持自动标引

  2. 这是一个好用的中文分词软件。。。。。。。 支持自动标引,自动分词。。。。。。。。 支持全文检索。。。。。 还有统计功能
  3. 所属分类:专业指导

    • 发布日期:2009-09-20
    • 文件大小:7340032
    • 提供者:panyunlai
  1. 刨丁解羊中文分词器-主要用于对网络蜘蛛或网络爬虫抓取的网页进行分词

  2. 刨丁解羊中文分词器,主要用于对网络蜘蛛或网络爬虫抓取的网页进行分词,支持繁体中文分词、简体中文分词、英文分词,是制作通用搜索引擎和垂直搜索引擎的核心组件。该软件在普通PC机器上测试显示:TXT格式正文分词速度约为3000万字/分钟,网页分词速度约为277.8个网页/秒。该软件采用基础词库(63万词语)+扩展词库(用户可手工添加新词)。DLL及OCX调用请联系QQ(601069289)。
  3. 所属分类:网络基础

    • 发布日期:2010-08-30
    • 文件大小:2097152
    • 提供者:henggua
  1. ictclass中文分词软件

  2. ictclass中文分词软件,基于Java的,是在官网上下载的,还不错。
  3. 所属分类:Java

    • 发布日期:2011-04-24
    • 文件大小:2097152
    • 提供者:shimingshu
  1. 中文分词软件及c++代码

  2. 由东北大学信息语言中心开发的中文分词软件
  3. 所属分类:其它

    • 发布日期:2011-07-14
    • 文件大小:595968
    • 提供者:xiaozhouzi911
  1. 中文分词用的词典文件

  2. 花了几天从各大名牌分词软件中提出的中文词组,已经对词组进行了整理和排序,保存成了三个txt文件,精简:74248个词组、常用:118021个词组、全部:222685个词组、常用标点符号文件共四个文件。
  3. 所属分类:Delphi

    • 发布日期:2011-09-02
    • 文件大小:1048576
    • 提供者:i8013
  1. 3GWS-Demo中文分词

  2. 很好用的一个中文分词软件。包括词库,智能分词。
  3. 所属分类:C

    • 发布日期:2011-11-09
    • 文件大小:3145728
    • 提供者:niubenaniu
  1. 中文分词软件

  2. 中文分词算法软件
  3. 所属分类:JavaME

    • 发布日期:2012-10-23
    • 文件大小:1048576
    • 提供者:lishengang_jju
  1. 中文分词-哈工大软件学院中文信息处理刘秉权

  2. 中文分词 哈工大 软件学院 中文中文信息处理 java
  3. 所属分类:Java

    • 发布日期:2012-11-17
    • 文件大小:3145728
    • 提供者:sunchuanleihit
  1. 中文分词系统

  2. 基于vc++ 的中文分词软件。 使用正向最大匹配算法和逆向最大匹配算法,加深对自然语言学习理解
  3. 所属分类:C++

    • 发布日期:2012-12-16
    • 文件大小:6291456
    • 提供者:comefar
  1. 正向最大匹配中文分词算法

  2. 中文分词一直都是中文自然语言处理领域的基础研究。目前,网络上流行的很多中文分词软件都可以在付出较少的代价的同时,具备较高的正确率。而且不少中文分词软件支持Lucene扩展。但不管实现如何,目前而言的分词系统绝大多数都是基于中文词典的匹配算法。其中最为常见的是最大匹配算法 (Maximum Matching,以下简称MM算法) 。MM算法有三种:一种正向最大匹配,一种逆向最大匹配和双向匹配。本程序实现了正向最大匹配算法。
  3. 所属分类:C++

    • 发布日期:2013-02-26
    • 文件大小:3145728
    • 提供者:lewsn2008
  1. 最新版ICTCLAS中文分词软件——2014版本

  2. 中科院最新版中文分词软件。 2014版,各种材料齐全,包含代码、文档等等;希望大家爱用。 以备不时之需。
  3. 所属分类:其它

    • 发布日期:2014-04-17
    • 文件大小:52428800
    • 提供者:peterlee1983
  1. Python中文分词_中文分词软件

  2. Python中文分词_中文分词软件,使用jieba字典
  3. 所属分类:Python

    • 发布日期:2014-11-14
    • 文件大小:628
    • 提供者:liulei9585
  1. 中文分词软件ICTCLAS2015

  2. 最新版的中文分词软件,兼容c#,c++,java,安卓
  3. 所属分类:其它

    • 发布日期:2015-06-25
    • 文件大小:46137344
    • 提供者:u014513521
  1. IKAnalyzer2012中文分词包

  2. 强大的中文分词软件工具,每秒百万分词量,支持Lucene4
  3. 所属分类:Java

    • 发布日期:2016-04-15
    • 文件大小:2097152
    • 提供者:baidu_26239887
  1. Coreseek LibMMSeg中文分词包 mmseg-3.2.14.tar

  2. LibMMSeg 是Coreseek.com为 Sphinx 全文搜索引擎设计的中文分词软件包,其在GPL协议下发行的中文分词法,采用Chih-Hao Tsai的MMSEG算法。
  3. 所属分类:互联网

    • 发布日期:2017-03-30
    • 文件大小:5242880
    • 提供者:cjq1126247054
  1. 正向最大匹配中文分词算法

  2. 中文分词一直都是中文自然语言处理领域的基础研究。目前,网络上流行的很多中文分词软件都可以在付出较少的代价的同时,具备较高的正确率。而且不少中文分词软件支持Lucene扩展。但不管实现如何,目前而言的分词系统绝大多数都是基于中文词典的匹配算法。其中最为常见的是最大匹配算法 (Maximum Matching,以下简称MM算法) 。MM算法有三种:一种正向最大匹配,一种逆向最大匹配和双向匹配。本程序实现了正向最大匹配算法。
  3. 所属分类:C++

    • 发布日期:2020-12-17
    • 文件大小:3145728
    • 提供者:jos_king
  1. 正向最大匹配中文分词算法

  2. 中文分词一直都是中文自然语言处理领域的基础研究。目前,网络上流行的很多中文分词软件都可以在付出较少的代价的同时,具备较高的正确率。而且不少中文分词软件支持Lucene扩展。但不管实现如何,目前而言的分词系统绝大多数都是基于中文词典的匹配算法。其中最为常见的是最大匹配算法 (Maximum Matching,以下简称MM算法) 。MM算法有三种:一种正向最大匹配,一种逆向最大匹配和双向匹配。本程序实现了正向最大匹配算法。
  3. 所属分类:C++

    • 发布日期:2021-02-22
    • 文件大小:3145728
    • 提供者:Miwentian
  1. 麻将:开源中文分词工具包,中文分词Web API,Lucene中文分词,中英文混合分词-源码

  2. 麻将中文分词 简介 麻将一直是广受欢迎的传统娱乐活动,字牌的组合千变万化。汉字的组合也是变化多端,麻将这个项目希望能从汉字组合中发现汉语的秘密,为自然语言处理提供好的中文分词工具。 麻将是基于Scala的语言实现的中文分词软件包。这个项目的核心是最大概率分词,整个项目专为搜索引擎,文本信息抽取和自然语言处理设计,参考我来实现。性能优异,速度快。整个分词包易于使用,测试覆盖率高。 在线展示 :链接 ,您可以自己测试它的功能。有任何问题,可以发邮件至: 。 分词歧义解决方案 分词的方法有很多,现
  3. 所属分类:其它

    • 发布日期:2021-02-05
    • 文件大小:14680064
    • 提供者:weixin_42097533
« 12 3 4 5 6 7 8 9 10 »