您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 中科院ICTCLAS分词源代码

  2. 这是中科院的ICTCLAS的中文分词算法的源代码,可以实现中文分词,词性标注等功能。绝对好用!
  3. 所属分类:C++

    • 发布日期:2012-03-01
    • 文件大小:17825792
    • 提供者:yxj6073
  1. 中科院分词器ICTCLAS

  2. 中科院语义分词 ICTCLAS 中科院官方于2009年2月19日发布了中科院中文分词器ICTCLAS2009版,转引官方介绍说明,新版本的中文分词系统在原有的基础上主要完善的有: 1、用户词典接口扩展 用户可以动态增加、删除用户词典中的词,调节分词的效果。提高了用户词典使用的灵活性。 2、分词粒度可调 可以控制分词结果的粒度。共享版本提供两种分词粒度,标准粒度和粗粒度,满足不同用户的需求。 3、词性标注功能加强 多种标注级的选择,系统可供选择的标注级有:计算所一级标注级,计算所二级标注集,北大
  3. 所属分类:Web开发

    • 发布日期:2012-03-08
    • 文件大小:2097152
    • 提供者:abing79
  1. IKAnalyzer中文分词器V2012使用手册

  2. 采用了特有的“正向迭代最细粒度切分算法“,具有60万字/秒的高速处理能力。 采用了多子处理器分析模式,支持:英文字母(IP地址、Email、URL)、数字(日期,常用中文数量词,罗马数字,科学计数法),中文词汇(姓名、地名处理)等分词处理。 优化的词典存储,更小的内存占用。支持用户词典扩展定义 针对Lucene全文检索优化的查询分析器IKQueryParser(作者吐血推荐);采用歧义分析算法优化查询关键字的搜索排列组合,能极大的提高Lucene检索的命中率。
  3. 所属分类:Java

    • 发布日期:2012-03-13
    • 文件大小:847872
    • 提供者:mailjava
  1. 汉语文本自动分词算法

  2. 最牛的分词算法,可直接应用 :分析了中文分词词典的机制,提出了一种改进的整词分词字典结构,并针对机械分词算法的特点,将其与概率算法相结 合,探讨了一种中文自动分词概率算法。采用哈希及二分法对词典进行分词匹配。实验表明,该算法具有较高的分词效率和准确 率,对于消去歧义词也有较好的性能。
  3. 所属分类:其它

    • 发布日期:2012-03-30
    • 文件大小:293888
    • 提供者:zmzbs123
  1. 中文 分词 搜狗 词库

  2. 搜狗的词库,虽然时间老,但是还是不错的,分词开发可以参考一下
  3. 所属分类:其它

    • 发布日期:2012-04-12
    • 文件大小:1048576
    • 提供者:outiantaxi
  1. 中文分词切分技术研究

  2. 本文分析了现有的基于词典的分词算法,在比较各种算法优缺点的基础上提出了将正向匹配算法与逆向匹配 算法所得到的结果集进行叠加,生成粗分结果集的新观点,再对生成的粗分结果集构造非负权有向图,最后应用最短路径算法求解有向图。通过Nutch实验验证,该算法较Nutch原始搜索系统提高了其汉语切分的准确性以及切分速度,同时部分解决了交集型歧义切分问题。
  3. 所属分类:网络基础

    • 发布日期:2012-04-17
    • 文件大小:183296
    • 提供者:wsde002
  1. 《信息处理用现代汉语分词规范》

  2. 《信息处理用现代汉语分词规范》:研究分词或者自然语言处理的必备啊。
  3. 所属分类:其它

    • 发布日期:2012-04-23
    • 文件大小:51200
    • 提供者:zhouliweihao
  1. 收集的一个智能分词工具

  2. 收集的一个智能分词工具,该工具很适合做文本识别、搜索
  3. 所属分类:C#

    • 发布日期:2012-05-06
    • 文件大小:2097152
    • 提供者:hmy1106
  1. 中文分词最大正向匹配

  2. 简单的最大正向匹配分词方法,用c++开发而成,自己可以手动的添加词典资源
  3. 所属分类:C++

    • 发布日期:2012-05-09
    • 文件大小:1048576
    • 提供者:zhuangzhuangnie
  1. 基于理解的汉语分词系统的设计与实现

  2. 硕士论文,基于理解的汉语分词系统的设计与实现
  3. 所属分类:其它

    • 发布日期:2012-05-13
    • 文件大小:1048576
    • 提供者:xiaobingsss
  1. 中文搜索引擎技术

  2. 内含:中文搜索引擎技术揭密:系统架构.doc中文搜索引擎技术揭密:网络蜘蛛.doc中文搜索引擎技术揭密:排序技术.doc中文搜索引擎技术揭密:中文分词.doc
  3. 所属分类:网络基础

    • 发布日期:2008-06-30
    • 文件大小:346112
    • 提供者:ahunspun
  1. 中文分词软件

  2. 包含分词、词性分析、句法分析功能的小软件
  3. 所属分类:C/C++

    • 发布日期:2012-05-19
    • 文件大小:3145728
    • 提供者:luobochaofan
  1. 分词组件V2.3.1源码

  2. 分词组件V2.3.1源码 程序介绍: 盘古分词是一个中英文分词组件。作者eaglet 曾经开发过KTDictSeg 中文分词组件,拥有大量用户来自51ASPX。 作者基于之前分词组件的开发经验,结合最新的开发技术重新编写了盘古分词组件。 中文分词功能 中文未登录词识别 盘古分词可以对一些不在字典中的未登录词自动识别 词频优先 盘古分词可以根据词频来解决分词的歧义问题 多元分词 盘古分词提供多重输出解决分词粒度和分词精度权衡的问题 中文人名识别 输入: “张三说的确实在理” 分词结果:张三/说/
  3. 所属分类:C#

    • 发布日期:2012-05-23
    • 文件大小:6291456
    • 提供者:ss_geng
  1. ICTCLAS中文分词论文收集

  2. 基于N-最短路径方法的中文词语粗分模型 基于多层隐马模型的汉语词法分析研究 基于角色标注的中国人名自动识别研究 基于角色标注的中文机构名识别
  3. 所属分类:其它

    • 发布日期:2012-08-08
    • 文件大小:4194304
    • 提供者:chengyunlu
  1. 基于N最短路径方法与中国人名 识别的中文分词系统

  2. 采取基于N-最短路径方法的中文词语粗分模型对中文文本进行粗切分,采取Viterbi算法对切分结果进行角色标注,在角色序列的基础上,进行模式最大匹配,最终实现中国人名的识别
  3. 所属分类:专业指导

    • 发布日期:2012-09-25
    • 文件大小:353280
    • 提供者:danisein
  1. 中文信息处理基础-詹卫东

  2. 中文分词的整套资源,中文信息处理基础、字符串分析、字频分析、最大匹配法、正逆向、等等,最全最齐的资源,还带有课件
  3. 所属分类:C++

    • 发布日期:2012-10-06
    • 文件大小:20971520
    • 提供者:princes_fan
  1. fenciserver(C语言中文分词服务)

  2. C语言分词服务 fenciserver 简易版本
  3. 所属分类:C/C++

    • 发布日期:2012-10-07
    • 文件大小:1048576
    • 提供者:zuccstu
  1. sogou-dic-utf8搜狗词库

  2. 搜狗中文词库 用于中文分词,是utf-8格式的,比较好用。
  3. 所属分类:其它

    • 发布日期:2012-10-30
    • 文件大小:847872
    • 提供者:suiyi0721
  1. ICTCLAS f分词工具

  2. 中科院 北大 实现的 一级二级分词算法简单方便 只是感觉词源不够丰富 但是幸运的是可以自己添加新词啊
  3. 所属分类:其它

    • 发布日期:2012-11-15
    • 文件大小:8388608
    • 提供者:joy516688
  1. 中文分词系统

  2. 本分词系统采用组合哈希算法,分词速度快
  3. 所属分类:其它

    • 发布日期:2008-08-03
    • 文件大小:2097152
    • 提供者:wd_gz
« 1 2 ... 40 41 42 43 44 4546 47 48 49 50 »