您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 改进的正向最大匹配分词算法

  2. 在正向最大匹配的基础上增加一个交集型歧义字段处理模块一次来提高分词效率
  3. 所属分类:其它

    • 发布日期:2010-12-09
    • 文件大小:131kb
    • 提供者:gray5201003
  1. 中文分词切分技术研究

  2. 本文分析了现有的基于词典的分词算法,在比较各种算法优缺点的基础上提出了将正向匹配算法与逆向匹配 算法所得到的结果集进行叠加,生成粗分结果集的新观点,再对生成的粗分结果集构造非负权有向图,最后应用最短路径算法求解有向图。通过Nutch实验验证,该算法较Nutch原始搜索系统提高了其汉语切分的准确性以及切分速度,同时部分解决了交集型歧义切分问题。
  3. 所属分类:网络基础

    • 发布日期:2012-04-17
    • 文件大小:179kb
    • 提供者:wsde002
  1. 毕业设计开题报告

  2. 国内对于中文分词技术已有较多的研究。在进来的研究中,计算机专家对于正向最大匹配算法的现状与缺陷进行了探讨,并对正向最大匹配算法提出了一系列的改进方案。有采用“长词优先”的的方法,并且使分出来的词的数量尽可能地少。也有使用优化双数组Trie树来提高收索速度。还有通过回溯的过程,结合互信息消除交集型歧义也尽可能地减少了歧义
  3. 所属分类:C/C++

    • 发布日期:2015-03-26
    • 文件大小:49kb
    • 提供者:liufang1994
  1. 基于词典和语素的交集型歧义消除模型

  2. 提出了一种消除中文分词中交集型歧义的模型。首先通过正向最大匹配法和逆向最大匹配法对中文文本信息进行分词,然后使用不单独成词语素表对分词结果进行分析对比消歧,得到符合汉语语境的结果。整个过程分为歧义识别、歧义分析、歧义消除三个阶段。实验结果表明,该模型可以有效降低由交集型歧义引起的中文文本切分错误率。
  3. 所属分类:其它

    • 发布日期:2020-10-17
    • 文件大小:223kb
    • 提供者:weixin_38712092