搜索资源 - 分词中文分词 - 点数信息

点数信息

注册会员 | 设为首页 | 加入收藏夹

您好，欢迎光临本网站！[请登录] ！[注册会员]！

热门搜索： 源码 Android 整站插件识别 p2p 游戏算法更多...

在线客服QQ:632832888

当前位置：

搜索资源 - 分词中文分词

下载资源分类

移动开发

开发技术

课程资源

网络技术

操作系统

安全技术

数据库

行业

服务器应用

存储

信息化

考试认证

云计算

大数据

跨平台

音视频

游戏开发

人工智能

区块链

资源分类

搜索资源列表

中文分词PPT
中文分词 ppt 牛*
所属分类：Java
- 发布日期：2007-08-06
- 文件大小：513kb
- 提供者：dashgo

idf词频统计小巧中文分词词库
idf词频统计小巧中文分词词库 idf词频统计小巧中文分词词库
所属分类：专业指导
- 发布日期：2009-05-31
- 文件大小：772kb
- 提供者：leo1314lll

php 中文分词程序
包含中文分词程序与中文分词库配置方法请看官方网站
所属分类：PHP
- 发布日期：2009-06-24
- 文件大小：3mb
- 提供者：tangdayun

中文分词包ictclas4j
中文分词包ictclas4j 中文分词包ictclas4j
所属分类：Java
- 发布日期：2009-06-24
- 文件大小：2mb
- 提供者：buaacjl

中文分词庖丁解牛 2_0_0版本发布 - 企业应用
中文分词庖丁解牛 2_0_0版本发布 - 企业应用中文分词庖丁解牛 2_0_0版本发布 - 企业应用
所属分类：Java
- 发布日期：2009-07-19
- 文件大小：108kb
- 提供者：ruanpanliang

引入局部统计识别高频词汇的Lucene中文分词程序src.rar
引入局部统计识别高频词汇的Lucene中文分词程序src.rar
所属分类：专业指导
- 发布日期：2009-07-29
- 文件大小：32kb
- 提供者：luanmad

引入局部统计识别高频词汇的Lucene中文分词程序STUSegmentConfig.rar
引入局部统计识别高频词汇的Lucene中文分词程序STUSegmentConfig.rar
所属分类：专业指导
- 发布日期：2009-07-29
- 文件大小：754byte
- 提供者：luanmad

Lucene关于几种中文分词的总结.doc
Lucene关于几种中文分词的总结.doc Lucene关于几种中文分词的总结.doc Lucene关于几种中文分词的总结.doc
所属分类：Java
- 发布日期：2009-08-25
- 文件大小：36kb
- 提供者：hbyufan

中文分词组件。1.5版的分词器
je分词器。1.5版的，对以前的有很大的改进，当我1.4的时候，发现连“好人”这个词都分析不出来，所以特上传1.5版
所属分类：专业指导
- 发布日期：2009-08-25
- 文件大小：871kb
- 提供者：lsyaxue

IKAnalyzer中文分词器V3.1.1使用手册
IKAnalyzer中文分词器V3.1.1使用手册 IKAnalyzer中文分词器V3.1.1使用手册
所属分类：Java
- 发布日期：2009-11-05
- 文件大小：487kb
- 提供者：jimmylin

中文分词论文.rar
中文分词论文合集，有大约10多篇论文，都是比较好的中文分词算法讲解！希望对大家有用！
所属分类：其它
- 发布日期：2009-11-30
- 文件大小：7mb
- 提供者：kaparo

IKAnalyzer中文分词器V3.1.1使用手册.pdf
IKAnalyzer中文分词器V3.1.1使用手册.pdf
所属分类：专业指导
- 发布日期：2009-12-03
- 文件大小：487kb
- 提供者：chinawr

C++中文分词+自动标引范例
1、合并使用停用词表和关键词表作为分词词表，应用逆向最长匹配法对所有篇名分词，给出每条篇名对应的分词结果。在屏幕上显示篇名序号、篇名、分词结果。 2、去除停用词（显示在屏幕上）。 3、利用tfx词频加权公式，计算各词的权重，在屏幕上显示每条篇名中各词的权重。 4、根据输入的阈值，确定标引词，并在屏幕上显示标引词。 5、根据输入的标引深度，确定标引词，并在屏幕上显示标引词。
所属分类：C++
- 发布日期：2009-12-10
- 文件大小：934kb
- 提供者：xutaozero21

IKAnalyzer中文分词器V3.2.0使用手册
IKAnalyzer中文分词器V3.2.0使用手册
所属分类：Java
- 发布日期：2009-12-12
- 文件大小：431kb
- 提供者：lujunson

刨丁解羊中文分词器-主要用于对网络蜘蛛或网络爬虫抓取的网页进行分词
刨丁解羊中文分词器，主要用于对网络蜘蛛或网络爬虫抓取的网页进行分词，支持繁体中文分词、简体中文分词、英文分词，是制作通用搜索引擎和垂直搜索引擎的核心组件。该软件在普通PC机器上测试显示：TXT格式正文分词速度约为3000万字/分钟，网页分词速度约为277.8个网页/秒。该软件采用基础词库（63万词语）+扩展词库（用户可手工添加新词）。DLL及OCX调用请联系QQ(601069289)。
所属分类：网络基础
- 发布日期：2010-08-30
- 文件大小：2mb
- 提供者：henggua

中文分词十年回顾自动分词系统
过去的十年间，尤其是2003年国际中文分词评测活动Bakeoff开展以来，中文自动分词技术有了可喜的进步。其主要表现为：(1)通过“分词规范+词表+分词语料库”的方法，使中文词语在真实文本中得到了可计算的定义，这是实现计算机自动分词和可比评测的基础；(2)实践证明，基于手工规则的分词系统在评测中不敌基于统计学习的分词系统；(3)在Bakeoff数据上的评估结果表明，未登录词造成的分词精度失落至少比分词歧义大5倍以上；(4)实验证明，能够大幅度提高未登录词识别性能的字标注统计学习方法优于
所属分类：其它
- 发布日期：2011-04-10
- 文件大小：1mb
- 提供者：lwccb

分词组件V2.3.1源码
分词组件V2.3.1源码程序介绍：盘古分词是一个中英文分词组件。作者eaglet 曾经开发过KTDictSeg 中文分词组件，拥有大量用户来自51ASPX。作者基于之前分词组件的开发经验，结合最新的开发技术重新编写了盘古分词组件。中文分词功能中文未登录词识别盘古分词可以对一些不在字典中的未登录词自动识别词频优先盘古分词可以根据词频来解决分词的歧义问题多元分词盘古分词提供多重输出解决分词粒度和分词精度权衡的问题中文人名识别输入： “张三说的确实在理” 分词结果：张三/说/
所属分类：C#
- 发布日期：2012-05-23
- 文件大小：6mb
- 提供者：ss_geng

Ansj中文分词（强大）
Ansj中文分词是一款纯Java、主要用于自然语言处理、高精度的中文分词工具，目标是“准确、高效、自由地进行中文分词”。内容简介：http://www.iteye.com/magazines/102#234 此分词具有自己学习的功能,所以拜托大家不要.乱提交数据.会带坏人家的.说着神秘.其实是一种机器学习动态规划模型!如果你发现此模式分词存在问题.可以看.新词发现.是此分词的初始版本! 此分词保证了准确率,具有人名识别的功能! 此分词结果,具有新词发现,人名识别,机构名识别.也许准确率稍差.
所属分类：Java
- 发布日期：2013-06-21
- 文件大小：13mb
- 提供者：kutekute

中文分词工具word-1.0,Java实现的中文分词组件多种基于词典的分词算法
word分词是一个Java实现的中文分词组件，提供了多种基于词典的分词算法，并利用ngram模型来消除歧义。能准确识别英文、数字，以及日期、时间等数量词，能识别人名、地名、组织机构名等未登录词。同时提供了Lucene、Solr、ElasticSearch插件。分词使用方法： 1、快速体验运行项目根目录下的脚本demo-word.bat可以快速体验分词效果用法: command [text] [input] [output] 命令command的可选值为：demo、text、file
所属分类：Java
- 发布日期：2014-11-05
- 文件大小：10mb
- 提供者：love_hachi

中文分词入门与字标注法
作为中文信息处理的“桥头堡”，中文分词在国内的关注度似乎远远超过了自然语言处理的其他研究领域。在中文分词中，资源的重要性又不言而喻，最大匹配法等需要一个好的词表，而基于字标注的中文分词方法又需要人工加工好的分词语料库。所以想研究中文分词，第一步需要解决的就是资源问题，这里曾经介绍过“LDC上免费的中文信息处理资源”，其中包括一个有频率统计的词表，共计44405条，就可以作为一个不错的中文分词词表使用。而一个好的人工分词语料库，需要很大的人力物力投入，所以无论研究还是商用往往需要一定的费用购买，
所属分类：深度学习
- 发布日期：2017-12-14
- 文件大小：246kb
- 提供者：u011563494

« 12 3 4 5 6 7 8 9 10 ... 50 »