您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. C# 盘古分词

  2. 1、 修改字典格式,提高字典加载速度 2、 增加对英文专业名词的支持 如C++,C#等只要加入字典就可以被分出来 3、 增加词频判断功能,在无法取舍时根据词频取舍 4、 增加优先优先词频选项,通过这个选项动态决定分词粒度 需打开 FreqFirst 5、 增加中文人名前后缀统计和根据该统计定位人名的功能 6、 增加中文人名和未登录词出现频率统计功能 7、 增加自动更新字典功能,对超过阈值的人名和未登录词自动插入字典 需打开 AutoInsertUnknownWords 开关 并设置 Unkno
  3. 所属分类:C#

    • 发布日期:2011-10-28
    • 文件大小:3mb
    • 提供者:jaymezhang
  1. 中文文本分类_新闻语料库.zip

  2. 做毕设自用的中文新闻文本分类语料库,整理自搜狗新闻和清华新闻语料,共八个类别,每类已分好4000条训练集和1000条测试集。附赠一份停用词表,综合了哈工大停用词及川大停用词。
  3. 所属分类:机器学习

    • 发布日期:2020-04-06
    • 文件大小:47mb
    • 提供者:qq_39496504
  1. 停词表新闻库.zip

  2. 包括各种停用词表和新闻分类代码。
  3. 所属分类:机器学习

    • 发布日期:2020-02-14
    • 文件大小:9mb
    • 提供者:qiqi547