您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 北京大学 有关自动文本分类的PPT

  2. 不错。北京大学的,就是有水平。希望想了解自动文本分类的学生,参考参考该资料。肯定有帮助。
  3. 所属分类:专业指导

    • 发布日期:2009-05-25
    • 文件大小:1047552
    • 提供者:chenwangying
  1. 自动文本分类中的机器学习(英文)

  2. 介绍了文本分类中的机器学习算法(无监督),广泛使用于文本分类、信息检索系统。
  3. 所属分类:其它

    • 发布日期:2009-05-31
    • 文件大小:430080
    • 提供者:wangying
  1. 基于新的关键词提取方法的快速文本分类系统

  2. 关键词的提取是进行计算机自动文本分类和其他文本数据挖掘应用的关键。系统从语言的词性角度 考虑,对传统的最大匹配分词法进行了改进,提出一种基于动词、虚词和停用词三个较小词库的快速分词方法 (,-),并利用.,/0, 算法来筛选出关键词以完成将123 文档进行快速有效分类的目的。实验表明,该方法在不 影响分类准确率的情况下,分类的速度明显提高。
  3. 所属分类:其它

    • 发布日期:2009-08-10
    • 文件大小:116736
    • 提供者:taipinghai
  1. Web自动文本分类技术研究综述

  2. Web自动文本分类技术研究综述Web自动文本分类技术研究综述Web自动文本分类技术研究综述
  3. 所属分类:Web开发

    • 发布日期:2009-12-31
    • 文件大小:356352
    • 提供者:h15004694589
  1. 基于VSM的中文文本分类系统的设计与实现.pdf

  2. 摘 要: 文本分类是指在给定分类体系下, 根据文本的内容 自动确定文本类别的过程。该文阐述了一个基于向量空间模 型的中文文本分类系统的设计和实现。对文本分类系统的系 统结构、预处理、特征提取、训练算法、分类算法等进行了详 细介绍。引入标题权重系数改进词语权重, 并提出了一种新 的分类算法。实验测试结果表明查全率和准确率均达到 90 %左右, 而且标题权重的引入和新分类算法的实施有效 地改善了分类性能。
  3. 所属分类:其它

    • 发布日期:2010-01-24
    • 文件大小:263168
    • 提供者:goodskyfly_1876
  1. 基于SVM的多类文本分类研究

  2. 本文在中文文本自动分类的基础上对文本多类分类方面做了一些有益的探索,对中 文文本分类的相关技术—中文分词、文本表示、特征提取、分类算法、可视化等方面做 了一些研
  3. 所属分类:其它

    • 发布日期:2010-03-02
    • 文件大小:603136
    • 提供者:wly_luffy
  1. 一种新的基于统计的自动文本分类方法.rar

  2. 一种新的基于统计的自动文本分类方法.rar
  3. 所属分类:专业指导

    • 发布日期:2010-04-15
    • 文件大小:271360
    • 提供者:lmsisbest
  1. 一种新的基于统计的自动文本分类方法.rar

  2. 一种新的基于统计的自动文本分类方法.rar
  3. 所属分类:专业指导

    • 发布日期:2010-04-15
    • 文件大小:436224
    • 提供者:lmsisbest
  1. svmcls文本分类程序(含C++源代码+语料库)完整版

  2. svmcls 2.0文本自动分类器支持中文和英文文档,特征选择方式包括全局和按类别选取,概率估算方法支持基于文档(布尔)统计和基于词频统计,支持三种特征加权方式,特征评估函数包括信息增益、互信息、期望交叉熵、X^2统计,文本证据权重,右半信息增益,分类方法包括支持向量机SVM和K近邻KNN,由李荣陆老师于2004年开发完成。 网上流传很多版本的svmcls文本分类程序,但几乎全部都是不能编译通过的,有些是缺少xercesc文件夹,有些是缺少xerces-c_2_2_0D.dll,有些是缺少分词
  3. 所属分类:C

    • 发布日期:2010-04-30
    • 文件大小:19922944
    • 提供者:moxibingdao
  1. 自动文本分类-分类浏览

  2. 自动文本分类,用来研究分类浏览的方法,一般用于图书馆系统的构建
  3. 所属分类:其它

    • 发布日期:2010-09-09
    • 文件大小:916480
    • 提供者:mannvhai
  1. 概率主题模型在文本分类中的应用研究

  2. 所属领域:数据挖掘、机器学习、文本分类 数据偏斜和噪声数据是文本自动分类应用中经常遇到的问题。在数据偏斜的 情况下,样本无法准确反映整个空间的数据分布,分类器容易受到大类的影响而忽 略小类。大多数分类算法都是面向均匀分布数据提出的,对于数据偏斜的情况, 仅利用传统的分类方法并不能取得理想的效果。另一方面,分类器的质量很大程 度上取决于训练文本集的质量。一般说来,训练文本集类别越准确、内容越全面, 得到的分类器质量就越高。但是在实际应用中,这种全面准确的训练文本集是很 难得到的,尤其是在数据规模
  3. 所属分类:其它

    • 发布日期:2011-03-06
    • 文件大小:1048576
    • 提供者:renyilibuaa
  1. 基于CHI值特征选取和覆盖的文本分类方法

  2. 利用 CHI 值特征选取和前向神经网络的覆盖算法, 通过对文本进行分词的预处理后, 实现文本的自动分类。该方法利用CHI 值进行特征选取即特征降维,应用覆盖算法进行文本分类。该方法将 CHI 值特征选取和覆盖算法充分结合,在提高了分类速度的同时还保证了分类的准确度。应用该方法对标准数据集中的文本进行实验, 并在不同的维数上与SVM 算法、 朴素贝叶斯方法的实验结果进行了比较。结果表明,与SVM 算法和朴素贝叶斯方法相比较, 覆盖算法在准确度上更好。并且,维数的选择对分类的精确度影响很大。
  3. 所属分类:专业指导

    • 发布日期:2011-05-06
    • 文件大小:162816
    • 提供者:nbayangcewqcewq
  1. 基于关键词提取方法的快速文本分类系统

  2. 关键词的提取是进行计算机自动文本分类和其他文本数据挖掘应用的关键。系统从语言的词性角度 考虑,对传统的最大匹配分词法进行了改进,提出一种基于动词、虚词和停用词三个较小词库的快速分词方法 ( FS) ,并利用TFIDF算法来筛选出关键词以完成将Web文档进行快速有效分类的目的。实验表明,该方法在不 影响分类准确率的情况下,分类的速度明显提高。 关键词: 计算机应用; 中文信息处理; 关键词提取; Web文档分类
  3. 所属分类:其它

    • 发布日期:2011-07-08
    • 文件大小:196608
    • 提供者:vcd
  1. 中文文本分类技术的研究

  2. 文本分类技术是文本挖掘的核心,本文简单介绍了该研究热点的研究动态、定义并针对其系统结构给出了一个简要 的概述,然后分析了文本分类处理过程中的关键技术,最后对依然存在的某些问题进行了展望。
  3. 所属分类:其它

    • 发布日期:2011-09-03
    • 文件大小:204800
    • 提供者:asllj
  1. 文本分类器

  2. 文本分类器,一款根据文本特征,将文本识别为哪一类,如体育文章(不知道的),分类器自动识别为体育类。
  3. 所属分类:C++

    • 发布日期:2011-10-28
    • 文件大小:3145728
    • 提供者:lhy046510
  1. 基于N元语言模型的文本分类方法

  2. 基于N元语言模型的文本分类方法.pdf 汉语n元模型统计软件.ppt 基于N元语法的汉语自动分词系统研究.pdf 一种基于N元语法分布的语言模型自适应方法.pdf 语言模型的基本概念.doc N元语言模型的解码算法.doc N元语言模型的训练方法.doc 自动文本分类.pdf
  3. 所属分类:Java

    • 发布日期:2013-07-15
    • 文件大小:1048576
    • 提供者:qq415171148
  1. K-近邻法的文本分类算法分析与改进

  2. 文本自动分类的相关技术是数据挖掘的一个分枝, K-近邻法是常用的文本分类算法之一。在研究K-近邻法的基础上, 根据其使用情况分析了K-近邻法的不足之处, 在满足一定的判定函数前提下, 提出改进后的K-近邻法。改进后的K-近邻法避免了K 值的搜寻过程, 降低了计算复杂性, 提高计算效率。最后通过实验证明了改进K-近邻法的有效性。
  3. 所属分类:其它

    • 发布日期:2013-09-22
    • 文件大小:181248
    • 提供者:slt1124
  1. 文本分类器

  2. 文本分类器,一款根据文本特征,将文本识别为哪一类,如体育文章(不知道的),分类器自动识别为体育类。
  3. 所属分类:C++

    • 发布日期:2014-03-19
    • 文件大小:3145728
    • 提供者:u014209908
  1. 基于支持向量机的越语新闻文本分类方法

  2. 针对越语新闻文本自动分类问题,本文提出一种基于支持向量机的越语新闻文本分类方法。采用支持向量机学习算法,充分考虑文本中命名实体对越语新闻文本分类的特殊作用,分别在句法和语义层面选取词、词性和命名实体作为特征,构建新闻文本分类模型。越语新闻文本分类实验结果表明,提出方法取得了好的效果,命名实体要素对分类有非常好的支撑作用。
  3. 所属分类:专业指导

    • 发布日期:2014-07-23
    • 文件大小:225280
    • 提供者:panhuashan2008
  1. jatecs:Java文本分类系统-源码

  2. JaTeCS(Java文本分类系统) JaTeCS是专注于自动文本分类(ATC)的开源Java库。 它涵盖了实验活动的所有步骤,从阅读语料库到评估实验结果。 JaTeCS专注于将文本作为中心输入,并且其代码针对此类数据进行了优化。 与许多其他机器学习(ML)框架一样,它为多种格式和知名语料库,NLP工具,功能选择和加权方法,多种ML算法的实现以及知名外部软件的包装器(例如libSVM,SVM_light)。 JaTeCS还提供了与ATC相关的方法的实现,而其他ML框架很少(如果没有的话)(例如
  3. 所属分类:其它

    • 发布日期:2021-03-11
    • 文件大小:3145728
    • 提供者:weixin_42144604
« 12 3 4 5 6 7 8 9 10 ... 50 »