您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 基于向量空间模型的多主题Web文本分类方法

  2. 基于向量空间模型的多主题Web文本分类方法.pdf
  3. 所属分类:Web开发

    • 发布日期:2009-08-12
    • 文件大小:233kb
    • 提供者:oxwangfeng
  1. 用于文本分类的语料库

  2. 分为10个类大概2000篇多文本,可用于文本分类的语料库
  3. 所属分类:专业指导

    • 发布日期:2009-10-14
    • 文件大小:3mb
    • 提供者:happy_maple
  1. 文本分类--分词算法

  2. 一款经典的文本分类器,用java编程实现。包含10万,20万,30万三种词库。适合文本分类,多分类等相关领域的研究应用。
  3. 所属分类:Java

    • 发布日期:2011-08-05
    • 文件大小:4mb
    • 提供者:oceanfan
  1. 文本分类器,KNN,SVM,贝叶斯等都有

  2. 多算法文本分类器,功能强大,界面简洁,自带帮助方便应用学习研究
  3. 所属分类:电子商务

    • 发布日期:2012-04-16
    • 文件大小:8mb
    • 提供者:ys344155411
  1. 文本分类系统

  2. TextClassify文本分类系统适用于中文,英文文本分类。 包括各个文本的关键词输出,可以控制关键词输出个数,也可以对关键词加入黑名单和白名单。 关于TextClassify文本分类系统的改进: 改进jieba中文分词词典 改进黑名单:增加停用词 改进白名单:增加专业词 在TextProcess改进每一类text至多选FileInFolder个:理论上越多越好 deleteN的选取:可以优化 特征词的长度限定:unicode不过长,不过短 特征词词典dict_size的选取:可以优化 特征
  3. 所属分类:Python

    • 发布日期:2014-06-17
    • 文件大小:1mb
    • 提供者:lining0806
  1. 多标签分类学习

  2. 基于数据分解、多标签分类、文本分类、机器学习、情感分析
  3. 所属分类:机器学习

    • 发布日期:2018-04-28
    • 文件大小:1mb
    • 提供者:halfwfarmer
  1. fastText:文本分类和词嵌入工具

  2. 快速文本分类,多文本分类, 词嵌入
  3. 所属分类:深度学习

    • 发布日期:2018-10-17
    • 文件大小:4mb
    • 提供者:m0_37963246
  1. 基于Bootstrapping的文本分类模型

  2. 文中提出一种基于Bootstrapping 的文本分类模型,该模型采用最大熵模型作为分类器,从少量的种子集出发,自动学习更多的文本作为新的种子样本,这样不断学习来提高最大熵分类器的文本分类性能。文中提出一个权重因子来调整新的种子样本在分类器训练过程中的权重。实验结果表明,在相同的手工训练语料的条件下,与传统的文本分类模型相比这种基于Bootstrapping 的文本分类模型具有明显优势。
  3. 所属分类:C/C++

    • 发布日期:2012-10-17
    • 文件大小:335kb
    • 提供者:jslfhao
  1. 文本分类语料库(复旦)测试语料

  2. 文本分类语料库(复旦)测试语料 由复旦大学李荣陆提供。answer.rar为测试语料,共9833篇文档;train.rar为训练语料,共9804篇文档,分为20个类别。训练语料和测试语料基本按照1:1的比例来划分。收集工作花费了不少人力和物力,所以请大家在使用时尽量注明来源(复旦大学计算机信息与技术系国际数据库中心自然语言处理小组)。文件较大(训练测试各50多兆),下载时请耐心等待。 经过数据清理将训练和测试合并成一个csv文件,可以用pandas.read_csv直接读取,分为两列分别是类别和
  3. 所属分类:互联网

    • 发布日期:2020-05-29
    • 文件大小:262mb
    • 提供者:xmrzh
  1. 基于模糊支持向量机的文本分类

  2. 为了有效地利用信息技术发展而产生的海量信息,信息检索与数据挖掘得到了快速的发展,通过对传统支持向量机的特点分析,针对其在文本分类中的局限性,采用了一种基于二叉树的模糊支持向量机的多分类算法,通过实验证明该算法有更好的抗干扰能力和更好的分类效果。
  3. 所属分类:其它

    • 发布日期:2020-06-27
    • 文件大小:880kb
    • 提供者:weixin_38665490
  1. 文本分类介绍,目前的文本分类模型,数据集和模型对应的代码链接,介绍文本分类的流程和发展史。给出多标签文本分类介绍和对应工具

  2. 文本分类介绍,目前的文本分类模型,数据集和模型对应的代码链接,介绍文本分类的流程和发展史。给出多标签文本分类介绍和对应工具
  3. 所属分类:机器学习

    • 发布日期:2020-08-07
    • 文件大小:2mb
    • 提供者:xiaoqianlizhen
  1. 机器学习实战之朴素贝叶斯(二)文本分类

  2. 朴素贝叶斯(二)文本分类朴素贝叶斯的一般流程用python进行文本分类准备数据:从文本中构建词向量训练算法:从词向量计算概率测试算法:朴素贝叶斯分类函数文档词袋模型 朴素贝叶斯的一般流程 (1)收集数据:任何方法 (2)准备数据:数值型、布尔型 (3)分析数据:特征多,用直方图效果好 (4)训练算法:计算不同的独立特征的多条件概率 (5)测试算法:计算错误率 (6)使用算法:一般应用于文档分类,也可以在任意分类场景 用python进行文本分类 以在线社区留言板为例,构建快速过滤器,判断是否是侮辱
  3. 所属分类:其它

    • 发布日期:2020-12-20
    • 文件大小:49kb
    • 提供者:weixin_38705723
  1. 文本分类之多标签分类

  2. 多标签分类综述 意义 网络新闻往往含有丰富的语义,一篇文章既可以属于“经济”也可以属于“文化”。给网络新闻打多标签可以更好地反应文章的真实意义,方便日后的分类和使用。 难点 类标数量不确定,有些样本可能只有一个类标,有些样本的类标可能高达几十甚至上百个。  类标之间相互依赖,例如包含蓝天类标的样本很大概率上包含白云,如何解决类标之间的依赖性问题也是一大难点。 多标签的训练集比较难以获取。 如下方法来解决这个问题: 1.在传统机器学习的模型中对每一类标签做二分类,可以使用SVM、DT、Naïv
  3. 所属分类:其它

    • 发布日期:2021-01-07
    • 文件大小:41kb
    • 提供者:weixin_38718262
  1. TextClf:简单易上手的基于pytorch/sklearn的文本分类工具

  2. 文本分类是自然语言处理中最常见的任务之一。从邮箱应用中的垃圾邮件识别到搜索引擎中的query意图判别, 再到商品评论中的情感分析, 这些其实都是我们身边对文本分类的常见需求。 为了帮助大家更好的应对经常遇到的文本分类场景,我最近开发了一个工具箱TextClf,使用TextClf, 你可以通过生成和修改配置文件,快速尝试多种分类算法模型、调整参数、搭建baseline, 有了这个工具箱,你可以从模型搭建、模型训练、模型测试等一系列复杂的实现中脱离出来, 让你能有更多精力关注于数据本身的特点,做针对
  3. 所属分类:其它

    • 发布日期:2021-01-07
    • 文件大小:120kb
    • 提供者:weixin_38671048
  1. 《动手学深度学习:文本分类;数据增强;模型微调》

  2. 文本情感分类 文本分类是自然语言处理的一个常见任务,它把一段不定长的文本序列变换为文本的类别。本节关注它的一个子问题:使用文本情感分类来分析文本作者的情绪。这个问题也叫情感分析,并有着广泛的应用。 同搜索近义词和类比词一样,文本分类也属于词嵌入的下游应用。在本节中,我们将应用预训练的词向量和含多个隐藏层的双向循环神经网络与卷积神经网络,来判断一段不定长的文本序列中包含的是正面还是负面的情绪。后续内容将从以下几个方面展开: 文本情感分类数据集 使用循环神经网络进行情感分类 使用卷积神经网络进行情感
  3. 所属分类:其它

    • 发布日期:2021-01-06
    • 文件大小:34kb
    • 提供者:weixin_38692969
  1. Text-Multilabel-Classification-BERT-Tf2.x:文本多标签分类-BERT-Tf2.0-源码

  2. 文本多标签分类-BERT-Tf2.0 该存储库包含针对多标签文本分类的预训练BERT模型的Tensorflow2.0实现。 脚步 从下载数据 借助download_bert.sh下载预训练的模型权重 运行train_bert.py 训练损失和准确性 测试损失和准确性
  3. 所属分类:其它

  1. 使用生成模型进行文本分类来挖掘多个领域的区别和共性

  2. 近年来,多个域之间的分布差异已被用于跨域文本分类。沿着这条线,我们在这项研究中显示了两个新的观察结果。首先,数据分布的差异通常是由于不同的域使用不同的索引词来表达相同的概念。其次,概念性要素与文档类之间的关联可以跨域保持稳定。这两个观察结果实际上表明了跨领域的区别和共性。受上述观察的启发,我们提出了一种生成统计模型,称为协作双重PLSA(CD-PLSA),以同时捕获多个域之间的域区别和共性。与仅具有一个潜在变量的概率潜在语义分析(PLSA)不同,该模型具有两个潜在因子y和z,分别对应于单词概念和
  3. 所属分类:其它

  1. text_classifier:该项目是使用TextCNNTextRCNN的文本分类任务,嵌入层可调用Word2Vec,Bert,也可以直接使用词粒度的随机嵌入,带有注意模块,项目基于Tensorflow2.3开发。-源码

  2. 文字分类器 此仓库是基于Tensorflow2.3的文本分类任务,分别支持: 随机初始单词嵌入+ TextCNN 随机初始词嵌入+注意+ TextCNN 随机初始单词嵌入+ TextRCNN Word2Vec + TextCNN Word2Vec +注意+ TextCNN Word2Vec + TextRCNN 伯特嵌入(没有微调,直接取向量)+ TextCNN Bert嵌入(没有微调,直接取向量)+ TextRCNN 代码支持二分类和多分类,此项目基于爬取的游戏评论正是个二元的情感分
  3. 所属分类:其它

    • 发布日期:2021-03-17
    • 文件大小:65mb
    • 提供者:weixin_42143806
  1. nlp_windows_exe_ui:python3.6-制作一个包含NLP基本功能系统(Windows exe)自然语言处理系统。系统功能:分词,词性标注,关键词提取,文本分类-源码

  2. nlp_windows_exe_ui 介绍 python3.6-制作一个包含NLP基本功能系统(Windows exe)自然语言处理系统。系统功能:分词,词性标注,关键字提取,文本分类;由于要打包成exe的关系,我将原本的项目的多一个文件的集成到一个python文件(合并文件)里,只保留了使用该系统所需要的函数,方便打包,通俗地讲就是,生成生成词向量过程,装袋过程,模型训练过程的,以及一些中间步骤的程序代码,这些有些涉及很多库的,这些打包进去。但是整个项目里的东西是完整的(包括数据) 运行这个系
  3. 所属分类:其它

    • 发布日期:2021-03-15
    • 文件大小:20mb
    • 提供者:weixin_42129113
  1. TextClassify2:多算法综合的文本分类系统-源码

  2. 多算法的文本分类系统 更多详见 关于分词 英文分词,采用nltk工具包进行分词 pip install nltk 中文分词,采用jieba工具包进行分词 pip install jieba jieba分词 dict 主词典文件 user_dict 用户词典文件,即分词白名单 user_dict为分词白名单 如果添加的过滤词(包括黑名单和白名单)无法正确被jieba正确分词,则需要添加的单词和词频加入到主字典dict文件中或者用户词典user_dict,一行一个(词频也可省略)
  3. 所属分类:其它

« 12 3 4 5 6 7 8 9 10 ... 50 »