您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 图片分类的plsa源代码

  2. 主要是利用plsa模型对一些图片进行分类,而且自动训练和自动分类功能。
  3. 所属分类:专业指导

    • 发布日期:2010-12-13
    • 文件大小:1kb
    • 提供者:kingzcc
  1. “视觉词包模型”演示(bag-of-visual words)

  2. 包括,PLSA、LDA等模型在词包模型下的演示及应用。
  3. 所属分类:其它

    • 发布日期:2012-06-02
    • 文件大小:31mb
    • 提供者:signfox
  1. BOW and pLSA and LDA

  2. 对BOW模型,pLSA模型,LDA模型进行详细的分析
  3. 所属分类:C/C++

    • 发布日期:2012-07-05
    • 文件大小:7mb
    • 提供者:qpg012230
  1. LDA模型学习笔记

  2. 从LSA到PLSA到LDA,对文本的建模一步步的完善,LDA在document到topic一层引入了dirichlet分布,这是它优于PLSA的地方,使得模型参数的数量不会随着语料库的扩大而增多。LDA建模中最关键的是对参数的估计,原始paper中使用的是variational inference和EM算法,但这不是必须的,实际上有更容易计算的方法:Gibbs Sampling。目前已经有该方法的实现。
  3. 所属分类:专业指导

    • 发布日期:2012-08-04
    • 文件大小:804kb
    • 提供者:mujiangcxl
  1. 主题模型介绍

  2. 文中介绍了当前比较主流的主题模型LSA.PLSA ,LDA等,同时分析了其演化过程和关联关系。另外,介绍了LDA的一些变种。对于学习主题模型的同学来说,这是一个相当不错的总结。
  3. 所属分类:专业指导

    • 发布日期:2013-11-29
    • 文件大小:600kb
    • 提供者:flashwxh2008
  1. PLSA文本分割

  2. PLSA模型的文本分割
  3. 所属分类:虚拟化

    • 发布日期:2014-02-07
    • 文件大小:275kb
    • 提供者:whl2529
  1. 基于主题模型的个性化新闻推荐系统

  2. 本本章上关于主题模型在个性化新闻推荐系统上的应用,以推测读者意图,来依据个性化进行新闻推荐
  3. 所属分类:其它

    • 发布日期:2014-10-30
    • 文件大小:14mb
    • 提供者:w28480
  1. EM算法求解混合高斯模型和pLSA

  2. EM算法求解混合高斯模型相关的东东,挺好的,想赚5个积分下载一篇文献,嘻嘻!
  3. 所属分类:其它

    • 发布日期:2014-12-23
    • 文件大小:211kb
    • 提供者:i_love_summer13
  1. plsamyl_master

  2. PLSA模型用于文档分类的matlab demo
  3. 所属分类:讲义

    • 发布日期:2015-04-01
    • 文件大小:6mb
    • 提供者:howard327
  1. PLSA主题模型

  2. 概率潜在语义分析简称pLSA(Probabilisticlatent semantic analysis)基于双模式和共现的数据分析方法延伸的经典的统计学方法。概率潜在语义分析应用于信息检索,过滤,自然语言处理,文本的机器学习或者其他相关领域。 概率潜在语义分析与标准潜在语义分析的不同是,标准潜在语义分析是以共现表(就是共现的矩阵)的奇异值分解的形式表现的,而概率潜在语义分析却是基于派生自LCM的混合矩阵分解。考虑到word和doc共现形式,概率潜在语义分析基于多项式分布和条件分布的混合来建模
  3. 所属分类:Python

    • 发布日期:2016-08-15
    • 文件大小:7mb
    • 提供者:u014780546
  1. 基于最小领域知识的主题建模 :Topic Modeling with Minimal Domain Knowledge

  2. 基于最小领域知识的主题建模 ,一种基于融合知识的主题模型的微博话题发现方法,涉及自然语言处理领域 传统的主题挖掘技术基于概率统计的混合模型,对文本信息进行建模,使得模型能够自动挖掘出文本中潜在的语义信息,使用户能够快速的了解文本中所涉及的内容。通过主题模型,不仅能够获得文本集合中主要涉及的信息,而且能够获得每篇文档中的内容信息。常见的主题模型有概率潜在语义分析(ProbabilisticLatentSemanticAnalysis,PLSA)模型[1]和潜在狄利克雷分配(LatentDiric
  3. 所属分类:机器学习

    • 发布日期:2017-09-19
    • 文件大小:526kb
    • 提供者:hhtnan
  1. Topic Medels主题模型

  2. 提纲 主题模型的直观理解 LDA模型及优化思路 主题模型的应用
  3. 所属分类:讲义

    • 发布日期:2018-10-09
    • 文件大小:896kb
    • 提供者:terriblenet
  1. PLSA模型详解

  2. PLSA模型详解, 本文详尽的整理了一下PLSA模型, 有兴趣的可以参考. 里面附带了很多自己的推导.
  3. 所属分类:机器学习

    • 发布日期:2018-10-10
    • 文件大小:878kb
    • 提供者:xiaqian369
  1. 四元组PLSA:法人识别中的合并实体及其评级

  2. 随着Web上观点的爆炸式增长,对观点挖掘的研究兴趣日益增长。在这项研究中,我们关注于观点挖掘中的一个重要问题-方面识别(AI),其目的是在实体评论中提取方面术语。以前基于PLSA的AI方法利用2个元组(例如,头部和修饰符的共同出现),其中每个潜在主题都对应一个方面。在这里,我们注意到每次评论还伴随着一个实体及其整体评分,从而导致四元组与前面提到的二元组结合在一起。相信四元组包含更多的共现信息,从而提供更多区分主题的能力,我们提出了四元组PLSA模型,该模型在主题建模中结合了两个项目-实体及其等级
  3. 所属分类:其它

    • 发布日期:2021-03-18
    • 文件大小:330kb
    • 提供者:weixin_38692707
  1. 使用生成模型进行文本分类来挖掘多个领域的区别和共性

  2. 近年来,多个域之间的分布差异已被用于跨域文本分类。沿着这条线,我们在这项研究中显示了两个新的观察结果。首先,数据分布的差异通常是由于不同的域使用不同的索引词来表达相同的概念。其次,概念性要素与文档类之间的关联可以跨域保持稳定。这两个观察结果实际上表明了跨领域的区别和共性。受上述观察的启发,我们提出了一种生成统计模型,称为协作双重PLSA(CD-PLSA),以同时捕获多个域之间的域区别和共性。与仅具有一个潜在变量的概率潜在语义分析(PLSA)不同,该模型具有两个潜在因子y和z,分别对应于单词概念和
  3. 所属分类:其它

  1. 基于术语相关矩阵的主题模型微博客热主题检测

  2. 为了应对短消息特征稀疏性对微博热点话题检测的挑战,本文首先探讨了词之间的关系,然后建立了比词-文档矩阵更密集的词相关矩阵。 术语相关矩阵上的对称非负矩阵分解(SNMF)用于获得术语-主题矩阵。 最后,我们根据术语-主题矩阵将主题学习问题表述为概率潜在语义分析(pLSA)。 此外,本文还介绍了热量的分布和主题排序的机制。 实验表明,该方法可以有效地对话题进行聚类,并应用于微博热点话题的检测。
  3. 所属分类:其它

    • 发布日期:2021-03-16
    • 文件大小:636kb
    • 提供者:weixin_38710127
  1. 使用生成模型进行文本分类的跨领域挖掘区别和共性

  2. 近年来,多个域之间的分布差异已被用于跨域文本分类。 沿着这条线,我们在这项研究中显示了两个新的观察结果。 首先,数据分布的差异通常是由于不同的域使用不同的索引词来表达相同的概念。 其次,概念性要素与文档类之间的关联可以跨域保持稳定。 这两个观察结果实际上表明了跨领域的区别和共性。 受以上观察的启发,我们提出了一种生成统计模型,称为协作双重PLSA(CD-PLSA),以同时捕获多个域之间的域区别和共性。 与仅具有一个潜在变量的概率潜在语义分析(PLSA)不同,该模型具有两个潜在因子y和z,分别对应
  3. 所属分类:其它

  1. 基于PLSA和卡方模型的视觉词袋方法

  2. 在传统的基于视觉单词袋(BoVW)模型的对象分类方法中,视觉单词的同义和歧义问题始终存在。 此外,嘈杂的视觉单词,即所谓的“视觉停用词”将降低视觉词典的语义分辨率。 有鉴于此,提出了一种基于PLSA和卡方模型的视觉分类方法。 首先,利用概率潜在语义分析(PLSA)分析视觉单词的语义共现概率,推断图像中潜在的语义主题,并得到单词引起的潜在主题分布。 其次,采用KL散度度量视觉词之间的语义距离,可以得到语义相关的同义词。 然后,结合自适应软分配策略,实现SIFT特征与同义词之间的软映射。 最后,引入
  3. 所属分类:其它

    • 发布日期:2021-03-04
    • 文件大小:461kb
    • 提供者:weixin_38635449
  1. nlp中的主题模型

  2. 谈起LDA,自然需要引入pLSA。pLSA是用一个生成模型来建模文章的生成过程。假设有K个主题,M篇文章;对语料库中的任意文章d,假设该文章有N个词,则对于其中的每一个词,我们首先选择一个主题z,然后在当前主题的基础上生成一个词w。生成主题z和词w的过程遵照一个确定的概率分布。设在文章d中生成主题z的概率为[公式],在选定主题的条件下生成词w的概率为[公式],则给定文章d,生成词w的概率可以写成:LDA可以看作是pLSA的贝叶斯版本,其文本生成过程与pLSA基本相同,不同的是为主题分布和词分布分
  3. 所属分类:其它

    • 发布日期:2021-02-24
    • 文件大小:816kb
    • 提供者:weixin_38720322
  1. history-newpaper-topic-analysis:使用k均值,pLSA和LDA分析美国和国家公报-源码

  2. 该项目的目的是从历史报纸中提取主题。 阅读历史报纸以研究历史是困难的,因为其庞大的数量证明对人类读者构成挑战。 机器学习算法可以从这些报纸自动生成主题,并可以节省大量时间。 结果保存在top_words文件夹中。 这是每个Python脚本的简短描述。 corpus.py: 用于使用拼写检查,词干分析和频次上限来预处理原始数据。 然后保存将语料库转换为文档词矩阵。 输出保存在“ vocabulary_files”文件夹中。 train.py [取决于k_means.py,pLSA.py和l
  3. 所属分类:其它

    • 发布日期:2021-02-10
    • 文件大小:485mb
    • 提供者:weixin_42116650
« 12 »