您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 主题模型博士论文

  2. 主题模型的主要目的是提取数据集中隐含的统计规律且利用主题进行直观表达,然后可以利用获得的主题进行信息检索、分类、聚类、摘要提取以及进行信息间相似性、相关性判断等一系列应用。近年来,主题模型已逐渐成为文本挖掘、信息检索等领域的一个新的研究方向。
  3. 所属分类:其它

    • 发布日期:2012-12-31
    • 文件大小:8mb
    • 提供者:wxhbj0889
  1. LDA数学八卦

  2. 经典的讲述隐含狄利克雷隐含模型的文章,从简单的gama分布讲起。
  3. 所属分类:讲义

    • 发布日期:2018-04-10
    • 文件大小:2mb
    • 提供者:qq_34729575
  1. LDA数学八卦

  2. 本资料是自然语言处理的最基础部分,主要介绍LDA的数学原理和实现办法
  3. 所属分类:机器学习

    • 发布日期:2018-04-18
    • 文件大小:1mb
    • 提供者:u014293896
  1. 融合词语类别特征和语义的短文本分类方法

  2. 针对短文本内容简短、特征稀疏等特点,提出一种新的融合词语类别特征和语义的短文本分类方法.该方法采用改进的特征选择方法从短文本中选择最能代表类别特征的词语构造特征词典,同时结合利用隐含狄利克雷分布LDA主题模型从背景知识中选择最优主题形成新的短文本特征,在此基础上建立分类器进行分类.采用支持向量机SVM与k近邻法k-NN分类器对搜狗语料库数据集上的搜狐新闻标题内容进行分类,实验结果表明该方法对提高短文本分类的性能是有效的.
  3. 所属分类:其它

  1. 基于主题模型的深层网数据源选择算法

  2. 联邦搜索是从大规模深层网上获取信息的一种重要技术。给定一个用户查询,联邦搜索系统需要解决的一个主要问题是数据源选择问题,即从海量数据源中选出一组最有可能返回相关结果的数据源。现有的数据源选择算法大多基于数据源的样本文档集和查询之间的关键词匹配,通常无法很好地解决少量样本文档的信息缺失问题。针对这一问题,提出了基于隐含狄利克雷分布(LDA)主题模型进行数据源选择的方法。首先,使用LDA主题模型获得数据源和查询的主题概率分布;然后,通过比较两者主题概率分布的相近性来对所有数据源进行排序。通过将数据源
  3. 所属分类:其它