您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 使用基于SVM 的局部潜在语义索引进行文本分类.pdf

  2. 一篇很好的文本分类的论文,用SVM进行的分类,效果很好
  3. 所属分类:专业指导

    • 发布日期:2009-07-17
    • 文件大小:560kb
    • 提供者:mazhenxin
  1. latent semantic analysis

  2. LSA(latent semantic analysis)潜在语义分析,也被称为 LSI(latent semantic index),是 Scott Deerwester, Susan T. Dumais 等人在 1990 年提出来的一种新的索引和检索方法。该方法和传 统向量空间模型(vector space model)一样使用向量来表示词(terms)和文档(documents),并通 过向量间的关系(如夹角)来判断词及文档间的关系;而不同的是,LSA 将词和文档映射到潜 在语义空间,从
  3. 所属分类:专业指导

    • 发布日期:2010-05-09
    • 文件大小:730kb
    • 提供者:ccyzhou
  1. 一种大规模数据的快速潜在语义索引

  2. 一种大规模数据的快速潜在语义索引一种大规模数据的快速潜在语义索引
  3. 所属分类:专业指导

    • 发布日期:2010-06-29
    • 文件大小:1mb
    • 提供者:allgoso
  1. 计算机网络与因特网(互联网技术的“圣经”)

  2. ********Shenkxiao Resources******** 资源:计算机网络与因特网(互联网技术的“圣经”) 作者:国外数据作者未知 版本:中文译本 主要内容: 本书以一种清晰并易于接受的方式将深奥的互联网技术问题表达给具有各种背景的读者。作者是互联网最早期的研究者之一,他以独树一帜的方法把技术上的准确性和当前网络的研究热点完美地结合起来,讲述了网络的底层技术和联网技术。本书是原书第2版的译本,比第1版增加了3章内容,介绍了基本网络工具、远程数字连接技术和中间件技术。对全书做了很多
  3. 所属分类:网络基础

    • 发布日期:2011-07-13
    • 文件大小:9mb
    • 提供者:shenkxiao
  1. 统计自然语言处理基础

  2. 第一部分 基础知识 第1章 绪论 1.1 理性主义者和经验主义者的方法 1.2 科学内容 1.3 语言中的歧义问题是自然语言难以处理的原因 1.4 第一手资料 1.5 深入阅读 1.6 习题 第2章 数学基础 2.1 概率论基础 2.2 信息论基础 2.3 深入阅读 2.4 习题 第3章 语言学基础 3.1 词性和词法 3.2 短语结枸 3.3 语义和语用 3.4 其他研究领域 3.5 深入阅读 3.6 习题 .第4章 基于语料库的工作 4.1 基础知识 4.2 文本 4.3 数据标注 4.
  3. 所属分类:专业指导

    • 发布日期:2012-07-26
    • 文件大小:25mb
    • 提供者:a06062125
  1. 使用基于SVM的局部潜在语义索引进行文本分类

  2. 使用基于SVM的局部潜在语义索引进行文本分类
  3. 所属分类:Web开发

    • 发布日期:2013-10-31
    • 文件大小:323kb
    • 提供者:alim0515
  1. 基于潜在语义索引的文本浏览机制

  2. (-----)互联网 语义索引 文本浏览机制
  3. 所属分类:Java

    • 发布日期:2008-10-01
    • 文件大小:364kb
    • 提供者:binzai325
  1. 统计自然语言处理基础 中文版

  2. 第一部分 基础知识 第1章 绪论 1.1 理性主义者和经验主义者的方法 1.2 科学内容 1.3 语言中的歧义问题是自然语言难以处理的原因 1.4 第一手资料 1.5 深入阅读 1.6 习题 第2章 数学基础 2.1 概率论基础 2.2 信息论基础 2.3 深入阅读 2.4 习题 第3章 语言学基础 3.1 词性和词法 3.2 短语结枸 3.3 语义和语用 3.4 其他研究领域 3.5 深入阅读 3.6 习题 .第4章 基于语料库的工作 4.1 基础知识 4.2 文本 4.3 数据标注 4.
  3. 所属分类:其它

    • 发布日期:2014-02-13
    • 文件大小:25mb
    • 提供者:aaa939291641
  1. 潜在语义分析

  2. 潜在语义分析(Latent Semantic Analysis)或者潜在语义索引(Latent Semantic Index),是1988年S.T. Dumais等人提出的一种新的信息检索代数模型,是用于知识获取和展示的计算理论和方法,它使用统计计算的方法对大量的文本集进行分析,从而提取出词与词之间潜在的语义结构,并用这种潜在的语义结构来表示词和文本,达到消除词之间的相关性和简化文本向量实现降维的目的。
  3. 所属分类:机器学习

    • 发布日期:2019-01-03
    • 文件大小:1mb
    • 提供者:fine145
  1. Python风格语言规范(google).pdf

  2. Python官方风格规范文档,编码规范,二合一pdf文档, https://zh-google-styleguide.readthedocs.io/en/latest/google-python-styleguide/python_language_rules/ https://zh-google-styleguide.readthedocs.io/en/latest/google-python-styleguide/python_style_rules/ 在线版不提供下载,如果下载需求的 可以
  3. 所属分类:Python

    • 发布日期:2019-07-02
    • 文件大小:1mb
    • 提供者:qq_18453581
  1. 中英文双语交叉过滤的逻辑模型

  2. 摘要文章简要地描述了文本过滤的背景,提出了基于潜在语义索引的中英文双语交叉过滤的逻辑模型。其基本思想 是改进双语交叉过滤中基于词汇对译的方法,而是利用双语文本中潜在的语义结构,作为用户模板与文本匹配的基础。 将出现的双语词汇和文本映射为语义空间的向量,不必翻译对译词,甚至不需要出现相应的对译词,也能匹配成功,极大 地改善了交叉过滤的精度,效果良好。
  3. 所属分类:专业指导

    • 发布日期:2010-10-27
    • 文件大小:78kb
    • 提供者:qiangqiang1978
  1. 使用生成模型进行文本分类来挖掘多个领域的区别和共性

  2. 近年来,多个域之间的分布差异已被用于跨域文本分类。沿着这条线,我们在这项研究中显示了两个新的观察结果。首先,数据分布的差异通常是由于不同的域使用不同的索引词来表达相同的概念。其次,概念性要素与文档类之间的关联可以跨域保持稳定。这两个观察结果实际上表明了跨领域的区别和共性。受上述观察的启发,我们提出了一种生成统计模型,称为协作双重PLSA(CD-PLSA),以同时捕获多个域之间的域区别和共性。与仅具有一个潜在变量的概率潜在语义分析(PLSA)不同,该模型具有两个潜在因子y和z,分别对应于单词概念和
  3. 所属分类:其它

  1. 使用生成模型进行文本分类的跨领域挖掘区别和共性

  2. 近年来,多个域之间的分布差异已被用于跨域文本分类。 沿着这条线,我们在这项研究中显示了两个新的观察结果。 首先,数据分布的差异通常是由于不同的域使用不同的索引词来表达相同的概念。 其次,概念性要素与文档类之间的关联可以跨域保持稳定。 这两个观察结果实际上表明了跨领域的区别和共性。 受以上观察的启发,我们提出了一种生成统计模型,称为协作双重PLSA(CD-PLSA),以同时捕获多个域之间的域区别和共性。 与仅具有一个潜在变量的概率潜在语义分析(PLSA)不同,该模型具有两个潜在因子y和z,分别对应
  3. 所属分类:其它

  1. 用于广告视频分类的多层多视图主题模型

  2. 广告(ad)视频的最近激增推动了从视频分析到视频索引和检索的多种应用的研究。 其中,对广告视频进行分类是一项关键任务,因为它可以根据类别或流派自动组织视频,从而进一步实现了广告视频的索引和检索。 但是,与其他类型的视频分类相比,对广告视频进行分类具有挑战性,因为其内容不受限制。 虽然许多研究着重于嵌入与视频相关的广告,但据我们所知,很少有研究着重于广告视频的分类。 为了对广告视频进行分类,本文提出了一种新颖的广告视频表示形式,旨在以无监督的方式从多个视图中充分捕获视频内容的潜在语义。 特别是,我
  3. 所属分类:其它

  1. 聚合神经词嵌入用于文档表示

  2. 自然语言处理(NLP)的最新进展表明,分布式模型可以有效地获取单词的语义上有意义的表示。 在这种情况下,文本文档可以看作是词袋嵌入(BoWE),剩下的问题是如何获取文档的固定长度矢量表示以进行有效的文档处理。 除了这些启发式聚合方法之外,最近的工作表明,人们可以利用Fisher Fisher(FK)框架以有原则的方式基于BoWE生成文档表示。 在这项工作中,单词是通过潜在语义索引(LSI)嵌入到欧氏空间中的,而高斯混合模型(GMM)被用作基于FK的非线性聚合的生成模型。 在这项工作中,我们提出了
  3. 所属分类:其它

    • 发布日期:2021-03-07
    • 文件大小:271kb
    • 提供者:weixin_38701640
  1. 基于监督术语权重和自适应度量学习的集群化Web服务发现模型

  2. 随着Web服务的爆炸性增长,关于如何快速找到所需服务的研究变得越来越重要和具有挑战性。 在本文中,我们将重点放在非语义Web服务发现上,并提出一种有效的集群化Web服务发现模型(CFWSFinder)。 与现有模型相比,CFWSFinder具有几个特征。 首先,在服务表示过程中,CFWSFinder导入WordNet和潜在语义索引以将非语义Web服务表示为低维紧凑型语义特征向量。 其次,在服务群集过程中,CFWSFinder使用修改后的内核批处理自组织图(KBSOM)神经网络来最大程度地缩短服务
  3. 所属分类:其它

    • 发布日期:2021-03-03
    • 文件大小:315kb
    • 提供者:weixin_38617297
  1. gensim:人类主题建模-源码

  2. gensim – Python中的主题建模 Gensim是用于主题建模,文档索引和大型语料库相似性检索的Python库。 目标受众是自然语言处理(NLP)和信息检索(IR)社区。 产品特点 所有算法均与语料库大小无关(可以处理大于RAM的输入,流式处理,核外处理), 直观的界面 轻松插入您自己的输入语料库/数据流(简单的流式API) 易于使用其他向量空间算法(简单转换API)进行扩展 流行算法的高效多核实现,例如在线潜在语义分析(LSA / LSI / SVD) ,潜在狄利克雷分配(LDA
  3. 所属分类:其它

    • 发布日期:2021-02-03
    • 文件大小:56mb
    • 提供者:weixin_42114645
  1. 结合类别信息和潜在语义索引进行文本分类的降维

  2. 结合类别信息和潜在语义索引进行文本分类的降维
  3. 所属分类:其它

    • 发布日期:2021-03-28
    • 文件大小:126kb
    • 提供者:weixin_38693524