搜索资源 - 潜在语义索引 - 点数信息

点数信息

注册会员 | 设为首页 | 加入收藏夹

您好，欢迎光临本网站！[请登录] ！[注册会员]！

热门搜索： 源码 Android 整站插件识别 p2p 游戏算法更多...

在线客服QQ:632832888

当前位置：

搜索资源 - 潜在语义索引

下载资源分类

移动开发

开发技术

课程资源

网络技术

操作系统

安全技术

数据库

行业

服务器应用

存储

信息化

考试认证

云计算

大数据

跨平台

音视频

游戏开发

人工智能

区块链

资源分类

搜索资源列表

使用基于SVM 的局部潜在语义索引进行文本分类.pdf
一篇很好的文本分类的论文，用SVM进行的分类，效果很好
所属分类：专业指导
- 发布日期：2009-07-17
- 文件大小：560kb
- 提供者：mazhenxin

latent semantic analysis
LSA(latent semantic analysis)潜在语义分析，也被称为 LSI(latent semantic index)，是 Scott Deerwester, Susan T. Dumais 等人在 1990 年提出来的一种新的索引和检索方法。该方法和传统向量空间模型(vector space model)一样使用向量来表示词(terms)和文档(documents)，并通过向量间的关系(如夹角)来判断词及文档间的关系；而不同的是，LSA 将词和文档映射到潜在语义空间，从
所属分类：专业指导
- 发布日期：2010-05-09
- 文件大小：730kb
- 提供者：ccyzhou

一种大规模数据的快速潜在语义索引
一种大规模数据的快速潜在语义索引一种大规模数据的快速潜在语义索引
所属分类：专业指导
- 发布日期：2010-06-29
- 文件大小：1mb
- 提供者：allgoso

计算机网络与因特网（互联网技术的“圣经”）
********Shenkxiao Resources******** 资源：计算机网络与因特网（互联网技术的“圣经”）作者：国外数据作者未知版本：中文译本主要内容：本书以一种清晰并易于接受的方式将深奥的互联网技术问题表达给具有各种背景的读者。作者是互联网最早期的研究者之一，他以独树一帜的方法把技术上的准确性和当前网络的研究热点完美地结合起来，讲述了网络的底层技术和联网技术。本书是原书第2版的译本，比第1版增加了3章内容，介绍了基本网络工具、远程数字连接技术和中间件技术。对全书做了很多
所属分类：网络基础
- 发布日期：2011-07-13
- 文件大小：9mb
- 提供者：shenkxiao

统计自然语言处理基础
第一部分基础知识第1章绪论 1．1 理性主义者和经验主义者的方法 1．2 科学内容 1．3 语言中的歧义问题是自然语言难以处理的原因 1．4 第一手资料 1．5 深入阅读 1．6 习题第2章数学基础 2．1 概率论基础 2．2 信息论基础 2．3 深入阅读 2．4 习题第3章语言学基础 3．1 词性和词法 3．2 短语结枸 3．3 语义和语用 3．4 其他研究领域 3．5 深入阅读 3．6 习题 .第4章基于语料库的工作 4．1 基础知识 4．2 文本 4．3 数据标注 4.
所属分类：专业指导
- 发布日期：2012-07-26
- 文件大小：25mb
- 提供者：a06062125

使用基于SVM的局部潜在语义索引进行文本分类
使用基于SVM的局部潜在语义索引进行文本分类
所属分类：Web开发
- 发布日期：2013-10-31
- 文件大小：323kb
- 提供者：alim0515

基于潜在语义索引的文本浏览机制
（-----）互联网语义索引文本浏览机制
所属分类：Java
- 发布日期：2008-10-01
- 文件大小：364kb
- 提供者：binzai325

统计自然语言处理基础中文版
第一部分基础知识第1章绪论 1．1 理性主义者和经验主义者的方法 1．2 科学内容 1．3 语言中的歧义问题是自然语言难以处理的原因 1．4 第一手资料 1．5 深入阅读 1．6 习题第2章数学基础 2．1 概率论基础 2．2 信息论基础 2．3 深入阅读 2．4 习题第3章语言学基础 3．1 词性和词法 3．2 短语结枸 3．3 语义和语用 3．4 其他研究领域 3．5 深入阅读 3．6 习题 .第4章基于语料库的工作 4．1 基础知识 4．2 文本 4．3 数据标注 4.
所属分类：其它
- 发布日期：2014-02-13
- 文件大小：25mb
- 提供者：aaa939291641

潜在语义分析
潜在语义分析（Latent Semantic Analysis）或者潜在语义索引（Latent Semantic Index），是1988年S.T. Dumais等人提出的一种新的信息检索代数模型，是用于知识获取和展示的计算理论和方法，它使用统计计算的方法对大量的文本集进行分析，从而提取出词与词之间潜在的语义结构，并用这种潜在的语义结构来表示词和文本，达到消除词之间的相关性和简化文本向量实现降维的目的。
所属分类：机器学习
- 发布日期：2019-01-03
- 文件大小：1mb
- 提供者：fine145

Python风格语言规范(google).pdf
Python官方风格规范文档,编码规范,二合一pdf文档, https://zh-google-styleguide.readthedocs.io/en/latest/google-python-styleguide/python_language_rules/ https://zh-google-styleguide.readthedocs.io/en/latest/google-python-styleguide/python_style_rules/ 在线版不提供下载,如果下载需求的可以
所属分类：Python
- 发布日期：2019-07-02
- 文件大小：1mb
- 提供者：qq_18453581

中英文双语交叉过滤的逻辑模型
摘要文章简要地描述了文本过滤的背景，提出了基于潜在语义索引的中英文双语交叉过滤的逻辑模型。其基本思想是改进双语交叉过滤中基于词汇对译的方法，而是利用双语文本中潜在的语义结构，作为用户模板与文本匹配的基础。将出现的双语词汇和文本映射为语义空间的向量，不必翻译对译词，甚至不需要出现相应的对译词，也能匹配成功，极大地改善了交叉过滤的精度，效果良好。
所属分类：专业指导
- 发布日期：2010-10-27
- 文件大小：78kb
- 提供者：qiangqiang1978

使用生成模型进行文本分类来挖掘多个领域的区别和共性
近年来，多个域之间的分布差异已被用于跨域文本分类。沿着这条线，我们在这项研究中显示了两个新的观察结果。首先，数据分布的差异通常是由于不同的域使用不同的索引词来表达相同的概念。其次，概念性要素与文档类之间的关联可以跨域保持稳定。这两个观察结果实际上表明了跨领域的区别和共性。受上述观察的启发，我们提出了一种生成统计模型，称为协作双重PLSA（CD-PLSA），以同时捕获多个域之间的域区别和共性。与仅具有一个潜在变量的概率潜在语义分析（PLSA）不同，该模型具有两个潜在因子y和z，分别对应于单词概念和
所属分类：其它
- 发布日期：2021-03-18
- 文件大小：3mb
- 提供者：weixin_38694006

使用生成模型进行文本分类的跨领域挖掘区别和共性
近年来，多个域之间的分布差异已被用于跨域文本分类。沿着这条线，我们在这项研究中显示了两个新的观察结果。首先，数据分布的差异通常是由于不同的域使用不同的索引词来表达相同的概念。其次，概念性要素与文档类之间的关联可以跨域保持稳定。这两个观察结果实际上表明了跨领域的区别和共性。受以上观察的启发，我们提出了一种生成统计模型，称为协作双重PLSA（CD-PLSA），以同时捕获多个域之间的域区别和共性。与仅具有一个潜在变量的概率潜在语义分析（PLSA）不同，该模型具有两个潜在因子y和z，分别对应
所属分类：其它
- 发布日期：2021-03-11
- 文件大小：3mb
- 提供者：weixin_38565818

用于广告视频分类的多层多视图主题模型
广告（ad）视频的最近激增推动了从视频分析到视频索引和检索的多种应用的研究。其中，对广告视频进行分类是一项关键任务，因为它可以根据类别或流派自动组织视频，从而进一步实现了广告视频的索引和检索。但是，与其他类型的视频分类相比，对广告视频进行分类具有挑战性，因为其内容不受限制。虽然许多研究着重于嵌入与视频相关的广告，但据我们所知，很少有研究着重于广告视频的分类。为了对广告视频进行分类，本文提出了一种新颖的广告视频表示形式，旨在以无监督的方式从多个视图中充分捕获视频内容的潜在语义。特别是，我
所属分类：其它
- 发布日期：2021-03-08
- 文件大小：1mb
- 提供者：weixin_38623366

聚合神经词嵌入用于文档表示
自然语言处理（NLP）的最新进展表明，分布式模型可以有效地获取单词的语义上有意义的表示。在这种情况下，文本文档可以看作是词袋嵌入（BoWE），剩下的问题是如何获取文档的固定长度矢量表示以进行有效的文档处理。除了这些启发式聚合方法之外，最近的工作表明，人们可以利用Fisher Fisher（FK）框架以有原则的方式基于BoWE生成文档表示。在这项工作中，单词是通过潜在语义索引（LSI）嵌入到欧氏空间中的，而高斯混合模型（GMM）被用作基于FK的非线性聚合的生成模型。在这项工作中，我们提出了
所属分类：其它
- 发布日期：2021-03-07
- 文件大小：271kb
- 提供者：weixin_38701640

基于监督术语权重和自适应度量学习的集群化Web服务发现模型
随着Web服务的爆炸性增长，关于如何快速找到所需服务的研究变得越来越重要和具有挑战性。在本文中，我们将重点放在非语义Web服务发现上，并提出一种有效的集群化Web服务发现模型（CFWSFinder）。与现有模型相比，CFWSFinder具有几个特征。首先，在服务表示过程中，CFWSFinder导入WordNet和潜在语义索引以将非语义Web服务表示为低维紧凑型语义特征向量。其次，在服务群集过程中，CFWSFinder使用修改后的内核批处理自组织图（KBSOM）神经网络来最大程度地缩短服务
所属分类：其它
- 发布日期：2021-03-03
- 文件大小：315kb
- 提供者：weixin_38617297

gensim：人类主题建模-源码
gensim – Python中的主题建模 Gensim是用于主题建模，文档索引和大型语料库相似性检索的Python库。目标受众是自然语言处理（NLP）和信息检索（IR）社区。产品特点所有算法均与语料库大小无关（可以处理大于RAM的输入，流式处理，核外处理），直观的界面轻松插入您自己的输入语料库/数据流（简单的流式API）易于使用其他向量空间算法（简单转换API）进行扩展流行算法的高效多核实现，例如在线潜在语义分析（LSA / LSI / SVD），潜在狄利克雷分配（LDA
所属分类：其它
- 发布日期：2021-02-03
- 文件大小：56mb
- 提供者：weixin_42114645

结合类别信息和潜在语义索引进行文本分类的降维
结合类别信息和潜在语义索引进行文本分类的降维
所属分类：其它
- 发布日期：2021-03-28
- 文件大小：126kb
- 提供者：weixin_38693524