搜索资源 - 文本相似度数据集 - 点数信息

点数信息

注册会员 | 设为首页 | 加入收藏夹

您好，欢迎光临本网站！[请登录] ！[注册会员]！

热门搜索： 源码 Android 整站插件识别 p2p 游戏算法更多...

在线客服QQ:632832888

当前位置：

搜索资源 - 文本相似度数据集

下载资源分类

移动开发

开发技术

课程资源

网络技术

操作系统

安全技术

数据库

行业

服务器应用

存储

信息化

考试认证

云计算

大数据

跨平台

音视频

游戏开发

人工智能

区块链

资源分类

搜索资源列表

数据挖掘——概念、模型、方法和算法.pdf
本书全面讲述了数据挖掘的概念、模型、方法和算法。本书共包括13章和2个附录，全面、详细地讲述了从数据挖掘的基本概念到数据挖掘的整个过程，以及数据挖掘工具及其典型应用领域。本书编写严谨、内容权威、结构合理、科学规范、语言流畅，特别适合作为高等院校数据挖掘课程的教科书，还适合作为数据挖掘研究人员必备的参考书。目录第1章数据挖掘的概念 1 1.1 概述 1 1.2 数据挖掘的起源 3 1.3 数据挖掘过程 5 1.3.1 陈述问题和阐明假设 5 1.3.2 数据收集 6 1.3.3 数据预处
所属分类：其它
- 发布日期：2009-05-27
- 文件大小：8mb
- 提供者：linkui26

文本相似度简单案例.zip
该文件中包含代码中所使用的数据集，代码主要是nlp中文本相似度计算的简单案例，给定一个标题，寻找与其类似的前十标题，给刚接触文本相似度计算的童鞋一个快速入门的案例，简单易懂，代码解释超级详细，代码测试可运行，配合里面的详细介绍看效果最佳。
所属分类：机器学习
- 发布日期：2019-06-26
- 文件大小：397kb
- 提供者：laojie4124

一种面向科技项目文本的相似度度量方法
现有的文本相似度度量方法主要采用TF-IDF方法，把文本建模为词频向量，但未考虑文本的结构特征。现将文本的结构特征和TF-IDF方法进行融合，提出了一种面向科技项目文本的相似度度量方法。该方法首先对文本进行预处理，其次根据文本的结构特征提取模块文本，然后使用TF-IDF方法提取每个模块文本的TOP-N关键词，作为模块文本的特征向量表示，最后使用余弦聚类计算文本的相似度。实验结果表明，在电力行业的科技项目文档数据集上，所提方法优于TF-IDF方法。
所属分类：其它
- 发布日期：2020-10-15
- 文件大小：48kb
- 提供者：weixin_38659248

中文文本相似度/文本推理/文本匹配数据集——XNLI
中文文本相似度/文本推理/文本匹配数据集——XNLI
所属分类：深度学习
- 发布日期：2020-12-25
- 文件大小：16mb
- 提供者：weixin_43639369

中文文本相似度/文本推理/文本匹配数据集——OCNLI
中文文本相似度/文本推理/文本匹配数据集——OCNLI
所属分类：深度学习
- 发布日期：2020-12-25
- 文件大小：1mb
- 提供者：weixin_43639369

中文文本相似度/文本推理/文本匹配数据集——LCQMC
中文文本相似度/文本推理/文本匹配数据集——LCQMC
所属分类：深度学习
- 发布日期：2020-12-25
- 文件大小：5mb
- 提供者：weixin_43639369

中文文本相似度/文本推理/文本匹配数据集——Chinese SNLI MultiNli
中文文本相似度/文本推理/文本匹配数据集——Chinese SNLI MultiNli
所属分类：机器学习
- 发布日期：2020-12-25
- 文件大小：19mb
- 提供者：weixin_43639369

中文文本相似度/文本推理/文本匹配数据集——CCKS2018
中文文本相似度/文本推理/文本匹配数据集——CCKS2018
所属分类：机器学习
- 发布日期：2020-12-25
- 文件大小：2mb
- 提供者：weixin_43639369

英文文本相似度/文本推理/文本匹配数据集——STS
英文文本相似度/文本推理/文本匹配数据集——STS
所属分类：深度学习
- 发布日期：2020-12-25
- 文件大小：385kb
- 提供者：weixin_43639369

英文文本相似度/文本推理/文本匹配数据集——SNLI
英文文本相似度/文本推理/文本匹配数据集——SNLI
所属分类：深度学习
- 发布日期：2020-12-25
- 文件大小：9mb
- 提供者：weixin_43639369

英文文本相似度/文本推理/文本匹配数据集——SICK
英文文本相似度/文本推理/文本匹配数据集——SICK
所属分类：机器学习
- 发布日期：2020-12-25
- 文件大小：214kb
- 提供者：weixin_43639369

英文文本相似度/文本推理/文本匹配数据集——SciTail
英文文本相似度/文本推理/文本匹配数据集——SciTail
所属分类：深度学习
- 发布日期：2020-12-25
- 文件大小：1mb
- 提供者：weixin_43639369

英文文本相似度/文本推理/文本匹配数据集——Quora
英文文本相似度/文本推理/文本匹配数据集——Quora
所属分类：深度学习
- 发布日期：2020-12-25
- 文件大小：19mb
- 提供者：weixin_43639369

英文文本相似度/文本推理/文本匹配数据集——MUltiNLI
英文文本相似度/文本推理/文本匹配数据集——MUltiNLI
所属分类：深度学习
- 发布日期：2020-12-25
- 文件大小：199mb
- 提供者：weixin_43639369

英文文本相似度/文本推理/文本匹配数据集——MSRP
英文文本相似度/文本推理/文本匹配数据集——MSRP
所属分类：深度学习
- 发布日期：2020-12-25
- 文件大小：485kb
- 提供者：weixin_43639369

基于新的句子层次聚类方法的印尼文本自动摘要
随着Internet的发展，信息量呈指数增长，自动文本摘要技术变得越来越重要。目前，大多数关于自动摘要技术的研究都应用于常见的语言，例如中文和英文，但在资源匮乏的语言中却很少。在本文中，我们构建了印尼语自动摘要数据集，并对印尼语自动摘要进行了相关研究。并且在本文中，我们提出了一种基于句子相似度聚类的高效的基于提取的自动文本摘要方法。基于聚类的思想，本文考虑了句子的语义，并根据句子与句子之间的相似性对句子进行聚类。根据规则提取摘要，最后得到摘要结果。该方法不仅保证了摘要的完整性，重要性
所属分类：其它
- 发布日期：2021-03-08
- 文件大小：282kb
- 提供者：weixin_38517095

排序哈希相似度以进行快速相似度搜索
本文涉及大规模的相似度搜索，该相似度搜索有效地并且有效地找到查询数据点的相似数据点。加速相似性搜索的有效方法是学习哈希函数。用于学习哈希函数的现有方法旨在获得相似对的汉明距离的低值。但是，这些方法忽略这些汉明距离的排名顺序。这导致有关为查询数据点查找相似项目的准确性很差。在本文中，提出了一种算法，称为top k RHS（Rank Hash相似度），其中设计了一种排序损失函数来学习哈希函数。假设哈希函数由1个二进制分类器组成。学习哈希函数的问题可以表述为学习二进制分类器的任务。该算
所属分类：其它
- 发布日期：2021-03-05
- 文件大小：543kb
- 提供者：weixin_38727825

基于语义分布相似度的主题模型
潜在狄利克雷分布(LDA)以词袋(bag of words,BOW)模型为基础,简化了建模的复杂度,但使得主题的语义连贯性较差,文档表征能力不强。为解决此问题,提出了一种基于语义分布相似度的主题模型。该模型在EM(expectation maximization)算法框架下,使用GPU(generalized Pólya urn)模型加入单词—单词和文档—主题语义分布相似度来引导主题建模,从语义关联层面上削弱了词袋假设对主题产生的影响。在四个公开数据集上的实验表明,基于语义分布相似度的主题模型在
所属分类：其它
- 发布日期：2021-03-02
- 文件大小：663kb
- 提供者：weixin_38722607

基于Hadoop平台的海量文本分类的并行化
文本分类是信息检索与数据挖掘的研究热点与核心技术,近年来得到了广泛的关注和快速的发展.近来年随着文本数据呈指数增长,要有效地管理这些数据,就必须在分布式环境下用有效的算法来处理这些数据.在Ha-doop分布式平台下实现了一简单有效的文本分类算法——TFIDF分类算法,即一种基于向量空间模型的分类算法,它用余弦相似度得到分类结果.在两个数据集上做了实验,结果表明,这一并行化算法在大数据集上很有效并可以在实际领域中得到良好的应用.
所属分类：其它
- 发布日期：2021-02-24
- 文件大小：645kb
- 提供者：weixin_38727453

tensorflow-nlp：TensorFlow 2.x 1.x中的NLP和文本生成实验-源码
Code has been run on Google Colab, thanks Google for providing computational resources 内容自然语言处理（Natural Language Processing） IMDB（英文）线索情感分析数据集（CHN） SNLI（ENG）微众银行智能客服（CHN）蚂蚁金融语义相似度（CHN） ATIS（英语）弹性搜索稀疏检索密集检索大型中文会话数据集（CHN） 20k腾讯AI研发数据（CHN）
所属分类：其它
- 发布日期：2021-02-03
- 文件大小：4mb
- 提供者：weixin_42143161

« 12 3 »