搜索资源 - 文本相似数据集 - 点数信息

点数信息

注册会员 | 设为首页 | 加入收藏夹

您好，欢迎光临本网站！[请登录] ！[注册会员]！

热门搜索： 源码 Android 整站插件识别 p2p 游戏算法更多...

在线客服QQ:632832888

当前位置：

搜索资源 - 文本相似数据集

下载资源分类

移动开发

开发技术

课程资源

网络技术

操作系统

安全技术

数据库

行业

服务器应用

存储

信息化

考试认证

云计算

大数据

跨平台

音视频

游戏开发

人工智能

区块链

资源分类

搜索资源列表

数据挖掘——概念、模型、方法和算法.pdf
本书全面讲述了数据挖掘的概念、模型、方法和算法。本书共包括13章和2个附录，全面、详细地讲述了从数据挖掘的基本概念到数据挖掘的整个过程，以及数据挖掘工具及其典型应用领域。本书编写严谨、内容权威、结构合理、科学规范、语言流畅，特别适合作为高等院校数据挖掘课程的教科书，还适合作为数据挖掘研究人员必备的参考书。目录第1章数据挖掘的概念 1 1.1 概述 1 1.2 数据挖掘的起源 3 1.3 数据挖掘过程 5 1.3.1 陈述问题和阐明假设 5 1.3.2 数据收集 6 1.3.3 数据预处
所属分类：其它
- 发布日期：2009-05-27
- 文件大小：8mb
- 提供者：linkui26

文本相似度简单案例.zip
该文件中包含代码中所使用的数据集，代码主要是nlp中文本相似度计算的简单案例，给定一个标题，寻找与其类似的前十标题，给刚接触文本相似度计算的童鞋一个快速入门的案例，简单易懂，代码解释超级详细，代码测试可运行，配合里面的详细介绍看效果最佳。
所属分类：机器学习
- 发布日期：2019-06-26
- 文件大小：397kb
- 提供者：laojie4124

dataset-sts, 语义文本相似数据集.zip
dataset-sts, 语义文本相似数据集基于的语义文本相似集一个典型的A 学习任务包括分类一个句子或者文档序列，换句话说，逼近函数。 f_1(s) ∈ [0,1] ( f_1 可能决定域。情绪。等等 ) 。但是，有很多问题往往难以解决，并且涉及到对句
所属分类：其它
- 发布日期：2019-09-18
- 文件大小：56mb
- 提供者：weixin_38743602

一种面向科技项目文本的相似度度量方法
现有的文本相似度度量方法主要采用TF-IDF方法，把文本建模为词频向量，但未考虑文本的结构特征。现将文本的结构特征和TF-IDF方法进行融合，提出了一种面向科技项目文本的相似度度量方法。该方法首先对文本进行预处理，其次根据文本的结构特征提取模块文本，然后使用TF-IDF方法提取每个模块文本的TOP-N关键词，作为模块文本的特征向量表示，最后使用余弦聚类计算文本的相似度。实验结果表明，在电力行业的科技项目文档数据集上，所提方法优于TF-IDF方法。
所属分类：其它
- 发布日期：2020-10-15
- 文件大小：48kb
- 提供者：weixin_38659248

中文文本相似度/文本推理/文本匹配数据集——XNLI
中文文本相似度/文本推理/文本匹配数据集——XNLI
所属分类：深度学习
- 发布日期：2020-12-25
- 文件大小：16mb
- 提供者：weixin_43639369

中文文本相似度/文本推理/文本匹配数据集——OCNLI
中文文本相似度/文本推理/文本匹配数据集——OCNLI
所属分类：深度学习
- 发布日期：2020-12-25
- 文件大小：1mb
- 提供者：weixin_43639369

中文文本相似度/文本推理/文本匹配数据集——LCQMC
中文文本相似度/文本推理/文本匹配数据集——LCQMC
所属分类：深度学习
- 发布日期：2020-12-25
- 文件大小：5mb
- 提供者：weixin_43639369

中文文本相似度/文本推理/文本匹配数据集——Chinese SNLI MultiNli
中文文本相似度/文本推理/文本匹配数据集——Chinese SNLI MultiNli
所属分类：机器学习
- 发布日期：2020-12-25
- 文件大小：19mb
- 提供者：weixin_43639369

中文文本相似度/文本推理/文本匹配数据集——CCKS2018
中文文本相似度/文本推理/文本匹配数据集——CCKS2018
所属分类：机器学习
- 发布日期：2020-12-25
- 文件大小：2mb
- 提供者：weixin_43639369

英文文本相似度/文本推理/文本匹配数据集——STS
英文文本相似度/文本推理/文本匹配数据集——STS
所属分类：深度学习
- 发布日期：2020-12-25
- 文件大小：385kb
- 提供者：weixin_43639369

英文文本相似度/文本推理/文本匹配数据集——SNLI
英文文本相似度/文本推理/文本匹配数据集——SNLI
所属分类：深度学习
- 发布日期：2020-12-25
- 文件大小：9mb
- 提供者：weixin_43639369

英文文本相似度/文本推理/文本匹配数据集——SICK
英文文本相似度/文本推理/文本匹配数据集——SICK
所属分类：机器学习
- 发布日期：2020-12-25
- 文件大小：214kb
- 提供者：weixin_43639369

英文文本相似度/文本推理/文本匹配数据集——SciTail
英文文本相似度/文本推理/文本匹配数据集——SciTail
所属分类：深度学习
- 发布日期：2020-12-25
- 文件大小：1mb
- 提供者：weixin_43639369

英文文本相似度/文本推理/文本匹配数据集——Quora
英文文本相似度/文本推理/文本匹配数据集——Quora
所属分类：深度学习
- 发布日期：2020-12-25
- 文件大小：19mb
- 提供者：weixin_43639369

英文文本相似度/文本推理/文本匹配数据集——MUltiNLI
英文文本相似度/文本推理/文本匹配数据集——MUltiNLI
所属分类：深度学习
- 发布日期：2020-12-25
- 文件大小：199mb
- 提供者：weixin_43639369

英文文本相似度/文本推理/文本匹配数据集——MSRP
英文文本相似度/文本推理/文本匹配数据集——MSRP
所属分类：深度学习
- 发布日期：2020-12-25
- 文件大小：485kb
- 提供者：weixin_43639369

Text-Processing-with-Neural-Embedding:关于使用stammer.factory的sastrawi处理印尼人的数据集，该处理还涉及在交叉推理之前使用经过预训练的模型进行神经嵌入，测试数据集的两个彼此相似的模
神经嵌入文本处理警告：以下代码中的数据集包含印尼语的HATE SPEECH 请自行承担风险打开ps：很遗憾使用这种数据集，即使这与如何使用神经嵌入处理仇恨言论有关；-; <> 关于使用stammer.factory的sastrawi处理印尼人的数据集，该处理还涉及在交叉推理之前使用经过预训练的模型进行神经嵌入，测试数据集的两个彼此相似的模型
所属分类：其它
- 发布日期：2021-03-15
- 文件大小：12kb
- 提供者：weixin_42104181

基于新的句子层次聚类方法的印尼文本自动摘要
随着Internet的发展，信息量呈指数增长，自动文本摘要技术变得越来越重要。目前，大多数关于自动摘要技术的研究都应用于常见的语言，例如中文和英文，但在资源匮乏的语言中却很少。在本文中，我们构建了印尼语自动摘要数据集，并对印尼语自动摘要进行了相关研究。并且在本文中，我们提出了一种基于句子相似度聚类的高效的基于提取的自动文本摘要方法。基于聚类的思想，本文考虑了句子的语义，并根据句子与句子之间的相似性对句子进行聚类。根据规则提取摘要，最后得到摘要结果。该方法不仅保证了摘要的完整性，重要性
所属分类：其它
- 发布日期：2021-03-08
- 文件大小：282kb
- 提供者：weixin_38517095

排序哈希相似度以进行快速相似度搜索
本文涉及大规模的相似度搜索，该相似度搜索有效地并且有效地找到查询数据点的相似数据点。加速相似性搜索的有效方法是学习哈希函数。用于学习哈希函数的现有方法旨在获得相似对的汉明距离的低值。但是，这些方法忽略这些汉明距离的排名顺序。这导致有关为查询数据点查找相似项目的准确性很差。在本文中，提出了一种算法，称为top k RHS（Rank Hash相似度），其中设计了一种排序损失函数来学习哈希函数。假设哈希函数由1个二进制分类器组成。学习哈希函数的问题可以表述为学习二进制分类器的任务。该算
所属分类：其它
- 发布日期：2021-03-05
- 文件大小：543kb
- 提供者：weixin_38727825

cnn-text-classification：在Yelp，IMDB和句子极性数据集v1.0上使用卷积神经网络进行文本分类-源码
卷积神经网络（CNN）的文本分类这是一个使用CNN对文本文档/句子进行分类的项目。您可以在和的博客条目中找到类似方法的精彩介绍。我的方法与Denny和Yoon Kim的原始论文[1]相似。您也可以在找到Yoon Kim的实现。 ***更新***-2019年12月15日：版本0.2.0的更改我已将代码更新为TensorFlow2。此外，我在jupyter笔记本中进行了一些更改：删除Yelp数据集为IMDB添加TensorFlow数据集 ***更新***-2019年5月17日：0.1
所属分类：其它
- 发布日期：2021-02-03
- 文件大小：209kb
- 提供者：weixin_42108054

« 12 3 4 5 »