点数信息
www.dssz.net
注册会员
|
设为首页
|
加入收藏夹
您好,欢迎光临本网站!
[请登录]
!
[注册会员]
!
首页
移动开发
云计算
大数据
数据库
游戏开发
人工智能
网络技术
区块链
操作系统
模糊查询
热门搜索:
源码
Android
整站
插件
识别
p2p
游戏
算法
更多...
在线客服QQ:632832888
当前位置:
资源下载
搜索资源 - 相似重复数据
下载资源分类
移动开发
开发技术
课程资源
网络技术
操作系统
安全技术
数据库
行业
服务器应用
存储
信息化
考试认证
云计算
大数据
跨平台
音视频
游戏开发
人工智能
区块链
在结果中搜索
所属系统
Windows
Linux
FreeBSD
Unix
Dos
PalmOS
WinCE
SymbianOS
MacOS
Android
开发平台
Visual C
Visual.Net
Borland C
CBuilder
Dephi
gcc
VBA
LISP
IDL
VHDL
Matlab
MathCAD
Flash
Xcode
Android STU
LabVIEW
开发语言
C/C++
Pascal
ASM
Java
PHP
Basic/ASP
Perl
Python
VBScript
JavaScript
SQL
FoxBase
SHELL
E语言
OC/Swift
文件类型
源码
程序
CHM
PDF
PPT
WORD
Excel
Access
HTML
Text
资源分类
搜索资源列表
Web数据模型以及获取、存储方法研究_北京大学硕士论文
Web上信息就像一条河流,从我们身边不停流过。已经有很多人认识到这些信息的价值,从而展开了对Web信息多方面的研究。本文阐述的内容就是基于这些研究,并希望能够对他人的相关工作带来方便。文章围绕的中心是Web数据的高效获取与存储,为此也专门研究了信息在Web上大量重复出现的现象和原因。 本文的主要内容包括: (1) 有关Web信息状况的一些统计数据,结合一些Web的基本概念,这些数据让读者对Web宏观上能有一些具体的认识。这是理解本文其他部分的基础, (2) 提出了同义主机的概念。在Web上有很
所属分类:
Web开发
发布日期:2009-07-08
文件大小:647kb
提供者:
rockychan1206
EXCEL数据高级查询
EXCEL数据高级查询摘要 EXCEL 对批量数据的多次重复或相似的统计和交叉性集合运算操作比较困难或效率不高 而使用 Visual Basic 开发平台利用ADO 数据库连接和操作技术可以很好的解决这样的问题 提高 EXCEL 文件数据的处理效率 这个方法前提利用 SQL 语言的高度灵活的 SELECT 语句 以实现 EXCEL 单个或多个数据表数据的快速统计汇总 组合计算等 支持分组和排序 同时考虑到数据的输出则使用了 EXCEL 的 VBA 技术的 QueryTable 对象实现 ADO
所属分类:
VB
发布日期:2009-07-28
文件大小:238kb
提供者:
vkings1
一种XML相似重复数据的清理方法研究
针对半结构化数据XML在数据清理中的重要性,研究了如何清理XML相似重复数据,主要工作有:提出一种有效的XML相似重复数据清理方法,该方法具有较强的适应性,任何XML相似检测算法都适用于此;给出一种基于树编辑距离的相似检测算法,该算法能有效地检测XML相似重复数据;采用树编辑距离的上下限优化基于树编辑距离的相似检测算法,避免了不必要的树编辑距离计算,降低了相似检测计算的复杂度,提高了运算效率. 此工作为研究XML相似重复数据清理打下基础。
所属分类:
其它
发布日期:2012-05-11
文件大小:362kb
提供者:
jane0516
C#数据结构
C#版本数据结构,用C#的同志们有福啦 本书节选: 第1章 绪论 数据是外部世界信息的计算机化,是计算机加工处理的对象。运用计算机处 理数据时,必须解决四个方面的问题:一是如何在计算机中方便、高效地表示和 组织数据;二是如何在计算机存储器(内存和外存)中存储数据;三是如何对存 储在计算机中的数据进行操作,可以有哪些操作,如何实现这些操作以及如何对 同一问题的不同操作方法进行评价;四是必须理解每种数据结构的性能特征,以 便选择一个适合于某个特定问题的数据结构。这些问题就是数据结构这门课程所 要研
所属分类:
C#
发布日期:2013-12-10
文件大小:2mb
提供者:
a01589
Simpler 合并重复项 v2.9.4
软件名称:Simpler 合并重复项 APK名称:com.simpler.merge 最新版本:2.9.4 支持ROM:4.0及更高版本 界面语言:英文软件 软件大小:8.25 M前 开发者:YT Dev Ltd 一键合并所有重复的联系人! 您的地址簿很乱? Simpler Merge将在几秒钟内修复! * 超过1,000,000人喜欢各种平台上的Simpler Merge :) 借助Simpler,您可以轻松合并所有重复的联系人,并快速找到所需的联系人 您的联系人信息是手机中最重要的数据,但
所属分类:
Android
发布日期:2015-01-12
文件大小:8mb
提供者:
bbcsport
RFID数据流近似去重
RFID冗余数据近似消重 1.简介: 随着信息技术的发展,各种数据(如XML、RDF和RFID数据生成。RFID不需要接触即可检测射频识别标签的特性,因此被用于很多领域,如商业、军事和医学,导致了大量的RFID数据生成,沃尔玛采用RFID技术是一个典型的RFID在商业领域应用的例子。 然而,RFID技术也带来一系列的问题,由于RFID是非接触式探测,只要标签在阅读器的探测范围内,所有的标签信息都会被读到,因此,RFID标签在探测区移动缓慢或者停留都会产生冗余数据。另外,标签在探测区移动速度过快
所属分类:
其它
发布日期:2015-10-06
文件大小:369kb
提供者:
qq_27383471
Fileaxy-136(文件重复数据处理工具).rar
安装环境 Windows和Linux发行版上以Java 8+ [https://adoptopenjdk.net]运行 Fileaxy是文件重复数据删除,组织,同步和批量预览工具,它利用新的用户界面进行本地文件管理。使用内容哈希或机器视觉算法,Fileaxy可以检测相同的文件以及相似的图像,视频或字体,并根据命名约定将它们与其他文件相关联。只需单击一下按钮,即可选择与ImageMagick,GraphicsMagick,FFmpeg和Mac Sips文件解码集成。 Fileaxy无
所属分类:
其它
发布日期:2020-03-21
文件大小:1mb
提供者:
sdacc33z
罗克韦尔自动化 RSViewSE技术数据(中文).pdf
罗克韦尔自动化 RSViewSE技术数据(中文)pdf,罗克韦尔自动化 RSViewSE技术数据(中文)与罗克韦尔控制器的最佳连接方案 Tag Browser ?| Folders Contents of 'Wwaste water: Water/OFfline 是与罗克韦尔自动化产品 回5 amples Water Name Descr iption 结合最的可视化软件产品。 捉供了与 Fc甲 waste water LEVEL1 自 ProcessData 會PRE5RE 和 平台的最 白W
所属分类:
其它
发布日期:2019-10-13
文件大小:2mb
提供者:
weixin_38743481
视频数据质量与视频数据检测技术
视频检测技术有助于改善视频数据质量问题。随着科技进步和信息技术发展,视频数据规模急剧增加,视频数据质量问题越来越受到人们关注。针对相似重复视频数据和异常视频数据这2类脏视频数据的检测技术将有助于发现并解决视频数据质量问题。为此,通过扩展视频数据质量概念,针对这2类脏视频数据,分析和总结相关的视频检测方法及关键技术;最后,简要说明视频检测技术研究的不足,并对视频检测技术的应用进行了总结和展望。
所属分类:
其它
发布日期:2020-06-15
文件大小:280kb
提供者:
weixin_38551143
粒子群优化BP神经网络用于重复记录检测
针对数据规模的扩大,重复记录检测效率往往不能进一步提升的问题,提出一种粒子群优化BP神经网络的重复记录检测方法,充分利用了神经网络的非线性映射和粒子群算法的全局优化特性。将基于学习的思想和进化的思想应用到重复记录检测中,避开了传统方法计算属性权重的问题。理论分析和实验表明:该方法不仅具有好的检测精度,而且具有很好的时间效率,能够有效地解决大数据量的相似重复记录检测问题。
所属分类:
其它
发布日期:2020-06-27
文件大小:902kb
提供者:
weixin_38680764
重复数据删除技术的发展及应用
重复数据删除技术包括相同数据重复数据删除技术和相似数据重复数据删除技术。相同数据重复数据删除技术主要有:相同文件重复数据删除技术、固定长度分块的重复数据删除技术、基于内容分块的重复数据删除技术、基于滑动块的重复数据删除技术和基于数据特征的重复数据消除算法等。重复数据删除技术适合应用于数据备份系统、归档存储系统、远程灾备系统等场合。
所属分类:
其它
发布日期:2020-10-25
文件大小:226kb
提供者:
weixin_38569515
vue项目优化之通过keep-alive数据缓存的方法
是Vue的内置组件,能在组件切换过程中将状态保留在内存中,防止重复渲染DOM。 包裹动态组件时,会缓存不活动的组件实例,而不是销毁它们。和 相似, 是一个抽象组件:它自身不会渲染一个 DOM 元素,也不会出现在父组件链中。 prop: include: 字符串或正则表达式。只有匹配的组件会被缓存。 exclude: 字符串或正则表达式。任何匹配的组件都不会被缓存。 通过vue提供的keep-alive减少对服务器的请求次数 VUE2.0中提供了一个keep-aliv
所属分类:
其它
发布日期:2020-11-26
文件大小:55kb
提供者:
weixin_38545959
Python中列表、字典、元组数据结构的简单学习笔记
列表 列表是Python中最具灵活性的有序集合对象类型。与字符串不同的是,列表可以包含任何类型的对象:数字、字符串甚至其他列表。列表是可变对象,它支持原地修改的操作。 Python的列表是: 任意对象的有序集合 通过偏移读取 可变长度、异构以及任意嵌套 属于可变序列的分类 对象引用数组(列表中的存储的是对象的引用,而不是对象的拷贝) 实际应用中的列表 >>基本列表操作 由于列表是序列,它支持很多与字符串相同的操作。列表对”+”和”*“操作的响应与字符串很相似,两个
所属分类:
其它
发布日期:2020-12-24
文件大小:75kb
提供者:
weixin_38632046
duplicateFileFinder:该程序在文件夹及其子文件夹中查找重复的文件。 重复项将移动到单独的文件夹中。 不会根据文件名检查文件。 根据文件大小和文件组成的前几个数据块检查它们。 还有一种模式可以使用图像的像素检查图像文件的相似
程序正在建设中。 plicateFileFinder 该程序在文件夹及其子文件夹中查找重复的文件。 重复项将移动到单独的文件夹中。 不会根据文件名检查文件。 根据文件大小和文件组成的前几个数据块检查它们。 还有一种模式可以使用图像的像素检查图像文件的相似性,即使图像的文件格式不同。 运行程序 首先安装此文件:python3 -m pip install filetype只需使用以下命令运行主文件: python3 main.py
所属分类:
其它
发布日期:2021-03-14
文件大小:10kb
提供者:
weixin_42118701
重复问题检测lsh:通过数据分析(包括局部敏感哈希(LSH))进行知识提取-源码
重复问题检测 通过数据分析(包括局部敏感哈希(LSH))进行知识提取。 该存储库包含一个Jupyter笔记本,该笔记本使用数据集的子集测试4种不同类型的知识提取。 测试的知识提取方法为: 使用余弦相似度的“一对VS全部” 使用Jaccard相似度的“一对多” 具有余弦相似度的SimHash和随机二元投影的LSH 具有Jashcard相似性的具有MinHash和随机置换函数的LSH
所属分类:
其它
发布日期:2021-03-02
文件大小:215kb
提供者:
weixin_42098830
2021-Spring:EMSE 4575的2021年Spring部分:GWU的探索性数据分析-源码
EMSE 4197:探索性数据分析-2021年Spring 描述 本课程为学生提供使用探索数据的基础。 学生将学习如何获取,管理,转换和探索各种数据类型。 学生还将掌握可视化和交流原始数据中包含的信息的基本概念,包括视觉信息处理的人类心理。 将使用进行所有分析,以支持从原始数据到结果的可。 教学将涉及互动式讲座,课堂上有大量时间用于编写示例和编码。 将通过测验和考试对学生进行评估。 在整个学期中,学生将进行自己设计的研究项目,以证明他们对课程主题的精通。 在学期末,学生将提交一份有关该项目的可重
所属分类:
其它
发布日期:2021-02-25
文件大小:215mb
提供者:
weixin_42164685
DuplicateQuestionPairs:预测在线论坛中的两个问题是否重复。 然后比较几种分类算法以找到最佳模型-源码
Udacity_MachineLearningEngineer_Capstone Udacity的机器学习纳米学位的Capstone项目 介绍 Quora是一个受欢迎的网站,人们可以在其中提问和回答各种问题。 但是,很多时候人们会遇到相似或几乎相同的问题,这使得寻找最佳答案变得困难。 在这个项目中,我开发了一种监督学习算法来检测Quora上的重复问题。 所需库 麻木 大熊猫 词云 斯克莱恩 matplotlib 操作系统 馆藏 xgboost Graphviz 跑步 所有运行脚本都在cap
所属分类:
其它
发布日期:2021-02-21
文件大小:54kb
提供者:
weixin_42168830
IntraArchiveDeduplicator:用于管理现有压缩存档文件中的重复数据删除的工具,以及用于模糊图像搜索的性能相对较高的BK树实现-源码
存档内重复数据删除器 用于管理现有压缩存档文件中的重复数据删除的工具,重点是Manga / Comic-book存档文件。 这是一个颇为奇特的工具,旨在允许压缩档案中的文件相当快的重复检测。 它为所有扫描的文件维护一个哈希数据库,并且实际上递归到压缩档案中以扫描档案中的文件,即使使用不同的压缩算法压缩了档案,这也应允许检测具有重复内容的档案。 还提供使用自定义树系统按图像相似度进行搜索的功能。 图像相似性系统在PostgreSQL(实际上是Cython,但基本上是python)中实现,在
所属分类:
其它
发布日期:2021-02-05
文件大小:7mb
提供者:
weixin_42120283
重复数据删除:用于准确,可扩展的模糊匹配,记录重复数据删除和实体解析的python库-源码
重复数据删除Python库 重复数据删除是一个python库,使用机器学习对结构化数据快速执行模糊匹配,重复数据删除和实体解析。 重复数据删除将帮助您: 从名称和地址的电子表格中删除重复的条目 将具有客户信息的列表链接到具有订单历史记录的列表,即使没有唯一的客户ID 收集竞选捐款的数据库,并找出同一个人所做的捐款,即使每个记录的名称输入略有不同 重复数据删除可吸收人工培训数据,并为您的数据集提供最佳规则,即使是非常大的数据库,也可以快速自动找到相似的记录。 重要连结 文档: : 仓
所属分类:
其它
发布日期:2021-02-05
文件大小:221kb
提供者:
weixin_42133329
graphql-inspector::woman_detective_selector:验证模式,获取模式更改通知,验证操作,查找重大更改,查找相似类型,模式覆盖率-源码
GraphQL Inspector输出两个GraphQL模式之间的更改列表。 每次更改都经过精确解释,并标记为中断,不中断或危险。 它可以帮助您根据架构验证文档和片段,甚至可以找到相似或重复的类型。 但是,您可以使用GraphQL Inspector: 产品特点 比较架构 检测损坏或危险的变化 架构变更通知 使用无服务器功能验证更改 根据模式验证操作和片段 查找相似/重复的类型 基于操作和片段的架构覆盖 为GraphQL服务器提供伪造数据和GraphiQL Docker镜像 在GitHub上
所属分类:
其它
发布日期:2021-01-30
文件大小:3mb
提供者:
weixin_42133969
«
1
2
3
4
5
6
7
8
9
10
»