您好,欢迎光临本网站![请登录][注册会员]  

大数据下载列表 第958页

« 1 2 ... .53 .54 .55 .56 .57 958.59 .60 .61 .62 .63 ... 1412 »

[Hbase] 基于HBase数据分类的压缩策略选择方法

说明: 为解决现有的HBase数据压缩策略选择方法未考虑数据的冷热性,以及在选择过程中存在片面性和不可靠性的缺陷,提出了基于HBase数据分类的压缩策略选择方法。依据数据文件的访问频度将HBase数据划分为冷热数据,并限定具体的访问级别;在此基础上增加评估层,综合考虑基于相邻区和统计列的选择方法,提出基于数据访问级别的压缩策略选择方法。仿真实验及结果表明,提出的压缩策略选择方法不仅节省了存储空间,还大大提高了数据查询的性能。
<qq_28339273> 上传 | 大小:639kb

[Hbase] 面向HBase的大规模数据加载研究

说明: 分布式数据库HBase在大规模数据加载中较传统关系型数据库有较大的优势但也存在很大的优化空间.基于Hadoop分布式平台搭建HBase环境,并优化自定义数据加载算法.首先,分析HBase底层数据存储,实验得出HBase自带数据加载方式在效率和灵活性方面存在不足;进而,提出了自定义并行数据加载算法,并针对集群进行优化.实验结果表明,优化后的自定义并行数据加载方式能充分发挥集群性能,具有较好的加载效率和数据操作能力.
<qq_28339273> 上传 | 大小:416kb

[Hbase] 基于Hbase的大数据查询优化

说明: Hbase有着先天的优势和先天的劣势,而劣势就是其较差的数据定位能力,也就是数据查询能力。因为面向列的特点,Hbase只能单单地以rowkey为主键作查询,而无法对表进行多维查询和join操作,并且查询通常都是全表扫描,耗费资源较大,查询效率较低。类比于传统型数据库里的一些查询方式,本文对Hbase的存储原理进行了研究,借助分布式计算框架Mapreduce在Hbase上构建了二级索引,就可以对表进行有针对性的定位和高效率的查找,同时也减轻zookeeper服务对资源调度的压力。
<qq_28339273> 上传 | 大小:626kb

[Hbase] 基于HBase和SimHash的大数据K-近邻算法简

说明: 针对大数据K-近邻(K-nearest neighbors,K-NN)计算复杂度高的问题,提出一种基于HBase和Sim Hash的大数据K-近邻分类算法。利用Sim Hash算法将大数据集从原空间映射到Hamming空间,得到哈希签名值集合;将样例的行键与值的二元对存储到HBase数据库中,行健(rowkey)为样例的哈希签名值,值(value)为样例的类别;对于测试样例,以其哈希签名值作为健rowkey,从HBase数据库中获取所有样例的value,通过对这些values进行多数投票,即可
<qq_28339273> 上传 | 大小:335kb

[spark] hmc311手册

说明: 讯泰手册,HMC311LP3手册,想要的人可以看一看。这个手册官网上也可以下
<hokinghoking> 上传 | 大小:933kb

[Hadoop] Apache Hadoop2.x 安装入门详解 PDF

说明: Apache Hadoop2.x 安装入门详解 PDF Apache Hadoop2.x 安装入门详解 PDF
<dayu0007> 上传 | 大小:4mb

[Hadoop] Hadoop集群搭建

说明: hadoop是anpche软件基金会旗下的一个开源分布式计算平台。对大数据 HDFS感兴趣的筒子搭建实验环境有帮助。
<tony0236> 上传 | 大小:535kb

[spark] rocketmq-sparkStreaming

说明: rocketmq创建spark流,手动打成第三方包,修改github的BUG,支持rocketmq4.2 spark2.2.1
<zhaohangzhi> 上传 | 大小:241kb

[算法与数据结构] MIC应用论文

说明: 论文主要基于MIC和MINE工具定量分析了类似健康指数等国家指标数据之间的相关性。
<niuniuting> 上传 | 大小:2mb

[算法与数据结构] 聚类分析,多元统计分析

说明: 多元统计分析的聚类分析课件,利用多元统计分析可以实现聚类分析
<weixin_42391851> 上传 | 大小:605kb

[Hadoop] AI学习-大数据实战-UDW里的数据宝藏

说明: 提供完整数据治理基础架构促进数据建设现代化 •日志标准化规范和机制 •可靠传输和存储规划和机制资源解耦所用即所需 •元数据服务规范
<li375268037> 上传 | 大小:3mb

[算法与数据结构] 经验模态分解

说明: 经验模态分解(Empirical Mode Decomposition,EMD),matlab程序,是一种自适应的数据处理或挖掘方法,非常适合非线性,非平稳时间序列的处理,本质上是对数据序列或信号的平稳化处理。
<qq15652703549qq> 上传 | 大小:3kb
« 1 2 ... .53 .54 .55 .56 .57 958.59 .60 .61 .62 .63 ... 1412 »