您好,欢迎光临本网站![请登录][注册会员]  

大数据下载,Hbase下载列表 第38页

« 1 2 ... 33 34 35 36 37 3839 40 41 42 43 ... 56 »

[Hbase] HDFS读文件并写入Hbase

说明: 从HDFS中读文件,用groupby进行sort,然后写入Hbase中
<ifpeace> 在 上传 | 大小:9216

[Hbase] hbase基于快照的数据迁移

说明: hbase基于快照的数据迁移,hbase提供的数据迁移方案。
<github_38358734> 在 上传 | 大小:201728

[Hbase] 最强指南:处理35种不良数据的正确方法

说明: 总结了数据分析处理过程中可能会遇到的各种不良数据,并对不良数据的处理方式提供了建议。让数据的更加的合理,让数据分析的结果有精准有意义。
<sunqiujing> 在 上传 | 大小:282624

[Hbase] HBase自学笔记

说明: 本自学笔记,是根据各大机构及HBase官网综合整理,笔记中有详细的知识体系,从基础到提升再到案例,深入浅出介绍hbase.
<czz1141979570> 在 上传 | 大小:2097152

[Hbase] flume hbanse2.0 lib

说明: 解决新版本flume 不支持hbase 2.0的问题 此资源包由于过大,分为两个分包,另外一个详情见本人博客
<qq_41831183> 在 上传 | 大小:212860928

[Hbase] hbase-0.94.14

说明: hbase-0.94.14hbase-0.94.14hbase-0.94.14hbase-0.94.14hbase-0.94.14hbase-0.94.14hbase-0.94.14hbase-0.94.14hbase-0.94.14hbase-0.94.14hbase-0.94.14hbase-0.94.14hbase-0.94.14hbase-0.94.14hbase-0.94.14hbase-0.94.14hbase-0.94.14
<chen_xyun> 在 上传 | 大小:5242880

[Hbase] 大数据、数据分析领域工具笔记

说明: 大数据、数据分析领域工具笔记,整理比较全,很值得学习
<qq_34618853> 在 上传 | 大小:746496

[Hbase] springboot-hbase

说明: springboot连接hbase工程示例。服务端采用微服务框架springboot,是要phoenix连接hbase
<daikai0201> 在 上传 | 大小:282624

[Hbase] 云海大数据一体机体系结构和关键技术

说明: 为了弥补从大数据技术到行业应用之间的鸿沟,针对当前行业用户对大数据处理平台的持续扩展、一体化和多样性需求,提出了大数据一体机的可扩展性、可定制性和多类型处理模型,并基于此设计了云海大数据一体机.该一体机采用兼顾横向和纵向可扩展的体系结构,并采用硬件可定制化设计和混合型软件架构支持多种大数据应用类型.在此基础上,针对HDFS元数据服务瓶颈问题、MapReduce负载倾斜问题、HBase的跨域问题,介绍了在云海大数据一体机中采用的多元数据服务、负载均衡和跨数据中心大表技术.在电信、金融和环保行业实
<qq_28339273> 在 上传 | 大小:967680

[Hbase] HBase负载均衡分析及优化策略

说明: HBase作为Hadoop分布式开源云数据库因其高可用性等优势越来越受到青睐,但是随着大量数据的注入,HBase对负载的分配状况将直接影响到整个集群的性能优劣.针对原有负载均衡算法在负载分配过程中可能产生的负载严重不均衡问题,通过分析原有算法和问题出现的因素,提出一种基于子表限制的负载均衡改进方法,并通过与不均衡状况下的对比实验,验证改进后的分配方式可以有效利用集群中各个节点的资源,从而提高分布式集群性能.
<qq_28339273> 在 上传 | 大小:206848

[Hbase] 基于HBase数据分类的压缩策略选择方法

说明: 为解决现有的HBase数据压缩策略选择方法未考虑数据的冷热性,以及在选择过程中存在片面性和不可靠性的缺陷,提出了基于HBase数据分类的压缩策略选择方法。依据数据文件的访问频度将HBase数据划分为冷热数据,并限定具体的访问级别;在此基础上增加评估层,综合考虑基于相邻区和统计列的选择方法,提出基于数据访问级别的压缩策略选择方法。仿真实验及结果表明,提出的压缩策略选择方法不仅节省了存储空间,还大大提高了数据查询的性能。
<qq_28339273> 在 上传 | 大小:654336

[Hbase] 面向HBase的大规模数据加载研究

说明: 分布式数据库HBase在大规模数据加载中较传统关系型数据库有较大的优势但也存在很大的优化空间.基于Hadoop分布式平台搭建HBase环境,并优化自定义数据加载算法.首先,分析HBase底层数据存储,实验得出HBase自带数据加载方式在效率和灵活性方面存在不足;进而,提出了自定义并行数据加载算法,并针对集群进行优化.实验结果表明,优化后的自定义并行数据加载方式能充分发挥集群性能,具有较好的加载效率和数据操作能力.
<qq_28339273> 在 上传 | 大小:425984
« 1 2 ... 33 34 35 36 37 3839 40 41 42 43 ... 56 »