您好,欢迎光临本网站![请登录][注册会员]  

大数据下载列表 第979页

« 1 2 ... .74 .75 .76 .77 .78 979.80 .81 .82 .83 .84 ... 1438 »

[Hadoop] cloudera官方java impala jdbc

说明: cloudera官方 java连接impala jdbc驱动 cloudera官方 java连接impala jdbc驱动
<qqcomok> 在 上传 | 大小:25165824

[Hadoop] SQL Power数据清洗工具DQguru

说明: SQL Power提供的数据清洗工具,用于大数据采集过程,此工具提供了丰富的方法来做数据清洗
<wangwenke2003> 在 上传 | 大小:20971520

[Hbase] springboot-hbase

说明: springboot连接hbase工程示例。服务端采用微服务框架springboot,是要phoenix连接hbase
<daikai0201> 在 上传 | 大小:282624

[Hadoop] 公共安全大数据平台的研究与设计

说明: 本文主要针对公共安全领域快速增长的海量数据处理需求,介绍了当前主流的大数据应用平台Hadoop框架,结合公安业务分析了Hadoop框架优势与应用场景,提出了公安大数据平台的建设思路以及RDBMS与Hadoop框架相结合的混合软件体系架构,从而兼顾海量数据的存储处理与OLTP的高实时性需求。
<qq_28339273> 在 上传 | 大小:308224

[算法与数据结构] 大数据建模方法与实践

说明: 2014年出现的一款名为"榫卯"的APP似乎一夜之间火了起来,达到20天内18万次下载量。"榫卯"进入了大众的视野:这种中国古典木匠工艺,仅仅通过木结构的凹凸结合就可以打造出坚固的结构。在明清之际,大部分宫廷家具做成了半榫、闷榫等暗藏结构,又运用了如竹钉、楔子等一些细小的零件来加固。这些体积微小却发挥着重要作用的零件,加上工匠们代代相传的精妙的制作方法,一起构成了中国传统木建筑之美。如"榫卯"一般,在信息时代,金融机构要在大数据领域有所作为,描绘数据之美,离不开各种分析方法与分析工具。这些方法
<qq_28339273> 在 上传 | 大小:395264

[Hbase] 云海大数据一体机体系结构和关键技术

说明: 为了弥补从大数据技术到行业应用之间的鸿沟,针对当前行业用户对大数据处理平台的持续扩展、一体化和多样性需求,提出了大数据一体机的可扩展性、可定制性和多类型处理模型,并基于此设计了云海大数据一体机.该一体机采用兼顾横向和纵向可扩展的体系结构,并采用硬件可定制化设计和混合型软件架构支持多种大数据应用类型.在此基础上,针对HDFS元数据服务瓶颈问题、MapReduce负载倾斜问题、HBase的跨域问题,介绍了在云海大数据一体机中采用的多元数据服务、负载均衡和跨数据中心大表技术.在电信、金融和环保行业实
<qq_28339273> 在 上传 | 大小:967680

[Hbase] HBase负载均衡分析及优化策略

说明: HBase作为Hadoop分布式开源云数据库因其高可用性等优势越来越受到青睐,但是随着大量数据的注入,HBase对负载的分配状况将直接影响到整个集群的性能优劣.针对原有负载均衡算法在负载分配过程中可能产生的负载严重不均衡问题,通过分析原有算法和问题出现的因素,提出一种基于子表限制的负载均衡改进方法,并通过与不均衡状况下的对比实验,验证改进后的分配方式可以有效利用集群中各个节点的资源,从而提高分布式集群性能.
<qq_28339273> 在 上传 | 大小:206848

[Hbase] 基于HBase数据分类的压缩策略选择方法

说明: 为解决现有的HBase数据压缩策略选择方法未考虑数据的冷热性,以及在选择过程中存在片面性和不可靠性的缺陷,提出了基于HBase数据分类的压缩策略选择方法。依据数据文件的访问频度将HBase数据划分为冷热数据,并限定具体的访问级别;在此基础上增加评估层,综合考虑基于相邻区和统计列的选择方法,提出基于数据访问级别的压缩策略选择方法。仿真实验及结果表明,提出的压缩策略选择方法不仅节省了存储空间,还大大提高了数据查询的性能。
<qq_28339273> 在 上传 | 大小:654336

[Hbase] 面向HBase的大规模数据加载研究

说明: 分布式数据库HBase在大规模数据加载中较传统关系型数据库有较大的优势但也存在很大的优化空间.基于Hadoop分布式平台搭建HBase环境,并优化自定义数据加载算法.首先,分析HBase底层数据存储,实验得出HBase自带数据加载方式在效率和灵活性方面存在不足;进而,提出了自定义并行数据加载算法,并针对集群进行优化.实验结果表明,优化后的自定义并行数据加载方式能充分发挥集群性能,具有较好的加载效率和数据操作能力.
<qq_28339273> 在 上传 | 大小:425984

[Hbase] 基于Hbase的大数据查询优化

说明: Hbase有着先天的优势和先天的劣势,而劣势就是其较差的数据定位能力,也就是数据查询能力。因为面向列的特点,Hbase只能单单地以rowkey为主键作查询,而无法对表进行多维查询和join操作,并且查询通常都是全表扫描,耗费资源较大,查询效率较低。类比于传统型数据库里的一些查询方式,本文对Hbase的存储原理进行了研究,借助分布式计算框架Mapreduce在Hbase上构建了二级索引,就可以对表进行有针对性的定位和高效率的查找,同时也减轻zookeeper服务对资源调度的压力。
<qq_28339273> 在 上传 | 大小:641024

[Hbase] 基于HBase和SimHash的大数据K-近邻算法简

说明: 针对大数据K-近邻(K-nearest neighbors,K-NN)计算复杂度高的问题,提出一种基于HBase和Sim Hash的大数据K-近邻分类算法。利用Sim Hash算法将大数据集从原空间映射到Hamming空间,得到哈希签名值集合;将样例的行键与值的二元对存储到HBase数据库中,行健(rowkey)为样例的哈希签名值,值(value)为样例的类别;对于测试样例,以其哈希签名值作为健rowkey,从HBase数据库中获取所有样例的value,通过对这些values进行多数投票,即可
<qq_28339273> 在 上传 | 大小:343040

[spark] hmc311手册

说明: 讯泰手册,HMC311LP3手册,想要的人可以看一看。这个手册官网上也可以下
<hokinghoking> 在 上传 | 大小:955392
« 1 2 ... .74 .75 .76 .77 .78 979.80 .81 .82 .83 .84 ... 1438 »