您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. Hadoo数据仓库-hive入门全面介绍

  2. hadoop hive 数据仓库 入门 hive是一个基于hadoop的数据仓库。使用hadoop-hdfs作为数据存储层;提供类似SQL的语言(HQL),通过hadoop-mapreduce完成数据计算;通过HQL语言提供使用者部分传统RDBMS一样的表格查询特性和分布式存储计算特性
  3. 所属分类:Java

    • 发布日期:2012-06-29
    • 文件大小:1048576
    • 提供者:shaozhi_jinni
  1. HIVE优化实战分享

  2. HIVE优化实战分享 大数据存储方案 很好的参考文档
  3. 所属分类:其它

    • 发布日期:2014-03-14
    • 文件大小:974848
    • 提供者:yesky_zhang
  1. 云计算大数据全套

  2. 1.Hadoop的源起与体系介绍 2.实施Hadoop集群 3.分布式文件系统HDFS,大数据存储实战 4.hadoop高级应用 5.Pig安装与Pig Latin语言,应用案例 6.Hive体系架构安装与HiveQL应用案例 7.HBase体系架构与安装 8.HBase数据分析与建模,实战案例剖析 9.Map-Reduce数据分析,Hadoop流,应用案例 10.Map-Reduce数据分析之一,API实战 11.Map-Reduce体系架构 12.等等
  3. 所属分类:其它

    • 发布日期:2014-03-21
    • 文件大小:153
    • 提供者:u011190726
  1. Hive用户指南

  2. Hive用户指南 目录 1. HIVE结构 6 1.1 HIVE架构 6 1.2 Hive 和 Hadoop 关系 7 1.3 Hive 和普通关系数据库的异同 8 1.4 HIVE元数据库 9 1.4.1 DERBY 9 1.4.2 Mysql 10 1.5 HIVE的数据存储 11 1.6 其它HIVE操作 11 2. HIVE 基本操作 12 2.1 create table 12 2.1.1 总述 12 2.1.2 语法 12 2.1.3 基本例子 14 2.1.4 创建分区 15 2
  3. 所属分类:Java

  1. 大数据分析的分布式MOLAP技术

  2. 数据的规模效应给数据存储、管理以及数据分析带来了极大的挑战,学界和业界广泛采用分布式文件 系统和 MapReduce 编程模型来应对这一挑战.提出了大数据环境中一种基于 Hadoop 分布式文件系统(HDFS)和 MapReduce 编程模型的分布式 MOLAP 技术,称为 DOLAP(distributed OLAP).DOLAP 采用一种特殊的多维模型完 成维和度量的映射;采用维编码和遍历算法实现维层次上的上卷下钻操作;采用数据分块和线性化算法将维和度量 保存在分布式文件系统中;采用数据块
  3. 所属分类:其它

    • 发布日期:2015-05-28
    • 文件大小:1048576
    • 提供者:qq_28551979
  1. hive数据存储模式

  2. hive数据存储模式,对理解hive有帮助
  3. 所属分类:其它

    • 发布日期:2015-08-08
    • 文件大小:157696
    • 提供者:lvv84929254
  1. Hive用户指南%28Hive_user_guide%29_中文版

  2. Hive用户指南 目录 1. HIVE结构 6 1.1 HIVE架构 6 1.2 Hive 和 Hadoop 关系 7 1.3 Hive 和普通关系数据库的异同 8 1.4 HIVE元数据库 9 1.4.1 DERBY 9 1.4.2 Mysql 10 1.5 HIVE的数据存储 11 1.6 其它HIVE操作 11 2. HIVE 基本操作 12 2.1 create table 12 2.1.1 总述 12 2.1.2 语法 12 2.1.3 基本例子 14 2.1.4 创建分区 15 2
  3. 所属分类:其它

    • 发布日期:2015-12-21
    • 文件大小:651264
    • 提供者:qq_21825619
  1. 大数据学习笔记

  2. 第一部分 Spark学习 6 第1章 Spark介绍 7 1.1 Spark简介与发展 7 1.2 Spark特点 7 1.3 Spark与Hadoop集成 7 1.4 Spark组件 8 第2章 Spark弹性分布数据集 9 2.1 弹性分布式数据集 9 2.2 MapReduce数据分享效率低 9 2.3 MapReduce进行迭代操作 9 2.4 MapReduce进行交互操作 10 2.5 Spark RDD数据分享 10 2.6 Spark RDD 迭代操作 10 2.7 Spark
  3. 所属分类:其它

    • 发布日期:2016-10-31
    • 文件大小:5242880
    • 提供者:henni_719
  1. 大数据学习笔记.pdf

  2. 目录 第一部分 Spark学习 ....................................................................................................................... 6 第1章 Spark介绍 ...................................................................................................
  3. 所属分类:其它

    • 发布日期:2016-11-03
    • 文件大小:6291456
    • 提供者:henni_719
  1. Hive的数据存储模式

  2. Hive的数据存储模式Hive的数据存储模式Hive的数据存储模式Hive的数据存储模式
  3. 所属分类:Hive

    • 发布日期:2017-10-08
    • 文件大小:654336
    • 提供者:fuliangyan
  1. 分布式数据仓库Hive大全

  2. 1. HIVE结构 6 1.1 HIVE架构 6 1.2 Hive 和 Hadoop 关系 7 1.3 Hive 和普通关系数据库的异同 8 1.4 HIVE元数据库 9 1.4.1 DERBY 9 1.4.2 Mysql 10 1.5 HIVE的数据存储 11 1.6 其它HIVE操作 11 2. HIVE 基本操作 12 2.1 create table 12 2.1.1 总述 12 2.1.2 语法 12 2.1.3 基本例子 14 2.1.4 创建分区 15 2.1.5 其它例子 16
  3. 所属分类:Java

    • 发布日期:2017-11-08
    • 文件大小:2097152
    • 提供者:u014407201
  1. CDH550@hive存储格式和HQL材料

  2. CDH550下的hive的存储格式介绍和HQL的详细说明。一般数据存储模式主要有三种,1)行存储;2)列存储;3)混合存储。 1)行存储模式就是:把一整行存在一起,包含所有的列,这是最常见的模式。这种结构能很好的适应动态的查询
  3. 所属分类:Hive

    • 发布日期:2017-11-14
    • 文件大小:1048576
    • 提供者:zdz131148
  1. 数据仓库与HDFS的列存储技术

  2. 单机数据(仓)库 数据量GB级(最多几个TB) Infobright MPP数据(仓)库 Share-nothing存储架构,水平扩展 Sybase IQ / Teradata / HANA / Greenplum SQL on Hadoop 采用HDFS作为统一的数据存储 采用MapReduce-like或者MPP-like的计算引擎 Hive / Spark SQL / Presto / Impala / HAWQ
  3. 所属分类:Hadoop

    • 发布日期:2018-07-31
    • 文件大小:3145728
    • 提供者:cwz199406060
  1. 2018最新高清大数据协作框架全套视频教程(Sqoop,Flume,Oozie,WEB工具Hue)

  2. 第1章 数据转换工具Sqoop 1.02_02_01_01 大数据Hadoop 2.x协作.框架的功能 网页.mp4 1.02_02_01_02 Sqoop 功能概述和版本、架构讲解 网页.mp4 1.02_02_01_03 Sqoop 使用要点(核心)及企业版本讲解.mp4 1.02_02_01_04 使用CDH 5.3.6版本快速搭建Hadoop 2.x和Hive伪分布式环境 网页.mp4 1.02_02_01_05 Sqoop 1安装及基本使用讲解 网页.mp4 1.02_02_01_0
  3. 所属分类:Java

    • 发布日期:2018-08-24
    • 文件大小:64
    • 提供者:xu0612204126
  1. 大数据-hive性能优化

  2. 详细讲解了大数据中的海量数据存储架构,hive的性能优化方案。
  3. 所属分类:Hive

    • 发布日期:2018-09-04
    • 文件大小:305152
    • 提供者:dch215810
  1. 快速学习-Hive 数据类型

  2. 第 3 章 Hive 数据类型 3.1 基本数据类型 对于 Hive 的 String 类型相当于数据库的 varchar 类型,该类型是一个可变的字符串,不过它不能声明其中最多能存储多少个字符,理论上它可以存储 2GB 的字符数。 3.2 集合数据类型 Hive 有三种复杂数据类型 ARRAY、MAP 和 STRUCT。ARRAY 和 MAP 与 Java 中的Array 和 Map 类似,而 STRUCT 与 C 语言中的 Struct 类似,它封装了一个命名字段集合,复杂数据类型允许任
  3. 所属分类:其它

    • 发布日期:2021-01-07
    • 文件大小:154624
    • 提供者:weixin_38697808
  1. 10-Hive数据仓库

  2. Hive数据仓库 Hive数据仓库思维导图下载链接 Hive简介 Hive的产生 非java编程者对HDFS的数据做Mapreduce操作 Hive : 数据仓库 Hive:解释器,编译器,优化器等 Hive 运行时,元数据存储在关系型数据库里面 Hive架构 (1)用户接口主要有三个:CLI,Client 和 WUI。其中最常用的是CLI,Cli启动的时候,会同时启动一个Hive副本。Client是Hive的客户端,用户连接至Hive Server。在启动 Client模式的时候,需要指出Hi
  3. 所属分类:其它

    • 发布日期:2021-01-07
    • 文件大小:59392
    • 提供者:weixin_38554193
  1. scripts-bda:统一数据存储库BDA的存储库-源码

  2. 脚本-bda BDA统一存储库 Arquivos base.py e timer.py disponibilizados aqui para serem usados nos projetos。 导入或删除文件--py文件执行spark-submit。 info-tecnica-HDFS的信息PDF文件 generic-extract-jdbc-模数生成的通用数据库jdbc(例如:tabelas oracle)或HDFS como tabela hive(BDA)。 compress_fi
  3. 所属分类:其它

    • 发布日期:2021-02-12
    • 文件大小:1048576
    • 提供者:weixin_42099116
  1. 基于Hive数据仓库的物流大数据平台的研究与设计

  2. 针对物流企业数据仓库扩展性不好、运行自动化程度不高、处理大规模数据效果较差等问题。本文通过对Hive技术的物流数据仓库进行分析,提出物流数据仓库的具体实现方案,该数据仓库结合云平台虚拟化技术,部署了 Hadoop和 Hive 环境,搭建了基于虚拟化技术的大数据处理平台。同时从数据 ETL 和数据查询分析处理两方面对数据仓库的可扩展性Hive 数据存储分析、Hive数据前置处理等进行研究设计。通过 Hive数据仓库运行效果进行分析,表明该系统能够很好地支持企业管理层决策。
  3. 所属分类:其它

    • 发布日期:2021-01-27
    • 文件大小:1048576
    • 提供者:weixin_38685600
  1. Redis hash数据存储空间优化

  2. 最近遇到一个需求,需要将hive中16亿行数据存储到redis中。数据存储采用hash结构,将16亿行数据根据key离散到32万个hash中。 由于每一行的key是16个字节,数据为1个字节,一开始在预估存储空间为:16亿*(16+1) = 26 G 左右。于是部署了16个分片,每个分片10G的集群。但是实际数据推上集群后,发现占用了140G空间,这大大超出了之前的预估。 感到很疑惑,于是查找相关资料。发现https://stackoverflow.com/questions/10004565/
  3. 所属分类:其它

    • 发布日期:2021-01-20
    • 文件大小:36864
    • 提供者:weixin_38720997
« 12 3 4 5 6 7 8 9 10 »