您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 基于Hadoop+Hive的数据查询优化设计与实现

  2. 基于Hadoop+Hive的数据查询优化设计与实现
  3. 所属分类:Java

    • 发布日期:2013-07-29
    • 文件大小:2097152
    • 提供者:yuanyinxiaing
  1. Hive用户指南

  2. Hive用户指南 目录 1. HIVE结构 6 1.1 HIVE架构 6 1.2 Hive 和 Hadoop 关系 7 1.3 Hive 和普通关系数据库的异同 8 1.4 HIVE元数据库 9 1.4.1 DERBY 9 1.4.2 Mysql 10 1.5 HIVE的数据存储 11 1.6 其它HIVE操作 11 2. HIVE 基本操作 12 2.1 create table 12 2.1.1 总述 12 2.1.2 语法 12 2.1.3 基本例子 14 2.1.4 创建分区 15 2
  3. 所属分类:Java

  1. hive性能优化

  2. 一个Hive查询生成多个map reduce job,一个map reduce job又有map,reduce,spill,shuffle,sort等多个阶段,所以针对hive查询的优化可以大致分为针对M/R中单个步骤的优化,针对M/R全局的优化,和针对整个查询(多M/R job)的优化,下文会分别阐述
  3. 所属分类:其它

    • 发布日期:2014-10-23
    • 文件大小:112640
    • 提供者:xdy2000
  1. Hive用户指南%28Hive_user_guide%29_中文版

  2. Hive用户指南 目录 1. HIVE结构 6 1.1 HIVE架构 6 1.2 Hive 和 Hadoop 关系 7 1.3 Hive 和普通关系数据库的异同 8 1.4 HIVE元数据库 9 1.4.1 DERBY 9 1.4.2 Mysql 10 1.5 HIVE的数据存储 11 1.6 其它HIVE操作 11 2. HIVE 基本操作 12 2.1 create table 12 2.1.1 总述 12 2.1.2 语法 12 2.1.3 基本例子 14 2.1.4 创建分区 15 2
  3. 所属分类:其它

    • 发布日期:2015-12-21
    • 文件大小:651264
    • 提供者:qq_21825619
  1. Hive sql优化

  2. 从数据倾斜,jvm重用,语句编写等方面对hive查询进行优化。
  3. 所属分类:其它

    • 发布日期:2016-06-13
    • 文件大小:31744
    • 提供者:nma_123456
  1. Hive大数据倾斜总结

  2. Hive查询生成多个map reduce job,一个map reduce job又有map,reduce,spill,shuffle,sort等多个阶段,所以针对hive查询的优化可以大致分为针对MR中单个步骤的优化,针对MR全局的优化以及针对整个查询的优化。 一个Hive查询生成多个Map Reduce Job,一个Map Reduce Job又有Map,Reduce,Spill,Shuffle,Sort等多个阶段,所以针对Hive查询的优化可以大致分为针对MR中单个步骤的优化(其中又会有
  3. 所属分类:Hive

    • 发布日期:2017-09-07
    • 文件大小:214016
    • 提供者:qq_37051667
  1. hive course pdf

  2. hive课程pdf集合,包括序列化器与反序列化器,4 算子Operators及查询优化器Optimizers
  3. 所属分类:Hive

    • 发布日期:2017-10-30
    • 文件大小:10485760
    • 提供者:jetdragon
  1. 分布式数据仓库Hive大全

  2. 1. HIVE结构 6 1.1 HIVE架构 6 1.2 Hive 和 Hadoop 关系 7 1.3 Hive 和普通关系数据库的异同 8 1.4 HIVE元数据库 9 1.4.1 DERBY 9 1.4.2 Mysql 10 1.5 HIVE的数据存储 11 1.6 其它HIVE操作 11 2. HIVE 基本操作 12 2.1 create table 12 2.1.1 总述 12 2.1.2 语法 12 2.1.3 基本例子 14 2.1.4 创建分区 15 2.1.5 其它例子 16
  3. 所属分类:Java

    • 发布日期:2017-11-08
    • 文件大小:2097152
    • 提供者:u014407201
  1. hive性能优化

  2. hive查询优化实践总结 optimizing hive queries, 详细描述了一些经典hive查询优化方法
  3. 所属分类:Hive

    • 发布日期:2018-06-02
    • 文件大小:968704
    • 提供者:weixin_39391253
  1. Apache Hive in CDH优化

  2. hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供简单的sql查询功能,可以将sql语句转换为MapReduce任务进行运行。 其优点是学习成本低,可以通过类SQL语句快速实现简单的MapReduce统计,不必开发专门的MapReduce应用,十分适合数据仓库的统计分析。 本人介绍如何在CDH中优化Hive,参考CDH文档翻译而来
  3. 所属分类:Hadoop

    • 发布日期:2018-08-13
    • 文件大小:972800
    • 提供者:szdxxhb
  1. hive原理及查询优化

  2. 学习掌握hive原理及查询优化的必备之书学习掌握hive原理及查询优化的必备之书
  3. 所属分类:Hive

    • 发布日期:2018-09-30
    • 文件大小:1048576
    • 提供者:ycjunhua
  1. hive查询优化

  2. hive作为hadoop系列的计算模型,在公司的数据清洗和报表开发广泛使用,合理的优化自己的语句结构可以节省计算时间,优化集群的计算资源,下面总结下日常工作中自己碰到的一些问题和别人总结的一些方法。
  3. 所属分类:Hive

  1. Hive查询优化整理与Hive简易版思维导图

  2. hive思维导图与hive优化的相关建议。纯属个人收集在线资料并个人实践之后整理
  3. 所属分类:Hive

    • 发布日期:2019-04-30
    • 文件大小:331776
    • 提供者:snipermarus
  1. Hive知识图谱.xmind

  2. hive是基于Hadoop的一个数据仓库工具,用来进行数据提取、转化、加载,这是一种可以存储、查询和分析存储在Hadoop中的大规模数据的机制。hive数据仓库工具能将结构化的数据文件映射为一张数据库表,并提供SQL查询功能,能将SQL语句转变成MapReduce任务来执行。Hive的优点是学习成本低,可以通过类似SQL语句实现快速MapReduce统计,使MapReduce变得更加简单,而不必开发专门的MapReduce应用程序。hive是十分适合数据仓库的统计分析和Windows注册表文件。
  3. 所属分类:Hive

    • 发布日期:2020-03-12
    • 文件大小:444416
    • 提供者:weixin_41824818
  1. Hive用户指南(Hive_user_guide)_中文版.pdf

  2. 1. HIVE结构 Hive 是建立在 Hadoop 上的数据仓库基础构架。它提供了一系列的工具,可以用来进行数 据提取转化加载 (ETL),这是一种可以存储、 查询和分析存储在 Hadoop 中的大规模数据的 机制。 Hive 定义了简单的类 SQL 查询语言,称为 QL,它允许熟悉 SQL 的用户查询数据。 同时,这个语言也允许熟悉 MapReduce 开发者的开发自定义的 mapper 和 reducer 来处理 内建的 mapper 和 reducer 无法完成的复杂的分析工作
  3. 所属分类:其它

    • 发布日期:2020-01-14
    • 文件大小:1048576
    • 提供者:weixin_45524326
  1. Hive日常积累优化技巧.pdf

  2. Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供简单的 sql查询功能,可以将sql语句转换 为MapReduce任务进行运行。 其优点是学习成本低,可以通过类SQL 语句快速实现简单的MapReduce统计,不必开发专门的MapReduce应用,十分适合数据仓库的统计分析。
  3. 所属分类:Hive

    • 发布日期:2019-07-02
    • 文件大小:272384
    • 提供者:abacaba
  1. Hive优化.docx

  2. Join 查找操作的基本原则:应该将条目少的表/子查询放在 Join 操作符的左边。原因 是在 Join 操作的 Reduce 阶段,位于 Join 操作符左边的表的内容会被加载进内存,将 条目少的表放在左边,可以有效减少发生内存溢出错误的几率。 Join 查找操作中如果存在多个 join,且所有参与 join 的表中其参与 join 的 key 都相 同,则会将所有的 join 合并到一个 mapred 程序中。
  3. 所属分类:Hive

    • 发布日期:2019-07-01
    • 文件大小:83968
    • 提供者:love284969214
  1. HIVE查询优化

  2. 所有的调优都离不开对CPU、内存、IO这三样资源的权衡及调整 Hive QL的执行本质上是MR任务的运行,因此优化主要考虑到两个方面:Mapreduce任务优化、SQL语句优化 一、Mapreduce任务优化 1、设置合理的task数量(map task、reduce task) 这里有几个考虑的点,一方面Hadoop MR task的启动及初始化时间较长,如果task过多,可能会导致任务启动和初始化时间远超逻辑处理时间,这种情况白白浪费了计算资源。另一方面,如果任务复杂,task过少又会导致任
  3. 所属分类:其它

    • 发布日期:2021-01-07
    • 文件大小:141312
    • 提供者:weixin_38752459
  1. 数据仓库中的SQL性能优化(Hive篇)

  2. 一个Hive查询生成多个mapreducejob,一个mapreducejob又有map,reduce,spill,shuffle,sort等多个阶段,所以针对hive查询的优化可以大致分为针对MR中单个步骤的优化(其中又会有细分),针对MR全局的优化,和针对整个查询(多MRjob)的优化,下文会分别阐述。在开始之前,先把MR的流程图帖出来(摘自Hadoop权威指南),方便后面对照。另外要说明的是,这个优化只是针对Hive0.9版本,而不是后来Hortonwork发起Stinger项目之后的版本
  3. 所属分类:其它

    • 发布日期:2021-03-03
    • 文件大小:333824
    • 提供者:weixin_38529123
  1. 数据仓库中的SQL性能优化(Hive篇)

  2. 一个Hive查询生成多个map reducejob,一个mapreducejob又有map,reduce,spill,shuffle,sort等多个阶段,所以针对hive查询的优化可以大致分为针对MR中单个步骤的优化(其中又会有细分),针对MR全局的优化,和针对整个查询(多MR job)的优化,下文会分别阐述。在开始之前,先把MR的流程图帖出来(摘自Hadoop权威指南),方便后面对照。另外要说明的是,这个优化只是针对Hive
  3. 所属分类:其它

    • 发布日期:2021-01-30
    • 文件大小:333824
    • 提供者:weixin_38729022
« 12 3 »