您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. hadoop和hive调优个人总结

  2. 个人在学习和测试hive过程中总结的几点调优新的!
  3. 所属分类:Java

    • 发布日期:2012-03-22
    • 文件大小:33kb
    • 提供者:xsflying
  1. 开发和优化高效的Hadoop & Hive 程序

  2. 《开发和优化高效的Hadoop & Hive 程序》,详细介绍了淘宝在应用大数据技术的思路,以及针对MAPREDUCE和HIVE的调优过程。
  3. 所属分类:其它

    • 发布日期:2013-10-30
    • 文件大小:1mb
    • 提供者:kevenking
  1. Hive及Hadoop作业调优

  2. Hive及Hadoop作业调优 *内部hive优化经验文档
  3. 所属分类:其它

    • 发布日期:2013-11-02
    • 文件大小:1mb
    • 提供者:jancan
  1. hive+Mapreduce 编程性能调优,带HappyETL v0.1介绍

  2. hive+Mapreduce 编程性能调优
  3. 所属分类:Java

    • 发布日期:2013-11-20
    • 文件大小:1mb
    • 提供者:kingfang007
  1. 王家林hive调优

  2. 本文详细介绍了hadoop中的hive的优化,图文并茂,深入浅出,内容详尽,能够让你看过一遍就知道hive优化的方法。
  3. 所属分类:Veritas

    • 发布日期:2014-06-21
    • 文件大小:3mb
    • 提供者:javaniceyou
  1. hive调优策略

  2. hive数据仓库的调优,大小表Join,小文件调优,实现原理
  3. 所属分类:Java

    • 发布日期:2017-09-28
    • 文件大小:1mb
    • 提供者:manongxx
  1. hive的读书笔记

  2. 本文主要描述了hive的基本概念、基本使用以及应用场景及根据数据切斜问题进行相关的hive调优。本文描述浅显,以后会另加补充
  3. 所属分类:Hive

    • 发布日期:2017-10-15
    • 文件大小:45kb
    • 提供者:snwdwtm
  1. 6.SparkSQL(中)--深入了解运行计划及调优.pdf

  2. 1.Spark及其生态圈简介.pdf 2.Spark编译与部署(上)--基础环境搭建.pdf 2.Spark编译与部署(下)--Spark编译安装.pdf 2.Spark编译与部署(中)--Hadoop编译安装.pdf 3.Spark编程模型(上)--概念及SparkShell实战.pdf 3.Spark编程模型(下)--IDEA搭建及实战.pdf 4.Spark运行架构.pdf 5.Hive(上)--Hive介绍及部署.pdf 5.Hive(下)--Hive实战.pdf 6.SparkSQL
  3. 所属分类:spark

    • 发布日期:2018-04-04
    • 文件大小:2mb
    • 提供者:u010195673
  1. HDP平台的Hive性能调优——Hive高性能最佳实践

  2. HDP平台的Hive性能调优——Hive高性能最佳实践, HDP平台的Hive性能调优——Hive高性能最佳实践
  3. 所属分类:Hive

  1. hive性能调优

  2. 本文主要是从Hive参数配置及应用程序设计与开发的角度,总结几种常用的性能优化方法
  3. 所属分类:Hive

    • 发布日期:2018-07-24
    • 文件大小:1mb
    • 提供者:long199366
  1. hive调优总结文档-hive tuning ppt

  2. hive调优总结,网络上分享的hive常见优化细节,join、shuffle优化等等。很不错
  3. 所属分类:Hive

    • 发布日期:2018-08-22
    • 文件大小:6mb
    • 提供者:genghaihua
  1. hive-tuning ppt

  2. Adam Muise是Hortonworks的解决方案工程师,他在多伦多举办的HUG上做了一个关于如何调优Hive的演讲,长达91页的PPT干货十足,从Hive的基本架构、Hive如何存取数据讲起,到如何调优的基本知识,最后介绍了个叫Stinger的项目,可看做下一代Hive,性能更快,它使得Hive不再局限于批处理领域,而是直接杀入交互式应用领域,与Impala等系统直接竞争。
  3. 所属分类:Hive

    • 发布日期:2018-08-31
    • 文件大小:2mb
    • 提供者:action825
  1. hive工作调优小结

  2. hive,基于底层的mr程序的调优,从一、Map阶段的优化(Map phase),二、Reduce阶段的优化(Reudce phase)三、Map与Reduce之间的优化(Spill、Copy、Sort phase)四、文件格式的优化(TextFile、SequenceFile、RCFile)五、Job执行模式的优化
  3. 所属分类:Hive

    • 发布日期:2018-11-16
    • 文件大小:17kb
    • 提供者:weixin_43231331
  1. Hive调优,数据工程师成神之路.pdf

  2. Hive调优,数据工程师成神之路。
  3. 所属分类:互联网

    • 发布日期:2020-10-14
    • 文件大小:1mb
    • 提供者:godlovedaniel
  1. Hive调优全方位指南.pdf

  2. Hive调优全方位指南,总结了25条关于Hive调优的经验,对于大数据及hive工程师是不可多得的资源。
  3. 所属分类:互联网

    • 发布日期:2020-12-28
    • 文件大小:5mb
    • 提供者:godlovedaniel
  1. hive调优

  2. 参数调优 如何开启map输出阶段压缩 背景:map完产生了很多中间文件,被保存在磁盘上,然后等待reduce通过网络来拉取,如果开启map输出阶段压缩,可以减少Map和Reduce间的数据传输量。 1)开启hive中间传输数据压缩功能 set hive.exec.compress.intermediate=true; 2)开启mapreduce中map输出压缩功能 set mapreduce.map.output.compress=true; 3)开启mapreduce中map输出数据的压缩方式
  3. 所属分类:其它

    • 发布日期:2021-01-07
    • 文件大小:487kb
    • 提供者:weixin_38593644
  1. 快速学习-Hive企业级调优

  2. 第 9 章 企业级调优 9.1 Fetch 抓取 Fetch 抓取是指,Hive 中对某些情况的查询可以不必使用 MapReduce 计算。例如:SELECT * FROM employees;在这种情况下,Hive 可以简单地读取 employee 对应的存储目录下的文件,然后输出查询结果到控制台。 在 hive-default.xml.template 文件中 hive.fetch.task.conversion 默认是 more,老版本 hive默认是 minimal,该属性修改为 mor
  3. 所属分类:其它

    • 发布日期:2021-01-07
    • 文件大小:230kb
    • 提供者:weixin_38616359
  1. 美团1万台 Hadoop 集群 YARN 的调优之路

  2. 背景 YARN作为Hadoop的资源管理系统,负责Hadoop集群上计算资源的管理和作业调度。 美团的YARN以社区2.7.1版本为基础构建分支。目前在YARN上支撑离线业务、实时业务以及机器学习业务。 离线业务主要运行的是Hive on MapReduce, Spark SQL为主的数据仓库作业。 实时业务主要运行Spark Streaming,Flink为主的实时流计算作业。 机器学习业务主要运行TensorFlow,MXNet,MLX(美团点评自研的大规模机器学习系统)等计算作业。 YA
  3. 所属分类:其它

    • 发布日期:2021-01-07
    • 文件大小:730kb
    • 提供者:weixin_38689113
  1. Spark性能优化:开发调优篇

  2. Spark性能优化的第一步,就是要在开发Spark作业的过程中注意和应用一些性能优化的基本原则。开发调优,就是要让大家了解以下一些Spark基本开发原则,包括:RDDlineage设计、算子的合理使用、特殊操作的优化等。在开发过程中,时时刻刻都应该注意以上原则,并将这些原则根据具体的业务以及实际的应用场景,灵活地运用到自己的Spark作业中。通常来说,我们在开发一个Spark作业时,首先是基于某个数据源(比如Hive表或HDFS文件)创建一个初始的RDD;接着对这个RDD执行某个算子操作,然后得
  3. 所属分类:其它

    • 发布日期:2021-02-26
    • 文件大小:520kb
    • 提供者:weixin_38704284
  1. Spark性能优化:开发调优篇

  2. Spark性能优化的第一步,就是要在开发Spark作业的过程中注意和应用一些性能优化的基本原则。开发调优,就是要让大家了解以下一些Spark基本开发原则,包括:RDD lineage设计、算子的合理使用、特殊操作的优化等。在开发过程中,时时刻刻都应该注意以上原则,并将这些原则根据具体的业务以及实际的应用场景,灵活地运用到自己的Spark作业中。通常来说,我们在开发一个Spark作业时,首先是基于某个数据源(比如Hive表或HDFS文件)创建一个初始的RDD;接着对这个RDD执行某个算子操作,然后
  3. 所属分类:其它

    • 发布日期:2021-02-01
    • 文件大小:520kb
    • 提供者:weixin_38640150
« 12 3 »