您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. Accelerate Your Hive Query

  2. Apache Hive是Hadoop生态圈中比较流行的大数据数据库引擎。在本次演讲中,涵盖一些新的Hive性能提升的优化,包括了最新Spark引擎升级到2.0,Parquet数据类型的向量化支持,以及nested column pruning等新特性。并介绍配置选项从而达到优化的性能。及benchmark数据来展现这些特性能够给Hive带来的性能提升。
  3. 所属分类:讲义

    • 发布日期:2017-05-16
    • 文件大小:698368
    • 提供者:erjin_ren
  1. Hive-Vectorized-Query-Execution-Design.pdf

  2. hive 向量化执行的设计说明。通过在单个操作中获取 1024 行,而不是每次只获取单行来改善 scans、aggregations、filters 和 join 这类操作的性能。
  3. 所属分类:互联网

    • 发布日期:2020-04-18
    • 文件大小:687104
    • 提供者:weixin_43320847
  1. 云粘合平台漫谈及代码理解初步例子

  2. NULL 博文链接:https://lokki.iteye.com/blog/1041255大规模自动化服务,及以上以下的一些名词,但大多数都只实现了简单的服务和功能部件,也未能很 好地"动态化、按需化、快速化”。而在互联网服务新阶段,云计算基础设施里,分布式海量储存、 cache、 KeyValue、 KeyList、非关系式储存、 MapReduce、 Loadbalance、CDN、 ondemand等,这些名 词是常见和普及化的。用后面介绍的名词来说要有专业方向云技术部件” “SLA服务
  3. 所属分类:其它

    • 发布日期:2019-03-23
    • 文件大小:748544
    • 提供者:weixin_38669628