您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 自定义hive函数

  2. 自定义 hive udf udaf 有url解析,获取网站主域名,根据ip获取区域码,有rownum,列聚合以及一些业务实现udf。
  3. 所属分类:Java

    • 发布日期:2013-07-24
    • 文件大小:152kb
    • 提供者:javashooter
  1. 实战Hadoop:开启通向云计算的捷径

  2. 第1章 神奇的大象——Hadoop 1.1 初识神象 1.2 Hadoop初体验 1.2.1 了解Hadoop的构架 1.2.2 查看Hadoop活动 1.3 Hadoop族群 1.4 Hadoop安装 1.4.1 在Linux系统中安装Hadoop 1.4.2 在Windows系统中安装Hadoop 1.4.3 站在象背上说“hello” 1.4.4 Eclipse下的Hadoop应用开发 参考文献 第2章 HDFS——不怕故障的海量存储 2.1 开源的GFS——HDFS 2.1.1 设计前
  3. 所属分类:其它

    • 发布日期:2013-07-31
    • 文件大小:59mb
    • 提供者:jsntghf
  1. 赵伟:HIVE在腾讯分布式数据仓库实践

  2. 赵伟首先介绍了他们的TDW核心架构,HIVE,MapReduce,HDFS及PostgreSQL构成。赵伟分享了最核心的HIVE模块在TDW中的实践经验;HIVE是一个在Hadoop上构建数据仓库的软件,它支持通过类SQL的HQL语言对结构化数据进行操作;实现了基本的SQL功能,可扩充UDF/UDAF...
  3. 所属分类:讲义

    • 发布日期:2014-05-29
    • 文件大小:1mb
    • 提供者:fowse
  1. Hive UDAF示例

  2. A custom UDAF to group oncatenates all arguments from different rows into a single string.
  3. 所属分类:Java

    • 发布日期:2015-08-01
    • 文件大小:2kb
    • 提供者:a_laws
  1. Spark SQL 表达式计算

  2. 表达式计算在Spark SQL中随处可见,本演讲将简介表达式、UDF、UDAF、UDTF的概念,主要的API,以及如何扩展Spark SQL函数库。本演讲还将提及Catalyst在计划阶段和Project Tungsten在执行层做的优化,以及未来性能提升可能的方向:向量化
  3. 所属分类:讲义

    • 发布日期:2017-05-16
    • 文件大小:537kb
    • 提供者:erjin_ren
  1. hive常用函数

  2. hive常用函数,包括时间、类型、udf、udaf等等的归纳。
  3. 所属分类:Hive

    • 发布日期:2018-04-17
    • 文件大小:692kb
    • 提供者:linc_then
  1. hive udaf 实现按位取与或

  2. hive udaf 实现按位取与或 hive udaf 实现按位取与或 hive udaf 实现按位取与或
  3. 所属分类:Hive

    • 发布日期:2018-11-21
    • 文件大小:2kb
    • 提供者:zaopower
  1. Hive性能优化

  2. 本文来自于cnblogs,赘述了在工作中总结Hive的常用优化手段和在工作中使用Hive出现的问题。下面开始本篇文章的优化介绍:继续《那些年使用Hive踩过的坑》一文中的剩余部分.首先,我们来看看Hadoop的计算框架特性,在此特性下会衍生哪些问题?数据量大不是问题,数据倾斜是个问题。jobs数比较多的作业运行效率相对比较低,比如即使有几百行的表,如果多次关联多次汇总,产生十几个jobs,耗时很长。原因是mapreduce作业初始化的时间是比较长的。sum,count,max,min等UDAF,
  3. 所属分类:其它

    • 发布日期:2021-02-25
    • 文件大小:191kb
    • 提供者:weixin_38543293
  1. 蜂巢:Apache蜂巢-源码

  2. Apache Hive(TM) Apache Hive(TM)数据仓库软件有助于使用SQL读取,写入和管理驻留在分布式存储中的大型数据集。 建立在Apache Hadoop(TM)之上,它提供: 通过SQL轻松访问数据的工具,从而实现数据仓库任务,例如提取/转换/加载(ETL),报告和数据分析 一种将结构强加于各种数据格式的机制 访问直接存储在Apache HDFS(TM)或其他数据存储系统(例如Apache HBase(TM))中的文件 使用Apache Hadoop MapReduce,
  3. 所属分类:其它

    • 发布日期:2021-01-30
    • 文件大小:47mb
    • 提供者:weixin_42138780
  1. Hive性能优化

  2. 本文来自于cnblogs,赘述了在工作中总结Hive的常用优化手段和在工作中使用Hive出现的问题。下面开始本篇文章的优化介绍:继续《那些年使用Hive踩过的坑》一文中的剩余部分.首先,我们来看看Hadoop的计算框架特性,在此特性下会衍生哪些问题?数据量大不是问题,数据倾斜是个问题。jobs数比较多的作业运行效率相对比较低,比如即使有几百行的表,如果多次关联多次汇总,产生十几个jobs,耗时很长。原因是map reduce作业初始化的时间是比较长的。sum,count,max,min等UDAF
  3. 所属分类:其它

    • 发布日期:2021-01-27
    • 文件大小:184kb
    • 提供者:weixin_38507208
  1. 【官网汉化中文】Hive函数运算符使用方法大全

  2. hive所有函数 包括UDTs、UDAF、UDTF函数和运算符等,中文汉化,翻译并测试
  3. 所属分类:互联网

    • 发布日期:2021-04-01
    • 文件大小:104kb
    • 提供者:qq_43853055