您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. Hive查询sql left join exists

  2. 里面 一个例子,说了几个需求,基本能符合,我要使用的功能,左外连接,还有exists替代方案,都很实用,结合文档看一下。
  3. 所属分类:MongoDB

    • 发布日期:2014-10-20
    • 文件大小:214kb
    • 提供者:qq540061627
  1. spark替代Hive实现ETL作业

  2. spark替代Hive实现ETL作业
  3. 所属分类:spark

    • 发布日期:2018-10-08
    • 文件大小:1mb
    • 提供者:blueyx555
  1. Hadoop的数据处理解决方案Cascalog.zip

  2. Cascalog 是 Hadoop 上的数据处理解决方案,无需 hassle。 Cascalog 是 Clojure 或者 Java 的全功能数据处理和查询库。Cascalog 主要的作用是处理 Hadoop 上的“大数据”或者分析你的本地电脑, Cascalog 是替代 Pig 和 Hive 的工具,而且比这些工具都有更高的抽象级别。 跟着 Cascalog 开始步骤做,五分钟就可以玩转 Cascalog。 标签:Cascalog
  3. 所属分类:其它

    • 发布日期:2019-07-19
    • 文件大小:205kb
    • 提供者:weixin_39840914
  1. 云粘合平台漫谈及代码理解初步例子

  2. NULL 博文链接:https://lokki.iteye.com/blog/1041255大规模自动化服务,及以上以下的一些名词,但大多数都只实现了简单的服务和功能部件,也未能很 好地"动态化、按需化、快速化”。而在互联网服务新阶段,云计算基础设施里,分布式海量储存、 cache、 KeyValue、 KeyList、非关系式储存、 MapReduce、 Loadbalance、CDN、 ondemand等,这些名 词是常见和普及化的。用后面介绍的名词来说要有专业方向云技术部件” “SLA服务
  3. 所属分类:其它

    • 发布日期:2019-03-23
    • 文件大小:731kb
    • 提供者:weixin_38669628
  1. Hive DML

  2. 数据导入 Hive不支持update的操作。数据一旦导入,则不可修改。要么drop掉整个表,要么建立新的表,导入新的数据。 load:加载数据到表 load data [local] inpath ‘filepath’ overwrite | into table 表名 [partition (partcol1=val1,…)]; 单纯的复制/移动:将 filepath 中指定的文件复制到目标文件所指定的目录中。如果目标表(分区)已经有一个文件,并且文件名和 filepath 中的文件名冲突,那
  3. 所属分类:其它

  1. 漫谈数据仓库之维度建模

  2. 下面的内容,是笔者在学习和工作中的一些总结,其中概念性的内容大多来自书中,实践性的内容大多来自自己的工作和个人理解。由于资历尚浅,难免会有很多错误,望批评指正!数据仓库包含的内容很多,它可以包括架构、建模和方法论。对应到具体工作中的话,它可以包含下面的这些内容:以Hadoop、Spark、Hive等组建为中心的数据架构体系。各种数据建模方法,如维度建模。调度系统、元数据系统、ETL系统、可视化系统这类辅助系统。我们暂且不管数据仓库的范围到底有多大,在数据仓库体系中,数据模型的核心地位是不可替代的
  3. 所属分类:其它

    • 发布日期:2021-02-25
    • 文件大小:143kb
    • 提供者:weixin_38707192
  1. 从Hive迁移到SparkSQL,有赞的大数据实践

  2. 有赞数据平台从2017年上半年开始,逐步使用SparkSQL替代Hive执行离线任务,目前SparkSQL每天的运行作业数量5000个,占离线作业数目的55%,消耗的cpu资源占集群总资源的50%左右。本文介绍由SparkSQL替换Hive过程中碰到的问题以及处理经验和优化建议,包括以下方面的内容:有赞数据平台的整体架构。SparkSQL在有赞的技术演进。从Hive到SparkSQL的迁移之路。首先介绍一下有赞大数据平台总体架构:如下图所示,底层是数据导入部分,其中DataY区别于开源届的全量导
  3. 所属分类:其它

    • 发布日期:2021-02-24
    • 文件大小:391kb
    • 提供者:weixin_38695159
  1. 数据X-源码

  2. 数据X DataX是*集团内部被广泛使用的离线数据同步工具/平台,实现包括MySQL,Oracle,SqlServer,Postgre,HDFS,Hive,ADS,HBase,TableStore(OTS),MaxCompute(ODPS),DRDS等各种异种构数据源之间高效的数据同步功能。 DataX商业版本 阿里云DataWorks数据集成是DataX团队在阿里云上的商业化产品,致力于提供复杂的网络环境下,丰富的替代数据源之间的高速稳定的数据移动能力,以及繁杂的业务背景下的数据同步解
  3. 所属分类:其它

    • 发布日期:2021-02-08
    • 文件大小:24mb
    • 提供者:weixin_42131352
  1. kNight.js::pick_selector:CryptoNight矿工(WIP)-源码

  2. kNight.js 暗夜矿工 关于 注意:自发行版cryptonight_v8起,此功能对Monero不再可用 作为使用js和WebAssembly构建的CryptoNight矿工,coin-hive的第一个完全免费的替代方案之一。 kNight可以取代网站当前基于广告的收入模式。 注意:当前使用100%CPU,并且在完成旧作业之前不会终止它们。 主要支持货币 门罗 电子ne 支持的算法 1MiB暂存器内存 cryptonight_lite cryptonight_lite_v7 2M
  3. 所属分类:其它

    • 发布日期:2021-02-04
    • 文件大小:507kb
    • 提供者:weixin_42130862
  1. 漫谈数据仓库之维度建模

  2. 下面的内容,是笔者在学习和工作中的一些总结,其中概念性的内容大多来自书中,实践性的内容大多来自自己的工作和个人理解。由于资历尚浅,难免会有很多错误,望批评指正!数据仓库包含的内容很多,它可以包括架构、建模和方法论。对应到具体工作中的话,它可以包含下面的这些内容:以Hadoop、Spark、Hive等组建为中心的数据架构体系。各种数据建模方法,如维度建模。调度系统、元数据系统、ETL系统、可视化系统这类辅助系统。我们暂且不管数据仓库的范围到底有多大,在数据仓库体系中,数据模型的核心地位是不可替代的
  3. 所属分类:其它

    • 发布日期:2021-02-02
    • 文件大小:143kb
    • 提供者:weixin_38562392
  1. BigSQL性能增强:Hadoop表分区以及分区消除

  2. BigSQL,是IBM依托其在RDBMS领域多年的技术积累,并结合当前大数据领域许多先进技术推出的 SQL-on-Hadoop产品。与市场上其它产品如Hive不同,BigSQL通过在Hadoop 上运行大规模并行处理(MPP)SQL引擎来替代MapReduce,极大地提高了查询速度。Big SQL以其无与伦比的SQL兼容性、丰富的企业及
  3. 所属分类:其它

    • 发布日期:2021-01-29
    • 文件大小:132kb
    • 提供者:weixin_38607971
  1. 从Hive迁移到SparkSQL,有赞的大数据实践

  2. 有赞数据平台从2017年上半年开始,逐步使用SparkSQL替代Hive执行离线任务,目前 SparkSQL每天的运行作业数量5000个,占离线作业数目的55%,消耗的cpu资源占集群总资源的 50%左右。本文介绍由SparkSQL替换Hive过程中碰到的问题以及处理经验和优化建议,包括以下方面的内容:有赞数据平台的整体架构。
  3. 所属分类:其它

    • 发布日期:2021-01-27
    • 文件大小:391kb
    • 提供者:weixin_38663151