您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. EasyHadoop部署实战手册_VM测试版本

  2. 文档概述   本文档是Hadoop部署文档,提供了Hadoop单机安装和Hadoop集群安装的方法和步骤,本文档希望让Hadoop安装部署更简单(Easy)。   本安装文档适用于 centos 5 /red hat 5.2 32位,64位版本,ubuntu 等操作系统 需要做部分修改。 EasyHadoop集群部署入门 修订记录 日期 修改原因 描述 作者 2012/02/14 初稿 Hadoop部署文档 向磊 2012/07/14 完善细节 新基础环境配置,修改配置文件,修改架构图。 童小
  3. 所属分类:其它

    • 发布日期:2013-07-15
    • 文件大小:1mb
    • 提供者:simplty
  1. hadoop+hive+mapreduce的java例子

  2. 基于hadoop的Hive数据仓库JavaAPI简单调用的实例,关于Hive的简介在此不赘述。hive提供了三种用户接口:CLI,JDBC/ODBC和 WebUI CLI,即Shell命令行 JDBC/ODBC 是 Hive 的Java,与使用传统数据库JDBC的方式类似 WebGUI是通过浏览器访问 Hive 本文主要介绍的就是第二种用户接口,直接进入正题。 1、Hive 安装: 1)hive的安装请参考网上的相关文章,测试时只在hadoop一个节点上安装hive即可。 2)测试数据 dat
  3. 所属分类:Java

  1. Spark学习--RDD编码

  2. RDD:弹性分布式数据集(ResilientDistributed Dataset),是Spark对数据的核心抽象。RDD其实是分布式的元素集合。当Spark对数据操作和转换时,会自动将RDD中的数据分发到集群,并将操作并行化执行。 Spark中的RDD是一个不可变的分布式对象集合。每个RDD都倍分为多个分区,这些分区运行在集群中的不同节点。RDD可以包含Python、Java、Scala中任意类型的对象,甚至可以包含用户自定义对象,本文主要通过Java实现相关示例。 Spark程序或shel
  3. 所属分类:Java

    • 发布日期:2017-05-09
    • 文件大小:10kb
    • 提供者:a123demi
  1. 大型分布式网站架构与实践

  2. 第1章 面向服务的体系架构(SOA) 1   本章主要介绍和解决以下问题,这些也是全书的基础:   HTTP协议的工作方式与HTTP网络协议栈的结构。   如何实现基于HTTP协议和TCP协议的RPC调用,它们之间有何差别,分别适应何种场景。   如何实现服务的动态注册和路由,以及软负载均衡的实现。   1.1 基于TCP协议的RPC 3   1.1.1 RPC名词解释 3   1.1.2 对象的序列化 4   1.1.3 基于TCP协议实现RPC 6   1.2 基于HTTP协议的RPC 9
  3. 所属分类:Java

    • 发布日期:2018-08-24
    • 文件大小:92mb
    • 提供者:mr_hope
  1. GIAC架构大会-承载每天万级任务的调度系统架构是如何设计的.pdf

  2. 承载每天万级任务的调度系统架构是如何设计的 分布式任务调度系统如何设计? 开源分布式任务调度系统介绍GGIAC 主办方:msp4oes 目前使用 EasySchedulerl的公司部分统计) Q雪球 鳳凰金融 s 嘀嗒出行 fengjr. com 水滴互助 Vanguard* 华润万家 y速快团 e Aisino|凹败科辣 航天信息 半云利技 环球易购 bwin. cn CiC 四万伟业 efonsoft Gobalegrow E-Commerce 8 育学园 EB 我们一起长大 东信北邮 微未
  3. 所属分类:Hadoop

    • 发布日期:2019-07-07
    • 文件大小:13mb
    • 提供者:odailidong
  1. archsz-20140719-yeyamingchuchengdong.pdf

  2. archsz-20140719-yeyamingchuchengdong.pdf,让你走入不一样的数据时代Front-end采集 Web App Hybrid App Native App Use Javascr ipt Use Object C /Java Addition Data App Initialize Ajax/ Pjax/Jsonp Download Animation Update Entrance Traffic Front-end架构 Js Library Perform
  3. 所属分类:算法与数据结构

    • 发布日期:2019-07-02
    • 文件大小:1mb
    • 提供者:qiuping0321
  1. java调用hive需要的jar

  2. java调用hive需要的jar
  3. 所属分类:Java

    • 发布日期:2017-03-17
    • 文件大小:18mb
    • 提供者:a7586032
  1. 项目实战——钉钉报警校验ElasticSearch和Hive数据仓库内的数据质量(Java版本)

  2. 此篇文章主要选取关键性指标,数据校验数据源Hive和目标ES内的数据是否一致; 因为你不知道将Hive的数据导入到了ElasticSearch后,数据量是否准确,所以需要钉钉报警校验ElasticSearch和Hive数据仓库内的数据质量,注意,这个项目打包后,最好另起一个进程调用,并且开始时间为文章1或者2最大预估的结束时间后的10分钟后调用,这样可以校验两种情形: 1.ETL项目被调度了,但是造成了数据异常,可以捕捉到; 2.ETL项目压根就没起来,即超时了,造成了数据异常,亦可被捕捉!
  3. 所属分类:其它

    • 发布日期:2020-10-24
    • 文件大小:168mb
    • 提供者:LXWalaz1s1s
  1. spark: RDD与DataFrame之间的相互转换方法

  2. DataFrame是一个组织成命名列的数据集。它在概念上等同于关系数据库中的表或R/Python中的数据框架,但其经过了优化。DataFrames可以从各种各样的源构建,例如:结构化数据文件,Hive中的表,外部数据库或现有RDD。 DataFrame API 可以被Scala,Java,Python和R调用。 在Scala和Java中,DataFrame由Rows的数据集表示。 在Scala API中,DataFrame只是一个类型别名Dataset[Row]。而在Java API中,用户需要
  3. 所属分类:其它

    • 发布日期:2021-01-20
    • 文件大小:56kb
    • 提供者:weixin_38577378