您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 阿里云大规模结构化云存储HBase架构特性解析

  2. 曹龙(封神) 阿里云技术专家、架构师 专注在大数据领域,有6年分布式引擎研发经验 先后研发上万台Hadoop、ODPS集群 先后负责阿里YARN、spark及自主研发内存计算引擎 目前为广大公共云用户提供专业的云Hadoop服务及 云HBase服务. 阿里大数据三大组件 • 云 最佳实践 • 云 部署模式 • 云 真实案例 • 云 内核特性 • 云 未来
  3. 所属分类:Hbase

    • 发布日期:2019-03-13
    • 文件大小:2mb
    • 提供者:woai6022
  1. 基于大数据平台构建数据仓库的研究与实践.pdf

  2. 数据仓库设计文档,帮助大家理解及如何设计数据仓库,很不错的一篇论文。专题 lTo 学习体系,能从海量数据中提炼高价值信息,构建自主 (1)源系统结构化数据:源系统按大数据平合的 训练与反馈、可不断从最新数据中调整演化的智能业务供数规范要求提供表数据文本和标志文件。 模型体系。 (2)文件交换区FSA:文件的交换中枢,含源系 以 Hadoop^ Spark为代表的大规模数据处理技术为统结构化数据和半结构化、非结构化数据(主要是外部 超越传统数据库的处理局限性提供了先进的并行计算和数据)。 资源调度
  3. 所属分类:其它

    • 发布日期:2019-07-16
    • 文件大小:1mb
    • 提供者:bucaixia08
  1. spark 累加器,广播变量.docx

  2. Spark三大数据结构 RDD 分布式数据集 广播变量:分布式只读共享变量 累加器:分布式只写共享变量 下面是累加器和广播变量的总结,不算是最好的,希望大家包涵
  3. 所属分类:spark

    • 发布日期:2020-03-29
    • 文件大小:39kb
    • 提供者:weixin_41801538
  1. spark三大数据结构

  2. 这是我将自己所学的spark撰写下来,用与大家分享,取长补短,共同进步,我也会吸取大家的建议,努力进步,写的不算是最好的,希望大家多多包涵
  3. 所属分类:spark

    • 发布日期:2020-03-29
    • 文件大小:160kb
    • 提供者:weixin_41801538