您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 云计算Hadoop:快速部署Hadoop集群.docx

  2. 云计算Hadoop:快速部署Hadoop集群 近来云计算越来越热门了,云计算已经被看作IT业的新趋势。云计算可以粗略地定义为使用自己环境之外的某一服务提供的可伸缩计算资源,并按使用量付费。可以通过 Internet 访问“云”中的任何资源,而不需要担心计算能力、带宽、存储、安全性和可靠性等问题。   从企业的角度来说,日益增长的信息已经很难存储在标准关系型数据库甚至数据仓库中。这些问题提到了一些在实践中已存在多年的难题。例如:怎样查询一个十亿行的表?怎样跨越数据中心所有服务器上的所有日志来运行
  3. 所属分类:Java

    • 发布日期:2012-06-07
    • 文件大小:150528
    • 提供者:huwanshanqazxsw
  1. BI商业智能是做什么的,主要体现在这3个方面.docx

  2. BI是商业智能的简称,商业智能是指用现代数据仓库技术、线上分析处理技术、数据挖掘和数据展现技术进行数据分析以实现商业价值。这么一看,大家也许会想,商业智能和大数据是不是一样的。
  3. 所属分类:算法与数据结构

    • 发布日期:2019-05-20
    • 文件大小:105472
    • 提供者:htl_3078
  1. 企业级大数据项目之数据仓库.docx

  2. 当前,所有应用到大数据的公司都需要建设企业数据仓库,以服务于数据分析和为企业决策、产品优化、产品运营等提供稳定可靠的数据支持,因此,数据仓库的建设在公司数据的E(抽取)、T(转化)、L(加载)流程中起到至关重要的地位。 本项目将数仓分为三层,分别是ODS层(贴源层)、DW层(数仓层)和APP层(应用层),其中DW层中包含事实层、维度层、宽表层,为了达到拿空间换时间的目的,由事实层中的事实表和维度层的维度表关联形成宽表层。
  3. 所属分类:Hadoop

    • 发布日期:2019-07-22
    • 文件大小:5242880
    • 提供者:u010739163
  1. 八斗大虚据第九期完整版.docx

  2. 一阶段:这一阶段会学习MapReduce、Hive、HDFS、Yarn、Spark等计算框架的开发技术,以及Scala编程语言。通过项目实践,你能快速掌握这些技术,获得数据开发、数据挖掘、机器学习等职位必备的基本开发能力。 第二阶段:这一阶段会学习FLume、Kafka、Spark Streaming、Flink/Storm、Zookeeper、HBase等计算框架的开发技术,以及大数据体系内的数据采集和数据仓库理论思想和技术实现。通过项目实践,你能快速掌握这些技术,获得完整的大数据架构开发能
  3. 所属分类:Hadoop

    • 发布日期:2019-07-24
    • 文件大小:12288
    • 提供者:qq_43648927
  1. 数据仓库架构师笔试题.docx

  2. 数据仓库架构师面试题,里面包含了各家的面试题,难度比较大,欢迎下载
  3. 所属分类:Hive

    • 发布日期:2019-08-13
    • 文件大小:17408
    • 提供者:godlovedaniel
  1. Git.docx

  2. Git介绍及基本概念 1. 分布式版本控制系统 Git是一个分布式版本控制系统,每个本地保留远程仓库的完整副本,在本地可以进行任何版本控制操作,比如修改,提交,创建分支,合并分支,回退等。需要时才推送到远程仓库。 2. Git文件保存 Git对每次提交,有变化的文件都会整个文件存储起来,而不是像其它版本控制系统,比如cvs,svn,perforce等存储的是文件的差异部分。但是git有package机制,适当的时候会自动运行git gc命令(也可以手动运行)对文件进行差异存储。当然为了节约空间
  3. 所属分类:Python

    • 发布日期:2019-08-22
    • 文件大小:37888
    • 提供者:qq_21101283
  1. 大数据技术之impala.docx

  2. Cloudera公司推出,提供对HDFS、Hbase数据的高性能、低延迟的交互式SQL查询功能。 基于Hive,使用内存计算,兼顾数据仓库、具有实时、批处理、多并发等优点。 是CDH平台首选的PB级大数据实时查询分析引擎。
  3. 所属分类:Hadoop

    • 发布日期:2020-01-19
    • 文件大小:574464
    • 提供者:qq_39199112
  1. 大数据项目之电商数仓(2用户行为数据仓库).docx

  2. 此数仓项目文档详细介绍从项目需求分析到数据生成模块、数据采集模块、数仓各分层搭建再到业务实现的过程,其中各种环境的配置很细致,很有价值学习一下。
  3. 所属分类:Hadoop

    • 发布日期:2019-08-03
    • 文件大小:25165824
    • 提供者:yw1441776254
  1. 移动统计分析,难点何在?.docx

  2. 数据仓库:移动统计分析,难点何在,大牛给你分析怎么统计分析。
  3. 所属分类:DB2

    • 发布日期:2019-07-12
    • 文件大小:17408
    • 提供者:cy1331295
  1. Hadoop接口与SnappyData数据处理调度配置.docx

  2. 本文档简单阐述了SnappyData做为数据仓库,结合hue及hadoop大数据平台,配置相关调度及简单ssh命令语法。
  3. 所属分类:Hadoop

    • 发布日期:2019-07-02
    • 文件大小:843776
    • 提供者:xc1989xc
  1. hadoop(伪分布式)安装步骤.docx

  2. 大数据作为时下火热的IT行业的词汇,随之而来的数据开发、数据仓库、数据安全、数据分析、数据挖掘等等围绕大数据的商业价值的利用逐渐成为行业人士争相追捧的利润焦点。本文章主要介绍: hadoop(伪分布式)Linux安装教程
  3. 所属分类:Hadoop

    • 发布日期:2020-06-01
    • 文件大小:498688
    • 提供者:snacks_in_desks
  1. 仓库管理系统.docx

  2. 作为新一代的数据平台产品,SQL Server 2012 不仅延续现有数据平台的强大能力,全面支持云技术与平台,并且能够快速构建相应的解决方案实现私有云与公有云之间数据的扩展与应用的迁移。SQL Server 2012 提供对企业基础架构最高级别的支持—专门针对关键业务应用的多种功能与解决方案可以提供最高级别的可用性及性能。在业界领先的商业智能领域,SQL Server 2012 提供了更多更全面的功能以满足不同人群对数据以及信息的需求,包括支持来自于不同网络环境的数据的交互,全面的自助分析等创
  3. 所属分类:MySQL

    • 发布日期:2020-08-16
    • 文件大小:1048576
    • 提供者:qq_43701418
  1. 适合初学者-大数据技术与应用介绍(含各种组件).docx

  2. NoSQL数据库种类介绍、大数据关键技术、大数据计算模式、大数据处理架构 分布式文件系统HDFS、分布式数据库HBASE、NoSQL、大数据处理与分析。 Hadoop分布式文件系统,具有处理超大数据、流式处理、可以运行在廉价商用服务器上等优点。对于超大数据集的应用程序而言,选择HDFS作为底层数据存储是较好的选择。 Hive是基于Hadoop的数据仓库工具,可以用于对Hadoop文件中的数据集进行数据整理、特殊查询和分析存储。(学习门槛较低,提供了类似于关系数据库SQL语言的查询语言=
  3. 所属分类:Hadoop

    • 发布日期:2020-08-26
    • 文件大小:545792
    • 提供者:qq_34709267
  1. 模型设计_数仓建模.docx

  2. 大数据、人工智能、数仓、数据治理 数据仓库 按照传统的定义,数据仓库是一个面向主题的、集成的、相对稳定的、反映历史变化的数据集合,用于支持管理决策。
  3. 所属分类:Hadoop

    • 发布日期:2020-09-02
    • 文件大小:331776
    • 提供者:weixin_43005633
  1. 大数据学习笔记.docx

  2. 大数据的学习笔记,从大数据的基本概念包括Hadoop、hive、离线计算、实时计算、数据库、数据仓库、维度建模、大规模并行处理MPP,到阿里大数据产品,包括MaxCompute、DataWorks、数据集成、机器学习PAI、AnalyticDB for MySQL,和最后的概要说明
  3. 所属分类:flink

    • 发布日期:2020-11-09
    • 文件大小:1048576
    • 提供者:weixin_43560804
  1. 大数据项目之电商数仓(4即席查询数据仓库).docx

  2. 大数据项目之电商数仓(4即席查询数据仓库).docx
  3. 所属分类:Hive

    • 发布日期:2020-11-18
    • 文件大小:5242880
    • 提供者:Yubingx
  1. 大数据项目之电商数仓(3系统业务数据仓库).docx

  2. 大数据项目之电商数仓(3系统业务数据仓库).docx
  3. 所属分类:Hive

    • 发布日期:2020-11-18
    • 文件大小:8388608
    • 提供者:Yubingx
  1. 大数据项目之电商数仓(2用户行为数据仓库).docx

  2. 大数据项目之电商数仓(2用户行为数据仓库).docx
  3. 所属分类:Hive

    • 发布日期:2020-11-18
    • 文件大小:4194304
    • 提供者:Yubingx
  1. 3.《离线数据仓库设计与开发》课件 v3.0.docx

  2. 离线数仓的课件,适用于大数据小白,希望了解数仓体系结构,使用数据仓库的人
  3. 所属分类:Hive

    • 发布日期:2021-01-06
    • 文件大小:8388608
    • 提供者:lucklydog123
  1. 大数据-数据仓库.docx

  2. 申明:只适用于基于hive搭建的大数据数仓,其他不要下载,谢谢,适用与想从事数仓架构师和数仓开发人员,或者想入门数据仓库开发的人,大数据开发想整体了解数仓只看这个就够了,项目中用到的整体规范文档,包括数仓的规范,日常开发规范,解释spark脚本规范,其中数仓分层,数仓的命名,都是项目中实际用到的落地方案
  3. 所属分类:Hive

    • 发布日期:2021-03-22
    • 文件大小:945152
    • 提供者:u012794992