您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 大数据平台

  2. 基于hadoop的大数据平台,整合数据处理,数据挖掘,实时计算框架等等开源技术。
  3. 所属分类:Java

    • 发布日期:2013-05-10
    • 文件大小:8mb
    • 提供者:cp_chen
  1. 2013中国大数据技术大会PPT——腾讯大规模Hadoop集群实践

  2. 【大数据架构与系统】腾讯数据中心资深专家翟艳堂分享了腾讯建立大规模Hadoop集群的过程,首先要解决单点问题,将JobTracker分散化,做NameNode高可用。在业务选型方面,选择了成熟度更高的Facebook开源的Corona。
  3. 所属分类:群集服务

    • 发布日期:2013-12-12
    • 文件大小:656kb
    • 提供者:makuiyu
  1. 2013中国大数据技术大会PPT——中国移劢大数据应用实践

  2. 【智能交通与大数据技术峰会】中国移动研究院专家,中国移动通信研究院云计算系统部大数据产品开发室技术经理徐萌表示移动互联网用户流量激增,手机数据化、宽带化趋势明显,亟需深挖大数据价值。移动的大云实验室在BC-Hadoop上在做搭建开源站点和开源合作方面的工作。
  3. 所属分类:群集服务

    • 发布日期:2013-12-12
    • 文件大小:3mb
    • 提供者:makuiyu
  1. 陈跃国:SQL-on-Hadoop结构化大数据分析系统性能评测

  2. 陈跃国介绍了关系型结构大数据的概念以及特点,并阐述了TPC-DS基准对于实时大数据分析应用的局限性。近期,陈跃国进行了一次大规模的测试,利用人民大学的云平台,使用50台物理机,虚拟出了100个节点,并用使用TPC-DS生成不同规模的关系型数据,测试了开源大数据分析系统。
  3. 所属分类:讲义

    • 发布日期:2014-05-29
    • 文件大小:1mb
    • 提供者:u011299305
  1. eCharts百度统计图表 开源 大数据 JS

  2. ECharts是一款开源、功能强大的数据可视化产品,代表了新一代的大数据可视化基础库。
  3. 所属分类:其它

    • 发布日期:2015-08-14
    • 文件大小:24mb
    • 提供者:xiayedexin
  1. 《开源大数据技术架构设计》视频+ppt

  2. 主题: 1、大数据时代趋势和数据库技术更新 2、IBM Power Linux 平台助力大数据 3、Spark 集群搭建介绍 4、Spark+Hbase+Scala实际环境搭建 5、IBM 超能云助力大数据on PowerLinux 分享人:1,2:IBM 苏再卿;3,4,5:IBM 钱广锐。 附件有一个《CSDN_开源大数据技术架构设计_2015-09-08_Q35636787.avi》一小时的全程视频(145 MB),还有一个讲师用的《开源大数据技术架构设计培训资料.pptx》(61 MB
  3. 所属分类:其它

    • 发布日期:2015-09-10
    • 文件大小:135mb
    • 提供者:defonds
  1. 开源大数据技术架构设计培训资料

  2. 1、大数据时代趋势和数据库技术更新 2、IBM Power Linux平台助力大数据 3、Spark集群搭建介绍 4、Spark+Hbase+Scala实际环境搭建 5、IBM超能云助力大数据on PowerLinux
  3. 所属分类:讲义

    • 发布日期:2016-01-26
    • 文件大小:59mb
    • 提供者:zlbdmm
  1. 一种思路,学习开源大数据平台( hadoop+spark).mm

  2. 绘画笔记,脑力风暴,脑图,大数据学习的脑力风暴图,希望大家喜欢。,绘画笔记,脑力风暴,脑图,大数据学习的脑力风暴图,希望大家喜欢绘画笔记,脑力风暴,脑图,大数据学习的脑力风暴图,希望大家喜欢
  3. 所属分类:讲义

    • 发布日期:2020-03-21
    • 文件大小:6kb
    • 提供者:topsjava
  1. Greenplum-新一代开源大数据平台

  2. Greenplum作为世界上首个开源MPP大数据平台,有着大规模并行处理海量数据的能力,同时它也具备高可用,HTAP,支持多云,在线扩展,灵活数据,机器学习等等强大功能。本PPT给大家简要介绍了Greenplum,以及Greenplum在国内的生态和社区发展。
  3. 所属分类:其它

    • 发布日期:2020-11-19
    • 文件大小:26mb
    • 提供者:gp_community
  1. Apache DolphinScheduler高效支撑企业大数据核心业务 - 代立冬.pptx

  2. 新一代开源大数据任务调度 Apache DolphinScheduler 如何高效支撑企业大数据核心业务
  3. 所属分类:Java

  1. 大数据处理中的Lambda架构和Kappa架构

  2. 首先我们来看一个典型的互联网大数据平台的架构,如下图所示:在这张架构图中,大数据平台里面向用户的在线业务处理组件用褐色标示出来,这部分是属于互联网在线应用的部分,其他蓝色的部分属于大数据相关组件,使用开源大数据产品或者自己开发相关大数据组件。你可以看到,大数据平台由上到下,可分为三个部分:数据采集、数据处理、数据输出与展示。将应用程序产生的数据和日志等同步到大数据系统中,由于数据源不同,这里的数据同步系统实际上是多个相关系统的组合。数据库同步通常用Sqoop,日志同步可以选择Flume,打点采集
  3. 所属分类:其它

    • 发布日期:2021-03-03
    • 文件大小:208kb
    • 提供者:weixin_38576561
  1. Hadoop和大数据:60款顶级开源工具

  2. 说到处理大数据的工具,普通的开源解决方案(尤其是ApacheHadoop)堪称中流砥柱。弗雷斯特调研公司的分析师MikeGualtieri最近预测,在接下来几年,“100%的大公司”会采用Hadoop。MarketResearch的一份报告预测,到2011年,Hadoop市场会以58%的年复合增长率(CAGR)高速增长;到2020年,市场产值会超过10亿美元。IBM更是非常看好开源大数据工具,派出了3500名研究人员开发ApacheSpark,这个工具是Hadoop生态系统的一部分。这回我们推出
  3. 所属分类:其它

    • 发布日期:2021-02-26
    • 文件大小:285kb
    • 提供者:weixin_38689477
  1. 基于Hadoop大数据分析应用场景与实战

  2. 本文来自于linkedkeeper.com,本文主要介绍了一下kafka的基本概念,并结合一些实验帮助理解kafka中的一些难点,如多个consumer的容错性机制,offset管理。为了满足日益增长的业务变化,京东的京麦团队在京东大数据平台的基础上,采用了Hadoop等热门的开源大数据计算引擎,打造了一款为京东运营和产品提供决策性的数据类产品-北斗平台。大数据是不能用传统的计算技术处理的大型数据集的集合。它不是一个单一的技术或工具,而是涉及的业务和技术的许多领域。目前主流的三大分布式计算系统分
  3. 所属分类:其它

    • 发布日期:2021-02-25
    • 文件大小:348kb
    • 提供者:weixin_38674883
  1. 详解开源大数据引擎Greenplum的架构和技术特点

  2. Greenplum(以下简称GPDB)是一款开源数据仓库。基于开源的PostgreSQL改造,主要用来处理大规模数据分析任务,相比Hadoop,Greenplum更适合做大数据的存储、计算和分析引擎。GPDB是典型的Master/Slave架构,在Greenplum集群中,存在一个Master节点和多个Segment节点,其中每个节点上可以运行多个数据库。Greenplum采用sharednothing架构(MPP)。典型的SharedNothing系统会集数据库、内存Cache等存储状态的信息
  3. 所属分类:其它

    • 发布日期:2021-02-24
    • 文件大小:417kb
    • 提供者:weixin_38592548
  1. TDengine:为物联网(IoT)设计和优化的开源大数据平台-源码

  2. 什么是TDengine? TDengine是下的开源大数据平台,专为物联网(IoT),互联汽车,工业IoT以及IT基础架构和应用程序监视而设计和优化。 除了速度快10倍的时间序列数据库外,它还提供了缓存,流计算,消息队列和其他功能,以降低开发和运营的复杂性并降低成本。 插入/查询速度提高10倍:通过创新的存储设计,在单核计算机上,可以处理超过2万个请求,可以提取数百万个数据点,并且每秒可以检索超过一千万个数据点。 它比其他数据库快10倍。 1/5的硬件/云服务成本:与典型的大数据解决方案相
  3. 所属分类:其它

  1. Hadoop和大数据:60款顶级开源工具

  2. 说到处理大数据的工具,普通的开源解决方案(尤其是ApacheHadoop)堪称中流砥柱。弗雷斯特调研公司的分析师MikeGualtieri最近预测,在接下来几年,“100%的大公司”会采用Hadoop。MarketResearch的一份报告预测,到2011年,Hadoop市场会以58%的年复合增长率(CAGR)高速增长;到2020年,市场产值会超过10亿美元。IBM更是非常看好开源大数据工具,派出了3500名研究人员开发ApacheSpark,这个工具是Hadoop生态系统的一部分。这回我们推出
  3. 所属分类:其它

    • 发布日期:2021-01-30
    • 文件大小:285kb
    • 提供者:weixin_38502510
  1. 基于Hadoop大数据分析应用场景与实战

  2. 本文主要介绍了一下kafka的基本概念,并结合一些实验帮助理解kafka中的一些难点,如多个consumer的容错性机制,offset管理。为了满足日益增长的业务变化,京东的京麦团队在京东大数据平台的基础上,采用了Hadoop等热门的开源大数据计算引擎,打造了一款为京东运营和产品提供决策性的数据类产品-北斗平台。大数据是不能用传统的计算技术处理的大型数据集的集合。它不是一个单一的技术或工具,而是涉及的业务和技术的许多领域。目前主流的三大分布式计算系统分别为:Hado
  3. 所属分类:其它

    • 发布日期:2021-01-27
    • 文件大小:348kb
    • 提供者:weixin_38639642
  1. 大数据处理中的Lambda架构和Kappa架构

  2. 首先我们来看一个典型的互联网大数据平台的架构,如下图所示:在这张架构图中,大数据平台里面向用户的在线业务处理组件用褐色标示出来,这部分是属于互联网在线应用的部分,其他蓝色的部分属于大数据相关组件,使用开源大数据产品或者自己开发相关大数据组件。你可以看到,大数据平台由上到下,可分为三个部分:数据采集、数据处理、数据输出与展示。将应用程序产生的数据和日志等同步到大数据系统中,由于数据源不同,这里的数据同步系统实际上是多个相关系统的组合。数据库同步通常用 Sqoop,日志同步可以选择Flume,打点采
  3. 所属分类:其它

    • 发布日期:2021-01-27
    • 文件大小:208kb
    • 提供者:weixin_38551205
  1. 详解开源大数据引擎Greenplum的架构和技术特点

  2. Greenplum(以下简称GPDB)是一款开源数据仓库。基于开源的PostgreSQL改造,主要用来处理大规模数据分析任务,相比Hadoop,Greenplum更适合做大数据的存储、计算和分析引擎。GPDB是典型的Master/Slave架构,在Greenplum集群中,存在一个Master节点和多个Segment节点,其中每个节点上可以运行多个数据库。Greenplum采用shared nothing架构(MPP)。典型的SharedNothing系统会集数据库、内存C
  3. 所属分类:其它

    • 发布日期:2021-01-27
    • 文件大小:417kb
    • 提供者:weixin_38635323
  1. 开源大数据平台的安全实践

  2. 开源大数据平台的安全机制目前并不特别完善,特别是用户认证、日志审计等方案还存在不少问题。分析了开源大数据平台存在的安全隐患,在开源Hadoop平台的基础上提出了基于Giaho的大数据平台用户认证机制和基于高效的日志审计方案,并结合百度公司的实际应用阐述所提技术方案的有效性。该技术方案具有一定的普适性,可根据企业当前技术环境灵活使用。
  3. 所属分类:其它

« 12 3 4 5 6 7 8 9 10 ... 50 »