您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 37篇经过消化云计算论文打包下载

  2. 1、 Atmosphere-Ocean Climate (性能测试) 这篇文章讨论了高性能标准测试应用程序在亚马逊EC2云计算系统中的性能。经过测试发现EC2云计算系统是一个可靠的解决方案,支持按需响应,小规模,高性能计算应用程序。 2、 Chukwa: A large-scale monitoring system Chukwa是建立在Hadoop上的数据收集系统,用以监控和分析大规模的分布式系统。本文介绍了他的设计和初步实施。 3、 Cloud Computing and Grid Com
  3. 所属分类:网络攻防

    • 发布日期:2011-01-03
    • 文件大小:9mb
    • 提供者:wangsheng8888
  1. Hadoop公平调度器指南.pdf

  2. 公平调度是一种赋予作业(job)资源的方法,它的目的是让所有的作业随着时间的推移, 都能平均的获取等同的共享资源。当单独一个作业在运行时,它将使用整个集群。当有其它 作业被提交上来时,系统会将任务(task)空闲时间片(slot)赋给这些新的作业,以使得每 一个作业都大概获取到等量的 CPU 时间。与 Hadoop 默认调度器维护一个作业队列不同,这 个特性让小作业在合理的时间内完成的同时又不“饿”到消耗较长时间的大作业。它也是一 个在多用户间共享集群的简单方法。公平共享可以和作业优先权搭配使
  3. 所属分类:其它

    • 发布日期:2012-04-17
    • 文件大小:307kb
    • 提供者:shaozhi_jinni
  1. 37篇论文系刘鹏教授的研究生龚传消化整理

  2. 1、 Atmosphere-Ocean Climate (性能测试) 这篇文章讨论了高性能标准测试应用程序在亚马逊EC2云计算系统中的性能。经过测试发现EC2云计算系统是一个可靠的解决方案,支持按需响应,小规模,高性能计算应用程序。 2、 Chukwa: A large-scale monitoring system Chukwa是建立在Hadoop上的数据收集系统,用以监控和分析大规模的分布式系统。本文介绍了他的设计和初步实施。 3、 Cloud Computing and Grid Com
  3. 所属分类:专业指导

    • 发布日期:2012-05-20
    • 文件大小:9mb
    • 提供者:gongxq0124
  1. hadoop-0.20.2.tar.gz

  2. Hadoop是一个开源的分布式系统基础架构,由Apache基金会开发,使得用户可以在不了解分布式底层细节的情况下,开发分布式应用程序,充分利用集群的威力实现高速运算和存储。Hadoop尤其适合大数据的分析与挖掘,最为常见的应用就是Web数据分析。因为从本质上讲,Hadoop提供了在大规模服务器集群中捕捉、组织、搜索、共享以及分析数据的模式,且可以支持多种数据源 (结构化、半结构化和非结构化),规模则能够从几十台服务器扩展到上千台服务器。
  3. 所属分类:Java

    • 发布日期:2013-06-04
    • 文件大小:42mb
    • 提供者:guofeng2010
  1. Hadoop技术在商业智能BI中的应用

  2. Hadoop是个很流行的分布式计算解决方案,是Apache的一个开源项目名称,核心部分包括HDFS及MapReduce。其中,HDFS是分布式文件系统,MapReduce是分布式计算引擎。时至今日,Hadoop在技术上已经得到验证、认可甚至到了成熟期,同时也衍生出了一个庞大的生态圈,比较知名的包括HBase、Hive、Spark等。HBase是基于HDFS的分布式列式数据库,HIVE是一个基于HBase数据仓库系统。Impala为存储在HDFS和HBase中的数据提供了实时SQL查询功能,基于
  3. 所属分类:其它

    • 发布日期:2017-03-06
    • 文件大小:297kb
    • 提供者:xuqian3326
  1. 分布式集群、PB级别网站性能优化

  2. 大数据高并发服务器实战教程 Linux LNMP部分 Memcached篇 Redis 项目开发准备工作 项目开发(前台UI) 项目开发(前台业务流程) 项目开发(后台管理) 大数据高并发系统架构实战方案 大数据高并发架构实战案例分享 Piranha安装快速搭建LVS负载均衡集群 LVS负载均衡DR模式安装调试介绍 LVS负载均衡深入进阶实战 LVS调度策略及负载均衡原理深入 LVS深入及NAT集群调试 Nginx反向代理实战 Nginx实战进阶 Nginx动静分离URL转发实战 NFS共享文
  3. 所属分类:Java

    • 发布日期:2018-06-02
    • 文件大小:84byte
    • 提供者:ermaoermao
  1. 分布式集群、PB级别网站性能优化

  2. 大数据高并发服务器实战教程 Linux LNMP部分 Memcached篇 Redis 项目开发准备工作 项目开发(前台UI) 项目开发(前台业务流程) 项目开发(后台管理) 大数据高并发系统架构实战方案 大数据高并发架构实战案例分享 Piranha安装快速搭建LVS负载均衡集群 LVS负载均衡DR模式安装调试介绍 LVS负载均衡深入进阶实战 LVS调度策略及负载均衡原理深入 LVS深入及NAT集群调试 Nginx反向代理实战 Nginx实战进阶 Nginx动静分离URL转发实战 NFS共享文
  3. 所属分类:群集服务

    • 发布日期:2018-02-28
    • 文件大小:77byte
    • 提供者:u013844840
  1. Spark技术内幕-深入解析Spark内核架构设计与实现原理(带书签目录)

  2. spark是一种快速、通用、可扩展的大数据分析引擎。Spark 核心的概念是 Resilient Distributed Dataset (RDD):一个可并行操作的有容错机制的数据集合。有 2 种方式创建 RDDs:第一种是在你的驱动程序中并行化一个已经存在的集合;另外一种是引用一个外部存储系统的数据集,例如共享的 文件系统,HDFS,HBase或其他 Hadoop 数据格式的数据源。
  3. 所属分类:其它

    • 发布日期:2019-02-24
    • 文件大小:21mb
    • 提供者:qq_30042621
  1. 基于大数据平台构建数据仓库的研究与实践.pdf

  2. 数据仓库设计文档,帮助大家理解及如何设计数据仓库,很不错的一篇论文。专题 lTo 学习体系,能从海量数据中提炼高价值信息,构建自主 (1)源系统结构化数据:源系统按大数据平合的 训练与反馈、可不断从最新数据中调整演化的智能业务供数规范要求提供表数据文本和标志文件。 模型体系。 (2)文件交换区FSA:文件的交换中枢,含源系 以 Hadoop^ Spark为代表的大规模数据处理技术为统结构化数据和半结构化、非结构化数据(主要是外部 超越传统数据库的处理局限性提供了先进的并行计算和数据)。 资源调度
  3. 所属分类:其它

    • 发布日期:2019-07-16
    • 文件大小:1mb
    • 提供者:bucaixia08
  1. 内存数据交换格式ApacheArrow.zip

  2. Apache Arrow是Apache基金会下一个全新的开源项目,同时也是顶级项目。它的目的是作为一个跨平台的数据层来加快大数据分析项目的运行速度。用户在应用大数据分析时除了将Hadoop等大数据平台作为一个经济的存储和批处理平台之外也很看重分析系统的扩展性和性能。过去几年开源社区已经发布了很多工具来完善大数据分析的生态系统,这些工具涵盖了数据分析的各个层面,比如列式存储格式(Parquet/ORC)、内存计算层(Drill、Spark、Impala和Storm)以及强大的API接口(Pyth
  3. 所属分类:其它

  1. 开源的分布式内存文件系统 Tachyon.zip

  2. Tachyon是一个分布式内存文件系统,可以在集群里以访问内存的速度来访问存在tachyon里的文件。把Tachyon是架构在最底层的分布式文件存储和上层的各种计算框架之间的一种中间件。主要职责是将那些不需要落地到DFS里的文件,落地到分布式内存文件系统中,来达到共享内存,从而提高效率。同时可以减少内存冗余,GC时间等。        特性:类 Java 的文件 API兼容性:实现 Hadoop 文件系统接口可插入式的底层文件系统内建 Raw 原生表的支持基于 Web 的 UI 提供命令行接口
  3. 所属分类:其它

    • 发布日期:2019-07-19
    • 文件大小:10mb
    • 提供者:weixin_39840387
  1. Hadoop大数据共享系统

  2. 计算机网络技术已逐步被应用于社会各个领域,使得各行业的现代化管理水平得到不断提高。以传统模式为主的档案工作对档案信息的查找效率低下,不能满足对档案信息获取日渐增加的需求。Hadoop的出现无疑为提高档案管理水平创造了有利条件。基于Hadoop的企业档案信息共享系统作为众多管理信息系统的一个分支,既具有管理信息系统的基本特征,又符合了档案管理的特点。本系统运用SSH框架管理实现,运行良好,功能划分合理,操作简单方便,信息提示友好。该档案信息共享系统能很好的提供基本档案服务,降低管理成本,提高档案管
  3. 所属分类:Linux

    • 发布日期:2020-04-30
    • 文件大小:541kb
    • 提供者:fsc2988877
  1. 基于流式计算的电信实时营销系统设计与实现.caj

  2. 在移动互联网时代,各式各样的新业务和新产品不断出现,通信市场的用户总体规模增长速度变缓,使运营商之间的竞争愈加激烈,新产品营销的时效性和准确度问题亟需解决。实时营销作为新的营销方式,具有较高的实时性,通过运用大数据分析技术分析用户上网行为特征,并在合适的时间、合适的地点向用户推荐合适的内容,从而提升用户感知、增加用户粘性。如何运用大数据技术实现实时营销是本文的重要内容。本文深入调研分析了大数据实时流式处理技术,并结合其在满足非功能性需求方面的独特优势,设计了一个可以同时满足大数据存储、大数据实时
  3. 所属分类:spark

  1. 2-童小军-运用Hadoop构建数据仓库平台.pdf

  2. 童小军-运用Hadoop构建数据仓库平台 基于Hadoop构建数据仓库云平台(DAAS) 思想,原理,成本,案例 专注于企业级大数据EasyHadop 社区创始人提纲 数据开放数据云服务平台(DAAS)时代 Hadoop平台在数据云平台(DAAS上的天然优势 数据云平台DAAS平台组成部分 互联网公共数据大云DAAS案例 Hadoop构建构建游戏云 Web Game Daas平台 RedHadoop 专注于企业级大数据 四点 BDaaS-Big Data As A Service 大数据即服务
  3. 所属分类:Hadoop

    • 发布日期:2019-07-06
    • 文件大小:3mb
    • 提供者:u010461615
  1. Vertica实时数据分析平台

  2. 深度介绍Vertica产品总体架构、核心优势、集群能力、Vertica与Hadoop的数据交换、SQL高级分析、与分布式R无缝集成、灾备能力等等,是不可多得的了解Vertica的好资料。数据分析平台演进阶段及挑战 事件触发,全量数据实时分析频 价值实 业务相关性分析 繁访问 产品分析、用户行为分析客客户活动预测,客户流失预测,直接提升业务 户分析等灵活直询和数据分析产品盈利预测 面向大量业务人员 MOLAP CUBE生成 面向少量管理者的机器学习和 现整合层行业模型批量加工 预测 监管报送等数据
  3. 所属分类:Hadoop

    • 发布日期:2019-04-20
    • 文件大小:4mb
    • 提供者:skyon
  1. 云粘合平台漫谈及代码理解初步例子

  2. NULL 博文链接:https://lokki.iteye.com/blog/1041255大规模自动化服务,及以上以下的一些名词,但大多数都只实现了简单的服务和功能部件,也未能很 好地"动态化、按需化、快速化”。而在互联网服务新阶段,云计算基础设施里,分布式海量储存、 cache、 KeyValue、 KeyList、非关系式储存、 MapReduce、 Loadbalance、CDN、 ondemand等,这些名 词是常见和普及化的。用后面介绍的名词来说要有专业方向云技术部件” “SLA服务
  3. 所属分类:其它

    • 发布日期:2019-03-23
    • 文件大小:731kb
    • 提供者:weixin_38669628
  1. Apache Hadoop---Alluxio.docx

  2. Tachyon(/'tæki:ˌɒn/ 意为超光速粒子)是以内存为中心的分布式文件系统,拥有高性能和容错能力,能够为集群框架(如Spark、MapReduce)提供可靠的内存级速度的文件共享服务。 从软件栈的层次来看,Tachyon是位于现有大数据计算框架和大数据存储系统之间的独立的一层。它利用底层文件系统作为备份,对于上层应用来说,Tachyon就是一个分布式文件系统。
  3. 所属分类:Hadoop

    • 发布日期:2020-06-11
    • 文件大小:397kb
    • 提供者:qq_31641743
  1. 华为工程师linux的笔记-第13章.pdf

  2. Linux基础篇总共包含8个章节,第1章到第8章学习内容分别包括:Linux快速入门、Linux发展及系统安装、CentOS Linux系统管理、Linux必备命令、Linux用户和组、Linux软件包管理、磁盘管理、Linux文件共享管理等。 Linux进阶篇总共包含6个章节,第9章到第14章学习内容分别包括:HTTP协议详解、Apache WEB服务器企业实战、MySQL数据库服务器企业实战、LAMP企业架构实战、Zabbix分布式监控系统实战、Nginx高性能WEB服务器实战等。 Linu
  3. 所属分类:Linux

    • 发布日期:2020-07-05
    • 文件大小:2mb
    • 提供者:dahere99091
  1. 基于大数据技术的网管系统数据管理层

  2. 数据管理层是运营商网管系统中数据处理和管理的核心。从网管现状和问题分析入手,提出打破专业网管之间的隔离、推进数据的公有共享,进一步细分数据管理层的数据域和重构数据模型,并使用Hadoop+MPP混搭的技术架构建设数据管理层平台,为网管系统的规划和设计指明了方向。最后,还对数据管理层平台和企业级大数据共享服务平台的关系进行了论述。
  3. 所属分类:其它

    • 发布日期:2021-01-19
    • 文件大小:693kb
    • 提供者:weixin_38631042
  1. 基于大数据的电力系统数据集成管理平台设计

  2. 针对当前电力数据海量异构和共享度不高的问题,结合Hadoop和电力企业数据共享的必要 性,提出一种基于Hadoop 的数据集成管理平台。为实现该平台,首先利用HDFS分布式文件系统 对元数据进行管理,以提高海量数据的集成管理效率;采用HBase的数据共享模式,提高数据共享 度;最后针对传统Apriori算法的问题,对Apriori算法进行改进,具体则是引入MapRduce并行化处 理框架对算法进行设计,以提高Apriori算法运算效率,进而达到提高电力元数据挖掘效率。最后 搭建Hadoop平台,
  3. 所属分类:其它

« 12 »