您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. Google搜索引擎核心架构 MapReduce: Simplified Data Processing on Large Clusters

  2. Google搜索引擎核心架构,并行与分布式结构的算法思想MapReduce: Simplified Data Processing on Large Clusters。2008年正式发表论文于ACM。正式论文有些变动。
  3. 所属分类:其它

    • 发布日期:2011-02-17
    • 文件大小:186kb
    • 提供者:cnlht
  1. 云计算之mapreduce算法

  2. 云计算之mapreduce算法,资源中讲到了该算法的思想以及如何设计,希望能够给学习mapreduce的同志们有所帮组有所启发。
  3. 所属分类:其它

    • 发布日期:2011-02-24
    • 文件大小:73kb
    • 提供者:piaoxuefengqi
  1. 基于Map_Reduce的并行关联分析方法

  2. 本文在研究BIRCH算法、规则关联算法、Hadoop的map/reduce机制的基础上,提 出了一种基于map/reduce的应用于网络安全事件分析的并行关联方法。一方面,通过对BIRCH 算法的改进,在BIRCH的分层次思想中引入预定义的规则库进行聚类,可以实现多级关联以 及提高聚类的收敛效果,从而达到精简报警教的目的;另一方面,把该关联算法与Hadoop的 map/reduce相结合,实现了算法的并行化计算,在一定程度上提高了算法的运行效率。最后的 实验结果表明,采用该关联方法可以有效提高
  3. 所属分类:群集服务

    • 发布日期:2012-05-20
    • 文件大小:386kb
    • 提供者:yyyyuuuu123
  1. Hadoop技术内幕 深入理解MapReduce架构设计与实现原理.pdf

  2. Hadoop技术内幕:深入解析MapReduce架构设计与实现原理 目录 前言 第一部分 基础篇 第1章 阅读源代码前的准备 1.1 准备源代码学习环境 1.1.1 基础软件下载 1.1.2 如何准备Windows环境 1.1.3 如何准备Linux环境 1.2 获取Hadoop源代码 1.3 搭建Hadoop源代码阅读环境 1.3.1 创建Hadoop工程 1.3.2 Hadoop源代码阅读技巧 1.4 Hadoop源代码组织结构 1.5 Hadoop初体验 1.5.1 启动Hadoop 1
  3. 所属分类:Java

    • 发布日期:2015-11-24
    • 文件大小:46mb
    • 提供者:yuan_xw
  1. 深入理解大数据 大数据处理与编程实践【1/2】

  2. 以大数据处理主流平台Hadoop1.0为核心,介绍Hadoop MapReduce,HDFS,HBase,以及Hive的基本设计思想、工作原理、系统构架、以及详细的大数据处理编程技术。 特点: (1) 重点放在教读者算法设计实现,从基础算法,到应用编程案例,解决实际问题。 (2) 作者多年的教学研究实践,课程设计沉淀,可以更深入地讨论大数据。 (3) 来自业界——Intel真实的实践经验和案例积累。
  3. 所属分类:其它

    • 发布日期:2016-04-15
    • 文件大小:47mb
    • 提供者:wangyanzhang123
  1. 深入理解大数据 大数据处理与编程实践【2/2】

  2. 以大数据处理主流平台Hadoop1.0为核心,介绍Hadoop MapReduce,HDFS,HBase,以及Hive的基本设计思想、工作原理、系统构架、以及详细的大数据处理编程技术。 特点: (1) 重点放在教读者算法设计实现,从基础算法,到应用编程案例,解决实际问题。 (2) 作者多年的教学研究实践,课程设计沉淀,可以更深入地讨论大数据。 (3) 来自业界——Intel真实的实践经验和案例积累。
  3. 所属分类:其它

    • 发布日期:2016-04-15
    • 文件大小:25mb
    • 提供者:wangyanzhang123
  1. Spark下BP神经网络并行化算法研究

  2. BP算法(反向传播算法)以其良好的非线性逼近能力、泛化能力以及实用性成为了人工神经网络训练算法中应用最为广泛的算法。但同时使用BP算法又存在收敛速度较慢、易陷入局部极小值等问题。为了将BP算法用于大规模数据分类问题,采用MapReduce思想,将大数据集切分成若干小的数据集来并行加速处理,同时引入Bagging算法的思想来综合并行结果,提高分类的准确率。通过在各个节点上根据子数据集独立地训练各个BP神经网络,直至各网络收敛,再将各节点上的网络收集起来进行集成,形成最终的分类器。基于Spark平
  3. 所属分类:spark

    • 发布日期:2018-06-22
    • 文件大小:1mb
    • 提供者:qq_28339273
  1. 新版Hadoop视频教程 段海涛老师Hadoop八天完全攻克Hadoop视频教程 Hadoop开发

  2. 第一天 hadoop的基本概念 伪分布式hadoop集群安装 hdfs mapreduce 演示 01-hadoop职位需求状况.avi 02-hadoop课程安排.avi 03-hadoop应用场景.avi 04-hadoop对海量数据处理的解决思路.avi 05-hadoop版本选择和伪分布式安装.avi 06-hadoop版本选择和伪分布式安装2.avi 07-hdfs&mapreduce;测试.avi 08-hdfs的实现机制初始.avi 09-hdfs的shell操作.avi 10-
  3. 所属分类:Java

    • 发布日期:2018-07-20
    • 文件大小:226byte
    • 提供者:jintaocccq
  1. hadoop段海涛老师八天实战视频

  2. 第一天 hadoop的基本概念 伪分布式hadoop集群安装 hdfs mapreduce 演示 01-hadoop职位需求状况.avi 02-hadoop课程安排.avi 03-hadoop应用场景.avi 04-hadoop对海量数据处理的解决思路.avi 05-hadoop版本选择和伪分布式安装.avi 06-hadoop版本选择和伪分布式安装2.avi 07-hdfs&mapreduce;测试.avi 08-hdfs的实现机制初始.avi 09-hdfs的shell操作.avi 10-
  3. 所属分类:Hadoop

    • 发布日期:2018-07-21
    • 文件大小:64byte
    • 提供者:weixin_40444270
  1. 大数据算法视频课程+课件

  2. 大数据在不论在研究还是工程领域都是热点之一,算法是大数据管理与计算的核心主题。本课程试图简要介绍大数据计算中涉及到的基本算法设计方法。适用于大数据研究与开发人员,也适用于数据科学爱好者。 大数据算法这门课程旨在通过讲授一些大数据上基本算法设计思想,包括概率算法、I/O有效算法和并行算法,让听课的同学们接触到和传统算法课程不一样的算法设计与分析思路,并且以最新的研究成果为导向,让参与这门课程学习的同学了解大数据算法的前沿知识。通过这门课程的学习,同学可以掌握大数据算法设计的基本思想,掌握大数据算
  3. 所属分类:算法与数据结构

    • 发布日期:2018-02-05
    • 文件大小:187byte
    • 提供者:u013844840
  1. 基于并行计算的文本分类技术

  2. 针对传统文本分类方法对于海量数据分类速度慢精度差等问题,将并行计算应用到文本分类领域,设计了一套基于MapReduce的并行化文本分类框架,结合Bagging算法思想提出了支持向量机的并行训练方法,并在Hadoop云计算平台上进行了实验,实验结果表明该分类方法具有较快的分类速度和较高的分类精度。
  3. 所属分类:算法与数据结构

    • 发布日期:2018-06-30
    • 文件大小:364kb
    • 提供者:qq_28339273
  1. Spark基本原理与设计思想

  2. Spark是一个通用的并行计算框架,由加州伯克利大学(UC Berkeley) 的AMP实验室开发于2009年,并于2010年开源,2013年成长为Apache旗下在大数据领域最活跃的开源项目之一。 虽然Spark是一个通用的并行计算框架,但是Spark本质上也是一个基于map-reduce算法模型实现的分布式计算框架,Spark不仅拥有了Hadoop MapReduce的能力和优点,还解决了Hadoop MapReduce中的诸多性能缺陷。
  3. 所属分类:spark

    • 发布日期:2018-10-20
    • 文件大小:23mb
    • 提供者:fct2001140269
  1. 八斗大虚据第九期完整版.docx

  2. 一阶段:这一阶段会学习MapReduce、Hive、HDFS、Yarn、Spark等计算框架的开发技术,以及Scala编程语言。通过项目实践,你能快速掌握这些技术,获得数据开发、数据挖掘、机器学习等职位必备的基本开发能力。 第二阶段:这一阶段会学习FLume、Kafka、Spark Streaming、Flink/Storm、Zookeeper、HBase等计算框架的开发技术,以及大数据体系内的数据采集和数据仓库理论思想和技术实现。通过项目实践,你能快速掌握这些技术,获得完整的大数据架构开发能
  3. 所属分类:Hadoop

    • 发布日期:2019-07-24
    • 文件大小:12kb
    • 提供者:qq_43648927
  1. 基于Hadoop平台的KNN分类器的优化和实现

  2. 分析了KNN分类算法的流程,然后在K值的动态获取和分类加权两个方面对分类算法进行改进;利用MapReduce编程思想完成KNN分类算法在Hadoop集群环境下的移植和实现。实验数据证明,改进后的KNN分类算法在人脸识别精度、识别效率和稳定性3个方面得到了有效提高。
  3. 所属分类:其它

    • 发布日期:2020-05-18
    • 文件大小:758kb
    • 提供者:weixin_38553275
  1. 2-童小军-运用Hadoop构建数据仓库平台.pdf

  2. 童小军-运用Hadoop构建数据仓库平台 基于Hadoop构建数据仓库云平台(DAAS) 思想,原理,成本,案例 专注于企业级大数据EasyHadop 社区创始人提纲 数据开放数据云服务平台(DAAS)时代 Hadoop平台在数据云平台(DAAS上的天然优势 数据云平台DAAS平台组成部分 互联网公共数据大云DAAS案例 Hadoop构建构建游戏云 Web Game Daas平台 RedHadoop 专注于企业级大数据 四点 BDaaS-Big Data As A Service 大数据即服务
  3. 所属分类:Hadoop

    • 发布日期:2019-07-06
    • 文件大小:3mb
    • 提供者:u010461615
  1. MapReduce进行大数据分析.pdf

  2. 在hadoop上利用MapReduce进行大数据分析的思维导图,超详细!!! 大数据专业学生考试前对一整个学期的大数据分析课程做了思维导图梳理,内容包含MapReduce核心思想,Hadoop架构理解、HDFS详解、MapReduce并行计算框架(如何使用)以及利用MapReduce实现经典算法的并行化处理。
  3. 所属分类:群集服务

    • 发布日期:2020-06-30
    • 文件大小:577kb
    • 提供者:Mr_jokersun
  1. gotest:这是用Golang编写的内存数据库的原型。 主要思想是提供能力以使用多个索引来快速选择。 希望它会比mysql更快-源码

  2. 关于它 这是内存数据库的草稿或原型,它支持一组不同的索引类型。 主键索引 多值索引 固定索引 另外,我想添加索引合并(或相交)功能,该功能将所有索引一起使用。 支持的功能: 数据持久层 REST API 我正在研究新功能和性能。 在不久的将来,我想在对等之间添加复制,WAL(预写日志),事务支持,FlatBuffer / Protobuf TCP套接字通信,MapReduce算法。
  3. 所属分类:其它

    • 发布日期:2021-03-13
    • 文件大小:15kb
    • 提供者:weixin_42151772
  1. 云计算环境下架构Hadoop集群的数据分配方式

  2. 云计算是并行计算、分布式计算和网格计算的发展。文中详细地阐述了MapReduce的编程思想、工作原理、步骤和方法。探讨了来自Apache开源的分布式计算平台Hadoop的核心设计MapReduce编程模型,并通过算法实验分析和研究了MapReduce模型的工作方式和应用方法。云计算(CloudComputing)是一种新兴的商业计算模型。它将计算任务分布在大量计算机构成的资源池上,使各种应用系统能够根据需要获取计算力、存储空间和各种软件服务。云计算是网格计算(GridComputing)、分布式
  3. 所属分类:其它

    • 发布日期:2021-03-02
    • 文件大小:242kb
    • 提供者:weixin_38570278
  1. 一种高维大数据全k近邻查询算法

  2. 全k近邻(all k-nearest neighbor,AkNN)查询,是k近邻查询的一个变型,旨在在一个查询过程中为给定数据集的每个对象确定k个最近邻。提出了一种在Hadoop分布式平台下处理高维大数据的AkNN查询算法。首先使用行条化思想结合p-stable LSH算法将高维数据对象降维,然后结合空间填充曲线Z-order的优良特性,把降维后的数据嵌入一维空间中,接着进行范围查询。整个过程使用MapReduce框架分布式并行处理。实验结果表明,所提出的算法可以高效处理高维大数据的AkNN查询
  3. 所属分类:其它

  1. 基于Spark和IPPSO_LSSVM的短期分布式电力负荷预测算法

  2. 为了提高电力负荷预测的精度,应对单机运算资源不足的挑战,提出一种改进并行化粒子群算法优化的最小二乘支持向量机短期负荷预测模型。通过引入Spark on YARN内存计算平台,将改进并行粒子群优化(IPPSO)算法部署在平台上,对最小二乘支持向量机(LSSVM)的不确定参数进行算法优化,利用优化后的参数进行负荷预测。通过引入并行化和分布式的思想,提高算法预测准确率和处理海量高维数据的能力。采用EUNITE提供的真实负荷数据,在8节点的云计算集群上进行实验和分析,结果表明所提分布式电力负荷预测算法精
  3. 所属分类:其它

    • 发布日期:2021-01-12
    • 文件大小:947kb
    • 提供者:weixin_38714637
« 12 »