您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. Spark 框架的Graphx 算法研究

  2. Spark 框架的Graphx 算法研究 陈虹君 (电子科技大学成都学院,四川成都611731) 摘要:随着搜索引擎对网页的排名的需要,以及社交网络的兴起,海量关系所产生的大数据需要得到处理。图计算在数据 关系的分析上发挥着其巨大的潜能。Spark 框架是Hadoop 大数据平台上整合能力强,处理速度快的内存模型框架,它的图 处理Graphx 也得到快速发展。该文先介绍Spark 框架与Graphx 的关系与发展。接着分析了Graphx 中的三个典型的算 法。最后总结了Graphx 的场景应用
  3. 所属分类:其它

    • 发布日期:2015-06-27
    • 文件大小:1mb
    • 提供者:u013072345
  1. spark 入门学习教程

  2. Spark是加州大学伯克利分校AMP实验室(Algorithms, Machines, and People Lab)开发通用内存并行计算框架。Spark在2013年6月进入Apache成为孵化项目,8个月后成为Apache顶级项目,速度之快足见过人之处,Spark以其先进的设计理念,迅速成为社区的热门项目,围绕着Spark推出了Spark SQL、Spark Streaming、MLLib和GraphX等组件,也就是BDAS(伯克利数据分析栈),这些组件逐渐形成大数据处理一站式解决平台。从各
  3. 所属分类:其它

    • 发布日期:2017-03-05
    • 文件大小:32mb
    • 提供者:claram
  1. Spark 2.0.2 Spark 2.2 中文文档

  2. 本资源为网页,不是PDF Apache Spark 2.0.2 中文文档 Spark 概述 编程指南 快速入门 Spark 编程指南 概述 Spark 依赖 Spark 的初始化 Shell 的使用 弹性分布式数据集(RDDS) 并行集合 外部数据集 RDD 操作 RDD 持久化 共享变量 Broadcast Variables (广播变量) Accumulators (累加器) 部署应用到集群中 使用 Java / Scala 运行 spark Jobs 单元测试 Spark 1.0 版本前
  3. 所属分类:spark

    • 发布日期:2017-12-07
    • 文件大小:62byte
    • 提供者:huoyongjie698
  1. solaris spark内存模型

  2. 包括soalris的硬件内存模型和软件内存模型,是不可多的珍贵资料
  3. 所属分类:专业指导

    • 发布日期:2009-03-19
    • 文件大小:161kb
    • 提供者:alexsto
  1. 2.Spark编译与部署(下)--Spark编译安装.pdf

  2. 1.Spark及其生态圈简介.pdf 2.Spark编译与部署(上)--基础环境搭建.pdf 2.Spark编译与部署(下)--Spark编译安装.pdf 2.Spark编译与部署(中)--Hadoop编译安装.pdf 3.Spark编程模型(上)--概念及SparkShell实战.pdf 3.Spark编程模型(下)--IDEA搭建及实战.pdf 4.Spark运行架构.pdf 5.Hive(上)--Hive介绍及部署.pdf 5.Hive(下)--Hive实战.pdf 6.SparkSQL
  3. 所属分类:spark

    • 发布日期:2018-04-04
    • 文件大小:1mb
    • 提供者:u010195673
  1. 5.Hive(上)--Hive介绍及部署.pdf

  2. 1.Spark及其生态圈简介.pdf 2.Spark编译与部署(上)--基础环境搭建.pdf 2.Spark编译与部署(下)--Spark编译安装.pdf 2.Spark编译与部署(中)--Hadoop编译安装.pdf 3.Spark编程模型(上)--概念及SparkShell实战.pdf 3.Spark编程模型(下)--IDEA搭建及实战.pdf 4.Spark运行架构.pdf 5.Hive(上)--Hive介绍及部署.pdf 5.Hive(下)--Hive实战.pdf 6.SparkSQL
  3. 所属分类:spark

    • 发布日期:2018-04-04
    • 文件大小:1mb
    • 提供者:u010195673
  1. 6.SparkSQL(下)--Spark实战应用.pdf

  2. 1.Spark及其生态圈简介.pdf 2.Spark编译与部署(上)--基础环境搭建.pdf 2.Spark编译与部署(下)--Spark编译安装.pdf 2.Spark编译与部署(中)--Hadoop编译安装.pdf 3.Spark编程模型(上)--概念及SparkShell实战.pdf 3.Spark编程模型(下)--IDEA搭建及实战.pdf 4.Spark运行架构.pdf 5.Hive(上)--Hive介绍及部署.pdf 5.Hive(下)--Hive实战.pdf 6.SparkSQL
  3. 所属分类:spark

    • 发布日期:2018-04-04
    • 文件大小:3mb
    • 提供者:u010195673
  1. 6.SparkSQL(中)--深入了解运行计划及调优.pdf

  2. 1.Spark及其生态圈简介.pdf 2.Spark编译与部署(上)--基础环境搭建.pdf 2.Spark编译与部署(下)--Spark编译安装.pdf 2.Spark编译与部署(中)--Hadoop编译安装.pdf 3.Spark编程模型(上)--概念及SparkShell实战.pdf 3.Spark编程模型(下)--IDEA搭建及实战.pdf 4.Spark运行架构.pdf 5.Hive(上)--Hive介绍及部署.pdf 5.Hive(下)--Hive实战.pdf 6.SparkSQL
  3. 所属分类:spark

    • 发布日期:2018-04-04
    • 文件大小:2mb
    • 提供者:u010195673
  1. 7.SparkStreaming(上)--SparkStreaming原理介绍.pdf

  2. 1.Spark及其生态圈简介.pdf 2.Spark编译与部署(上)--基础环境搭建.pdf 2.Spark编译与部署(下)--Spark编译安装.pdf 2.Spark编译与部署(中)--Hadoop编译安装.pdf 3.Spark编程模型(上)--概念及SparkShell实战.pdf 3.Spark编程模型(下)--IDEA搭建及实战.pdf 4.Spark运行架构.pdf 5.Hive(上)--Hive介绍及部署.pdf 5.Hive(下)--Hive实战.pdf 6.SparkSQL
  3. 所属分类:spark

    • 发布日期:2018-04-04
    • 文件大小:989kb
    • 提供者:u010195673
  1. 8.SparkMLlib(下)--SparkMLlib实战.pdf

  2. 1.Spark及其生态圈简介.pdf 2.Spark编译与部署(上)--基础环境搭建.pdf 2.Spark编译与部署(下)--Spark编译安装.pdf 2.Spark编译与部署(中)--Hadoop编译安装.pdf 3.Spark编程模型(上)--概念及SparkShell实战.pdf 3.Spark编程模型(下)--IDEA搭建及实战.pdf 4.Spark运行架构.pdf 5.Hive(上)--Hive介绍及部署.pdf 5.Hive(下)--Hive实战.pdf 6.SparkSQL
  3. 所属分类:spark

    • 发布日期:2018-04-04
    • 文件大小:1mb
    • 提供者:u010195673
  1. 9.SparkGraphX介绍及实例.pdf

  2. 1.Spark及其生态圈简介.pdf 2.Spark编译与部署(上)--基础环境搭建.pdf 2.Spark编译与部署(下)--Spark编译安装.pdf 2.Spark编译与部署(中)--Hadoop编译安装.pdf 3.Spark编程模型(上)--概念及SparkShell实战.pdf 3.Spark编程模型(下)--IDEA搭建及实战.pdf 4.Spark运行架构.pdf 5.Hive(上)--Hive介绍及部署.pdf 5.Hive(下)--Hive实战.pdf 6.SparkSQL
  3. 所属分类:spark

    • 发布日期:2018-04-04
    • 文件大小:1mb
    • 提供者:u010195673
  1. 10.分布式内存文件系统Tachyon介绍及安装部署.pdf

  2. 1.Spark及其生态圈简介.pdf 2.Spark编译与部署(上)--基础环境搭建.pdf 2.Spark编译与部署(下)--Spark编译安装.pdf 2.Spark编译与部署(中)--Hadoop编译安装.pdf 3.Spark编程模型(上)--概念及SparkShell实战.pdf 3.Spark编程模型(下)--IDEA搭建及实战.pdf 4.Spark运行架构.pdf 5.Hive(上)--Hive介绍及部署.pdf 5.Hive(下)--Hive实战.pdf 6.SparkSQL
  3. 所属分类:spark

    • 发布日期:2018-04-04
    • 文件大小:1mb
    • 提供者:u010195673
  1. 基于Spark框架的聚类算法研究

  2. 大数据的挖掘是当今的研究热点,也有着巨大的商业价值。新型框架Spark部署在Hadoop平台上,它的机器学习算法几乎可以完全替代传统的Mahout Map Reduce的编程模式,但由于Spark的内存模型特点,执行速度快。该文研究了Spark中的机器学习中的聚类算法KMeans,先分析了算法思想,再通过实验分析其应用的方法,然后通过实验结果分析其应用场景和不足。
  3. 所属分类:spark

    • 发布日期:2018-06-22
    • 文件大小:1mb
    • 提供者:qq_28339273
  1. Spark大数据处理

  2. 第1章 Spark简介 1.1 Spark是什么 1.2 Spark生态系统BDAS 1.3 Spark架构 1.4 Spark分布式架构与单机多核架构的异同 1.5 Spark的企业级应用 1.5.1 Spark在Amazon中的应用 1.5.2 Spark在Yahoo!的应用 1.5.3 Spark在西班牙电信的应用 1.5.4 Spark在淘宝的应用 1.6 本章小结 第2章 Spark集群的安装与部署 2.1 Spark的安装与部署 2.1.1 在Linux集群上安装与配置Spark
  3. 所属分类:spark

    • 发布日期:2018-06-26
    • 文件大小:9mb
    • 提供者:m0_37585915
  1. Spark Ecosystem core analysing

  2. Spark是第一个脱胎于该转变的快速、通用分布式计算范式, 并且很快流行起来。Spark使用函数式编程范式扩展了MapReduce模型以支持更多计算类型,可以涵盖广泛的工作流,这些工作流之前被实现为 Hadoop之上的特殊系统。Spark使用内存缓存来提升性能,因此进行交互式分析也足够快速(就如同使用Python解释器,与集群进行交互一样)。 缓存同时提升了迭代算法的性能,这使得Spark非常适合数据理论任务,特别是机器学习。
  3. 所属分类:spark

    • 发布日期:2018-07-28
    • 文件大小:1mb
    • 提供者:wcg512
  1. 基于 Spark 框架的文本主题特征提取与分类

  2. 主题模型目前广泛应用于机器学习与自然语言分析等领域,该模型自动分析一系列未识别的文档,试图通过统计信息发现多个抽象主题。主题模型在新闻文本智能处理与推荐领域的应用前景十分广阔。本文首先从文档自动分类为出发点,介绍文本分析的一般流程。 在此基础之上,介绍主题模型和基于 LDA 模型的文本主题特征提取原理。最后结合 Spark 大数据处理的内存迭代和分布式计算特性,实现了基于 LDA 模型的文本主题提取过程,并给 出了在新闻文本数据集上的主题抽取与分类预测结果。
  3. 所属分类:spark

    • 发布日期:2018-01-17
    • 文件大小:386kb
    • 提供者:weixin_36200363
  1. Spark 入门实战系列

  2. Spark 入门实战系列,适合初学者,文档包括十部分内容,质量很好,为了感谢文档作者,也为了帮助更多的人入门,传播作者的心血,特此友情转贴: 1.Spark及其生态圈简介.pdf 2.Spark编译与部署(上)--基础环境搭建.pdf 2.Spark编译与部署(下)--Spark编译安装.pdf 2.Spark编译与部署(中)--Hadoop编译安装.pdf 3.Spark编程模型(上)--概念及SparkShell实战.pdf 3.Spark编程模型(下)--IDEA搭建及实战.pdf 4.
  3. 所属分类:spark

    • 发布日期:2018-01-18
    • 文件大小:32mb
    • 提供者:zy205
  1. 大数据Spark企业级实战版.pdf

  2. park是当今大数据领域最活跃、最热门、最高效的大数据通用计算平台,是Apache软件基金会下所有开源项目中三大顶级开源项目之一。 在“One Stack to rule them all”理念的指引下,Spark基于RDD成功地构建起了大数据处理的一体化解决方案,将MapReduce、Streaming、SQL、Machine Learning、Graph Processing等大数据计算模型统一到一个技术堆栈中,开发者使用一致的API操作Spark中的所有功能;更为重要的是Spark的Sp
  3. 所属分类:spark

    • 发布日期:2018-02-27
    • 文件大小:114mb
    • 提供者:tianxia12321
  1. 大数据spark学习之rdd概述

  2. RDD(Resilient Distributed Dataset)叫做弹性分布式数据集,是Spark中最基本的数据抽象,它代表一个不可变、可分区、里面的元素可并行计算的集合。在 Spark 中,对数据的所有操作不外乎创建 RDD、转化已有RDD 以及调用 RDD 操作进行求值。每个 RDD 都被分为多个分区,这些分区运行在集群中的不同节点上。RDD 可以包含 Python、Java、Scala 中任意类型的对象, 甚至可以包含用户自定义的对象。RDD具有数据流模型的特点:自动容错、位置感知性调
  3. 所属分类:互联网

    • 发布日期:2020-05-03
    • 文件大小:3kb
    • 提供者:fy1235
  1. Spark环境搭建——standalone集群模式

  2. 这篇博客,Alice为大家带来的是Spark集群环境搭建之——standalone集群模式。 文章目录集群角色介绍集群规划修改配置并分发启动和停止查看web界面测试 集群角色介绍         Spark是基于内存计算的大数据并行计算框架,实际中运行计算任务肯定是使用集群模式,那么我们先来学习Spark自带的standalone集群模式了解一下它的架构及运行机制。         Standalone集群使用了分布式计算中的master-slave模型         master是集群中
  3. 所属分类:其它

    • 发布日期:2021-01-07
    • 文件大小:326kb
    • 提供者:weixin_38669729
« 12 3 »