点数信息
www.dssz.net
注册会员
|
设为首页
|
加入收藏夹
您好,欢迎光临本网站!
[请登录]
!
[注册会员]
!
首页
移动开发
云计算
大数据
数据库
游戏开发
人工智能
网络技术
区块链
操作系统
模糊查询
热门搜索:
源码
Android
整站
插件
识别
p2p
游戏
算法
更多...
在线客服QQ:632832888
当前位置:
资源下载
搜索资源 - 用ApacheSpark进行大数据处理
下载资源分类
移动开发
开发技术
课程资源
网络技术
操作系统
安全技术
数据库
行业
服务器应用
存储
信息化
考试认证
云计算
大数据
跨平台
音视频
游戏开发
人工智能
区块链
在结果中搜索
所属系统
Windows
Linux
FreeBSD
Unix
Dos
PalmOS
WinCE
SymbianOS
MacOS
Android
开发平台
Visual C
Visual.Net
Borland C
CBuilder
Dephi
gcc
VBA
LISP
IDL
VHDL
Matlab
MathCAD
Flash
Xcode
Android STU
LabVIEW
开发语言
C/C++
Pascal
ASM
Java
PHP
Basic/ASP
Perl
Python
VBScript
JavaScript
SQL
FoxBase
SHELL
E语言
OC/Swift
文件类型
源码
程序
CHM
PDF
PPT
WORD
Excel
Access
HTML
Text
资源分类
搜索资源列表
Spark工作原理
ApacheSpark是一个围绕速度、易用性和复杂分析构建的大数据处理框架,最初在2009年由加州大学伯克利分校的AMPLab开发,并于2010年成为Apache的开源项目之一,与Hadoop和Storm等其他大数据和MapReduce技术相比,Spark有如下优势:1.运行速度快,Spark拥有DAG执行引擎,支持在内存中对数据进行迭代计算。官方提供的数据表明,如果数据由磁盘读取,速度是HadoopMapReduce的10倍以上,如果数据从内存中读取,速度可以高达100多倍。2.适用场景广泛,
所属分类:
其它
发布日期:2021-03-01
文件大小:1mb
提供者:
weixin_38624628
用ApacheSpark进行大数据处理
ApacheSpark是一个围绕速度、易用性和复杂分析构建的大数据处理框架。最初在2009年由加州大学伯克利分校的AMPLab开发,并于2010年成为Apache的开源项目之一。与Hadoop和Storm等其他大数据和MapReduce技术相比,Spark有如下优势。首先,Spark为我们提供了一个全面、统一的框架用于管理各种有着不同性质(文本数据、图表数据等)的数据集和数据源(批量数据或实时的流数据)的大数据处理的需求。Spark可以将Hadoop集群中的应用在内存中的运行速度提升100倍,甚
所属分类:
其它
发布日期:2021-02-26
文件大小:200kb
提供者:
weixin_38614377
snappydata:项目SnappyData-基于Apache Spark:trade_mark:和Apache Geode:trade_mark:的内存优化分析数据库。 在一个集群中进行流,事务处理,分析,预测-源码
介绍 SnappyData(又名TIBCO ComputeDB社区版)是一个分布式的,内存优化的分析数据库。 SnappyData为统一分析工作负载提供高吞吐量,低延迟和高并发性。 通过在Apache Spark中融合内存中的混合数据库,它可以在一个统一的集群中提供分析查询处理,可变性/事务,对几乎所有大数据源的访问以及流处理。 SnappyData的一个常见用例是以交互速度提供对大量数据的分析,而无需对数据集进行最少的预处理。 例如,无需经常对大型数据集进行预聚集/归约或生成多维数据集以进行
所属分类:
其它
发布日期:2021-02-25
文件大小:120mb
提供者:
weixin_42097189
用Spark机器学习数据流水线进行广告检测
在这篇文章中,我们Spark的其它机器学习API,名为SparkML,如果要用数据流水线来开发大数据应用程序的话,这个是推荐的解决方案。关键点:了解机器学习数据流水线有关内容。怎么用ApacheSpark机器学习包来实现机器学习数据流水线。数据价值链处理的步骤。Spark机器学习流水线模块和API。文字分类和广告检测用例。SparkML(spark.ml)包提供了构建在DataFrame之上的机器学习API,它已经成了SparkSQL库的核心部分。这个包可以用于开发和管理机器学习流水线。它也可以
所属分类:
其它
发布日期:2021-02-24
文件大小:298kb
提供者:
weixin_38565221
用ApacheSpark进行大数据处理
ApacheSpark是一个围绕速度、易用性和复杂分析构建的大数据处理框架。最初在2009年由加州大学伯克利分校的AMPLab开发,并于2010年成为Apache的开源项目之一。与Hadoop和Storm等其他大数据和MapReduce技术相比,Spark有如下优势。首先,Spark为我们提供了一个全面、统一的框架用于管理各种有着不同性质(文本数据、图表数据等)的数据集和数据源(批量数据或实时的流数据)的大数据处理的需求。Spark可以将Hadoop集群中的应用在内存中的运行速度提升100倍,甚
所属分类:
其它
发布日期:2021-01-30
文件大小:200kb
提供者:
weixin_38749863
Spark工作原理
ApacheSpark是一个围绕速度、易用性和复杂分析构建的大数据处理框架,最初在2009年由加州大学伯克利分校的AMPLab开发,并于2010年成为Apache的开源项目之一,与Hadoop和Storm等其他大数据和MapReduce技术相比,Spark有如下优势: 1.运行速度快,Spark拥有DAG执行引擎,支持在内存中对数据进行迭代计算。官方提供的数据表明,如果数据由磁盘读取,速度是Hadoop MapReduce的10倍以上,如果数据从内存中读取,速度可以高达100
所属分类:
其它
发布日期:2021-01-27
文件大小:1mb
提供者:
weixin_38608055