您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 2013年大数据技术峰会PPT(34篇)完整版

  2. 2013年大数据技术峰会PPT(34篇)完整版猛料上传。 资料包含了“大数据架构与系统”、“大数据技术”、“大数据应用”、“大数据的研发趋势”,“大数据基准测试(Benchmark)”,以及“智能交通与大数据” 六个分论坛及行业峰会。拟邀请近百位国内外顶级的大数据学术界专家和业界技术领袖坐而论道,内容涵盖数据获取与清 理、传输、存储、计算、挖掘、展现、开发平台与应用市场等方面,覆盖了数据生产的全生命周期。除了Hadoop 版本2.0系统YARN,以及Spark等新型系统架构介绍外,还将探讨流式
  3. 所属分类:其它

    • 发布日期:2013-12-16
    • 文件大小:58720256
    • 提供者:kingalong
  1. 你需要Spark的10个理由

  2. 你需要Spark的十大理由: 1,Spark是可以革命Hadoop的目前唯一替代者,能够做Hadoop做的一切事情,同时速度比Hadoop快了100倍以上: Logistic regression in Hadoop and Spark 可以看出在Spark特别擅长的领域其速度比Hadoop快120倍以上! 2,原先支持Hadoop的四大商业机构纷纷宣布支持Spark,包含知名Hadoop解决方案供应商Cloudera和知名的Hadoop供应商MapR; 3,Spark是继Hadoop之后,成
  3. 所属分类:虚拟化

    • 发布日期:2014-09-22
    • 文件大小:27648
    • 提供者:javaniceyou
  1. Spark 展望&应用开发 - 亚马逊AWS首席云计算技术顾问 - 费良宏

  2. Spark 这个诞生了7年的开源框架已经成为了今天大数据市场上最炙手可热的词汇。而即将到来的Spark 2.0 将会成为这个项目的一个重大的里程碑。也许你会感兴趣新的版本中那些激动人心的特性:DataFrame、SparkR、StreamingML 以及Dataset API,那么我将在这个议题里面与你一同展望。此外,作为开发者的你或许希望可以了解围绕Spark 应用开发的一切。 我将以Python 为例, 聊一聊如何Spark 引擎开发诸如实时数据流或者批任务这一类数据密集性应用。
  3. 所属分类:专业指导

    • 发布日期:2016-07-18
    • 文件大小:18874368
    • 提供者:jason5186
  1. spark_java_2.1.0api.chm

  2. 童叟无欺,spark2.10 java chm文档格式的api。市场仅此一份
  3. 所属分类:Java

    • 发布日期:2017-05-10
    • 文件大小:5242880
    • 提供者:xiashuijun
  1. 数据算法 Hadoop Spark大数据处理技巧

  2. 《数据算法:Hadoop/Spark大数据处理技巧》介绍了很多基本设计模式、优化技术和数据挖掘及机器学习解决方案,以解决生物信息学、基因组学、统计和社交网络分析等领域的很多问题。这还概要介绍了MapReduce、Hadoop和Spark。, 主要内容包括:, ■ 完成超大量交易的购物篮分析。, ■ 数据挖掘算法(K-均值、KNN和朴素贝叶斯)。, ■ 使用超大基因组数据完成DNA和RNA测序。, ■ 朴素贝叶斯定理和马尔可夫链实现数据和市场预测。, ■ 推荐算法和成对文档相似性。, ■ 线性回
  3. 所属分类:Hadoop

    • 发布日期:2018-03-17
    • 文件大小:180355072
    • 提供者:tianshan2010
  1. 数据算法 Hadoop Spark大数据处理技巧

  2. 《数据算法:Hadoop/Spark大数据处理技巧》介绍了很多基本设计模式、优化技术和数据挖掘及机器学习解决方案,以解决生物信息学、基因组学、统计和社交网络分析等领域的很多问题。这还概要介绍了MapReduce、Hadoop和Spark。 主要内容包括: ■ 完成超大量交易的购物篮分析。 ■ 数据挖掘算法(K-均值、KNN和朴素贝叶斯)。 ■ 使用超大基因组数据完成DNA和RNA测序。 ■ 朴素贝叶斯定理和马尔可夫链实现数据和市场预测。 ■ 推荐算法和成对文档相似性。 ■ 线性回归、Cox回归
  3. 所属分类:spark

    • 发布日期:2018-06-01
    • 文件大小:104857600
    • 提供者:luofazha2012
  1. 数据算法 Hadoop Spark大数据处理技巧

  2. 《数据算法:Hadoop/Spark大数据处理技巧》介绍了很多基本设计模式、优化技术和数据挖掘及机器学习解决方案,以解决生物信息学、基因组学、统计和社交网络分析等领域的很多问题。这还概要介绍了MapReduce、Hadoop和Spark。   主要内容包括:   ■ 完成超大量交易的购物篮分析。   ■ 数据挖掘算法(K-均值、KNN和朴素贝叶斯)。   ■ 使用超大基因组数据完成DNA和RNA测序。   ■ 朴素贝叶斯定理和马尔可夫链实现数据和市场预测。   ■ 推荐算法和成对文档相似性。
  3. 所属分类:Java

    • 发布日期:2018-01-13
    • 文件大小:79691776
    • 提供者:arterhwq
  1. 自己动手做大数据系统.azw3

  2. 目前很多想学习或正在学习大数据的人,大都面临一些问题或困惑,本书的第一个特点就是系统性,覆盖了如何利用爬虫、Sqoop等获取各种数据,如何利用HDFS、HBase等存储大数据,如何利用MapReduce、Hive、Pig、Python、Spark等技术来处理大数据,如何利用Spark及R分析展示大数据整个过程,而且这些过程我们都可以以实战项目的方式在云平台上完成,这又体现出本书的第二个特点,即操作的便捷性。 如果你是一位在校大学生,对大数据感兴趣,也知道使用的企业越来越多,市场需求更是日新月异
  3. 所属分类:Hadoop

    • 发布日期:2018-09-05
    • 文件大小:19922944
    • 提供者:u011669700
  1. 数据算法 Hadoop Spark大数据处理技巧

  2. 数据算法 Hadoop Spark大数据处理技巧的主要内容包括: ■ 完成超大量交易的购物篮分析。 ■ 数据挖掘算法(K-均值、KNN和朴素贝叶斯)。 ■ 使用超大基因组数据完成DNA和RNA测序。 ■ 朴素贝叶斯定理和马尔可夫链实现数据和市场预测。 ■ 推荐算法和成对文档相似性。 ■ 线性回归、Cox回归和皮尔逊(Pearson)相关分析。 ■ 等位基因频率和DNA挖掘。 ■ 社交网络分析(推荐系统、三角形计数和情感分析)
  3. 所属分类:spark

    • 发布日期:2018-10-31
    • 文件大小:76546048
    • 提供者:together_cz
  1. 基于大数据平台构建数据仓库的研究与实践.pdf

  2. 数据仓库设计文档,帮助大家理解及如何设计数据仓库,很不错的一篇论文。专题 lTo 学习体系,能从海量数据中提炼高价值信息,构建自主 (1)源系统结构化数据:源系统按大数据平合的 训练与反馈、可不断从最新数据中调整演化的智能业务供数规范要求提供表数据文本和标志文件。 模型体系。 (2)文件交换区FSA:文件的交换中枢,含源系 以 Hadoop^ Spark为代表的大规模数据处理技术为统结构化数据和半结构化、非结构化数据(主要是外部 超越传统数据库的处理局限性提供了先进的并行计算和数据)。 资源调度
  3. 所属分类:其它

    • 发布日期:2019-07-16
    • 文件大小:1048576
    • 提供者:bucaixia08
  1. CLOUDERA-Manager-中文手册+CDH安装手册(Inter实验室版本).pdf

  2. CLOUDERA-Manager-中文手册+CDH安装手册 中文版本 CLOUDERA-Manager-中文手册+CDH安装手册 中文版本产品介绍 1.介绍 Cloudera Manager是CDH市场领先的管理平台。作为业界第一的端到端 Apache Hadoop的管理应用, Cloudera Manager对CDH的每个部件都提供了细粒度的可视化和控制,从而设立了企业部署的标准。通过 Cloudera manger,运 维人员得以提髙集群的性能,提升服务质量,提高合规性并降低管理成本。 Cl
  3. 所属分类:Hadoop

    • 发布日期:2019-07-16
    • 文件大小:5242880
    • 提供者:c275090933
  1. FUSINGAPACHESPARKANDLUCENEFORNEARREALTIMEPREDICTIVEMODELBUILDING.pdf

  2. 在SPARK SUMMIT 2017上,Debasish Das, Principal Engineer和Pramod Lakshmi Narasimha,Principal Engineer分享了题为《FUSING APACHE SPARK AND LUCENE FOR NEAR-REALTIME PREDICTIVE MODEL BUILDING》,就市场分析,数据建模,数据设备分析等方面的内容做了深入的分析。
  3. 所属分类:其它

    • 发布日期:2019-08-28
    • 文件大小:2097152
    • 提供者:weixin_38744375
  1. UsingSparkandRiakforIoTappsPatternsandAntipatterns.pdf

  2. 在SPARK SUMMIT 2017上,Pavel Hardak, Basho Technologies分享了题为《Using Spark and Riak for IoT apps Patterns and Anti-patterns》,就IoT市场数据分析,IoT项目计划,IoT独特优势等方面的内容做了深入的分析。
  3. 所属分类:其它

    • 发布日期:2019-08-29
    • 文件大小:3145728
    • 提供者:weixin_38743737
  1. 高性能大数据平台助力京东提高业务和服务效率

  2. 迁移至Spark计算框架,运行在英特尔架构计算平台上的京东大数据平台实现3倍效率提升,增强的扩展性助力京东持续保持B2C电子商务市场竞争优势。
  3. 所属分类:其它

    • 发布日期:2020-03-04
    • 文件大小:739328
    • 提供者:weixin_38640168
  1. 基于流式计算的电信实时营销系统设计与实现.caj

  2. 在移动互联网时代,各式各样的新业务和新产品不断出现,通信市场的用户总体规模增长速度变缓,使运营商之间的竞争愈加激烈,新产品营销的时效性和准确度问题亟需解决。实时营销作为新的营销方式,具有较高的实时性,通过运用大数据分析技术分析用户上网行为特征,并在合适的时间、合适的地点向用户推荐合适的内容,从而提升用户感知、增加用户粘性。如何运用大数据技术实现实时营销是本文的重要内容。本文深入调研分析了大数据实时流式处理技术,并结合其在满足非功能性需求方面的独特优势,设计了一个可以同时满足大数据存储、大数据实时
  3. 所属分类:spark

    • 发布日期:2019-10-20
    • 文件大小:3145728
    • 提供者:weixin_41045909
  1. 百度浏览器下载 Spark Browser v43.20.1000.205

  2. 百度向国外市场推出的基于Chromium的浏览器,有正体中文、英文、希伯来文等语言,加入了截图、鼠标手势、拖拽等功能,并集成了百宝工具箱。不同于国内的百度浏览器,Spark很干净清
  3. 所属分类:其它

    • 发布日期:2020-11-09
    • 文件大小:47185920
    • 提供者:weixin_38746387
  1. apache-airflow-mini-project:通过Apache Airflow Scheduler安排股票市场财务数据下载作业-源码

  2. apache-airflow-mini-project 通过Apache Airflow Scheduler安排股票市场财务数据下载作业 指导性Capstone项目:日终(EOD)数据加载 客观的: 使用Spark聚合方法执行数据清理。 使用Parquet文件创建Spark DataFrames 使用云存储作为Spark作业的输出 输出
  3. 所属分类:其它

    • 发布日期:2021-03-08
    • 文件大小:240640
    • 提供者:weixin_42109125
  1. 京东基于Spark的风控系统架构实践和技术细节

  2. 互联网的迅速发展,为电子商务兴起提供了肥沃的土壤。2014年,中国电子商务市场交易规模达到13.4万亿元,同比增长31.4%。其中,B2B电子商务市场交易额达到10万亿元,同比增长21.9%。这一连串高速增长的数字背后,不法分子对互联网资产的觊觎,针对电商行业的恶意行为也愈演愈烈,这其中,最典型的就是黄牛抢单囤货和商家恶意刷单。黄牛囤货让广大正常用户失去了商家给予的优惠让利;而商家的刷单刷好评,不仅干扰了用户的合理购物选择,更是搅乱了整个市场秩序。京东作为国内电商的龙头企业,在今天遭受着严酷的风
  3. 所属分类:其它

    • 发布日期:2021-02-25
    • 文件大小:1048576
    • 提供者:weixin_38645133
  1. Spark-Streaming流式数据处理

  2. 目前为止,已经讨论了机器学习和批处理模式的数据挖掘。现在审视持续处理流数据,实时检测其中的事实和模式,好像从湖泊来到了河流。先研究一下不断改变的动态环境带来的挑战,在列出流处理应用的先决条件(如,与Twitter的TCPSockets)之后,结合Spark,KafkaandFlume把数据放入一个低延迟,高吞吐量,可缩放的处理流水线。要点如下:按照惯例,先看一下最初的数据密集型应用架构,指明我们所感兴趣的SparkStreaming模块的所处位置.下图着重指明了整体架构中的SparkStream
  3. 所属分类:其它

    • 发布日期:2021-02-25
    • 文件大小:787456
    • 提供者:weixin_38717143
  1. 京东基于Spark的风控系统架构实践和技术细节

  2. 互联网的迅速发展,为电子商务兴起提供了肥沃的土壤。2014年,中国电子商务市场交易规模达到13.4万亿元,同比增长31.4%。其中,B2B电子商务市场交易额达到10万亿元,同比增长21.9%。这一连串高速增长的数字背后,不法分子对互联网资产的觊觎,针对电商行业的恶意行为也愈演愈烈,这其中,最典型的就是黄牛抢单囤货和商家恶意刷单。黄牛囤货让广大正常用户失去了商家给予的优惠让利;而商家的刷单刷好评,不仅干扰了用户的合理购物选择,更是搅乱了整个市场秩序。京东作为国内电商的龙头企业,在今天遭受着严酷的风
  3. 所属分类:其它

    • 发布日期:2021-02-20
    • 文件大小:1048576
    • 提供者:weixin_38642735
« 12 »