您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 201711-流计算技术产品分析

  2. 流计算处理系统的分类 1、实现流处理系统有两种完全不同的方式: 一种是称作原生流处理,意味着所有输入的记录一旦到达即会一个接着一个进行处理。 第二种称为微批处理。把输入的数据按照某种预先定义的时间间隔(典型的是几秒钟)分成短小的批量数据,流经流处理系统。
  3. 所属分类:kafka

    • 发布日期:2017-12-24
    • 文件大小:4194304
    • 提供者:leajames
  1. kafka、storm、flink、apex、spark五种流式大数据系统调研报告

  2. 本文主要调研了Apache Kafka、Apache Flink、Apache Storm、Apache Apex和Apache Spark Streaming五种流式大数据系统。主要的工作有:1)通过文献阅读和试用比较了它们的实现原理;2)利用了kafka自带的测试脚本进行了kafka性能测试;3)通过Hibench进行了Flink、Storm和Spark Streaming的比较测试;4)进行了Apex的简单测试;5)对以上流式大数据系统进行了总结分析。
  3. 所属分类:Hadoop

    • 发布日期:2018-06-21
    • 文件大小:2097152
    • 提供者:selinaqqqq
  1. 基于Hadoop、Spark及Flink大规模数据分析的性能评价

  2. 针对目前缺少大型数据分析框架间的横向比较问题,使用有代表性的大数据工作负载,对Hadoop、Spark和Flink进行性能和可扩展性等因素的比较评价。此外,通过调整工作负载的一些主要参数,例如HDFS块大小、输入数据大小、互连网络或线程配置等,描述了这些框架的行为模式特征。实验结果分析表明,对于非排序的基准测试程序,使用Spark或Flink替代Hadoop,分别带来平均77%和70%执行时间的降低。整体上,Spark的性能结果最好;而Flink通过使用的显式迭代程序,极大提高了迭代算法的性能
  3. 所属分类:Hadoop

    • 发布日期:2018-06-29
    • 文件大小:2097152
    • 提供者:qq_28339273
  1. Interactive Data Analysis with Apache Flink

  2. 使用Flink交互式大数据分析资料Interactive Data Analysis with Apache Flink
  3. 所属分类:flink

    • 发布日期:2018-01-24
    • 文件大小:5242880
    • 提供者:wxssanzang
  1. The Dataflow Model: A Practical Approach to Balancing Correctness

  2. 在日常商业运营中,无边界、乱序、大规模数据集越来越普遍了。(例如,网站日志,手机应用统计,传感器网络)。同时,对这些数据的消费需求也越来越复杂。比如说按事件发生时间序列处理数据,按数据本身的特征进行窗口计算等等。同时人们也越来越苛求立刻得到数据分析结果。然而,实践表明,我们永远无法同时优化数据处理的准确性、延迟程度和处理成本等各个维度。因此,数据工作者面临如何协调这些几乎相互冲突的数据处理技术指标的窘境,设计出来各种纷繁的数据处理系统和实践方法。
  3. 所属分类:flink

    • 发布日期:2018-10-15
    • 文件大小:1048576
    • 提供者:mudinglou
  1. Flink 数据类型与序列化.pdf

  2. Flink 2019峰会 阿里大牛的技术, 在线教程有github:*,第6个文档 简明扼要的讲解Flink的数据类型和转换的源码分析。值得收藏
  3. 所属分类:flink

    • 发布日期:2019-07-17
    • 文件大小:12582912
    • 提供者:dargun
  1. Flink笔记.md

  2. 首先大数据存储和分析引擎Hadoop自2006年诞生。谈及Hadoop大家自然不会对 MapReduce感到陌生,它将计算分为两个阶段,分别为 Map 和 Reduce。MapReduce计算框架虽然借鉴了函数式编程和矢量编程的思想完成了分布式计算。但不得不承认MapReduce在矢量编程结构过于简单,在完成一些比较复杂的高阶计算(例如:机器学习线性回归)的时候,需要将多个MapReduce任务串联起来才能完成一个复杂的计算逻辑,因此在早期人们需要在编写完多个job任务之后还需要Job的调用流程
  3. 所属分类:flink

    • 发布日期:2020-03-31
    • 文件大小:92160
    • 提供者:weixin_44027155
  1. 基于flink的电商用户行为数据分析

  2. 该项目是基于于flink的电商用户行为数据分析的flink项目,模块划为为:从项目介绍与代码框架、实时热门商品统计、替换kafka源、实时流量统计、恶意登录检测、恶意登录监控CEP实现、订单支付监控CEP实现
  3. 所属分类:flink

    • 发布日期:2020-03-21
    • 文件大小:18874368
    • 提供者:weixin_39868387
  1. 基于Flink的实时视频分析系统设计与实现

  2. 基于Flink的实时视频分析系统设计与实现,刘应亮,李文生,随着智能视频监控的快速发展,对监控视频数据进行实时视频分析的需求日益增多,由于视频分析算法的复杂度相对较高,对视频数据进
  3. 所属分类:其它

    • 发布日期:2020-03-12
    • 文件大小:434176
    • 提供者:weixin_38713203
  1. Flink电商用户行为分析源代码

  2. 模拟电商系统上线运行一段时间后,根据收集到大量的用户行为数据,利用大数据技术(Flink)进行深入挖掘和分析,进而得到感兴趣的商业指标并增强对风险的控制。 整体可以分为用户行为习惯数据和业务行为数据两大类。用户的行为习惯数据包括了用户的登录方式、上线的时间点及时长、点击和浏览页面、页面停留时间以及页面跳转等等,从中进行流量统计和热门商品的统计,并深入挖掘用户的特征;业务行为数据分为两类:一类是能够明显地表现出用户兴趣的行为,比如对商品的收藏、喜欢、评分和评价,对数据进行深入分析,得到用户画像,进
  3. 所属分类:flink

    • 发布日期:2020-06-25
    • 文件大小:123731968
    • 提供者:IronmanJay
  1. Flink-构建下一代大数据处理引擎

  2. 分析阿里、滴滴、知乎业务等典型案例,计算出数据趋势——Flink将成为下一代优秀的数据引擎,它不但可以解决大规模部署+云计算隔离问题,还可以解决流计算时延问题,减少Date Skew,避免木桶效应。
  3. 所属分类:flink

    • 发布日期:2020-10-13
    • 文件大小:7340032
    • 提供者:luzuocheng_1503
  1. flink学习详细笔记

  2. 包含了基础概念 数据源读取和数据源处理算子详解,时间窗口,cep算子和详解,让你从0步入数据分析!!!!!!
  3. 所属分类:flink

    • 发布日期:2020-10-28
    • 文件大小:2097152
    • 提供者:weixin_44284982
  1. flink-source-code-analysis:Apache Flink源码分析系列,基于git tag 1.1.2-源码

  2. flink-源代码分析 Apache Flink源码分析系列,基于git tag 1.1.2 Apache Flink被视为第四代的大数据处理框架,它融合了流式计算和批处理【批处理被视为流式计算的特例】 在流式计算方面,使用分布式快照【检查点】实现了高效的数据不丢的机制从而实现准确的一次;使用WaterMark技术实现了窗口计算中延迟数据的处理,同时对流式计算的窗口时间定义分类:处理时间,摄取时间,事件时间 本人觉得flink的这些特性一定程序上可以窥探出大数据的未来方向,所以花了些时间来阅读
  3. 所属分类:其它

    • 发布日期:2021-03-24
    • 文件大小:3145728
    • 提供者:weixin_42131790
  1. awesome-opensource-data-engineering:很棒的开源数据工程项目清单-源码

  2. 很棒的开源数据工程 该旨在概述与数据工程相关项目。这是社区的努力:请并发送您的拉取请求,以增加此列表!有关包括非OSS工具的列表的信息,请参阅此令人惊叹的 。 目录 分析工具 用于大规模数据处理的统一分析引擎。包括Scala,Java,Python(称为PySpark)和R(SparkR)中的API。 -Google DataFlow的开源实现。提供在任何执行引擎(包括Spark,Flink或它自己的DirectRunner)上运行的批处理和流数据处理作业的功能。支持Java,Python和
  3. 所属分类:其它

    • 发布日期:2021-03-20
    • 文件大小:6144
    • 提供者:weixin_42100032
  1. LarkMidTableWeb:基于flink的分布式数据分析系统-源码

  2. LarkMidTable 中文| Lark中文名称云雀,云代表大数据,雀代表平凡和自由。 LarkMidTable是一站式开源的数据中台,实现元数据管理,数据仓库开发,数据质量管理,数据的可视化,实现高效赋能数据前台并提供数据服务的产品。 产品愿景 1.满足许多的小企业,提供一站式的解决方案。 2.创造世界等级,能够证明美BAT大厂的产品。 3.创造价值,产生价值,让世界变得更加美好。 产品效果图 产品架构图 产品功能 功能 功能特性 数据库类型 读取类型 写入类型 数据集成 批处理同步
  3. 所属分类:其它

    • 发布日期:2021-03-11
    • 文件大小:19922944
    • 提供者:weixin_42122340
  1. bigdata_analyse:大数据分析-源码

  2. bigdata_analyse 大数据分析项目 希望 采用不同的技术栈,通过对不同行业的数据集进行分析,期望达到以下目标: 了解不同领域的业务分析指标 深化数据处理,数据分析,数据可视化能力 增加大数据批处理,流处理的实践经验 增加数据挖掘的实践经验 小费 项目主要使用的编程语言是python,sql,hql .ipynb可以用jupyter notebook :,如何安装,可以参考 jupyter notebook是一种网页交互形式的python编辑器,直接通过pip安装,也支持markd
  3. 所属分类:其它

    • 发布日期:2021-03-08
    • 文件大小:475136
    • 提供者:weixin_42099815
  1. Flink动态表的连续查询

  2. 越来越多的公司采用流处理,并将现有的批处理应用迁移到流处理,或者对新的用例采用流处理实现的解决方案。其中许多应用集中在流数据分析上,分析的数据流来自各种源,例如数据库事务、点击、传感器测量或IoT设备。ApacheFlink非常适用于流分析应用程序,因为它支持事件时间语义,确保只处理一次,以及同时实现了高吞吐量和低延迟。因为这些特性,Flink能够近实时对大量的输入数据计算出一个确定和精确的结果,并且在发生故障的时候提供一次性语义。Flink的核心流处理API,DataStreamAPI,非常具
  3. 所属分类:其它

    • 发布日期:2021-02-24
    • 文件大小:930816
    • 提供者:weixin_38564003
  1. 大数据之王:必承其冠,必承其重!大数据之王,力求做到更好!-源码

  2. 大数据之王 友情提示 说明书:关于TheKingOfBigData的相关介绍, :backhand_index_pointing_right: 联系我:如要进群或者有问题咨询,请联系我(备注来自GitHub 。直接说明问题) 国王 ##文章目录以下列出的是作者对原创或非原创的一些项目做成一个汇总,会持续更新!有任何好的文章欢迎提pr,也欢迎投稿! Linux 高清 蜂巢 Flink [大数据实战]电商用户行为数据分析 程序人生 TheKingOfBigData,我们继续!
  3. 所属分类:其它

    • 发布日期:2021-02-12
    • 文件大小:102400
    • 提供者:weixin_42127369
  1. incubator-streampipes:Apache StreamPipes-一个自助式(工业)IoT工具箱,使非技术用户可以连接,分析和探索IoT数据流-源码

  2. (工业)IoT的自助数据分析 StreamPipes是一种自助式(工业)IoT工具箱,使非技术用户可以连接,分析和浏览IoT数据流。 目录 关于Apache StreamPipes Apache StreamPipes(正在孵化)通过在现有流处理框架之上提供图形化建模编辑器来实现对流处理管道的灵活建模。 它使非技术用户可以基于易于扩展的数据源,数据处理器和数据接收器工具箱,快速定义和执行处理管道。 StreamPipes具有可交换的运行时执行层,并使用提供的包装器之一(例如,独立的或分布在A
  3. 所属分类:其它

    • 发布日期:2021-02-07
    • 文件大小:5242880
    • 提供者:weixin_42128015
  1. Flink动态表的连续查询

  2. 越来越多的公司采用流处理,并将现有的批处理应用迁移到流处理,或者对新的用例采用流处理实现的解决方案。其中许多应用集中在流数据分析上,分析的数据流来自各种源,例如数据库事务、点击、传感器测量或IoT设备。ApacheFlink非常适用于流分析应用程序,因为它支持事件时间语义,确保只处理一次,以及同时实现了高吞吐量和低延迟。因为这些特性,Flink能够近实时对大量的输入数据计算出一个确定和精确的结果,并且在发生故障的时候提供一次性语义。Flink的核心流处理API,DataStreamAPI,非常具
  3. 所属分类:其它

    • 发布日期:2021-01-27
    • 文件大小:930816
    • 提供者:weixin_38724919
« 12 3 »