您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 2013中国大数据技术大会PPT——阿里大数据应用平台

  2. 【大数据应用】*数据平台架构师刘昌钰,讲述了阿里大数据应用平台的业务流程:数据导入、数据开发、数据生产、数据回流、元数据中心、数据质量中心。阿里每天要处理的数据非常惊人,仅在日志中心,日采集40TB数据,峰值1GB/s。
  3. 所属分类:群集服务

    • 发布日期:2013-12-12
    • 文件大小:3mb
    • 提供者:makuiyu
  1. SPLUNK大数据日志系统分析平台技术方案

  2. SPLUNK大数据日志系统分析平台技术方案
  3. 所属分类:其它

    • 发布日期:2017-06-21
    • 文件大小:2mb
    • 提供者:lzx704
  1. 大数据搜索与日志挖掘及可视化方案

  2. 大数据搜索与日志挖掘及可视化方案——ELK Stack:Elasticsearch Logstash Kibana(第2版).高凯(详细书签).pdf
  3. 所属分类:算法与数据结构

    • 发布日期:2018-03-27
    • 文件大小:35mb
    • 提供者:hoho1151191150
  1. 大数据工程师篇2017

  2. 大数据工程师篇2017介绍包括:流式计算、日志收集、编程语言、数据分析挖掘、数据搜索/可视化、机器学习、算法、云计算、大数据通用处理平台、分布式协调、分布式存储、存储格式、数据库、资源调度、工作流调度、机器学习工具、数据安全、部署工具、数据分析/数据仓库(SQL类)、消息队列。
  3. 所属分类:算法与数据结构

    • 发布日期:2018-04-27
    • 文件大小:2mb
    • 提供者:w_h_zhang
  1. 大数据搜索与日志挖掘及可视化方案--ELK+Stack+Elasticsearch+Logstash+Kibana.pdf

  2. 大数据搜索与日志挖掘及可视化方案--ELK+Stack+Elasticsearch+Logstash+Kibana大数据搜索与日志挖掘及可视化方案--ELK+Stack+Elasticsearch+Logstash+Kibana
  3. 所属分类:其它

    • 发布日期:2018-02-13
    • 文件大小:37mb
    • 提供者:kizzle
  1. 基于大数据平台构建数据仓库的研究与实践.pdf

  2. 数据仓库设计文档,帮助大家理解及如何设计数据仓库,很不错的一篇论文。专题 lTo 学习体系,能从海量数据中提炼高价值信息,构建自主 (1)源系统结构化数据:源系统按大数据平合的 训练与反馈、可不断从最新数据中调整演化的智能业务供数规范要求提供表数据文本和标志文件。 模型体系。 (2)文件交换区FSA:文件的交换中枢,含源系 以 Hadoop^ Spark为代表的大规模数据处理技术为统结构化数据和半结构化、非结构化数据(主要是外部 超越传统数据库的处理局限性提供了先进的并行计算和数据)。 资源调度
  3. 所属分类:其它

    • 发布日期:2019-07-16
    • 文件大小:1mb
    • 提供者:bucaixia08
  1. 大数据简历,内含有数据项目的简历,大数据 简历

  2. 大数据详细项目简历: 离线项目:于用户行为标签的智能气象服务系统 个人职责: 1.运用Flume采集源数据,存放于Kafka消息队列中 2.采用Kstream框架对数据进行初步数据清洗与变换,使用Java API将数据导入HBase 3.使用Hive集成Hbase,对数据进行ETL,进一步清洗处理数据 4.协助使用Hive提取特征值,运用Spark ML构建模型 5.参与模型检验与随机森林算法调优 6.参与编写脚本文件将数据导出到MySQL中,运用Tableau工具进行可视化分析 参与编写部分O
  3. 所属分类:互联网

    • 发布日期:2020-04-28
    • 文件大小:31kb
    • 提供者:qq_46359356
  1. 大数据综合案例-搜狗搜索日志分析(修复版final).doc

  2. 基于搜狗查询数据500w条使用MapReduce做数据清洗,hive做离线分析的项目,详细文档附数据连接,搜狗实验室的搜索数据下载后缺少了用户ID字段的数据,所以本分析采用的是完整的数据,大家可以放心下载,如果下载数据的百度云链接失效无法下载,大家可以给我留言。
  3. 所属分类:Hive

    • 发布日期:2019-12-20
    • 文件大小:3mb
    • 提供者:yuyuyuxiaolei
  1. 罗克韦尔自动化 RSSq技术数据(中文).pdf

  2. 罗克韦尔自动化 RSSq技术数据(中文)pdf,罗克韦尔自动化 RSSq技术数据(中文)RSLinx或任何一般的 OPC Server/ AdvanceD ODBC连接器 Server的连接既可以是永久连接(也称热连接),也可以 RSSql ODBO连接器可以与任何支持ODBC20或以上 是只为获得数捐来建立的间断性的连接(冷连接 的数据库连接。在多数情况下,数据库厂商提供可以 通过NT网络或其它平台(例如∪NⅨX和AS-400)直接连 除了访问控制外,RSSq还提供了与控制连接器有关接刭数据库
  3. 所属分类:其它

    • 发布日期:2019-10-13
    • 文件大小:664kb
    • 提供者:weixin_38743602
  1. ArcGIS的大数据利器.pdf

  2. 介绍时空大数据特点,ArcGIS的大数据工具使用,相关案例、时空大数据的特点 esr China BEJJINS 大数据 PEAK OF INFLATED EXPECTATIONS PLATEAU OF >技术关注度 过高期望的峰值 PRODUCTIVITY SLOPE OI实质生产的高峰期 ENLIGHTENMENT 稳步爬升的光明期 TROUGH OF DISILLUSIONMENT 泡沫化的底谷期 TECHNOLOGY TRIGGER 科技诞生的促动期 MATURITY技术成熟度
  3. 所属分类:Hadoop

    • 发布日期:2019-08-18
    • 文件大小:7mb
    • 提供者:tozhangjl
  1. 大数据Hive.pdf

  2. 什么是 Hive Hive:由 Facebook 开源用于解决海量结构化日志的数据统计。 Hive 是基于 Hadoop 的一个数据仓库工具,可以将结构化的数据文件映射为一张表,并 提供类 SQL 查询功能
  3. 所属分类:Hive

    • 发布日期:2020-08-25
    • 文件大小:3mb
    • 提供者:ffffqqqqwwww
  1. 大数据技术之Hive.pdf

  2. 什么是 Hive Hive:由 Facebook 开源用于解决海量结构化日志的数据统计。 Hive 是基于 Hadoop 的一个数据仓库工具,可以将结构化的数据文件映射为一张表,并 提供类 SQL 查询功能
  3. 所属分类:Hive

    • 发布日期:2020-08-25
    • 文件大小:2mb
    • 提供者:ffffqqqqwwww
  1. 在Python中利用Pandas库处理大数据的简单介绍

  2. 在数据分析领域,最热门的莫过于Python和R语言,此前有一篇文章《别老扯什么Hadoop了,你的数据根本不够大》指出:只有在超过5TB数据量的规模下,Hadoop才是一个合理的技术选择。这次拿到近亿条日志数据,千万级数据已经是关系型数据库的查询分析瓶颈,之前使用过Hadoop对大量文本进行分类,这次决定采用Python来处理数据:     硬件环境         CPU:3.5 GHz Intel Core i7         内存:32 GB HDDR 3 1600 MHz       
  3. 所属分类:其它

    • 发布日期:2020-12-25
    • 文件大小:230kb
    • 提供者:weixin_38632797
  1. 大数据框架整理

  2. 大数据离线部分   一、HDFS   1:HDFS的架构部分及工作原理   NameNode:负责管理元素据,将信息保存在内存中   DataNode:保存数据,以块的形式保存。启动后需要定时的向NameNode发送心跳,报告自身存储的块信息   2:HDFS的上传过程   3:HDFS的下载   4:NameNode的元数据安全机制   以记日志的形式将每一个操作写在磁盘的日志文件中,然后借助Secondary NameNode的checkpoint功能将fsImage和日志进
  3. 所属分类:其它

    • 发布日期:2020-12-22
    • 文件大小:101kb
    • 提供者:weixin_38592134
  1. 开源组件下的大数据技术框架

  2. 目录 (一)通用框架概述 (二)数据收集层 (三)数据存储层 (四)资源管理与服务协调层 (五)计算引擎层 (六)数据分析层 (七)数据可视化层   (一)通用框架概述   自底向上,与OSI类似,通用框架下的大数据体系有七层:数据源、数据收集层、数据存储层、资源管理与服务协调层、计算引擎层、数据分析层及数据可视化层。图示如下:   (二)数据收集层   数据收集层直接与数据源对接,负责采集产品使用过程中生成的日志,具有分布式、通用化等属性。由于实际场景中,大部分的数据源是零散的,因此采集到一
  3. 所属分类:其它

    • 发布日期:2021-01-07
    • 文件大小:139kb
    • 提供者:weixin_38637580
  1. 大数据平台开发架构讲解

  2. 大数据背景 对于业务数据数据量的暴增,用户智能化需求提升。在这个DT的时代,大数据的开发也就应运而生了,大数据开发必须解决两个问题,大数据量如何统一存储,大数据量如何统一计算。针对这些问题产生了很多大数据方面的技术框架。到今天为止,大数据方面的技术可以说已经相当成熟,BAT在大数据方面都应用十分的广泛,大数据量的分析使得数据更有了价值,运营有了通过大数据的分析可以做出精确的营销计划,通过收集用户的操作日志,分析用户行为,给出用户精确和有价值的推荐。人工智能也是通过海量数据做分析,通过算法做出智能
  3. 所属分类:其它

    • 发布日期:2021-01-07
    • 文件大小:484kb
    • 提供者:weixin_38564718
  1. 大数据技术之Flume

  2. 大数据技术之Flume 第 1 章 Flume 概述 1.1 Flume 定义 Flume 是 Cloudera 提供的一个高可用的,高可靠的,分布式的海量日志采集、聚合和传 输的系统。Flume 基于流式架构,灵活简单。 1.2 Flume 基础架构 Flume 组成架构如图所示: 下面我们来详细介绍一下 Flume 架构中的组件: 1.2.1 Agent Agent 是一个 JVM 进程,它以事件的形式将数据从源头送至目的。 Agent 主要有 3 个部分组成,Source、Chan
  3. 所属分类:其它

    • 发布日期:2021-01-07
    • 文件大小:416kb
    • 提供者:weixin_38502290
  1. 大数据:hive1

  2. 1:什么是hive:由facebook开源的用于解决海量结构化日志的数据统计 2:hive是基于hadoop的数据仓库工具,可以将结构化的数据文件映谢成一张表,并提供类SQL查询功能。 本质:将Hql转化成mpareduce  其基本执行过程:     数据仓库通过sql进行统计分析——–>将SQL语言中常用的操作(select,where,group等)用mapreduce写成很多模板 所有的mapreduce模板封装在hive中—>通过hive框架匹配出相应的mapreduce模
  3. 所属分类:其它

    • 发布日期:2021-01-07
    • 文件大小:98kb
    • 提供者:weixin_38612095
  1. 关于大数据量或者存储过程或者业务逻辑过于复杂的解决方案

  2. 1.大数据量的清洗 存储过程和定时任务对大数据量的清洗,过程过于复杂涉及到的中间变量过多,计算和统计过多,导致整个过程执行时间过长。 所以通过数据准备,通过一个中间表来抽取过程中的中间变量和逻辑变量,预先抽取一些数据,减轻整个数据清洗过程的压力。 这些存储过程一定考虑到执行的效率问题,索引的使用;尽量避免在where条件里使用函数,有一些条件能抽取到中间表中,尽量抽取出来。 1.1)数据准备 1.2)中间表 1.3)任务分解表 2.执行过程的监控 在大型执行过程中,要有一个可视化的监控,能够监控
  3. 所属分类:其它

    • 发布日期:2021-01-07
    • 文件大小:32kb
    • 提供者:weixin_38692631
  1. bdp-dataplatform:大数据生态解决方案数据平台:基于大数据,数据平台,微服务,机器学习,商城,自动化运维,DevOps,容器部署平台,数据平台,数据平台存储,数据平台计算,数据平台开发,数据平台应用构建的大数据解决方案-源码

  2. 总项目 0,大数据生态解决方案数据平台 数据平台: bdp-dataplatform:基于大数据、数据平台、微服务、机器学习、商城、自动化运维、DevOps、容器部署平台、数据平台采集、数据平台存储、数据平台计算、数据平台开发、数据平台应用搭建的大数据解决方案。 数据来源: 商城:使用SpringBoot,Java,Vue,React,Android开发多端商城,包括网站、App、微信小程序; 日志:使用Java开发服务端日志、客户端日志收集系统,使用DataX实现数据的导入导出系统;
  3. 所属分类:其它

    • 发布日期:2021-02-01
    • 文件大小:40mb
    • 提供者:weixin_42166105
« 12 3 4 5 6 7 8 9 10 ... 50 »