您好,欢迎光临本网站![请登录][注册会员]  
文件名称: Vertica实时数据分析平台
  所属分类: Hadoop
  开发工具:
  文件大小: 4mb
  下载次数: 0
  上传时间: 2019-04-20
  提 供 者: sk***
 详细说明:深度介绍Vertica产品总体架构、核心优势、集群能力、Vertica与Hadoop的数据交换、SQL高级分析、与分布式R无缝集成、灾备能力等等,是不可多得的了解Vertica的好资料。数据分析平台演进阶段及挑战 事件触发,全量数据实时分析频 价值实 业务相关性分析 繁访问 产品分析、用户行为分析客客户活动预测,客户流失预测,直接提升业务 户分析等灵活直询和数据分析产品盈利预测 面向大量业务人员 MOLAP CUBE生成 面向少量管理者的机器学习和 现整合层行业模型批量加工 预测 监管报送等数据集市的批量计面向少量管理者的灵活查询和 算 数据分析 业务智能支持 面向少量管理者的报表 机器学习和预测 灵活查询和数据分析 批量(整合层统计报表 传统数据库的集群运算能力不足 由于维度太多,维成员太多 挖掘和预测效率受R或SAs等通常只能提供T+1的数据加载 数据加载效率受共享存储(NAS或cube太大都有严重性能问题 计算能力的严重制约,无法实‖和服务,实时数据加载和分析 SAS)吞吐能力的限制 全局统一视图被严重割裂,多维 施大规模推广 服务能力不足 分析只是玩具 无法存储多结构和低价值数据 仅能基于小样本训练集,预测无法满足一线运营的高并发和 重复加工和维护成本高 准确性受到影响 数据实时查询分析要求,无法 海量数据初级提炼工作要基于高 仅支持少量灵活查询分析 仅支持少量用户挖掘和预测 最大程度发挥平台价值 价值MPP进行 业务敏捷性 VERTICA M|ER口 典型的大数据平台逻辑架构 数据标准,数据质量,元数据,数据生命周期管理 业务系统环境 大数据分析管理环境 业务应用环境 数据源层数据交换层 数据平台层 数据服务层数据应用展现层 综合 大数据整合平台 分析师平台 灵活查询 结个货 EDW批量系统 EDW查询系统 灵活查询 大数据存储平台」 构化数 8用 应用 服务 山报表 集市 集市 数据加载处理 通用查询 结构化数据存储 服务 数据挖掘 UDS 据外汇 非结构化数据存储 SAS EM 业务系统 归档 挖掘模块 文档/ 非视频 发现/探索分析& 自助取数 结 构电商/网银 可视化模块 化社交媒体 联机访问 数邮件/ 据系统日志 外部系统 批量接口服务 知识管理 数据 MQ 流数据处理平台 流数据存储 果回流 流数据加工 实时处理服务 分析应用 VERTICA M|ER口 传统DBMS(OLTP)的不足 主要优化措施,包括 >预计算:例如 Materialized views(物化视图) >查询加速 >查询优化工具 >其它一些索引技术 >OLAP扩展 >嵌入式分析手段 缺点: 1~2邛B数据规模下,需要 POWER780+中髙端存储+大量调优工作才能勉强保证性能 >2CPU的PC服务器, Oracle license价格要30~40万 人工维护管理成本过高,需要大量的DBAS >数据库管理的复杂性:分区、表空间、索引维护、性能调优 >分析性能低下∶凨管提供了一些性能优化措施,但仍无法从根本上解决分析查询性能低下的问题 OLTP DBMS适合做 OLTP >小型企业/部门级分析应用或者很小的数据量 简单的查询分析 传统的 Oracle/DB2/ SQL Server并不适合做分析数据库 VERTICA M|ER口 大数据平台的基本要求 开放弹性架构在线线性扩展拥有成本可控海量并行处理优秀混合负载极速智能分析平台持续可用易于管理维护 采用无共享的·增加节点可·提供纯软件·支持PB级的·按需分配资·深度整合高。数据镜像、硬·直观的图形化 海量并行处理线性增加存 许可方式 数据处理、 源(CPU 级分析模块 件冗余等多种界面,实时的 架构 储、查询和保证用户不存储和访问内存、10)·与 Hadoop 容错技术保证状态监控 °工业标准的通加载性能 被专有平台 系统高可用 用平台 支持在线扩 锁定 在数据加载、·智能定义规无缝集成 最大限度降低 处理、访问则,动态调·专为传统商·故障切换和恢管理员的日常 服务器资源按容,扩容期·企业初期投等各个环节整资源 业智能分析 复,对用户透管理和维护工 需分配,按需间保证系统 入和后续扩 最大化并 和大数据分明 作 搭建集群,按继续对外提容的成本可处理能力 析应用优化 需缩放集群规供服务 扩容期间可持 续对外服务 模 VERTICA M|ER口 成熟MPP软件正在成为海量数据结构化分析的主流产品 形朋 Oracle(传统) 兵有传统来总成本时13 传统DBMS(OLTP) IBM DB2(传统) 高用 Microsoft SQL Server(传统) Teradata 《属 IBM Netezza MPP一体机 神鞋刘分作韵 Oracle Exadata Hana Apache Hadoop Cloudera HADOOP Hortonworks 传间 8元快加计 T:-0PB5s 行处形的(P) MapI R HPE Vertica 新一代MPP软件 Pivotal Greenplum VERTICA M|ER口 典型案例全球大型社交媒体公司企业分析平台 facebook 单个集群规模超过300节点以上 支持超过6PB详细数据的分析能力 平均35TB/小时的数据入库速度 实现精确的营收分析,用户行为分析和广告 效率分析 月度活跃用户人数115亿 Web Servers 每天60万个M/ R Jobs mIle 每天5万个 nformatica Jobs 移动端 Logs 定时任野 调度表 Log curly 25亿内容分享3照片口 Hadoop/ HDFS 2个超大规模 Hadoop集 群 17 ExaBytes数据 离 桌面设箭 15000节点 60KM 40000节点 27亿“赞”500TB新增数据 Vertica 客灾、测试 与开发 VERTICA M|ER口 富国基金原有分析系统不能满足业务需求 业务系统 KM系统 数据应用 监管信息披露(XBRL DElink 客户定期报告 过投资交估值 查询分析报表 户系统易系统系统系统 DELink Local 客户关系管理 Table I Table 模板报告 订单天相 贴汇 模报 KM函数 数据应用面临的问题 报表类应用整体效率不佳 数据准确性不佳 历史数据的高效查询缺少架构支持 从形成需求、分析、开发、测试、上线过程较长 缺少必要的、科学的、完整的数据清洗、数据转换、 随着数据量的不断增长,获取难,查询效率低下 报表冗余,相同指标重复加工;报表生成不及时 数据质量检查评估等数据管理过程,导致数据取信 °大量依赖手工提数定制开发,重复劳动一定程度上 度不高,制约数据应用的拓展 的问题日渐突出 分流了科技生产力 数据应用缺乏科学权限管理机制 数据应用停留在报表阶段 数据中心应从传统的成本中心逐渐向利润中 数据安全 数据的价值挖掘停留在初级阶段 心转变 角色分配;业务化配置 受制于传统数据库架构,不能继续拓展支持分析型 数据应用能够帮助提升运营效率,降低运营成本 数据应用(例如多维分析、灵活查询、数据挖掘、 电商等领域的大数据分析与风控) VERTICA M|ER口 富国选择 Vertica的原因:高性能因:高性能 列存储 压缩 横向扩展 分布式查询 预测 通过只读取所需数据 减少费用昂贵的以实现无名称节点或其他单点任何节点均可以启动查询#使将高可用性与特殊优化完美结合,可 提高查询速度 提高总体性能 故障的群集的高可扩展性用其他节点进行工作。无单点 故 有效提高查询性能 VERTICA M|ER口
(系统自动生成,下载前可以参看下载内容)

下载文件列表

相关说明

  • 本站资源为会员上传分享交流与学习,如有侵犯您的权益,请联系我们删除.
  • 本站是交换下载平台,提供交流渠道,下载内容来自于网络,除下载问题外,其它问题请自行百度
  • 本站已设置防盗链,请勿用迅雷、QQ旋风等多线程下载软件下载资源,下载后用WinRAR最新版进行解压.
  • 如果您发现内容无法下载,请稍后再次尝试;或者到消费记录里找到下载记录反馈给我们.
  • 下载后发现下载的内容跟说明不相乎,请到消费记录里找到下载记录反馈给我们,经确认后退回积分.
  • 如下载前有疑问,可以通过点击"提供者"的名字,查看对方的联系方式,联系对方咨询.
 输入关键字,在本站1000多万海量源码库中尽情搜索: