您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 【白雪红叶】JAVA学习技术栈梳理思维导图.xmind

  2. 关于java程序员发展需要学习的路线整理集合 技术 应用技术 计算机基础知识 cpu mem disk net 线程,进程 第三方库 poi Jsoup zxing Gson 数据结构 树 栈 链表 队列 图 操作系统 linux 代码控制 自动化代码检查 sonar 代码规范 阿里巴巴Java开发规范手册 UMPAY——编码规范 日志规范 异常规范 网络 协议 TCP/IP HTTP hession file HTTPS 负载均衡 容器 JBOSS tomcat resin jetty 容灾
  3. 所属分类:Java

    • 发布日期:2018-04-25
    • 文件大小:623616
    • 提供者:zhuguang_2016
  1. Kylo调研总结

  2. Kylo定位于企业级的数据湖管理平台(Data Lake Platform),它是基于Spark和NiFi的开源数据湖编排框架,Kylo提供的主要特性包括数据获取、数据准备和数据发现,并支持元数据管理、数据治理和高级安全特性。
  3. 所属分类:Hadoop

    • 发布日期:2018-10-16
    • 文件大小:2097152
    • 提供者:wiborgite
  1. spark-2.2.2安装流程

  2. ClusterManager:在Standalone模式中即为Master(主节点),控制整个集群,监控Worker。在YARN模式中为资源管理器。 Worker:从节点,负责控制计算节点,启动Executor。在YARN模式中为NodeManager,负责计算节点的控制。 Driver:运行Application的main()函数并创建SparkContext。 Executor:执行器,在worker node上执行任务的组件、用于启动线程池运行任务。每个Application拥有独立的一
  3. 所属分类:spark

    • 发布日期:2019-05-06
    • 文件大小:6144
    • 提供者:rainbowfirst
  1. 基于大数据平台构建数据仓库的研究与实践.pdf

  2. 数据仓库设计文档,帮助大家理解及如何设计数据仓库,很不错的一篇论文。专题 lTo 学习体系,能从海量数据中提炼高价值信息,构建自主 (1)源系统结构化数据:源系统按大数据平合的 训练与反馈、可不断从最新数据中调整演化的智能业务供数规范要求提供表数据文本和标志文件。 模型体系。 (2)文件交换区FSA:文件的交换中枢,含源系 以 Hadoop^ Spark为代表的大规模数据处理技术为统结构化数据和半结构化、非结构化数据(主要是外部 超越传统数据库的处理局限性提供了先进的并行计算和数据)。 资源调度
  3. 所属分类:其它

    • 发布日期:2019-07-16
    • 文件大小:1048576
    • 提供者:bucaixia08
  1. Android-Genie是分布式大数据编排服务

  2. Genie是由Netflix开发的联合作业协调引擎。 Genie提供REST-ful API来运行Hadoop,Pig,Hive,Spark,Presto,Sqoop等各种大数据作业。 它还提供了用于管理许多分布式处理群集的元数据以及在其上运行的命令和应用程序的API。
  3. 所属分类:其它

    • 发布日期:2019-08-13
    • 文件大小:2097152
    • 提供者:weixin_39840914
  1. Apache atlas使用说明文档.pdf

  2. 元数据管理apache atlas 自己总结的使用说明文档。主要包括Apache atlas 第一章: Apache atlas简介 1.1 apache atlas 架构介绍 2 1.1.1核心组件Core 2 1.1.2 Integration 4 1.1.3 Metadata source 4 1.1.4 应用领域 4 .2 apache atlas基本功能 4 第二章: Atlas Admin UI 使用介绍 5 2.1 Search 5 2.1.1 BASE SEARCH 5 2.1
  3. 所属分类:Hive

    • 发布日期:2019-10-17
    • 文件大小:2097152
    • 提供者:weixin_43597282
  1. GIAC架构大会-承载每天万级任务的调度系统架构是如何设计的.pdf

  2. 承载每天万级任务的调度系统架构是如何设计的 分布式任务调度系统如何设计? 开源分布式任务调度系统介绍GGIAC 主办方:msp4oes 目前使用 EasySchedulerl的公司部分统计) Q雪球 鳳凰金融 s 嘀嗒出行 fengjr. com 水滴互助 Vanguard* 华润万家 y速快团 e Aisino|凹败科辣 航天信息 半云利技 环球易购 bwin. cn CiC 四万伟业 efonsoft Gobalegrow E-Commerce 8 育学园 EB 我们一起长大 东信北邮 微未
  3. 所属分类:Hadoop

    • 发布日期:2019-07-07
    • 文件大小:13631488
    • 提供者:odailidong
  1. 中国大数据发展调查报告(2015年).pdf

  2. 中国大数据发展调查报告(2015年).pdf中国大数据发展调查报告(2015年) CAcT中国體盒听 刊言 2014年是中国企业级大数据市场的起步之年,经过近两年的探 索与准备,国内一些电信和金融等行业用户开始实际部署大数据平台 与应用,带动软件、硬件和服务市场发展。为进一步掌握中国企业大 数据的应用状况和特点,中国信息通信研究院开展了2014年中国大 数据应用状况的调查。本次活动采用在线间卷的方式,对中国大数据 市场规模、应用状况、数据资源情况、平台建设情况、企业大数据应 用的政策和资源需求等
  3. 所属分类:互联网

    • 发布日期:2019-07-03
    • 文件大小:1048576
    • 提供者:qq_34543438
  1. 信息集成:元数据管理全景.pdf

  2. 信息集成:元数据管理系统 信息集成:元数据管理系统 信息集成:元数据管理系统 信息集成:元数据管理系统 信息集成:元数据管理系统
  3. 所属分类:spark

    • 发布日期:2020-09-11
    • 文件大小:37748736
    • 提供者:qingqichiyu
  1. hive metastore java api使用

  2. hive metastore hive metastore是hive的元数据管理服务,实际应用中很多第三方框架需要访问metastore服务,如spark,impala等。同样hive metastore也提供了java接口。 使用 import org.apache.hadoop.hive.conf.HiveConf; import org.apache.hadoop.hive.metastore.HiveMetaStoreClient; import org.apache.hadoop.hi
  3. 所属分类:其它

    • 发布日期:2021-01-07
    • 文件大小:52224
    • 提供者:weixin_38707862
  1. mlrun:机器学习自动化和跟踪-源码

  2. 开源MLOps编排框架 MLRun是一个开源MLOps框架,它提供了一种集成方法来管理您的机器学习管道,从早期开发到模型开发再到生产中的完整管道部署。 MLRun为各种技术堆栈提供了一个方便的抽象层,同时使数据工程师和数据科学家能够定义功能和模型。 MLRun体系结构 MLRun由以下几层组成: Feature and Artifact Store-处理跨多个存储库和技术的数据和功能的提取,处理,元数据和存储。 Elastic Serverless Runtimes-使用特定于工作负载的
  3. 所属分类:其它

    • 发布日期:2021-03-21
    • 文件大小:3145728
    • 提供者:weixin_42117032
  1. hugegraph:HugeGraph数据库核心组件,包括图形引擎,API和内置后端-源码

  2. 巨图 HugeGraph是一个快速且高度可扩展的。 HugeGraph具有出色的OLTP功能,因此可以轻松地将数十亿个顶点和边存储到HugeGraph中并从中查询。 为了符合框架,可以通过 (一种强大的图形遍历语言)来完成各种复杂的图形查询。 特征 符合支持 架构元数据管理,包括VertexLabel,EdgeLabel,PropertyKey和IndexLabel 多类型索引,支持精确查询,范围查询和复杂条件组合查询 插件后端存储驱动程序框架,现在支持RocksDB,Cassandra,
  3. 所属分类:其它

    • 发布日期:2021-03-11
    • 文件大小:2097152
    • 提供者:weixin_42104181
  1. hopsworks:HopsWorks-人类的Hadoop-源码

  2. 注意:Hopsworks已移动(不建议使用该版本)! Hopsworks的开发已移至 。 啤酒花 HopsWorks是Hops的UI,这是Apache Hadoop新发行版,具有可扩展的,高度可用的,可自定义的元数据。 Hopsworks通过提供对服务(例如Spark,Flink,Kafka,HDFS和YARN)的图形访问,降低了Hadoop入门用户的入门门槛。 HopsWorks通过引入两个新的抽象来提供自助式Hadoop:项目和数据集。 用户管理项目的成员资格,从而限制对数据集的访问。
  3. 所属分类:其它

    • 发布日期:2021-03-01
    • 文件大小:4194304
    • 提供者:weixin_42149145
  1. 木地板元数据浏览器-源码

  2. 木地板元数据浏览器 用于Parquet元数据资源管理器的Spark SQL数据源,它是parquet-cli / parquet-tools的更简单替代方案。 特征: 使用Spark SQL分析Parquet元数据,例如行组大小,数据页标记,编码等。 将Parquet表中的所有文件上的元数据收集为DataFrame。 收集Parquet或任何基于文件的源(如JSON或CSV)的统计信息。 实现为Spark数据源V1,因此代码与Spark的早期版本兼容。 该库可与Apache Spar
  3. 所属分类:其它

    • 发布日期:2021-02-28
    • 文件大小:31744
    • 提供者:weixin_42168750
  1. 网易大数据平台架构实践分享!

  2. 随着网易云音乐、新闻、考拉、严选等互联网业务的快速发展,网易开始加速大数据平台建设,以提高数据获取速度,提升数据分析效率,更快发挥数据价值。本次演讲主要分享网易如何围绕和改造开源技术,以产品化思维打造网易自己的大数据平台,也会分享一下网易在大数据平台构建和支撑互联网业务过程中面临的技术挑战,以及我们在调度、安全、元数据管理、spark多租户、SQL流计算、高性能查询引擎等关键技术环节的实践经验。最后会介绍一下,网易大数据平台未来的技术路线规划。分享大纲:1、大数据平台概述2、Sloth:实时计算
  3. 所属分类:其它

    • 发布日期:2021-02-25
    • 文件大小:438272
    • 提供者:weixin_38545463
  1. kyuubi:Kyuubi是一个统一的多租户JDBC接口,用于大规模数据处理和分析,基于Apache Spark构建-源码

  2. 久比 Kyuubi是基于构建的高性能通用JDBC和SQL执行引擎。 Kyuubi的目标是促进用户处理大数据(如普通数据)。 它提供了标准化的JDBC接口,在大数据场景中具有易于使用的数据访问。 最终用户可以专注于开发自己的业务系统并挖掘数据价值,而不必了解底层的大数据平台(计算引擎,存储服务,元数据管理等)。 Kyuubi依靠Apache Spark提供高性能的数据查询功能,并且引擎功能的每一项改进都可以帮助Kyuubi的性能取得质的飞跃。 此外,Kyuubi通过引擎缓存提高了临时响应速度
  3. 所属分类:其它

    • 发布日期:2021-02-06
    • 文件大小:16777216
    • 提供者:weixin_42136826
  1. 网易大数据平台架构实践分享!

  2. 随着网易云音乐、新闻、考拉、严选等互联网业务的快速发展,网易开始加速大数据平台建设,以提高数据获取速度,提升数据分析效率,更快发挥数据价值。 本次演讲主要分享网易如何围绕和改造开源技术,以产品化思维打造网易自己的大数据平台,也会分享一下网易在大数据平台构建和支撑互联网业务过程中面临的技术挑战,以及我们在调度、安全、元数据管理、spark多租户、SQL流计算、高性能查询引擎等关键技术环节的实践经验。 最后会介绍一下,网易大数据平台未来的技术路线规划。分享大纲:1、大数据平台概
  3. 所属分类:其它

    • 发布日期:2021-01-27
    • 文件大小:437248
    • 提供者:weixin_38744375
  1. catalog:通过'sparklyr'访问Spark Catalog API-源码

  2. {目录} 概述 {catalog}使用户可以使用 API来访问Spark API。目录是用于管理关系实体(例如,数据库,表,函数,表列和临时视图)的元存储(也称为元数据目录)的接口。 安装 您可以安装: 来自的开发版本 # install.packages("remotes") remotes :: install_github( " nathaneastwood/catalog " ) 用法 {catalog}提供与Catalog API匹配的API,并提供对所有方法的完全访问权限。下面是其
  3. 所属分类:其它

    • 发布日期:2021-03-20
    • 文件大小:32768
    • 提供者:weixin_42117082