您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. spline-spark-agent:适用于Apache Spark的样条线代理-源码

  2. 火花剂/收割机 该模块负责侦听火花命令事件并将其转换为样条谱系。 Spark / Scala版本兼容性列表 Scala2.11 Scala2.12 火花2.2 (没有SQL;没有无代码的init) - 火花2.3 (不支持Delta) - 火花2.4 是的 是的 伪像 agent-core_Y是一个经典的Maven库,您可以将其与任何兼容的Spark版本一起使用。 spark-X-spline-agent-bundle_Y是一个胖子。 这意味着它包含所有内部依赖项。 X代表
  3. 所属分类:其它

    • 发布日期:2021-03-17
    • 文件大小:495kb
    • 提供者:weixin_42143221
  1. bigdata:Apache Hive,Spark相关-源码

  2. 程式设计 配置目标: Hive on Mr-Apache Ignite缓存 通过LLAP缓存(TODO)在MR上进行配置 在Tez上蜂巢 通过LLAP缓存(TODO)在Tez上进行配置 Spark SQL-具有HDFS的Spark独立集群 依存关系: 阿帕奇蜂巢 元商店: 蜂巢-> /data/hdfs/apache-hive-2.3.3-bin hadoop-> /data/hdfs/hadoop-2.9.0 HiveServer2: 必须具有可用的元
  3. 所属分类:其它

    • 发布日期:2021-03-07
    • 文件大小:249kb
    • 提供者:weixin_42103587
  1. csv-serde:Hive SerDe for CSV-源码

  2. Hive CSV支持 这项工作是对apache hive项目的贡献,并在那里维护,。 此SerDe使用出色的库为蜂巢添加了真正的CSV输入和输出支持。 使用 基本用途 add jar path/to/csv-serde.jar; create table my_table(a string, b string, ...) row format serde 'com.bizo.hive.serde.csv.CSVSerde' stored as textfile ; 自定义格式 open
  3. 所属分类:其它

    • 发布日期:2021-02-24
    • 文件大小:12kb
    • 提供者:weixin_42134097
  1. 数据科学-源码

  2. 数据科学 数据科学之路 程式设计 • • •Excel •可以轻松使用终端,Git中的版本控制以及使用GitHub • • • : 访问数据库,CSV和JSON数据 使用熊猫进行数据清理和转换 可视化 仪表板 机器学习: 特征工程 回归算法 分类算法 决策树学习 支持向量机 无监督学习 降维 推荐系统 文字分析 基于内容的协作过滤 评估推荐系统。 DCG,nDCG 合奏方法 引导,装袋和提升 AdaBoost 随机森林 大数据工程基础 Hadoop和MapReduce编程 NoSQL数据
  3. 所属分类:其它

  1. zookage:Docker桌面上的Kubernetes上的Hadoop-源码

  2. 动物园 ZooKage提供了一个沙盒环境,可以在Kubernetes上启动驻留在Hadoop生态系统中的一组组件。 支持的组件 Apache Hadoop(HDFS,YARN,MapReduce) 阿帕奇蜂巢 Apache Spark 阿帕奇·特兹(Apache Tez) Apache ZooKeeper 要求 支持macOS 带有 入门 启动Hadoop集群 只需运行以下命令。 $ git clone --branch v0.1.1 gitgithub.com:zookage/zoo
  3. 所属分类:其它

    • 发布日期:2021-02-09
    • 文件大小:82kb
    • 提供者:weixin_42168230
  1. php-thrift-sql:一个通过Thrift连接到Hive或ImpalaPHP库-源码

  2. PHP ThriftSQL ThriftSQL.phar存档旨在提供对PHPSQL-on-Hadoop框架的访问。 它将Thrift和各种服务包捆绑在一起,并公开了用于在各种框架上运行查询的通用接口。 当前支持以下引擎: 蜂巢-在HiveServer2节俭接口,SASL默认情况下启用,因此用户名和密码,必须提供然而,这可以通过关闭setSasl()方法调用之前connect() Impala-通过Impala Service Thrift接口扩展了Beeswax协议。 版本兼容性 该库当
  3. 所属分类:其它

    • 发布日期:2021-01-30
    • 文件大小:240kb
    • 提供者:weixin_42097189
  1. 蜂巢:Apache蜂巢-源码

  2. Apache Hive(TM) Apache Hive(TM)数据仓库软件有助于使用SQL读取,写入和管理驻留在分布式存储中的大型数据集。 建立在Apache Hadoop(TM)之上,它提供: 通过SQL轻松访问数据的工具,从而实现数据仓库任务,例如提取/转换/加载(ETL),报告和数据分析 一种将结构强加于各种数据格式的机制 访问直接存储在Apache HDFS(TM)或其他数据存储系统(例如Apache HBase(TM))中的文件 使用Apache Hadoop MapReduce,
  3. 所属分类:其它

    • 发布日期:2021-01-30
    • 文件大小:47mb
    • 提供者:weixin_42138780
  1. 数据管道项目:数据管道项目-源码

  2. 数据管道项目 (我正在维护该项目,并添加有关Hadoop分布式模式,在云上部署Hadoop,Spark高性能,Spark流应用程序演示,Spark分布式集群等的更多演示。请给我一些支持。) 架构师大数据应用 数据输入:Apache Sqoop,Apache Flume Hadoop 工具:猪,蜂巢, Hadoop流 处理HTTP服务器日志脚本 流MapReduce作业 Linux Shell实用程序作为Mapper和Reducer Hadoop自定义指标 火花 建筑 集群经理:YARN,M
  3. 所属分类:其它

    • 发布日期:2021-01-30
    • 文件大小:57mb
    • 提供者:weixin_42105570