您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. kettle 中文用户手册(原创)

  2. kettle 是非常优秀的,易操作的ETL工具,轻量级,系统要求少,快速,是软件开发人员必备的etl工具。
  3. 所属分类:专业指导

    • 发布日期:2010-01-20
    • 文件大小:3mb
    • 提供者:xxuhe
  1. Python-MaraDataIntegration一个专注于透明度和降低复杂性的轻量级ETL框架

  2. Mara Data Integration 一个专注于透明度和降低复杂性的轻量级ETL框架
  3. 所属分类:其它

  1. KISETL v1.0.0

  2. KISETL是一个开源的,轻量级的数据迁移程序。之前做过几年游戏开发,开发过程中需要大量的策划数据校验,测试数据分析,因此开发了这一个轻量级的ETL工具,现开源出来与有兴趣的码农一起分享,改进! ~_~感谢钉客提供网页存放空间。特点:1、程序简单,由PHP编写,用Excell做迁移配置。2、目前支持mysql, sqlite,Excell三种数据源3、操作方便,在php的环境中执行,由dos shell启动4、配置灵活,适合处理10万以下的小批量数据
  3. 所属分类:其它

    • 发布日期:2019-10-23
    • 文件大小:60kb
    • 提供者:weixin_38743968
  1. KISETL v1.0.0.rar

  2. KISETL是一个开源的,轻量级的数据迁移程序。之前做过几年游戏开发,开发过程中需要大量的策划数据校验,测试数据分析,因此开发了这一个轻量级的ETL工具,现开源出来与有兴趣的码农一起分享,改进! ~_~感谢钉客提供网页存放空间。 KISETL特点 1、程序简单,由PHP编写,用Excell做迁移配置。 2、目前支持mysql, sqlite,Excell三种数据源 3、操作方便,在php的环境中执行,由dos shell启动 4、配置灵活,适合处理10万以下的小批量数据   KIS
  3. 所属分类:其它

    • 发布日期:2019-07-07
    • 文件大小:61kb
    • 提供者:weixin_39841882
  1. 现代企业轻量级的ETL实现方案

  2. 针对低端市场的ETL(Extract、Transformation、Loading)需求,文章提出了一种轻量级的ETL实现方案。该方案具备了灵活,易于理解和维护,操作方便等特点,在用户的培训、实施到维护整个过程都可以为其降低很大成本。
  3. 所属分类:其它

    • 发布日期:2020-07-04
    • 文件大小:196kb
    • 提供者:weixin_38735887
  1. CBoard-branch-0.4.2

  2. 国产轻量级BI平台CBoard的安装和初步使用介 自带轻量级ETL工具Power Query,在数据仓库不完善的场景下特别有用; 可视化的建模方式,拖拉放,所见即所得; 强大的DAX,不但能定义Measure,还可以编写循环等高级查询; 通过Embed方式嵌入Web应用,无缝集成在自己的应用中
  3. 所属分类:IT管理

    • 发布日期:2020-11-17
    • 文件大小:175mb
    • 提供者:wawa129
  1. 基于Python的SQL Server数据库实现对象同步轻量级

  2. 缘由 日常工作中经常遇到类似的问题:把某个服务器上的某些指定的表同步到另外一台服务器。 类似需求用SSIS或者其他ETL工作很容易实现,比如用SSIS的话,就会会存在相当一部分反复的手工操作。 建源的数据库信息,目标的数据库信息,如果是多个表,需要一个一个地拉source和target,然后一个一个地mapping,然后运行实现数据同步。 然后很可能,这个workflow使用也就这么一次,就寿终正寝了,却一样要浪费时间去做这个ETL。 快速数据同步实现 于是在想,可不可能快速实现类似需求,
  3. 所属分类:其它

    • 发布日期:2020-12-16
    • 文件大小:251kb
    • 提供者:weixin_38631389
  1. QStreaming:一个简化的轻量级ETL管道框架,用于在Apache Spark之上构建流批量处理应用程序-源码

  2. 介绍 QStreaming是一个框架,可简化基于ETL的编写和执行 它基于简单的类似于SQL的配置文件,并且可以在任何Spark集群上运行 入门 构型 要运行QStreaming,必须首先定义如下的Pipeline DSL文件。 管道DSL 例如,一个简单的管道dsl文件应如下所示: -- DDL for streaming input which connect to a kafka topic -- this declares five fields based on the JSON d
  3. 所属分类:其它

    • 发布日期:2021-03-19
    • 文件大小:450kb
    • 提供者:weixin_42119866
  1. Rope轻量级ETL工具源代码

  2. Rope是一款轻量级别的ETL(Extract-Transform-Load)工具。主要用于从不同源获取/接受数据,然后统一处理数据后,写入到各种目标源;系统采用多级缓冲和数据缓存,每秒可处理上万级别的数据;而且系统采用插件扩展系统的各个组件,针对不同需求扩展不同插件。 R
  3. 所属分类:其它

  1. aistore:AIStore:用于AI应用程序的可扩展存储-源码

  2. AIStore是一种轻量级的对象存储系统,具有随每个添加的存储节点线性扩展的能力,并且特别关注PB级深度学习。 AIStore(简称AIS)是为AI应用程序量身定制的轻量级存储堆栈。 AIS始终在任意数量的群集服务器上始终显示平衡的I / O分布和线性可伸缩性,从而产生如下的性能图表: 上图包含120个HDD。 随着添加的每个磁盘线性扩展的能力一直是,而且仍然是AIStore的主要诱因之一。 许多开发工作还受到减轻数据集转换和ETL管道的其他I / O密集阶段的想法的推动。 产品特点 横向
  3. 所属分类:其它

    • 发布日期:2021-02-09
    • 文件大小:16mb
    • 提供者:weixin_42138780
  1. etl-light:基于Apache Spark的轻量级Kafka到HDFSS3 ETL库-源码

  2. etl-light:基于Apache Spark的轻量级Kafka到HDFSS3 ETL库
  3. 所属分类:其它

    • 发布日期:2021-02-05
    • 文件大小:136kb
    • 提供者:weixin_42126677
  1. mara-pipelines:一个轻量级的,自以为是的ETL框架,介于纯脚本和Apache Airflow之间-源码

  2. 马拉管道 该软件包包含一个轻量级的数据转换框架,重点是透明性和降低复杂性。 它具有许多固有的假设/原则: 数据集成管道作为代码:管道,任务和命令是使用声明性的Python代码创建的。 PostgreSQL作为数据处理引擎。 广泛的Web用户界面。 Web浏览器是检查,运行和调试管道的主要工具。 GNU使语义。 节点取决于上游节点的完成。 没有数据依赖性或数据流。 无需应用内数据处理:命令行工具是与数据库和数据进行交互的主要工具。 基于Python的单机流水线执行。 无需分布式任务队
  3. 所属分类:其它

  1. Kaggler:Kaggle数据科学竞赛代码-源码

  2. 卡格勒 Kaggler是一个Python软件包,用于轻量级在线机器学习算法和ETL和数据分析的实用程序功能。 它根据MIT许可证分发。 其在线学习算法的灵感来自Kaggle用户。 它使用可有效处理大型稀疏数据的稀疏输入格式。 核心代码通过使用Cython进行了速度优化。 安装 依存关系 所需的Python软件包列在requirements.txt 赛顿 h5py 超光 lightgbm ml_metrics numpy / scipy 大熊猫 scikit学习 使用点子 PyPi提供
  3. 所属分类:其它

    • 发布日期:2021-02-03
    • 文件大小:63kb
    • 提供者:weixin_42125770
  1. metorikku:基于Apache Spark的简化,轻量级ETL框架-源码

  2. Metorikku是一个库,可简化基于ETL的编写和执行。 它基于简单的YAML配置文件,并且可以在任何Spark群集上运行。 该平台还包括一种编写单元测试和端到端测试的简单方法。 入门 要运行Metorikku,您必须首先定义2个文件。 公制文件 度量标准文件定义了ETL的步骤和查询以及在何处输出什么。 例如,简单的配置YAML(也支持JSON)应如下所示: steps : - dataFrameName : df1 sql : SELECT * FROM inp
  3. 所属分类:其它