© 1999-2048 dssz.net 粤ICP备11031372号
[其它] data-systems:演示和动手教程,关于现代数据系统-源码
说明:数据系统概论 该存储库包含一组有关巴黎南硕士课程的Data Lake课程的演示文稿和动手教程。 我决定打开此模块的内容以: 使任何想要学习数据工程的人都可以使用它 通过公开和开放供稿来提高模块的质量 内容 简报: 涵盖: 什么是大数据 从DataWarehouse到Data Lake 数据处理架构: Lambda架构和kappa架构 HDFS的设计目标和概念 HDFS中的数据操作说明数据存储格式简介: avro , orc和parquet 数据整合问题 什么是write ahead l<weixin_42121725> 上传 | 大小:4mb