© 1999-2048 dssz.net 粤ICP备11031372号
[其它] ETL项目-源码
说明:ETL项目 在项目的所有阶段与团队紧密合作,以确保不会出现意外情况; 想象有大量数据输入,您和您的团队要负责将其迁移到生产数据库。 我们使用三个来源:来自Kaggle的一个CSV文件和两个互联网来源(Billboard前100名和Insider),我们将数据提取,转换并加载到不同的集合中,以供以后进一步分析。 提取:您的原始数据源(CSV和JSON)。 以csv格式读取的样本。 也可以从实时网页中阅读。 转换:数据清理和转换 广告牌循环 使用三个for循环提取标题,艺术家和年份,然后执行合并<weixin_42140846> 上传 | 大小:143kb