说明:ETL项目
项目的ETL流程最初是使用Kaggle的两个数据集进行的。 一个数据集包含有关印度食品配方的信息,另一个数据集包含有关常见食品和产品的营养价值的信息。
数据集的两个链接都可以在这里找到:
ETL的EXTRACT部分首先使用简单的pd.read语句将这些数据集中的CSV加载到我们的Jupyter Notebook中。
读完CSV文件后,ETL的TRANSFORMATION(清洗)部分要求我们从包含成分类型的两个数据框中拆分或拆分列。 我们使用了split函数将每种成分分解为单独的
<weixin_42097914> 上传 | 大小:1mb