二、EDA-数据探索性分析
前面的步骤就不做赘述了,我在下载好资料后,在jupyter notebook里将数据导入,随后进行课程内容的一系列指导操作,熟悉数据集,包括:
2.1 载入各种数据科学以及可视化库:
数据科学库 pandas、numpy、scipy;
可视化库 matplotlib、seabon;
其他;
2.2 载入数据:
载入训练集和测试集;
简略观察数据**(head()+shape)**;
2.3 数据总览:
通过**describe()**来熟悉数据的相关统计量
通过**i