说明:水质指数
预测模型,预测格林斯伯勒市水资源司的水质指数
加载库
标题名称被调用以供以后在程序中使用。 加载和框架数据集以及默认标题。
运行原始数据的描述性统计信息,以深入了解和理解数据,以进行进一步的操作(例如清理和标注尺寸)
总结每个属性的分布
相关性
单峰数据可视化
直方图
密度
箱须图
多峰数据可视化
散点图矩阵
相关矩阵
通过删除空单元格来清洁数据集,以实现更好的可视化
窥探干净的数据
标准化数据集的平均值,以获得良好的数据总体分布
窥探数据
按4:1的比例分拆训练和测试数据集,训练:
<weixin_42138408> 上传 | 大小:70kb