目录
动机
该数据集包含通过传感器测量的空气化学物质。 提供了一组稀有的化学物质地面真实值以及有关湿度,温度和日期时间的信息。 我在该项目中的目标是预测空气中化学物质的存在,并获得一些对哪些参数影响最大的有用信息。
特征工程
通过提取一天中的时间(早晨,下午,晚上,晚上,夜晚,睡眠时间),星期几和月份,我们可以从datetime列中获得一些有用的功能。 我还决定对化学药品的数量进行汇总,以获得一个目标变量。 该步骤的好处是减小了目标变量空间的尺寸。
数据预处理
立即观察到,NMHC地面真相(缺少