© 1999-2048 dssz.net 粤ICP备11031372号
[其它] Phase3_Project:坦桑尼亚水井竞赛-源码
说明:Phase3_Project 推动数据竞争>抽水:数据挖掘地下水位坦桑尼亚水井比赛 任务 根据提供的数据,预测哪些井处于“功能性”,“需要维修”或“非功能性” 打扫: 有很多类似的列-要删除的选定列。 根据位置描述数据推算缺少的物理地理数据将缺少的分类功能设置为“未知” 要素工程-将日期记录为一年中的某天和几年中的工作 造型 跑许多模型与: 不同的超参数 有/没有标准标量 删除不同数量的不频繁类别或目标编码 结论 最佳模型:CatBoost,对测试集的预测精度为81% -准确性是比赛<weixin_42125192> 上传 | 大小:15mb