文件名称:
University-Enrollment-源码
开发工具:
文件大小: 791kb
下载次数: 0
上传时间: 2021-03-15
详细说明:大学录取
数据挖掘方法预测大学入学率
我们的分析主要包括五个部分:数据探索,数据转换,建模,模型比较和结论。 我们根据验证错误分类率来选择最佳模型。 我们还确定了最重要的预测变量,并获得了得分数据集。
数据探索:首先,我们评估了原始数据集并发现了一些变量中的缺失值。 注意这一点很重要,因为某些模型可能需要插补才能正确运行。 我们还分析了区间变量的分布(请参见附录图1)。 除“ satscore”外,所有间隔变量都高度偏斜。 我们调查了对这些变量的转换,以减少偏度并增加正态性。
数据插补和转换:在插补过程中,我们用模式替换了丢失的类变量值,并用均值替换了丢失的区间变量。 我们使用转换“最大正态”选项来评估偏斜变量的适当转换。 对数转换用于自我发起的联系,总联系和平均收入。 距离变量为平方根,初始跨度为幂函数。 这些转换导致偏斜度和峰度均减小(参见附录图2)。 其他变量未进行转换,因为没有
(系统自动生成,下载前可以参看下载内容)
下载文件列表
相关说明
- 本站资源为会员上传分享交流与学习,如有侵犯您的权益,请联系我们删除.
- 本站是交换下载平台,提供交流渠道,下载内容来自于网络,除下载问题外,其它问题请自行百度。
- 本站已设置防盗链,请勿用迅雷、QQ旋风等多线程下载软件下载资源,下载后用WinRAR最新版进行解压.
- 如果您发现内容无法下载,请稍后再次尝试;或者到消费记录里找到下载记录反馈给我们.
- 下载后发现下载的内容跟说明不相乎,请到消费记录里找到下载记录反馈给我们,经确认后退回积分.
- 如下载前有疑问,可以通过点击"提供者"的名字,查看对方的联系方式,联系对方咨询.