数据科学实验
XGBoost(Xtreme Gradient Boosting)是用于分类和回归的非常强大的工具。它是梯度提升决策树算法的实现。在梯度提升决策树算法中,我们经历了反复构建新模型并将其组合为整体模型的循环。为了进行预测,我们可以添加之前所有模型的预测,并使用这些预测来计算新的误差,构建下一个模型并将其添加到集合中。用于读取数据的环境是使用库建立的。核心xgboost函数要求数据为矩阵。它具有内置的数据类型DMatrix,特别擅长高效地存储和访问稀疏矩阵。加载数据后,将其混洗以将其分