统一建模语言( U M L)是一个通用的可视化建模语言,用于对软件进行描述、可视化处 理、构造和建立软件系统制品的文档。它记录了对必须构造的系统的决定和理解,可用于对 系统的理解、设计、浏览、配置、维护和信息控制。UML 适用于各种软件开发方法、软件生 命周期的各个阶段、各种应用领域以及各种开发工具,是一种总结了以往建模技术的经验并 吸收当今优秀成果的标准建模方法。U M L包括概念的语义,表示法和说明,提供了静态、动 态、系统环境及组织结构的模型。它可被交互的可视化建模工具所支持,这些工具提
C5.0是决策树模型中的算法,79年由J R Quinlan发展,并提出了ID3算法,主要针对离散型属性数据,其后又不断的改进,形成C4.5,它在ID3基础上增加了队连续属性的离散化。 C5.0是C4.5应用于大数据集上的分类算法,主要在执行效率和内存使用方面进行了改进。 C4.5算法是ID3算法的修订版,采用GainRatio来加以改进方法,选取有最大GainRatio的分割变量作为准则,避免ID3算法过度配适的问题。