您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. data-science-adventures:探索性数据科学项目-源码

  2. 数据科学历险记 该存储库包含探索性数据科学项目,目的是记录我的学习情况。随时欢迎提出意见和建议,不胜感激! 当前项目: 该项目的重点是预测爱荷华州埃姆斯地区的房价。 使用各种模型,包括正则回归,梯度提升树和随机森林,以及最终的估算器叠加方法。 预测排在的前1% Dean De Cock从2006年至2010年之间从单个住宅物业销售中收集的数据。 该项目着重于了解导致心力衰竭死亡的患者因素 采用几种监督分类模型,包括KNN,逻辑回归SVM和随机森林。 费萨拉巴德联合医院费萨拉巴德心脏病研究所在2
  3. 所属分类:其它

  1. EDA-SVM-源码

  2. EDA-SVM
  3. 所属分类:其它

    • 发布日期:2021-03-18
    • 文件大小:239kb
    • 提供者:weixin_42165973
  1. Projects-Portfolio-源码

  2. 数据科学组合 概括 该存储库由我为学术和自学目的而完成的端到端数据科学项目组成。 以iPython Notebooks的形式呈现。 按照以下步骤完成项目,它们是: 机器学习步骤 定义问题陈述:通过检查数据集并确定解决问题陈述所需的机器学习模型的类型来定义问题陈述。 探索性数据分析(EDA) :在此步骤中,将对数据进行细致的分析以提取任何新信息,以查找自变量内以及自变量与因变量之间的任何关系。 使用单变量分析,双变量分析和相关矩阵。 处理任何空值。 检查数据的偏斜度。 处理异常值:使用Z Sc
  3. 所属分类:其它

    • 发布日期:2021-03-16
    • 文件大小:32mb
    • 提供者:weixin_42134240
  1. 将客户定向到通过应用程序行为分析:此模型的目的是预测哪些用户不会订阅付费会员,以便进行更大的营销工作,以尝试将他们“转换”为付费用户-源码

  2. 机器学习:FINTECH中的用例 这些项目的数据是根据实际案例研究中发现的趋势制造的字段。 这些字段描述了公司通常从其用户处跟踪的内容,并且这些分布基于在真实世界分析中观察到的分布。 这意味着,尽管数据是人为创建的,但是模式,关联和分布并不是随机的。 数据可以很好地表示您在工作场所可能遇到的情况。 也就是说,数据很少是干净的,并且需要大量预处理才能准备好进行建模。 型号说明: 模型构建过程由多个部分组成: 使用Matplotlib和Seaborn进行绘图-探索性数据分析(EDA)将花费大量
  3. 所属分类:其它

    • 发布日期:2021-02-17
    • 文件大小:345kb
    • 提供者:weixin_42159267
  1. Machine-Learning-Laboratory-源码

  2. 机器学习实验室 实验1 下载与您分配的域相关的基准数据集,并在其上执行探索性数据分析(EDA)。 通过EDA探索数据集的性质。 通过检查EDA的结果得出结论,哪种类型的技术适合您的数据集。 实验2 在您选择的域上实施遵循非参数方法进行分类的任何监督机器学习算法,并通过适当的推理突出显示观察的主要要点。 实验3 将单回归与多元回归进行比较和对比,并通过适当的推断对模型的工作提供详细的观察。 实验4 程序与降维有关。 利用合适的数据集,探索PCA和LDA的工作原理,并确定两种技术的工作程序之
  3. 所属分类:其它

    • 发布日期:2021-04-01
    • 文件大小:10mb
    • 提供者:weixin_42166623
  1. Jonathan_Lynch:数据科学组合-源码

  2. 对世界各国的数据集进行了探索性数据分析(EDA) 使用核密度估计(KDE)分析数据子集的分布 利用相关矩阵热图和散点图评估相关性 开发线性回归和随机森林回归模型以预测人均GDP 使用奥运奖牌数据集通过可视化方式讲述了一个引人入胜的故事 创建了一个树形图,堆积的条形图和小的倍数躲避的条形图,以及 设计了六个国家/地区随时间推移赢得的总奖牌 对酒店预订需求数据集进行了初步探索 构造的多项式朴素贝叶斯,KNN,SVM和随机森林分类器 利用网格搜索调整单个模型的超参数 使用接收器工作特性(ROC)
  3. 所属分类:其它

  1. Data-Science:R中的EDA和机器学习模型(回归,分类,聚类,SVM,决策树,随机森林,时间序列分析,推荐系统,XGBoost)-源码

  2. EDA和ML项目 存储库包含各种项目,这些项目都使用R语言编写了以下代码: 探索性数据分析 机器学习模型(线性回归,逻辑回归,k均值聚类,分层聚类,SVM,决策树,随机森林,时间序列分析,XGBoost) 以下是一些常用的程序包/库的列表,这些程序包/库被用作数据分析和构建机器学习模型的一部分 数据处理: dplyr,plyr,tidyr,stringer,data.table,lubridate(用于日期处理), 数据可视化: ggplot2,cowplot,ggthemes,比例 ML模型:
  3. 所属分类:其它

    • 发布日期:2021-03-20
    • 文件大小:26mb
    • 提供者:weixin_42135462