您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 数据分析数据流.zip

  2. 数值数据分析流 框架 python code案例 数据分析流框架理解 1、需求 2、y量化 3、x选择 4、描述 4.1图形 4.2统计量 5、预分析(特征工程,流程化和模块化) 5.1、异常值 单变量异常值 多变量异常值 5.2、缺失值 单变量缺失值 多变量缺失值 5.3、特征筛选 单变量特征筛选 多变量特征筛选 5.4、共线性 scipy.optional 单变量 多变量 5.5、变换 单变量 多变量 5.6、编码 单变量编码 多变量编码 6、建模(大模型:机器学习) 小数据算法:8 sta
  3. 所属分类:机器学习

    • 发布日期:2020-06-02
    • 文件大小:10mb
    • 提供者:u010591976
  1. 【机器学习】菜菜的sklearn课堂(1-12全课).rar

  2. 【机器学习】菜菜的sklearn课堂(1-12全课) 这是完整版的课件pdf 1.决策树 2.随机森林 3.数据预处理和特征工程 4.主成分分析PCA 5.逻辑回归与评分卡 6.聚类算法 7.支持向量机上 8.支持向量机下 9.回归大家族 10.朴素贝叶斯 11.XGBoost 12.神经网络(还在录课)
  3. 所属分类:机器学习

    • 发布日期:2020-08-14
    • 文件大小:130mb
    • 提供者:JENHE
  1. 掌握了这个之后,数据挖掘竞赛稳拿top10:利用Sklearn库进行特征工程处理

  2. 完整的数据挖掘打比赛模板:https://vicky.blog.csdn.net/article/details/104983889 文章目录一、什么是特征工程?特征工程主要分为三部分数据预处理特征选择降维二、数据预处理2.1 无量纲化2.1.1 标准化(也叫Z-score standardization)(对列向量处理)2.1.2 区间缩放(对列向量处理)2.1.3 归一化(对行向量处理)2.3 对定性特征哑编码(对列向量处理)2.4 缺失值计算(对列向量处理)2.5 数据变换2.5.1 多
  3. 所属分类:其它

    • 发布日期:2020-12-22
    • 文件大小:227kb
    • 提供者:weixin_38745891
  1. 逻辑回归模型(Logistic)实战应用——文本分类

  2. 承接之前写的“机器学习之线性模型”的那篇文章,这里运用逻辑回归模型实现对文本的一个大体分类,目的是进一步熟悉逻辑回归的运用和sklearn工具包的使用,理解各参数代表的含义,并没有特意做数据处理、特征工程和模型优化方面的考虑来提高准确度。 数据来源于:https://www.dcjingsai.com/common/cmpt/“达观杯”文本智能处理挑战赛_赛体与数据.html 也可以通过如下网盘下载: 链接:https://pan.baidu.com/s/1P67-jvrI2IhZtsWEQWt
  3. 所属分类:其它

    • 发布日期:2020-12-21
    • 文件大小:55kb
    • 提供者:weixin_38683721
  1. xfeat:使用GPU和Optuna的灵活的功能工程和探索库-源码

  2. xfeat ||| 使用GPU和柔性特征工程与探索库。 xfeat提供了类似于sklearn的转换类,用于要素工程和探索。与sklearn API不同,xfeat提供了一个数据帧输入,数据帧输出接口。 xfeat支持和数据帧。通过使用cuDF和 ,xfeat可以比原始的熊猫操作快10到30倍地生成特征。 分组汇总基准() 目标编码基准() 文档 Optuna的功能选择 目录中提供了更多示例。 快速开始 xfeat提供了一个数据帧输入,数据帧输出接口: 特征工程 可以使用xfeat.Pipeli
  3. 所属分类:其它

  1. 特征工程(sklearn)

  2. 本文来自于csdn,本文中使用sklearn中的IRIS(鸢尾花)数据集来对特征处理功能进行说明。有这么一句话在业界广泛流传:数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上限而已。那特征工程到底是什么呢?顾名思义,其本质是一项工程活动,目的是最大限度地从原始数据中提取特征以供算法和模型使用。通过总结和归纳,人们认为特征工程包括以下方面:特征处理是特征工程的核心部分,sklearn提供了较为完整的特征处理方法,包括数据预处理,特征选择,降维等。首次接触到sklearn,通常会被其丰富且
  3. 所属分类:其它

    • 发布日期:2021-02-24
    • 文件大小:189kb
    • 提供者:weixin_38716563
  1. 自动化学习框架(AutoML)的性能比较

  2. AutoML作为一个有效的工具可以帮助很多企业方便地实施和加速人工智能方面的应用落地。对于还不具备数据科学团队的公司来说,AutoML可以是全自动化的模型构建工具来使用,即便对于具备一定数据科学能力的公司,AutoML仍然可以帮助他们更加专注在人工智能落地中最为重要的事情上。在文本中,主要讲解目前常用的四个自动化学习平台,auto-sklearn,TPOT,auto_ml和H2O,以及他们之间的性能比较。机器学习建模是一个流程化的过程。首先我们需要拿到数据,其次就是数据的预处理、特征工程,接着要
  3. 所属分类:其它

    • 发布日期:2021-02-24
    • 文件大小:356kb
    • 提供者:weixin_38604620
  1. 投资组合:数据科学投资组合-源码

  2. 数据科学组合 包含数据科学和数据分析项目的存储库。 使用Python进行机器学习 解释性数据分析,特征工程,监督机器学习(逻辑回归,决策树,随机森林)。 结果:基准是Logistic回归,并且在测试数据集上产生了0.7694的AUC。 通过利用随机森林和对参数进行超调,可以达到0.8025 AUC。 因此,超调会产生更好的性能。 技术: 监督机器学习:逻辑回归,决策树,随机森林 工具 : Python :熊猫,Numpy,Sklearn,Matplotlib,Seaborn 带有Pyt
  3. 所属分类:其它

  1. w207_project4:关于项目4的协作的回购-源码

  2. w207_project4 团队ErrorBuster! 团队成员:叶爱丽,Prakhar Maini,Simran Bhatia,Srishti Mehra 项目链接: : 学习目标 复合建模-二级合奏 特征选择技术 基于信息的技术(MI,PMI,mRMR) 正则化 功能消除 文字分析 Word2vec Doc2vec 特征工程 基于文本的功能 时间特征 汇总不同的数据类型(自动编码器) 项目要素 文字(甲板) 初步的 最终的 EDA- 特征工程 造型 模型评估 确定指标
  3. 所属分类:其它

  1. 泰坦尼克号:您必须要做的必不可少的泰坦尼克项目,然后他们才能称呼您为数据科学家-源码

  2. 在这里,这是您必须要做的必不可少的“泰坦尼克计划”,任何人都可以合法地将您称为数据科学家。 说真的,我很想参加一场kaggle比赛 项目概况: 在测试装置上达到了77.51%的准确性。 很难知道排行榜有多好,因为排行榜上充满了100%准确率的人。 我必须假设他们获得如此高分的方法是...让我们说这是非常规的。 数据是从正在进行的kaggle比赛中获取的 广泛的EDA和功能工程。 使用Logistic回归,梯度提升和支持向量聚类。 使用GridSearchCV和RandomizedSea
  3. 所属分类:其它

    • 发布日期:2021-02-14
    • 文件大小:604kb
    • 提供者:weixin_42126677
  1. HungaBunga:HungaBunga:使用.fit .predict强制使用所有参数对所有sklearn模型进行强制!-源码

  2. 洪加邦加 暴力破解所有scikit-learn模型和所有scikit-learn参数,并带有fit预言。 让所有sklearn参数强行使用所有sklearn模型! Ahhh Hunga Bunga !! from hunga_bunga import HungaBungaClassifier , HungaBungaRegressor 然后简单地: 什么? 是。 没有! 真! 什么? 许多人认为 监督型(非深度)机器学习的大部分工作都在特征工程中,而模型选择过程仅在所有模型中运行,或者仅使
  3. 所属分类:其它

    • 发布日期:2021-02-04
    • 文件大小:172kb
    • 提供者:weixin_42134240
  1. 特征工程(sklearn)

  2. 本文来自于csdn,本文中使用sklearn中的IRIS(鸢尾花)数据集来对特征处理功能进行说明。有这么一句话在业界广泛流传:数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上限而已。那特征工程到底是什么呢?顾名思义,其本质是一项工程活动,目的是最大限度地从原始数据中提取特征以供算法和模型使用。通过总结和归纳,人们认为特征工程包括以下方面: 特征处理是特征工程的核心部分,sklearn提供了较为完整的特征处理方法,包括数据预处理,特征选择,降维等。首次接触到sklearn,通常会被其丰富
  3. 所属分类:其它

    • 发布日期:2021-01-27
    • 文件大小:177kb
    • 提供者:weixin_38668776
  1. 自动化学习框架(AutoML)的性能比较

  2. AutoML作为一个有效的工具可以帮助很多企业方便地实施和加速人工智能方面的应用落地。对于还不具备数据科学团队的公司来说,AutoML可以是全自动化的模型构建工具来使用,即便对于具备一定数据科学能力的公司,AutoML仍然可以帮助他们更加专注在人工智能落地中最为重要的事情上。在文本中,主要讲解目前常用的四个自动化学习平台,auto-sklearn, TPOT,auto_ml和H2O,以及他们之间的性能比较。机器学习建模是一个流程化的过程。首先我们需要拿到数据,其次就是数据的预处理、特征工程,接着
  3. 所属分类:其它

    • 发布日期:2021-01-27
    • 文件大小:356kb
    • 提供者:weixin_38656741
  1. Task3 特征工程

  2. Task3 特征工程 一、数据预处理 在这一块,比较常用的包是sklearn.Processing data,主要包括以下操作: 异常值处理 使用箱型图(或小提琴图)发现离群点(off-group points)之后,为了不干扰实验结果,我们通常将离群点处理掉: #from DW阿泽 import the code def outliers_proc(data, col_name, scale=3): 用于清洗异常值,默认用 box_plot(scale=3)进行清洗 :pa
  3. 所属分类:其它

    • 发布日期:2021-01-20
    • 文件大小:532kb
    • 提供者:weixin_38626179
  1. house-features:创建了一个回归模型来预测爱荷华州埃姆斯市房屋的销售价格在实际价值的25,000美元以内,并确定对销售价格贡献最大的交互条件-源码

  2. 预测房屋售价 技术与技能 技术技能:回归,数据清理,探索性数据分析(EDA),数据可视化,机器学习,偏差方差折衷,插补方法,模型验证,统计,特征工程,正则化,集成模型,k均值聚类,管道,网格搜索,转学 技术: Python,Jupyter Notebook,GitHub,Git Python库: Pandas,numpy,sklearn,matplotlib,seaborn,scipy 模型:多元线性回归,岭回归,LASSO回归,k近邻回归,随机森林回归,额外树木回归,支持向量回归,XGBo
  3. 所属分类:其它