您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 用于机器学习特征工程的哈希

  2. Hashing for Machine Learning(用于机器学习特征工程的哈希),微软研究院 John Longford 的讲义。
  3. 所属分类:讲义

    • 发布日期:2015-03-23
    • 文件大小:613kb
    • 提供者:happytofly
  1. 【机器学习】菜菜的sklearn课堂(1-12全课).rar

  2. 【机器学习】菜菜的sklearn课堂(1-12全课) 这是完整版的课件pdf 1.决策树 2.随机森林 3.数据预处理和特征工程 4.主成分分析PCA 5.逻辑回归与评分卡 6.聚类算法 7.支持向量机上 8.支持向量机下 9.回归大家族 10.朴素贝叶斯 11.XGBoost 12.神经网络(还在录课)
  3. 所属分类:机器学习

    • 发布日期:2020-08-14
    • 文件大小:130mb
    • 提供者:JENHE
  1. (菜菜机器学习教程)Tsai_sklearn_tutorial.zip

  2. 菜菜完整机器学习教程,内含code和从参数说明,以及参考书目的目录等 01 决策树课件数据源码 02随机森林 03数据预处理和特征工程 04主成分分析PCA与奇异值分解SVD 05逻辑回归与评分卡 06聚类算法Kmeans 07支持向量机上 08支持向量机下等
  3. 所属分类:机器学习

    • 发布日期:2020-08-24
    • 文件大小:157mb
    • 提供者:o_3ric
  1. 特征工程(机器学习)

  2. 一共30页PPT,何为特征工程呢?顾名思义,就是对原始数据进行一系列工程处理,将其提炼为特征,作为输入供算法和模型使用。 本质上讲,特征工程是一个表示和展现数据的过程;实际工作中,特征工程的目的是去除原始数据中的杂质和冗余,设计更高效的特征以刻画求解的问题与预测模型之间的关系。
  3. 所属分类:机器学习

    • 发布日期:2020-11-04
    • 文件大小:1mb
    • 提供者:Northpavilion
  1. plagiarism-detection:Udacity机器学习工程(MLE)纳米学位计划的窃检测项目-源码

  2. 抄袭项目,机器学习部署 该存储库包含用于使用AWS SageMaker部署a窃检测器的代码和相关文件。 项目概况 在这个项目中,您将负责构建a窃检测器,该检测器将检查文本文件并执行二进制分类。 根据该文本文件与提供的源文本的相似程度,将该文件标记为抄袭或不抄袭。 侦查窃是一个活跃的研究领域。 这项任务很艰巨,解释的答案和原始作品之间的区别通常并不那么明显。 该项目将分为三个主要笔记本: 笔记本1:数据探索 加载窃文本数据的语料库。 探索现有的数据功能和数据分布。 这第一台笔记本是不是在你
  3. 所属分类:其它

    • 发布日期:2021-03-26
    • 文件大小:804kb
    • 提供者:weixin_42101641
  1. machine_learning_projects::robot:机器学习项目-源码

  2. 机器学习项目 该存储库包含我在第一周完成的数据科学项目。 这些项目涵盖数据分析和可视化,功能工程,不同机器学习模型(随机森林,线性回归,决策树,朴素贝叶斯,ARIMA)的应用,超参数优化和正则化,自然语言处理和时间序列分析。 Gapminder-可视数据分析 数据: 目标:创建动画散点图 描述性统计,使用Matplotlib和Seaborn进行绘图 泰坦尼克号-分类项目 数据: 目标:应用机器学习模型预测泰坦尼克号上的乘客生存 探索泰坦尼克号数据集并建立基线模型 训练逻辑回归和随机森林分类
  3. 所属分类:其它

  1. 加利福尼亚住房数据集:将机器学习建模应用于加利福尼亚住房数据集-源码

  2. 加州住房数据集 开发了机器学习模型来预测加利福尼亚住房数据集的中位数房屋价值特征。 使用了三种算法:线性回归,XGBoost和TensorFlow / Keras神经网络。 在模型训练之前进行了要素工程,包括Z分数归一化,对数缩放,要素添加(总卧室与总房间的比率),要素修剪和要素合并以及经度和纬度的交叉。 对于所有这三种算法,均使用工程特征的不同组合绘制R平方图,以观察有效性。 然后,根据算法以图形方式编辑这些图,以便于比较。 下面提供了每种算法的图例,这些图例将数值链接到一组工程特征。
  3. 所属分类:其它

    • 发布日期:2021-03-02
    • 文件大小:33mb
    • 提供者:weixin_42122878
  1. 机器学习入门

  2. 数据科学正在快速发展成所有行业开发人员和管理人员的关键技能,它看起来也十分有趣。但是,它非常复杂,虽有许多工程和分析工具助力,却也难清楚掌握现在做得对不对,哪里是不是有陷阱。在本文中,我们解释了如何发挥数据科学的作用,理解哪里需要它,哪里不需要它,以及如何令它为你产生价值,如何从先行者那里获得有用的经验。这是“GettingAHandleOnDataScience”系统文章中的一部分,你可以通过此RSS予以订阅。大多数类型的机器学习项目归根结底通常是使用监督式学习方式进行分类或回归。特征工程是大
  3. 所属分类:其它

    • 发布日期:2021-02-25
    • 文件大小:372kb
    • 提供者:weixin_38581455
  1. 机器学习项目中的数据预处理与数据整理之比较

  2. 在常见的机器学习/深度学习项目里,数据准备占去整个分析管道的60%到80%。市场上有各种用于数据清洗和特征工程的编程语言、框架和工具。它们之间的功能有重叠,也各有权衡。数据整理是数据预处理的重要扩展。它最适合在可视化分析工具中使用,这能够避免分析流程被打断。可视化分析工具与开源数据科学组件之间,如R、Python、KNIME、RapidMiner互为补充。避免过多地使用组件能够加速数据科学项目。因此,在数据准备步骤中利用流式获取框架或流式分析产品会是一个不错的选择。机器学习和深度学习项目在大多数
  3. 所属分类:其它

    • 发布日期:2021-02-25
    • 文件大小:526kb
    • 提供者:weixin_38730821
  1. Weiflow——微博机器学习框架

  2. 本文从开发效率(易用性)、可扩展性、执行效率三个方面,介绍了微博机器学习框架Weiflow在微博的应用和最佳实践。在上期《基于Spark的大规模机器学习在微博的应用》一文中我们提到,在机器学习流中,模型训练只是其中耗时最短的一环。如果把机器学习流比作烹饪,那么模型训练就是最后翻炒的过程;烹饪的大部分时间实际上都花在了食材、佐料的挑选,洗菜、择菜,食材再加工(切丁、切块、过油、预热)等步骤。在微博的机器学习流中,原始样本生成、数据处理、特征工程、训练样本生成、模型后期的测试、评估等步骤所需要投入的
  3. 所属分类:其它

    • 发布日期:2021-02-25
    • 文件大小:384kb
    • 提供者:weixin_38744902
  1. msds621:旧金山大学的MSDS621课程笔记,机器学习简介-源码

  2. MSDS621机器学习简介 “我们相信上帝; 其他所有带来数据。 ” —归因于W. Edwards Deming和George Box 本课程向学生介绍表格/结构化数据的机器学习的关键过程,模型和概念,例如: 数据清理 处理丢失的数据 基本特征工程 功能选择 模型实施 模型训练 模型评估 模式解释 我们将深入研究一些关键模型,而不是提供广泛而肤浅的模型概览。 作为本课程的一部分,学生将通过梯度下降,用于文本情感分析的朴素贝叶斯模型,决策树和随机森林模型,通过正则化实现线性和逻辑回归。 自己
  3. 所属分类:其它

    • 发布日期:2021-02-25
    • 文件大小:63mb
    • 提供者:weixin_42102401
  1. Python机器学习项目实战

  2. 本文来自于cloud.tencent.com,作者以浅显易懂的语言和清晰的示例和代码教你从头开始走过一个机器学习之旅,并且附详细的代码,大家可以收藏和学习。这是一篇完全手把手进行机器学习项目构建的教程,包含:1.数据清理和格式化2.探索性数据分析3.特征工程和特征选择4.在性能指标上比较几种机器学习模型5.对最佳模型执行超参数调整6.在测试集合中评估最佳模型7.解释模型结果8.得出结论。今天是(1-3)从数据清理,到数据分析,到特征工程,再到Baseline的构建.——Puttingthemac
  3. 所属分类:其它

    • 发布日期:2021-02-24
    • 文件大小:435kb
    • 提供者:weixin_38674409
  1. 机器学习之(四)特征工程以及特征选择的工程方法

  2. 本文来自于segmentfault.com,从特征工程是什么?为什么要做特征工程?应该如何做特征工程?这三个方面详细叙述。关于特征工程(FeatureEngineering),已经是很古老很常见的话题了,坊间常说:“数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上限而已”。由此可见,特征工程在机器学习中占有相当重要的地位。在实际应用当中,可以说特征工程是机器学习成功的关键。纵观Kaggle、KDD等国内外大大小小的比赛,每个竞赛的冠军其实并没有用到很高深的算法,大多数都是在特征工程这个
  3. 所属分类:其它

    • 发布日期:2021-02-24
    • 文件大小:328kb
    • 提供者:weixin_38655810
  1. 特征工程(sklearn)

  2. 本文来自于csdn,本文中使用sklearn中的IRIS(鸢尾花)数据集来对特征处理功能进行说明。有这么一句话在业界广泛流传:数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上限而已。那特征工程到底是什么呢?顾名思义,其本质是一项工程活动,目的是最大限度地从原始数据中提取特征以供算法和模型使用。通过总结和归纳,人们认为特征工程包括以下方面:特征处理是特征工程的核心部分,sklearn提供了较为完整的特征处理方法,包括数据预处理,特征选择,降维等。首次接触到sklearn,通常会被其丰富且
  3. 所属分类:其它

    • 发布日期:2021-02-24
    • 文件大小:189kb
    • 提供者:weixin_38716563
  1. AutoML之自动化特征工程

  2. 个人以为,机器学习是朝着更高的易用性、更低的技术门槛、更敏捷的开发成本的方向去发展,且AutoML或者AutoDL的发展无疑是最好的证明。因此花费一些时间学习了解了AutoML领域的一些知识,并对AutoML中的技术方案进行归纳整理。众所周知,一个完整的机器学习项目可概括为如下四个步骤。其中,特征工程(提取)往往是决定模型性能的最关键一步。而往往机器学习中最耗时的部分也正是特性工程和超参数调优。因此,许多模型由于时间限制而过早地从实验阶段转移到生产阶段从而导致并不是最优的。自动化机器学习(Aut
  3. 所属分类:其它

    • 发布日期:2021-02-24
    • 文件大小:672kb
    • 提供者:weixin_38724919
  1. 为特征工程和机器学习准备数据:特征工程技术-源码

  2. 为功能工程和机器学习准备数据 特征工程技术 无论如何设计和实施良好的机器学习模型,如果输入的数据设计不良,模型的预测将令人失望。 在此回购中,为特征工程和机器学习准备数据,您将能够对数据进行适当的预处理(实际上是对其进行工程设计),以便从ML模型中获得最大的收益。 首先,您将学习如何使用特征选择技术来查找包含最多信息的预测变量。 特征选择可以大致分为三类,分别称为过滤器,包装器和嵌入式技术,我们将理解并实现所有这些。 接下来,您将发现特征提取与特征选择有何不同,因为数据实际上被重新表达,有时
  3. 所属分类:其它

    • 发布日期:2021-02-19
    • 文件大小:10mb
    • 提供者:weixin_42172572
  1. 我的数据竞赛经验:本人多次机器学习与大数据竞赛Top5的经验总结,满满的干货,拿好不谢-源码

  2. 数据科学竞赛经验谈 如何做数据分析?如何做数据清洗?如何做特征工程?(面向关系型数据的特征工程系统化分析方法)如何做特征选择?如何选择合适的机器学习模型?如何调参?如何做模型融合?如何上分刷榜? 请各位直接到以下链接阅读: : 想咨询竞赛经验,快速上分,争夺奖金的同学,欢迎来到大卫的小屋与我交流: 纯文字PDF版已经制作完成,已与PPT版一起上传至我的知识星球
  3. 所属分类:其它

  1. 机器学习之(四)特征工程以及特征选择的工程方法

  2. 本文来自于segmentfault.com,从特征工程是什么?为什么要做特征工程?应该如何做特征工程?这三个方面详细叙述。关于特征工程(FeatureEngineering),已经是很古老很常见的话题了,坊间常说:“数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上限而已”。由此可见,特征工程在机器学习中占有相当重要的地位。在实际应用当中,可以说特征工程是机器学习成功的关键。纵观Kaggle、KDD等国内外大大小小的比赛,每个竞赛的冠军其实并没有用到很高深的算法,大多数都是在特征工程这个
  3. 所属分类:其它

    • 发布日期:2021-01-27
    • 文件大小:326kb
    • 提供者:weixin_38608025
  1. 特征工程(sklearn)

  2. 本文来自于csdn,本文中使用sklearn中的IRIS(鸢尾花)数据集来对特征处理功能进行说明。有这么一句话在业界广泛流传:数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上限而已。那特征工程到底是什么呢?顾名思义,其本质是一项工程活动,目的是最大限度地从原始数据中提取特征以供算法和模型使用。通过总结和归纳,人们认为特征工程包括以下方面: 特征处理是特征工程的核心部分,sklearn提供了较为完整的特征处理方法,包括数据预处理,特征选择,降维等。首次接触到sklearn,通常会被其丰富
  3. 所属分类:其它

    • 发布日期:2021-01-27
    • 文件大小:177kb
    • 提供者:weixin_38668776
  1. AutoML之自动化特征工程

  2. 个人以为,机器学习是朝着更高的易用性、更低的技术门槛、更敏捷的开发成本的方向去发展,且AutoML或者AutoDL的发展无疑是最好的证明。因此花费一些时间学习了解了AutoML领域的一些知识,并对AutoML中的技术方案进行归纳整理。众所周知,一个完整的机器学习项目可概括为如下四个步骤。其中,特征工程(提取)往往是决定模型性能的最关键一步。而往往机器学习中最耗时的部分也正是特性工程和超参数调优。因此,许多模型由于时间限制而过早地从实验阶段转移到生产阶段从而导致并不是最优的。自动化机器学习(Aut
  3. 所属分类:其它

    • 发布日期:2021-01-27
    • 文件大小:672kb
    • 提供者:weixin_38500664
« 12 3 4 »