您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 菊安酱的机器学习第1期-k-近邻算法(直播).pdf

  2. k-近邻算法的课件。来自于菊安酱的机器学习实战12期的免费教程。内涵python源码。菊安酱的直播间: 我们已经知道k近邻算法的工作原理,根据特征比较,然后提取样本集中特征最相似数据(最近邻)的分类标签。 那么如何进行比较呢?比如表1中新出的电影,我们该如何判断他所属的电影类别呢?如图2所示。 电影分类 120 爱情片(1,101) 爱情片(12,97) 80 爱情片(5,89) 水弊 60 ?(24,67) 动作片(112,9 20 动作片(1158) 动作片(108,5) 0 20 60 8
  3. 所属分类:讲义

    • 发布日期:2019-07-27
    • 文件大小:847kb
    • 提供者:qiu1440528444
  1. 时间序列分析

  2. python时间序列分析2018/12/7 python时序数据分析-以示例说玥-geek精神-博客园 1.均值 X staticnary series Non-stationary serles Ⅹ是时序数捱的值,t是时间。可以看到左图,数据的均值对于时间轴来说是常量,即数据的均值 不是时间的函数所有它是稳定的;右图随着时间的推移,数捱的值整体趋势是增加的,所有均 值是时间的函数,数据具有趋势,所以是非稳定的 2.方差 X tationary series Non-Stationary ser
  3. 所属分类:算法与数据结构

    • 发布日期:2019-03-05
    • 文件大小:2mb
    • 提供者:vanghoh
  1. Python使用pandas对数据进行差分运算的方法

  2. 今天小编就为大家分享一篇Python使用pandas对数据进行差分运算的方法,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
  3. 所属分类:其它

    • 发布日期:2020-09-19
    • 文件大小:29kb
    • 提供者:weixin_38553478
  1. Python使用pandas对数据进行差分运算的方法

  2. 如下所示: >>> import pandas as pd >>> import numpy as np # 生成模拟数据 >>> df = pd.DataFrame({'a':np.random.randint(1, 100, 10),\      'b':np.random.randint(1, 100, 10)},\     index=map(str, range(10))) >>> df     a    b 0
  3. 所属分类:其它

    • 发布日期:2020-12-24
    • 文件大小:31kb
    • 提供者:weixin_38675815
  1. Python DataFrame.groupby()聚合函数,分组级运算

  2. pandas提供了一个灵活高效的groupby功能,它使你能以一种自然的方式对数据集进行切片、切块、摘要等操作。根据一个或多个键(可以是函数、数组或DataFrame列名)拆分pandas对象。计算分组摘要统计,如计数、平均值、标准差,或用户自定义函数。对DataFrame的列应用各种各样的函数。应用组内转换或其他运算,如规格化、线性回归、排名或选取子集等。计算透视表或交叉表。执行分位数分析以及其他分组分析。 groupby分组函数:   返回值:返回重构格式的DataFrame,特别注意,g
  3. 所属分类:其它

    • 发布日期:2020-12-24
    • 文件大小:65kb
    • 提供者:weixin_38562492
  1. Python数据分析之分布分析

  2. Python数据分析之分布分析 概念:就是研究数据的分布特征和分布类型,分定量数据、定性数据区分基本统计量; 应用场景:分布分析主要用于观察数据分布特征,常见方法比如散点图、求极差、观察频率分布情况、分组组距及组数。 *本次以某壳二手房数据为分析案例: (1)导入模块:* import numpy as np import pandas as pd import matplotlib.pyplot as plt %matplotlib inline (2)导入数据: data = pd.rea
  3. 所属分类:其它

    • 发布日期:2020-12-22
    • 文件大小:218kb
    • 提供者:weixin_38518074
  1. python数据分析实战之AQI预测

  2. 前言:上一篇对AQI进行了分析,这一篇根据对以往的数据,建立一个模型,可以将模型应用于未知的数据,来进行AQI的预测。 文章目录1、加载相关库和数据集2、数据处理和转换2.1 简单的数据处理2.2 数据转换3、建立基模型4、特征选择4.1 RFECV4.2 使用RFECV进行特征选择5、异常值处理5.1 使用临界值进行填充5.2 分箱离散化6 、残差图分析6.1 异方差性6.2 离群点 1、加载相关库和数据集 使用的库主要有:pandas、numpy、matplotlib、seaborn、s
  3. 所属分类:其它

    • 发布日期:2020-12-21
    • 文件大小:194kb
    • 提供者:weixin_38681082
  1. pandas数据的异常值判断、可视化以及异常值的处理

  2. pandas数据的异常值判断、可视化、处理方式 回想一下我们小时候参加唱歌比赛,最后算分的时候总会去掉一个最高分,去掉一个最低分,将剩下的分数进行去平均。这里面就有筛选异常值的思想。一个非常夸张的异常值可能会造成对最后统计结果产生比较大的影响。所以,在这里,我们介绍两种办法来判断异常值,并使用箱线图进行显示。 异常值的判断 1、使用均值和标准差进行判断 mean 为数据的均值 std 为数据的标准差 数据的正常范围为 【mean-2 × std,mean+2 × std】 接下来我们使用代码来看
  3. 所属分类:其它

    • 发布日期:2021-01-06
    • 文件大小:112kb
    • 提供者:weixin_38714370
  1. hands-on-time-series-analylsis-python:BV Vishwas和Ashish Patel的“使用Python进行时间序列分析”的源代码-Python source code analysis

  2. Apress源代码 该存储库随附BV Vishwas和Ashish Patel的(Apress,2020年)。 使用绿色按钮将文件下载为zip格式,或使用Git将存储库克隆到您的计算机上。 安装 pip install -r requirements.txt 第一章:时间序列特征 话题 笔记本 合作实验室 1.趋势 2.使用差分去趋势 3,使用Scipy信号进行去趋势 4,使用HP过滤器进行趋势消除 5,多月箱图 6,季节性的自相关图 7,淡季时间系列 8,检测周期性变化 9
  3. 所属分类:其它

    • 发布日期:2021-03-25
    • 文件大小:38mb
    • 提供者:weixin_42126274
  1. matplotlib-challenge-源码

  2. 药物方案研究分析 此Jupyter笔记本对给定的实验室研究数据集执行以下分析: 从数据中删除重复的记录。 生成汇总统计表,该表由每种药物方案的肿瘤体积的平均值,中位数,方差,标准差和SEM组成。 使用Pandas的DataFrame.plot()和Matplotlib的pyplot ,该pyplot显示了整个研究过程中每种治疗方案的总小鼠数。 使用Pandas的DataFrame.plot()和Matplotlib的pyplot生成饼图,该饼图显示了研究中雌性或雄性小鼠的分布。 计算四
  3. 所属分类:其它

    • 发布日期:2021-03-17
    • 文件大小:118kb
    • 提供者:weixin_42146888
  1. 冲浪-源码

  2. 冲浪 概述 要求根据当地气象站的测量结果确定夏威夷海滩上的温度变化。 资源 数据源:hawaii.sqlite 软件/工具:Jupyter Lab(pandas) 语言:SQL,Python 结果 每年的温度变化很小。 比较6月和12月的温度时,平均值,四分位数,标准差和最高记录温度的变化幅度不超过4°F。 最大的差异是最低记录温度之间的差异,该最低温度相差8°F。 有了这些信息,就可以得出结论,海滩的温度将保持稳定的一年,非常适合提议的商店。 未来分析 温度分析仅限于一年中的两个月,将来可
  3. 所属分类:其它

    • 发布日期:2021-02-19
    • 文件大小:219kb
    • 提供者:weixin_42172204
  1. 简单数据分布分析及python实现

  2. 简单数据分布分析及python实现数据集中趋势分析平均值中位数众数分位数数据离中趋势分析标准差方差数据的分布分析正态分布卡方分布(x^2^分布)t分布f分布 数据集中趋势分析 数据集中趋势分析是为了衡量数据的集中程度,常用的集中趋势衡量指标包括数据的平均值、中位数、众数和分位数。平均值和中位数多作为连续数据的衡量指标,众数多作为离散数据的衡量指标。 平均值 python实现。 import pandas as pd import numpy as np df = pd.DataFrame(np.
  3. 所属分类:其它

    • 发布日期:2021-01-21
    • 文件大小:59kb
    • 提供者:weixin_38618024