您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 【整理】pandas教程

  2. 辛苦整理的,非常不错,可以用来学习pandas的基本操作。 正文目录: pandas教程:[1]DataFrame入门 pandas教程:[2]DataFrame选择数据 pandas教程:[3]DataFrame切片操作 pandas教程:[4]Dataframe筛选数据 pandas教程:[5]读取csv数据 pandas教程:[6]计数统计 pandas教程:[7]筛选计数统计 pandas教程:[8]数据分组 pandas教程:[9]MultiIndex用法 pandas教程:[10]
  3. 所属分类:Python

    • 发布日期:2016-08-29
    • 文件大小:8mb
    • 提供者:yuan8222
  1. Python数据科学手册(高清完整带目录)

  2. 豆瓣8.9分 本书是对以数据深度需求为中心的科学、研究以及针对计算和统计方法的参考书。本书共五章,每章介绍一到两个Python数据科学中的重点工具包。首先从IPython和Jupyter开始,它们提供了数据科学家需要的计算环境;第2章讲解能提供ndarray对象的NumPy,它可以用Python高效地存储和操作大型数组;第3章主要涉及提供DataFrame对象的Pandas,它可以用Python高效地存储和操作带标签的/列式数据;第4章的主角是Matplotlib,它为Python提供了许多数
  3. 所属分类:Python

    • 发布日期:2018-08-13
    • 文件大小:9mb
    • 提供者:qq_42815176
  1. pandasTrain.html python-pandas的一些小练习——东北大学大数据班数据挖掘实训Python基础二(2)

  2. python-pandas的一些小练习——东北大学大数据班数据挖掘实训Python基础二(2) 实训练习:练习使用pandas 包中的dataframe和方法。 1将数据读取为dataframe类型,命名为df 2查看数据的形状[了解数据有多少行、多少列] 3查看数据的最开始的7条数据和尾部的3条数据 4查看数据的各字段的类型 5查看数据是否有缺失值 6如果有缺失值,进行补0操作 7从df中按字段取出‘ date’’dist’和‘ flight’形成新的df1 8从df中按位置选取行为3和4,列
  3. 所属分类:Python

    • 发布日期:2020-03-29
    • 文件大小:329kb
    • 提供者:weixin_43124279
  1. pandas常用操作.pdf

  2. pandas库的常用操作,参考书籍《Pandas Cookbook》,内容干货,推荐下载!movie get_dtype_counts# output the number of columns with each specific data type: movie. select_dtypes(include['int ]).head(# select only integer columns movie. filter(1ike=' facebook').head()#1ike参数表示包含此
  3. 所属分类:Python

    • 发布日期:2019-08-31
    • 文件大小:685kb
    • 提供者:justisme
  1. python中pandas.DataFrame对行与列求和及添加新行与列示例

  2. pandas是python环境下最有名的数据统计包,而DataFrame翻译为数据框,是一种数据组织方式,这篇文章主要给大家介绍了python中pandas.DataFrame对行与列求和及添加新行与列的方法,文中给出了详细的示例代码,需要的朋友可以参考借鉴,下面来一起看看吧。
  3. 所属分类:其它

    • 发布日期:2020-09-21
    • 文件大小:36kb
    • 提供者:weixin_38678521
  1. pandas数据框,统计某列数据对应的个数方法

  2. 下面小编就为大家分享一篇pandas数据框,统计某列数据对应的个数方法,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
  3. 所属分类:其它

    • 发布日期:2020-09-20
    • 文件大小:93kb
    • 提供者:weixin_38720390
  1. 详解python pandas 分组统计的方法

  2. 首先,看看本文所面向的应用场景:我们有一个数据集df,现在想统计数据中某一列每个元素的出现次数。这个在我们前面文章《如何画直方图》中已经介绍了方法,利用value_counts()就可以实现(具体回看文章) 但是,现在,我们考虑另外一个场景,我们假如要想统计其中两列元素出现次数呢?举个栗子: 在df数据集中,如果我们想统计A、B两列的元素的出现情况,也就是说,得到如下表。 从上面的最后一列可以看到,在A、B两列中,1 2 出现了2次,1 4 出现1次 ,1 6出现1次,2 3出现了2次,
  3. 所属分类:其它

    • 发布日期:2020-12-25
    • 文件大小:48kb
    • 提供者:weixin_38643401
  1. 解决pandas 作图无法显示中文的问题

  2. 最近开始使用 pandas 处理可视化数据,挖掘信息。但是在作图时遇到,无法显示中文的问题。 下面这段代码是统计 fujian1.csv 文件中 City 所在列中各个城市出现次数的代码。可是作图直方图时在 x 轴上无法显示中文。 import pandas as pd # Reading data locally df = pd.read_csv('fujian1.csv', encoding='gbk') counts = df['City'].value_counts() counts[
  3. 所属分类:其它

    • 发布日期:2020-12-25
    • 文件大小:49kb
    • 提供者:weixin_38691669
  1. pandas 数据归一化以及行删除例程的方法

  2. 如下所示: #coding:utf8 import pandas as pd import numpy as np from pandas import Series,DataFrame # 如果有id列,则需先删除id列再进行对应操作,最后再补上 # 统计的时候不需要用到id列,删除的时候需要考虑 # delete row def row_del(df, num_percent, label_len = 0): #print list(df.count(axis=1)) col_num
  3. 所属分类:其它

    • 发布日期:2020-12-24
    • 文件大小:38kb
    • 提供者:weixin_38747978
  1. pandas速查表总结

  2. 目录数据创建数据读写数据查看数据操作数据提取数据筛选数据统计操作数据表结构数据表合并修改列名细节总结inplace参数map()apply() 数据创建 代码 作用 pd.Series([1, 2, 3, 4, 5]) list创建Series dates = pd.date_range(‘20171022’, periods=6) 创建时间索引 pd.DataFrame(np.random.randn(6, 4), index=dates, columns=list([‘
  3. 所属分类:其它

    • 发布日期:2020-12-23
    • 文件大小:62kb
    • 提供者:weixin_38571992
  1. pandas入门

  2. 文章目录数据结构Series属性:生成 Series:检查缺失值:DataFrame构建DataFrame:基本操作:索引,选择,增删基本功能重建索引*df.reindex()*删除行或列算术方法逐元素应用函数排序描述性统计 概述 处理表格型数据,每一列数据类型可以不一样 导入:import pandas as pd from pandas import Series,DataFrame 常用显示选项: pd.options.display.max_rows = n :设置pd对象的显示行数,
  3. 所属分类:其它

    • 发布日期:2020-12-22
    • 文件大小:370kb
    • 提供者:weixin_38560797
  1. 3.机器学习—数据科学包3.3pandas操作

  2. pandas操作一.pandas索引1.Series索引index2.DateFrame行索引index和列索引columns3.pandas预置索引的类4.重复索引4.1重复索引定义4.2重复索引处理groupby()5.多级索引pd.MultiIndex5.1Series多级索引5.1.1.新建多级索引5.2.2.选取元素5.2 DataFrame多级索引5.2.1新建DataFrame5.2.2选取元素5.2.3索引交换5.2.4索引排序5.2.5统计索引5.2.6索引 index和列co
  3. 所属分类:其它

    • 发布日期:2020-12-21
    • 文件大小:86kb
    • 提供者:weixin_38694336
  1. SciPy.org 003 用PyQt5显示pandas的DataFrame数据

  2. pandas中的DataFrame有以下基本属性:   属性 描述 1 values 返回ndarray类型对象 2 index 行索引 3 columns 列索引 4 axes 行和列索引 5 T 行和列对换 6 info 对象信息 7 head(i) 显示前i行数据 8 tail(i) 显示后i行数据 9 describe() 数据按列的统计信息 10 DataFrame() 初始化 创建一个df数据: data = {'性别':
  3. 所属分类:其它

    • 发布日期:2020-12-21
    • 文件大小:62kb
    • 提供者:weixin_38535808
  1. 数据清洗之 分组对象与apply函数

  2. 分组对象与apply函数 函数apply即可用于分组对象,也可以作用于dataframe数据 Groupby.apply(func) 需要注意axis=0和axis=1的区别 np.sum, axis=0 相当于计算每列的总和 np.sum, axis=1 相当于计算每行的总和 import pandas as pd import numpy as np import os os.getcwd() 'D:\\Jupyter\\notebook\\Python数据清洗实战\\数据清洗之数据统计
  3. 所属分类:其它

    • 发布日期:2020-12-21
    • 文件大小:40kb
    • 提供者:weixin_38522029
  1. pandas数据集的端到端处理

  2. 1. 数据集基本信息 df = pd.read_csv() df.head():前五行; df.info(): rangeindex:行索引; data columns:列索引; dtypes:各个列的类型, 主体部分是各个列值的情况,比如可判断是否存在 NaN 值; 对于非数值型的属性列 df[‘some_categorical_columns’].value_counts():取值分布; df.describe(): 各个列的基本统计信息 count mean
  3. 所属分类:其它

    • 发布日期:2020-12-26
    • 文件大小:46kb
    • 提供者:weixin_38629449
  1. pandasxlframer:一个更简单的包装器,用于增强Pandas的to_excel功能以实现高级格式化-源码

  2. 熊猫xlframer 这是openpyxl的简单包装,可为Pandas的数据框启用其他Excel格式。 目的是在将数据框保存到Excel时添加格式化功能:字体大小,文本对齐方式,颜色/合并单元格和添加标题。 目标是使用方法链来提供快速语法来完成此类任务。 例如,默认的Pandas的to_excel输出如下文件: 我们经常遇到的任务是向此Excel文件添加标题,合并一些列单元格,设置单元格格式以及更改背景色。 这可以通过以下代码完成: ( df.excel_format.add_he
  3. 所属分类:其它

    • 发布日期:2021-03-16
    • 文件大小:511kb
    • 提供者:weixin_42150341
  1. datastand:一个python软件包,可帮助用户尤其是数据科学家,机器学习工程师和分析师更好地理解数据。 提供有关给定数据的快速见解; 常规数据集统计信息,数据集的大小和形状,唯一数据类型的数量,数字列和非数字列的数量,数据集的概览,

  2. 资料架 为什么要使用资料架? 数据+理解一个python软件包,可帮助用户(尤其是数据科学家,机器学习工程师和分析师)更好地理解DATA。 提供有关给定数据的快速见解。 安装 在终端上运行以下命令以安装软件包: pip install datastand 用法 : 代码: from DataStand . DataStand import DataStand import pandas as pd df = pd . read_csv ( "path/to/target/datafram
  3. 所属分类:其它

    • 发布日期:2021-03-06
    • 文件大小:528kb
    • 提供者:weixin_42136477
  1. pandas-tutorial:适合初级到中级晋升者,有了体系之后就看熟练度了-源码

  2. 教程目录 0. 配置环境 1. Series和DataFrame对象的创建 2. Series和DataFrame对象的查、改、增、删 3. merge详解 4. Index对象的创建,查、改、增、删和使用 5. 普通列和行index的相互转化 6. 数据结构总览 7. 显示控制 8. 快速查看整体信息 9. 数值运算 10. 数值统计运算 11. mask与比较运算(待完成) 12. Cat
  3. 所属分类:其它

    • 发布日期:2021-03-03
    • 文件大小:188kb
    • 提供者:weixin_42166626
  1. DataFrame:用于统计,财务和ML分析的C ++ DataFrame-在现代C ++中使用本机类型,连续内存存储且不涉及指针-源码

  2. 数据框 这是一个C ++统计库,提供类似于Python中的Pandas包的接口。 一个DataFrame可以具有一个索引列和许多内置或用户定义类型的数据列。 您可以采用许多不同的方式对数据进行切片。 您可以加入,合并,分组数据。 您可以对数据运行各种统计,摘要和ML算法。 您可以轻松添加自定义算法。 您可以进行多列排序,自定义选择和删除数据。 和更多 … DataFrame还以访问者的形式包含了大量的分析例程-请参阅下面的。 这些从基本统计数据(例如均值,标准偏差,返回等)到更复杂的分析(如亲和
  3. 所属分类:其它

  1. pandas数据框,统计某列数据对应的个数方法

  2. 现在要解决的问题如下: 我们有一个数据的表 第7列有许多数字,并且是用逗号分隔的,数字又有一个对应的关系: 我们要得到第7列对应关系的统计,就是每一行的第7列a有多少个,b有多少个 好了,我给的解决方法如下: #!/bin/python #-*-coding:UTF-8-*- import pandas as pd import numpy as np dfidspec = pd.read_table(one.txt)#这个是对应关系的文件 dfmgs = pd.read_table(tw
  3. 所属分类:其它

    • 发布日期:2021-01-20
    • 文件大小:96kb
    • 提供者:weixin_38741996
« 12 »