首先新建一个dataframe:
In[8]: df = pd.DataFrame({'name':list('ABCDA'),'house':[1,1,2,3,3],'date':['2010-01-01','2010-06-09','2011-12-03','2011-04-05','2012-03-23']})
In[9]: df
Out[9]:
date house name
0 2010-01-01 1 A
1 2010-06-09 1 B
2 2011-12-03 2
pandas中有时需要按行依次对.csv文件读取内容,那么如何进行呢?
我们来完整操作一遍,假设我们已经有了一个.csv文件。
# 1.导入包
import pandas as pd
# 2读入数据
readFile = pd.read_csv('输出路径',encoding='gb2312')
for record in readFile.values:
print(record)
至此就完成了整个过程
如果有Nan怎么处理呢?
我们可以在readFile后面加入以下内容:
rea
如下所示:
群里一朋友发了一个如上图的问题,解决方法如下
data = {'a':[1,1,1,1,1,1,1,1,2,2,2,2,2,2,2,2,2],'b':[1,2,3,4,5,8,9,10,1,2,3,6,7,8,9,12,13]}
df = pd.DataFrame(data)
for name,group in df.groupby('a'):
group['c'] = ((group['b'].shift(1).fillna(0) + 1).astype(int) != gr
约定:
import pandas as pd
import numpy as np
from numpy import nan as NaN
填充缺失数据
fillna()是最主要的处理方式了。
df1=pd.DataFrame([[1,2,3],[NaN,NaN,2],[NaN,NaN,NaN],[8,8,NaN]])
df1
代码结果:
0
1
2
0
1.0
2.0
3.0
1
NaN
NaN
2.0
2
NaN
NaN
NaN
3
8.0
8.0
N
昨天,我们学习了pandas中的dropna方法,今天,学习一下fillna方法。该方法的主要作用是实现对NaN值的填充功能。该方法主要有3个参数,分别是:value,method,limit等。其余参数可以通过调用help函数获取信息。
(1)value
该参数主要是确定填充数值
>>> df = pd.read_excel(r'D:/myExcel/1.xlsx')
>>> df
name Chinese Chinese.1 id
0 bob