需要把一个从csv文件里读取来的数据集等距抽样分割,这里用到了列表表达式和dataframe.iloc
先生成索引列表:
index_list = ['%d' %i for i in range(df.shape[0]) if i % 3 == 0]
在dataframe中选取
sample_df = df.iloc[index_list]
合起来
sample_df = df.iloc[['%d' %i for i in range(df.shape[0]) if i % 3 == 0]
pandas中有时需要按行依次对.csv文件读取内容,那么如何进行呢?
我们来完整操作一遍,假设我们已经有了一个.csv文件。
# 1.导入包
import pandas as pd
# 2读入数据
readFile = pd.read_csv('输出路径',encoding='gb2312')
for record in readFile.values:
print(record)
至此就完成了整个过程
如果有Nan怎么处理呢?
我们可以在readFile后面加入以下内容:
rea