导入数据
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
plt.rcParams['font.sans-serif']=['SimHei']
plt.rcParams['axes.unicode_minus']=False
data = pd.read_excel("data/attacks.xlsx")
data.head(5)
不管是分析什么数据,首先都要将其数据导入进来,才会有后续的问题分析
点赞、关注再看,养成良好习惯
Life is short, U need Python
初学Python,快来点我吧
1. 概述
首先对数据缺失的原因、类型以及处理方法做一个简单地总结,如下图所示:
2. 直接删除法
当缺失值的个数只占整体很小一部分的时候,可直接删除缺失值(行)。但是如果缺失值占比比较大,这种直接删除缺失值的处理方法就会丢失重要信息。
直接删除法处理缺失值时,需要检测样本总体中缺失值的个数。Python中统计缺失值的方法如下(下面结合具体数据集,直接上代码):
impor
在写 Python 项目的时候,我们可能经常会遇到导入模块失败的错误:ImportError: No module named ‘xxx’ 或者 ModuleNotFoundError: No module named ‘xxx’ 。
导入失败问题,通常分为两种:一种是导入自己写的模块(即以 .py 为后缀的文件),另一种是导入三方库。本文主要讨论第二种情况,今后有机会,我们再详细讨论其它的相关话题。
解决导入 Python 库失败的问题,其实关键是在运行环境中装上缺失的库(注意是否是虚拟环境)