一、dataframe计算某数值、空值的个数
1、空值统计
df = pd.DataFrame({'A': ['a0', 'a1', 'a2', 'a3'],
'B': ['b0', 'b1', 'b2', 'b3'],
'C': ['x0', 'x1', 'x1', 'x2'],
'D': ['y1', 'y2', 'y3', 'y4']
})
print(df)
print(df.isnull().sum(axis=0)) # 所有行的空值
print(df.isnull().sum(axis=1)) # 所有列的空值
print(df.info()) # 所有列的空值
return:
A B C D
0 a0 b0 x0 y1
1 a1 b1 x1 y2
2 None b2 x1 y3
3 a3 b3 x2 y4
所有行的空值数:
A 1
B 0
C 0
D 0
dtype: int64
所有列的空值数:
0 0
1 0
2 1
3 0
dtype: int64
行是否有空值:
A True
B False
C False
D False
dtype: bool
列是否有空值:
0 False
1 False
2 True
3 False
dtype: bool
2、计算某列的空值个数
print(df['A'].isnull().sum())
return:
1
3、统计各元素或某元素出现次数
df['A'].value_counts()
return:
a1 1
a3 1
a0 1
print(df[df == 'x0'].count())
return:
A 0
B 0
C 1
D 0