在Python Pandas中,检查DataFrame是否有一个(或多个)NaN值的最佳方法是什么?
我知道函数pd。isnan,但这将返回每个元素的布尔值的DataFrame。这篇文章也没有完全回答我的问题。
在Python Pandas中,检查DataFrame是否有一个(或多个)NaN值的最佳方法是什么?
我知道函数pd。isnan,但这将返回每个元素的布尔值的DataFrame。这篇文章也没有完全回答我的问题。
当前回答
df.isnull().sum()
这将为您提供DataFrame各列中所有NaN值的计数。
其他回答
加上霍布斯的精彩回答,我对Python和熊猫很陌生,所以如果我错了,请指出来。
要找出哪些行有nan:
nan_rows = df[df.isnull().any(1)]
将执行相同的操作,而不需要通过将any()的轴指定为1来检查'True'是否在行中存在。
另一种方法是dropna,检查长度是否相等:
>>> len(df.dropna()) != len(df)
True
>>>
df.apply(axis=0, func=lambda x : any(pd.isnull(x)))
将检查每一列是否包含Nan。
df.isnull().sum()
这将为您提供DataFrame各列中所有NaN值的计数。
这将只包括至少有一个null/na值的列。
df.isnull().sum()[df.isnull().sum()>0]