如何在熊猫数据框架的一列中用零替换NaN值?

我有一个熊猫数据框架如下:

      itm Date                  Amount 
67    420 2012-09-30 00:00:00   65211
68    421 2012-09-09 00:00:00   29424
69    421 2012-09-16 00:00:00   29877
70    421 2012-09-23 00:00:00   30990
71    421 2012-09-30 00:00:00   61303
72    485 2012-09-09 00:00:00   71781
73    485 2012-09-16 00:00:00     NaN
74    485 2012-09-23 00:00:00   11072
75    485 2012-09-30 00:00:00  113702
76    489 2012-09-09 00:00:00   64731
77    489 2012-09-16 00:00:00     NaN

当我尝试应用一个函数到金额列，我得到以下错误:

ValueError: cannot convert float NaN to integer

我尝试使用数学模块中的.isnan应用一个函数我已经尝试了pandas .replace属性我尝试了pandas 0.9中的.sparse data属性我还尝试了在函数中if NaN == NaN语句。我也看了这篇文章我如何替换NA值与零在一个R数据框架?同时看一些其他的文章。我尝试过的所有方法都不起作用或不能识别NaN。任何提示或解决方案将不胜感激。

当前回答

主要有两种选择;在输入或填充缺失值NaN / np时。只有数值替换的Nan(跨列):

df(“金额”)。fillna(value=None, method=，axis=1，)是足够的:

来自文档:

取值:scalar、dict、Series或DataFrame 值用于填充孔(例如0)，交替使用a dict/Series/DataFrame的值，指定用于哪个值每个索引(对于Series)或列(对于DataFrame)。(值不在dict/Series/DataFrame中将不会被填充)。此值不能列个清单。

这意味着'字符串'或'常量'不再允许被赋值。

对于更专门的imputer，使用SimpleImputer():

from sklearn.impute import SimpleImputer
si = SimpleImputer(strategy='constant', missing_values=np.nan, fill_value='Replacement_Value')
df[['Col-1', 'Col-2']] = si.fit_transform(X=df[['C-1', 'C-2']])

2019-07-23 13:36:14

其他回答

将所有nan替换为0

df = df.fillna(0)

2021-03-01 14:22:54

这对我有用，但没人提过。会有什么问题吗?

df.loc[df['column_name'].isnull(), 'column_name'] = 0

2021-03-31 03:24:29

主要有两种选择;在输入或填充缺失值NaN / np时。只有数值替换的Nan(跨列):

df(“金额”)。fillna(value=None, method=，axis=1，)是足够的:

来自文档:

这意味着'字符串'或'常量'不再允许被赋值。

对于更专门的imputer，使用SimpleImputer():

from sklearn.impute import SimpleImputer
si = SimpleImputer(strategy='constant', missing_values=np.nan, fill_value='Replacement_Value')
df[['Col-1', 'Col-2']] = si.fit_transform(X=df[['C-1', 'C-2']])

2019-07-23 13:36:14

如果你想为一个特定的列填充NaN，你可以使用loc:

d1 = {"Col1" : ['A', 'B', 'C'],
     "fruits": ['Avocado', 'Banana', 'NaN']}
d1= pd.DataFrame(d1)

output:

Col1    fruits
0   A   Avocado
1   B   Banana
2   C   NaN


d1.loc[ d1.Col1=='C', 'fruits' ] =  'Carrot'


output:

Col1    fruits
0   A   Avocado
1   B   Banana
2   C   Carrot

2020-11-07 19:03:05

我相信DataFrame.fillna()将为您完成此工作。

链接到文档的数据框架和系列。

例子:

In [7]: df
Out[7]: 
          0         1
0       NaN       NaN
1 -0.494375  0.570994
2       NaN       NaN
3  1.876360 -0.229738
4       NaN       NaN

In [8]: df.fillna(0)
Out[8]: 
          0         1
0  0.000000  0.000000
1 -0.494375  0.570994
2  0.000000  0.000000
3  1.876360 -0.229738
4  0.000000  0.000000

若要仅在一列中填充nan，请仅选择该列。在这种情况下，我使用inplace=True来实际改变df的内容。

In [12]: df[1].fillna(0, inplace=True)
Out[12]: 
0    0.000000
1    0.570994
2    0.000000
3   -0.229738
4    0.000000
Name: 1

In [13]: df
Out[13]: 
          0         1
0       NaN  0.000000
1 -0.494375  0.570994
2       NaN  0.000000
3  1.876360 -0.229738
4       NaN  0.000000

编辑:

为了避免SettingWithCopyWarning，使用内置的列特定功能:

df.fillna({1:0}, inplace=True)

2012-11-08 18:54:27

如何在熊猫数据框架的一列中用零替换NaN值?

推荐文章

最新文章

标签