如何添加一个空列到一个数据框架?

向pandas DataFrame对象添加空列的最简单方法是什么?我碰到的最好的是

df['foo'] = df.apply(lambda _: '', axis=1)

有没有更合理的方法?

当前回答

df["C"] = ""
df["D"] = np.nan

赋值会给你这个警告SettingWithCopyWarning:

一个值正试图从数据帧(DataFrame)中设置一个片的副本。试一试使用.loc[row_indexer,col_indexer] = value代替

所以最好使用insert:

df.insert(index, column-name, column-value)

2022-06-17 07:51:07

其他回答

我喜欢:

df['new'] = pd.Series(dtype='int')

# or use other dtypes like 'float', 'object', ...

如果您有一个空的数据框架，这个解决方案确保没有只包含NaN的新行被添加。

指定dtype并不是必须的，但是如果没有指定dtype，更新的Pandas版本会产生DeprecationWarning。

2019-07-31 14:59:14

如果我理解正确，assignment应该填写:

>>> import numpy as np
>>> import pandas as pd
>>> df = pd.DataFrame({"A": [1,2,3], "B": [2,3,4]})
>>> df
   A  B
0  1  2
1  2  3
2  3  4
>>> df["C"] = ""
>>> df["D"] = np.nan
>>> df
   A  B C   D
0  1  2   NaN
1  2  3   NaN
2  3  4   NaN

2013-05-01 21:52:57

为了补充DSM的答案，并在这个相关问题的基础上，我将这种方法分为两种情况:

添加单列:只需为新列分配空值，例如df['C'] = np.nan 添加多个列:我建议使用pandas的.reindex(columns=[…])方法将新列添加到数据帧的列索引中。这也适用于使用.reindex(rows=[…])添加多个新行。注意，更新版本的Pandas (v>0.20)允许您指定axis关键字，而不是显式地分配给列或行。

下面是一个添加多列的例子:

mydf = mydf.reindex(columns = mydf.columns.tolist() + ['newcol1','newcol2'])

mydf = mydf.reindex(mydf.columns.tolist() + ['newcol1','newcol2'], axis=1)  # version > 0.20.0

你也可以总是连接一个新的(空的)数据框架到现有的数据框架，但这对我来说不像python式的:)

2016-09-09 06:56:47

我寻找这样一个解决方案的原因只是在多个df之间添加空格，这些df已经使用pd按列连接。Concat函数，然后使用xlsxwriter写入excel。

df[' ']=df.apply(lambda _: '', axis=1)
df_2 = pd.concat([df,df1],axis=1)                #worked but only once. 
# Note: df & df1 have the same rows which is my index. 
#
df_2[' ']=df_2.apply(lambda _: '', axis=1)       #didn't work this time !!?     
df_4 = pd.concat([df_2,df_3],axis=1)

然后将第二个lambda调用替换为

df_2['']=''                                 #which appears to add a blank column
df_4 = pd.concat([df_2,df_3],axis=1)

我测试的输出是使用xlsxwriter到excel。 Jupyter空白列看起来和excel一样，虽然没有xlsx格式。不知道为什么第二个Lambda调用没有工作。

2021-02-16 19:08:24

从v0.16.0开始，可以使用DF.assign()将新列(单个/多个)分配给DF。这些列按字母顺序插入DF的末尾。

当你想直接对返回的数据帧执行一系列链式操作时，这比简单的赋值更有优势。

考虑@DSM演示的相同DF示例:

df = pd.DataFrame({"A": [1,2,3], "B": [2,3,4]})
df
Out[18]:
   A  B
0  1  2
1  2  3
2  3  4

df.assign(C="",D=np.nan)
Out[21]:
   A  B C   D
0  1  2   NaN
1  2  3   NaN
2  3  4   NaN

请注意，这将返回一个副本，其中包含所有以前的列以及新创建的列。为了对原始DF进行相应的修改，可以这样使用:DF = DF .assign(…)，因为它目前不支持就地操作。

2017-01-31 08:53:31

如何添加一个空列到一个数据框架?

推荐文章

最新文章

标签