如何添加一个空列到一个数据框架?

向pandas DataFrame对象添加空列的最简单方法是什么?我碰到的最好的是

df['foo'] = df.apply(lambda _: '', axis=1)

有没有更合理的方法?

当前回答

很抱歉我一开始没有解释清楚我的答案。还有另一种方法可以将新列添加到现有数据框架中。第一步，创建一个新的空数据帧(包含数据帧中的所有列，加上您想添加的新列或少数列)，称为df_temp 第二步，结合df_temp和你的数据帧。

df_temp = pd.DataFrame(columns=(df_null.columns.tolist() + ['empty']))
df = pd.concat([df_temp, df])

这可能是最好的解决方案，但这是思考这个问题的另一种方式。

我使用这种方法的原因是因为我总是得到这样的警告:

: SettingWithCopyWarning: 
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  df["empty1"], df["empty2"] = [np.nan, ""]

太好了，我找到了禁用警告的方法

pd.options.mode.chained_assignment = None

2020-08-09 02:56:22

其他回答

从v0.16.0开始，可以使用DF.assign()将新列(单个/多个)分配给DF。这些列按字母顺序插入DF的末尾。

当你想直接对返回的数据帧执行一系列链式操作时，这比简单的赋值更有优势。

考虑@DSM演示的相同DF示例:

df = pd.DataFrame({"A": [1,2,3], "B": [2,3,4]})
df
Out[18]:
   A  B
0  1  2
1  2  3
2  3  4

df.assign(C="",D=np.nan)
Out[21]:
   A  B C   D
0  1  2   NaN
1  2  3   NaN
2  3  4   NaN

请注意，这将返回一个副本，其中包含所有以前的列以及新创建的列。为了对原始DF进行相应的修改，可以这样使用:DF = DF .assign(…)，因为它目前不支持就地操作。

2017-01-31 08:53:31

我喜欢:

df['new'] = pd.Series(dtype='int')

# or use other dtypes like 'float', 'object', ...

如果您有一个空的数据框架，这个解决方案确保没有只包含NaN的新行被添加。

指定dtype并不是必须的，但是如果没有指定dtype，更新的Pandas版本会产生DeprecationWarning。

2019-07-31 14:59:14

一个更简单的解决方案是:

df = df.reindex(columns = header_list)

其中“header_list”是你想要显示的标题列表。

列表中包含的任何标题，如果在数据帧中没有找到，将在下面添加空白单元格。

因此,如果

header_list = ['a','b','c', 'd']

然后将c和d添加为带空白单元格的列

2017-05-16 08:08:56

如果我理解正确，assignment应该填写:

>>> import numpy as np
>>> import pandas as pd
>>> df = pd.DataFrame({"A": [1,2,3], "B": [2,3,4]})
>>> df
   A  B
0  1  2
1  2  3
2  3  4
>>> df["C"] = ""
>>> df["D"] = np.nan
>>> df
   A  B C   D
0  1  2   NaN
1  2  3   NaN
2  3  4   NaN

2013-05-01 21:52:57

下面的代码解决了“如何向现有数据框架中添加n个空列”的问题。为了将类似问题的解决方案保存在一个地方，我在这里添加了它。

方法1(创建64个附加列，列名从1到64)

m = list(range(1,65,1)) 
dd=pd.DataFrame(columns=m)
df.join(dd).replace(np.nan,'') #df is the dataframe that already exists

方法2(创建64个附加列，列名从1到64)

df.reindex(df.columns.tolist() + list(range(1,65,1)), axis=1).replace(np.nan,'')

2019-09-12 11:48:42

如何添加一个空列到一个数据框架?

推荐文章

最新文章

标签