在Pandas数据帧中选择多个列

如何从df中选择列a和b，并将它们保存到新的数据帧df1中？

index  a   b   c
1      2   3   4
2      3   4   5

尝试失败：

df1 = df['a':'b']
df1 = df.ix[:, 'a':'b']

当前回答

我认为这是实现目标的最简单方法。

熊猫作为pd进口列=[a'，'b']df1=pd.DataFrame（df，columns=cols）df1=df.iloc[：，0:2]

2022-06-03 20:33:55

其他回答

若要排除某些列，可以将它们放在列索引中。例如：

   A   B    C     D
0  1  10  100  1000
1  2  20  200  2000

选择除两个以外的所有选项：

df[df.columns.drop(['B', 'D'])]

输出：

   A    C
0  1  100
1  2  200

也可以使用truncate方法选择中间列：

df.truncate(before='B', after='C', axis=1)

输出：

    B    C
0  10  100
1  20  200

2021-05-04 08:19:45

一种不同且简单的方法：迭代行

使用迭代

 df1 = pd.DataFrame() # Creating an empty dataframe
 for index,i in df.iterrows():
    df1.loc[index, 'A'] = df.loc[index, 'A']
    df1.loc[index, 'B'] = df.loc[index, 'B']
    df1.head()

2018-10-15 11:43:43

从0.21.0开始，在列表中使用.loc或[]（其中包含一个或多个缺失的标签）是不推荐使用.reindex的。因此，问题的答案是：

df1 = df.reindex(columns=['b','c'])

在以前的版本中，只要找到至少一个键，就可以使用.loc〔标签列表〕（否则会引发KeyError）。此行为已弃用，现在显示警告消息。建议使用.reindex（）。

阅读更多关于索引和选择数据的信息。

2018-08-15 18:13:41

In [39]: df
Out[39]: 
   index  a  b  c
0      1  2  3  4
1      2  3  4  5

In [40]: df1 = df[['b', 'c']]

In [41]: df1
Out[41]: 
   b  c
0  3  4
1  4  5

2012-07-08 17:55:12

您可以使用pandas.DataFrame.filter方法对列进行筛选或重新排序，如下所示：

df1 = df.filter(['a', 'b'])

这在链接方法时也非常有用。

2020-04-21 03:03:00

在Pandas数据帧中选择多个列

推荐文章

最新文章

标签