如何更改DataFrame列的顺序？

我有以下DataFrame（df）：

import numpy as np
import pandas as pd

df = pd.DataFrame(np.random.rand(10, 5))

我通过分配添加更多列：

df['mean'] = df.mean(1)

如何将列的意思移到前面，即将其设置为第一列，而其他列的顺序保持不变？

当前回答

您可以使用以下名称列表对数据帧列进行重新排序：

df=df.filter（list_of_col_name）

2021-04-13 13:36:15

其他回答

在您的情况下，

df = df.reindex(columns=['mean',0,1,2,3,4])

会做你想做的事。

在我的情况下（一般形式）：

df = df.reindex(columns=sorted(df.columns))
df = df.reindex(columns=(['opened'] + list([a for a in df.columns if a != 'opened']) ))

2016-08-30 21:57:36

只需按所需顺序分配列名：

In [39]: df
Out[39]: 
          0         1         2         3         4  mean
0  0.172742  0.915661  0.043387  0.712833  0.190717     1
1  0.128186  0.424771  0.590779  0.771080  0.617472     1
2  0.125709  0.085894  0.989798  0.829491  0.155563     1
3  0.742578  0.104061  0.299708  0.616751  0.951802     1
4  0.721118  0.528156  0.421360  0.105886  0.322311     1
5  0.900878  0.082047  0.224656  0.195162  0.736652     1
6  0.897832  0.558108  0.318016  0.586563  0.507564     1
7  0.027178  0.375183  0.930248  0.921786  0.337060     1
8  0.763028  0.182905  0.931756  0.110675  0.423398     1
9  0.848996  0.310562  0.140873  0.304561  0.417808     1

In [40]: df = df[['mean', 4,3,2,1]]

现在，“mean”列出现在前面：

In [41]: df
Out[41]: 
   mean         4         3         2         1
0     1  0.190717  0.712833  0.043387  0.915661
1     1  0.617472  0.771080  0.590779  0.424771
2     1  0.155563  0.829491  0.989798  0.085894
3     1  0.951802  0.616751  0.299708  0.104061
4     1  0.322311  0.105886  0.421360  0.528156
5     1  0.736652  0.195162  0.224656  0.082047
6     1  0.507564  0.586563  0.318016  0.558108
7     1  0.337060  0.921786  0.930248  0.375183
8     1  0.423398  0.110675  0.931756  0.182905
9     1  0.417808  0.304561  0.140873  0.310562

2015-04-28 14:19:49

对我来说，一个非常简单的解决方案是在df.columns上使用.rendex：

df = df[df.columns.reindex(['mean', 0, 1, 2, 3, 4])[0]]

2020-05-08 15:42:13

import numpy as np
import pandas as pd
df = pd.DataFrame()
column_names = ['x','y','z','mean']
for col in column_names: 
    df[col] = np.random.randint(0,100, size=10000)

您可以尝试以下解决方案：

解决方案1：

df = df[ ['mean'] + [ col for col in df.columns if col != 'mean' ] ]

解决方案2：

df = df[['mean', 'x', 'y', 'z']]

解决方案3：

col = df.pop("mean")
df = df.insert(0, col.name, col)

解决方案4：

df.set_index(df.columns[-1], inplace=True)
df.reset_index(inplace=True)

解决方案5：

cols = list(df)
cols = [cols[-1]] + cols[:-1]
df = df[cols]

解决方案6：

order = [1,2,3,0] # setting column's order
df = df[[df.columns[i] for i in order]]

时间比较：

解决方案1：

CPU时间：用户1.05 ms，sys:35µs，总计：1.08 ms壁时间：995µs

解决方案2：

CPU时间：用户933µs，系统：0 ns，总计：933µ壁时间：800µs

解决方案3：

CPU时间：用户0 ns，sys:1.35 ms，总计：1.35 ms壁时间：1.08 ms

解决方案4：

CPU时间：用户1.23毫秒，系统：45µs，总计：1.27毫秒壁时间：986µs

解决方案5：

CPU时间：用户1.09 ms，系统：19µs，总计：1.11 ms壁时间：949µs

解决方案6：

CPU时间：用户955µs，系统：34µs，总计：989µs壁时间：859µs

2019-11-09 06:24:12

与上面的答案类似，还有一种方法可以使用deque（）及其rotate（）方法。rotate方法获取列表中的最后一个元素并将其插入开头：

from collections import deque

columns = deque(df.columns.tolist())
columns.rotate()

df = df[columns]

2021-03-26 14:10:47

如何更改DataFrame列的顺序？

推荐文章

最新文章

标签