在Pandas中重命名列名

我想从

['$a', '$b', '$c', '$d', '$e']

['a', 'b', 'c', 'd', 'e']

当前回答

df.columns = ['a', 'b', 'c', 'd', 'e']

它将按照您提供的顺序用您提供的名称替换现有名称。

2016-03-22 08:59:12

其他回答

除了已经提供的解决方案之外，您还可以在读取文件时替换所有列。我们可以使用names和header=0来实现这一点。

首先，我们创建一个我们喜欢用作列名的名称列表：

import pandas as pd

ufo_cols = ['city', 'color reported', 'shape reported', 'state', 'time']
ufo.columns = ufo_cols

ufo = pd.read_csv('link to the file you are using', names = ufo_cols, header = 0)

在这种情况下，所有列名都将替换为列表中的名称。

2020-03-08 15:43:28

另一种替换原始列标签的方法是从原始列标签中删除不需要的字符（此处为“$”）。

这可以通过在df.columns上运行for循环并将剥离的列附加到df.column来完成。

相反，我们可以通过使用下面的列表理解在一个语句中巧妙地做到这一点：

df.columns = [col.strip('$') for col in df.columns]

（Python中的strip方法会从字符串的开头和结尾剥离给定的字符。）

2015-11-23 13:56:10

如果您必须处理由提供系统命名的超出您控制范围的列负载，我提出了以下方法，它是一种通用方法和特定替换方法的组合。

首先使用正则表达式从数据帧列名创建一个字典，以便丢弃列名的某些附加部分，然后向字典中添加特定替换项，以命名接收数据库中的核心列。

然后将其一次性应用于数据帧。

dict = dict(zip(df.columns, df.columns.str.replace('(:S$|:C1$|:L$|:D$|\.Serial:L$)', '')))
dict['brand_timeseries:C1'] = 'BTS'
dict['respid:L'] = 'RespID'
dict['country:C1'] = 'CountryID'
dict['pim1:D'] = 'pim_actual'
df.rename(columns=dict, inplace=True)

2017-06-16 08:27:37

我的单线回答是

df.columns=df_new_cols

它是最好的，处理时间为1/3。

timeit比较：

df有七列。我正在尝试更改一些名称。

%timeit df.rename(columns={old_col:new_col for (old_col,new_col) in zip(df_old_cols,df_new_cols)},inplace=True)
214 µs ± 10.1 µs per loop (mean ± std. dev. of 7 runs, 1000 loops each)

%timeit df.rename(columns=dict(zip(df_old_cols,df_new_cols)),inplace=True)
212 µs ± 7.7 µs per loop (mean ± std. dev. of 7 runs, 1000 loops each)

%timeit df.columns = df_new_cols
72.9 µs ± 17.2 µs per loop (mean ± std. dev. of 7 runs, 10000 loops each)

2022-09-06 14:14:07

假设这是您的数据帧。

可以使用两种方法重命名列。

使用dataframe.columns=[#list]df.columns=[‘a’，‘b’，‘c’，‘d’，‘e’]此方法的限制是，如果必须更改一列，则必须传递完整的列列表。此外，此方法不适用于索引标签。例如，如果您通过以下步骤：df.columns=[‘a’、‘b’、‘c’、‘d’]这将引发错误。长度不匹配：预期轴有5个元素，新值有4个元素。另一种方法是Pandasrename（）方法，用于重命名任何索引、列或行df=df.rename（列=｛‘$a‘：‘a‘｝）

同样，您可以更改任何行或列。

2019-08-27 08:30:27

在Pandas中重命名列名

推荐文章

最新文章

标签