这似乎相当明显,但我似乎无法弄清楚如何将数据帧的索引转换为列?

例如:

df=
        gi       ptt_loc
 0  384444683      593  
 1  384444684      594 
 2  384444686      596  

To,

df=
    index1    gi       ptt_loc
 0  0     384444683      593  
 1  1     384444684      594 
 2  2     384444686      596  

当前回答

在最新版本的pandas 1.5.0中,您可以使用函数reset_index和新的参数names来指定您想要给出索引列的名称列表。下面是一个具有一个索引列的可重复示例:

import pandas as pd

df = pd.DataFrame({"gi":[232,66,34,43],"ptt":[342,56,662,123]})

    gi  ptt
0  232  342
1   66   56
2   34  662
3   43  123

df.reset_index(names=['new'])

输出:

   new   gi  ptt
0    0  232  342
1    1   66   56
2    2   34  662
3    3   43  123

这也可以很容易地应用于MultiIndex。把你想要的名字列一个清单。

其他回答

对于MultiIndex,您可以使用

df['si_name'] = R.index.get_level_values('si_name') 

其中si_name是子索引的名称。

这应该做的技巧(如果不是多级索引)-

df.reset_index().rename({'index':'index1'}, axis = 'columns')

当然,如果你不想将它赋值给rename函数参数中的一个新变量,你总是可以设置inplace = True。

我通常是这样做的:

df = df.assign(index1=df.index)

在最新版本的pandas 1.5.0中,您可以使用函数reset_index和新的参数names来指定您想要给出索引列的名称列表。下面是一个具有一个索引列的可重复示例:

import pandas as pd

df = pd.DataFrame({"gi":[232,66,34,43],"ptt":[342,56,662,123]})

    gi  ptt
0  232  342
1   66   56
2   34  662
3   43  123

df.reset_index(names=['new'])

输出:

   new   gi  ptt
0    0  232  342
1    1   66   56
2    2   34  662
3    3   43  123

这也可以很容易地应用于MultiIndex。把你想要的名字列一个清单。

如果你想使用reset_index方法,同时保留你现有的索引,你应该使用:

df.reset_index().set_index('index', drop=False)

或者就地改变:

df.reset_index(inplace=True)
df.set_index('index', drop=False, inplace=True)

例如:

print(df)
          gi  ptt_loc
0  384444683      593
4  384444684      594
9  384444686      596

print(df.reset_index())
   index         gi  ptt_loc
0      0  384444683      593
1      4  384444684      594
2      9  384444686      596

print(df.reset_index().set_index('index', drop=False))
       index         gi  ptt_loc
index
0          0  384444683      593
4          4  384444684      594
9          9  384444686      596

如果你想去掉索引标签,你可以这样做:

df2 = df.reset_index().set_index('index', drop=False)
df2.index.name = None
print(df2)
   index         gi  ptt_loc
0      0  384444683      593
4      4  384444684      594
9      9  384444686      596