在Pandas数据帧中选择多个列

如何从df中选择列a和b，并将它们保存到新的数据帧df1中？

index  a   b   c
1      2   3   4
2      3   4   5

尝试失败：

df1 = df['a':'b']
df1 = df.ix[:, 'a':'b']

当前回答

df[['a', 'b']]  # Select all rows of 'a' and 'b'column 
df.loc[0:10, ['a', 'b']]  # Index 0 to 10 select column 'a' and 'b'
df.loc[0:10, 'a':'b']  # Index 0 to 10 select column 'a' to 'b'
df.iloc[0:10, 3:5]  # Index 0 to 10 and column 3 to 5
df.iloc[3, 3:5]  # Index 3 of column 3 to 5

2020-05-19 08:18:08

其他回答

一种不同且简单的方法：迭代行

使用迭代

 df1 = pd.DataFrame() # Creating an empty dataframe
 for index,i in df.iterrows():
    df1.loc[index, 'A'] = df.loc[index, 'A']
    df1.loc[index, 'B'] = df.loc[index, 'B']
    df1.head()

2018-10-15 11:43:43

要选择多个列，请提取并查看它们：df是先前命名的数据帧。然后创建一个新的数据帧df1，并选择要提取和查看的列a到D。

df1 = pd.DataFrame(data_frame, columns=['Column A', 'Column B', 'Column C', 'Column D'])
df1

将显示所有必需的列！

2020-10-11 10:40:52

前面的答案中讨论的不同方法基于这样的假设：用户知道要删除或子集的列索引，或者用户希望使用一系列列（例如“C”和“E”之间）来子集数据帧。

pandas.DataFrame.drop（）当然是一个基于用户定义的列列表对数据进行子集的选项（尽管您必须谨慎地始终使用数据帧的副本，并且不应将就地参数设置为True！！）

另一个选项是使用pandas.columns.difference（），它对列名进行设置差异，并返回包含所需列的数组的索引类型。以下是解决方案：

df = pd.DataFrame([[2,3,4], [3,4,5]], columns=['a','b','c'], index=[1,2])
columns_for_differencing = ['a']
df1 = df.copy()[df.columns.difference(columns_for_differencing)]
print(df1)

输出将是：

    b   c
1   3   4
2   4   5

2018-07-21 21:28:41

def get_slize(dataframe, start_row, end_row, start_col, end_col):
    assert len(dataframe) > end_row and start_row >= 0
    assert len(dataframe.columns) > end_col and start_col >= 0
    list_of_indexes = list(dataframe.columns)[start_col:end_col]
    ans = dataframe.iloc[start_row:end_row][list_of_indexes]
    return ans

只需使用此功能

2021-05-02 21:20:23

您可以使用pandas.DataFrame.filter方法对列进行筛选或重新排序，如下所示：

df1 = df.filter(['a', 'b'])

这在链接方法时也非常有用。

2020-04-21 03:03:00

在Pandas数据帧中选择多个列

推荐文章

最新文章

标签