如何从熊猫数据框架中删除行列表?

我有一个数据框架df:

>>> df
                  sales  discount  net_sales    cogs
STK_ID RPT_Date                                     
600141 20060331   2.709       NaN      2.709   2.245
       20060630   6.590       NaN      6.590   5.291
       20060930  10.103       NaN     10.103   7.981
       20061231  15.915       NaN     15.915  12.686
       20070331   3.196       NaN      3.196   2.710
       20070630   7.907       NaN      7.907   6.459

然后我想删除具有特定序列号的行，这些序列号在列表中表示，假设这里是[1,2,4]，然后左:

                  sales  discount  net_sales    cogs
STK_ID RPT_Date                                     
600141 20060331   2.709       NaN      2.709   2.245
       20061231  15.915       NaN     15.915  12.686
       20070630   7.907       NaN      7.907   6.459

什么函数可以做到这一点?

当前回答

你也可以传递给DataFrame。删除标签本身(而不是一系列索引标签):

In[17]: df
Out[17]: 
            a         b         c         d         e
one  0.456558 -2.536432  0.216279 -1.305855 -0.121635
two -1.015127 -0.445133  1.867681  2.179392  0.518801

In[18]: df.drop('one')
Out[18]: 
            a         b         c         d         e
two -1.015127 -0.445133  1.867681  2.179392  0.518801

这相当于:

In[19]: df.drop(df.index[[0]])
Out[19]: 
            a         b         c         d         e
two -1.015127 -0.445133  1.867681  2.179392  0.518801

2016-05-08 08:28:42

其他回答

请注意，当您想要执行下拉行时，使用“inplace”命令可能很重要。

df.drop(df.index[[1,3]], inplace=True)

因为您最初的问题没有返回任何东西，所以应该使用这个命令。 http://pandas.pydata.org/pandas-docs/version/0.17.0/generated/pandas.DataFrame.drop.html

2016-01-05 14:28:26

使用DataFrame。删除并传递一系列索引标签:

In [65]: df
Out[65]: 
       one  two
one      1    4
two      2    3
three    3    2
four     4    1
    
    
In [66]: df.drop(index=[1,3])
Out[66]: 
       one  two
one      1    4
three    3    2

2013-02-02 12:11:11

我用了一个更简单的方法——只用了两步。

用不需要的行/数据创建一个数据框架。使用这个不需要的数据帧的索引来删除原始数据帧中的行。

例子: 假设你有一个数据框架df，它有很多列，包括'Age'，它是一个整数。现在让我们假设你想删除所有以'Age'为负数的行。

df_age_negative = df[ df['Age'] < 0 ] # Step 1
df = df.drop(df_age_negative.index, axis=0) # Step 2

希望这是更简单的，并帮助你。

2017-12-28 07:05:12

如果DataFrame很大，并且要删除的行数也很大，那么通过索引df.drop(df.index[])简单地删除会花费太多时间。

在我的情况下，我有一个多索引的DataFrame的浮动100M行x 3 cols，我需要从它删除10k行。我发现的最快的方法是，完全违反直觉的，取剩下的行。

设indexes_to_drop为要删除的位置索引数组(问题中的[1,2,4])。

indexes_to_keep = set(range(df.shape[0])) - set(indexes_to_drop)
df_sliced = df.take(list(indexes_to_keep))

在我的例子中，这需要20.5秒，而简单的df。掉落花了5分钟27秒，消耗了大量内存。结果的数据帧是相同的。

2017-04-15 01:57:42

如上所述，从布尔值中确定索引。

df[df['column'].isin(values)].index

是否比使用此方法确定索引更占用内存

pd.Index(np.where(df['column'].isin(values))[0])

像这样应用

df.drop(pd.Index(np.where(df['column'].isin(values))[0]), inplace = True)

这种方法在处理大数据帧和有限内存时非常有用。

2019-04-17 05:42:10

如何从熊猫数据框架中删除行列表?

推荐文章

最新文章

标签