如何删除熊猫数据帧的最后一行数据

我认为这应该很简单，但我尝试了一些想法，但没有一个奏效:

last_row = len(DF)
DF = DF.drop(DF.index[last_row])  #<-- fail!

我试过使用负号，但这也会导致错误。我肯定还是误解了一些基本的东西。

当前回答

对于具有多索引的更复杂的dataframe(例如“Stock”和“Date”)，并且希望删除每个股票的最后一行，而不仅仅是最后一只股票的最后一行，那么解决方案如下:

# To remove last n rows
df = df.groupby(level='Stock').apply(lambda x: x.head(-1)).reset_index(0, drop=True)

# To remove first n rows
df = df.groupby(level='Stock').apply(lambda x: x.tail(-1)).reset_index(0, drop=True)

由于groupby()向Multi-Index添加了一个额外的级别，我们只需使用reset_index()将其放在末尾。结果df与操作前保持相同类型的Multi-Index。

2020-07-06 08:21:14

其他回答

Drop返回一个新数组，这就是为什么它在og post中阻塞的原因;我有一个类似的要求，重命名一些列标题，并删除了一些行，因为一个格式不正确的csv文件转换为Dataframe，所以在阅读这篇文章后，我使用:

newList = pd.DataFrame(newList)
newList.columns = ['Area', 'Price']
print(newList)
# newList = newList.drop(0)
# newList = newList.drop(len(newList))
newList = newList[1:-1]
print(newList)

它工作得很好，正如你可以看到上面的两条注释掉的行，我尝试了drop.()方法，它工作，但不像使用[n:-n]那样酷和可读，希望能帮助到一些人，谢谢。

2018-12-12 20:23:32

DF。drop((label =None, axis=0, index = last_row)

作为的函数:

DataFrame。drop(label =None, axis=0, index=None, columns=None, level=None, inplace=False, errors='raise')

从行或列中删除指定的标签。

https://pandas.pydata.org/docs/reference/api/pandas.DataFrame.drop.html

2022-10-10 17:38:30

stats = pd.read_csv("C:\\py\\programs\\second pandas\\ex.csv")

统计数据输出:

       A            B          C
0   0.120064    0.785538    0.465853
1   0.431655    0.436866    0.640136
2   0.445904    0.311565    0.934073
3   0.981609    0.695210    0.911697
4   0.008632    0.629269    0.226454
5   0.577577    0.467475    0.510031
6   0.580909    0.232846    0.271254
7   0.696596    0.362825    0.556433
8   0.738912    0.932779    0.029723
9   0.834706    0.002989    0.333436

只需使用skipfooter=1

Skipfooter: int，默认为0 文件底部要跳过的行数

stats_2 = pd.read_csv("C:\\py\\programs\\second pandas\\ex.csv", skipfooter=1, engine='python')

stats_2的输出

       A          B            C
0   0.120064    0.785538    0.465853
1   0.431655    0.436866    0.640136
2   0.445904    0.311565    0.934073
3   0.981609    0.695210    0.911697
4   0.008632    0.629269    0.226454
5   0.577577    0.467475    0.510031
6   0.580909    0.232846    0.271254
7   0.696596    0.362825    0.556433
8   0.738912    0.932779    0.029723

2018-12-31 19:32:48

DF[:-n]

其中n是最后要删除的行数。

删除最后一行:

DF = DF[:-1]

2017-11-27 18:42:03

令人惊讶的是居然没人提这个问题:

# To remove last n rows
df.head(-n)

# To remove first n rows
df.tail(-n)

在1000行的DataFrame上运行速度测试表明，切片和头部/尾部比使用drop快6倍:

>>> %timeit df[:-1]
125 µs ± 132 ns per loop (mean ± std. dev. of 7 runs, 10000 loops each)

>>> %timeit df.head(-1)
129 µs ± 1.18 µs per loop (mean ± std. dev. of 7 runs, 10000 loops each)

>>> %timeit df.drop(df.tail(1).index)
751 µs ± 20.4 µs per loop (mean ± std. dev. of 7 runs, 1000 loops each)

2019-08-27 19:36:01

如何删除熊猫数据帧的最后一行数据

推荐文章

最新文章

标签