根据日期过滤Pandas数据框架

我有一个熊猫DataFrame与“日期”列。现在我需要过滤掉DataFrame中日期在未来两个月之外的所有行。实际上，我只需要保留接下来两个月内的行。

实现这一目标的最佳方式是什么?

当前回答

你可以通过这样做来选择时间范围:df.loc['start_date':'end_date']

2020-06-12 09:51:16

其他回答

如果您的datetime列具有Pandas datetime类型(例如datetime64[ns])，为了进行适当的过滤，您需要pd。时间戳对象，例如:

from datetime import date

import pandas as pd

value_to_check = pd.Timestamp(date.today().year, 1, 1)
filter_mask = df['date_column'] < value_to_check
filtered_df = df[filter_mask]

2018-06-18 00:38:24

根据我的经验，前面的答案是不正确的，你不能传递一个简单的字符串，需要一个datetime对象。所以:

import datetime 
df.loc[datetime.date(year=2014,month=1,day=1):datetime.date(year=2014,month=2,day=1)]

2016-02-04 14:29:12

# 60 days from today
after_60d = pd.to_datetime('today').date() + datetime.timedelta(days=60)
# filter date col less than 60 days date
df[df['date_col'] < after_60d]

2022-03-16 11:15:24

我还不允许写评论，所以我会写一个答案，如果有人读了所有的评论，并找到了这个。

如果数据集的索引是一个日期时间，并且您想仅通过(例如)月份过滤它，您可以执行以下操作:

df.loc[df.index.month == 3]

它将在3月份为您过滤数据集。

2020-04-23 08:22:32

如果您已经使用pd将字符串转换为日期格式。To_datetime你可以使用:

df = df [(df[日期]>”2018-01-01”)及(df[日期]<”2019-07-01”)

2020-07-21 19:06:47

根据日期过滤Pandas数据框架

推荐文章

最新文章

标签