为另一列的每个不同值获取某列的Max值的行

表:

UserId, Value, Date.

我想获得UserId，为每个UserId的最大值(日期)的值。也就是说，具有最新日期的每个UserId的值。有没有一种方法可以在SQL中简单地做到这一点?(最好是Oracle)

更新:为任何歧义道歉:我需要得到所有的用户id。但是对于每个UserId，只有该用户拥有最新日期的行。

当前回答

select   UserId,max(Date) over (partition by UserId) value from users;

2013-04-21 02:36:36

其他回答

这也会处理重复的数据(为每个user_id返回一行):

SELECT *
FROM (
  SELECT u.*, FIRST_VALUE(u.rowid) OVER(PARTITION BY u.user_id ORDER BY u.date DESC) AS last_rowid
  FROM users u
) u2
WHERE u2.rowid = u2.last_rowid

2010-02-24 17:07:28

我看到许多人使用子查询或其他窗口函数来执行此操作，但我经常以以下方式执行这种不带子查询的查询。它使用普通的标准SQL，因此它应该适用于任何品牌的RDBMS。

SELECT t1.*
FROM mytable t1
  LEFT OUTER JOIN mytable t2
    ON (t1.UserId = t2.UserId AND t1."Date" < t2."Date")
WHERE t2.UserId IS NULL;

换句话说:从t1中获取没有其他具有相同UserId和更大Date的行。

(我把标识符“Date”放在分隔符中，因为它是一个SQL保留字。)

如果是t1。Date = t2。“日期”，加倍出现。通常表有auto_inc(seq)键，例如id。为避免加倍可采用以下方法:

SELECT t1.*
FROM mytable t1
  LEFT OUTER JOIN mytable t2
    ON t1.UserId = t2.UserId AND ((t1."Date" < t2."Date") 
         OR (t1."Date" = t2."Date" AND t1.id < t2.id))
WHERE t2.UserId IS NULL;

关于@Farhan的评论:

下面是更详细的解释:

外部连接尝试连接t1和t2。默认情况下，将返回t1的所有结果，如果t2中有匹配，也将返回。如果t2中t1的给定行没有匹配，那么查询仍然返回t1的行，并对t2的所有列使用NULL作为占位符。这就是外层连接的工作原理。

此查询中的技巧是设计联接的匹配条件，使t2必须匹配相同的用户id和更大的日期。它的意思是，如果t2中存在一个日期更大的行，那么t1中与它比较的行就不能是该userid的最大日期。但是如果没有匹配——也就是说，如果t2中不存在比t1中的行日期大的行——我们就知道t1中的行是给定userid中日期最大的行。

在这些情况下(当没有匹配时)，t2的列将为NULL——即使是连接条件中指定的列。这就是为什么我们用WHERE t2。UserId IS NULL，因为我们正在搜索没有为给定的UserId找到日期更大的行的情况。

2008-09-23 20:01:21

SELECT userid, MAX(value) KEEP (DENSE_RANK FIRST ORDER BY date DESC)
  FROM table
  GROUP BY userid

2008-09-23 15:18:24

我想是这样的。(请原谅我的语法错误;在这一点上，我习惯使用HQL !)

编辑:也误解了问题!修正了查询…

SELECT UserId, Value
FROM Users AS user
WHERE Date = (
    SELECT MAX(Date)
    FROM Users AS maxtest
    WHERE maxtest.UserId = user.UserId
)

2008-09-23 14:36:59

我没有Oracle来测试它，但最有效的解决方案是使用分析查询。它应该看起来像这样:

SELECT DISTINCT
    UserId
  , MaxValue
FROM (
    SELECT UserId
      , FIRST (Value) Over (
          PARTITION BY UserId
          ORDER BY Date DESC
        ) MaxValue
    FROM SomeTable
  )

我怀疑您可以摆脱外部查询，并在内部放置distinct，但我不确定。与此同时，我知道这招管用。

如果您想了解分析查询，我建议您阅读http://www.orafaq.com/node/55和http://www.akadia.com/services/ora_analytic_functions.html。这是一个简短的总结。

在底层，分析查询对整个数据集进行排序，然后按顺序进行处理。当你处理它的时候，你根据特定的标准对数据集进行分区，然后对每一行查看一些窗口(默认为当前行分区中的第一个值-默认也是最有效的)，并可以使用许多分析函数(其列表非常类似于聚合函数)计算值。

在本例中，下面是内部查询的功能。整个数据集先按UserId排序，再按Date DESC排序，然后一次处理。对于每一行，您返回UserId和该UserId看到的第一个日期(因为日期是按DESC排序的，所以这是最大日期)。这就得到了重复行的答案。然后外部的DISTINCT压缩重复项。

这并不是一个特别引人注目的分析查询示例。如果想获得更大的胜利，可以考虑制作一张财务收据表格，计算每个用户和收据的总花费。分析查询可以有效地解决这个问题。其他解决方案效率较低。这就是为什么它们是2003 SQL标准的一部分。(不幸的是Postgres还没有。叽阿…)

2008-09-23 15:47:54

为另一列的每个不同值获取某列的Max值的行

推荐文章

最新文章

标签