为另一列的每个不同值获取某列的Max值的行

我没有Oracle来测试它，但最有效的解决方案是使用分析查询。它应该看起来像这样:

SELECT DISTINCT
    UserId
  , MaxValue
FROM (
    SELECT UserId
      , FIRST (Value) Over (
          PARTITION BY UserId
          ORDER BY Date DESC
        ) MaxValue
    FROM SomeTable
  )

我怀疑您可以摆脱外部查询，并在内部放置distinct，但我不确定。与此同时，我知道这招管用。

如果您想了解分析查询，我建议您阅读http://www.orafaq.com/node/55和http://www.akadia.com/services/ora_analytic_functions.html。这是一个简短的总结。

在底层，分析查询对整个数据集进行排序，然后按顺序进行处理。当你处理它的时候，你根据特定的标准对数据集进行分区，然后对每一行查看一些窗口(默认为当前行分区中的第一个值-默认也是最有效的)，并可以使用许多分析函数(其列表非常类似于聚合函数)计算值。

在本例中，下面是内部查询的功能。整个数据集先按UserId排序，再按Date DESC排序，然后一次处理。对于每一行，您返回UserId和该UserId看到的第一个日期(因为日期是按DESC排序的，所以这是最大日期)。这就得到了重复行的答案。然后外部的DISTINCT压缩重复项。

这并不是一个特别引人注目的分析查询示例。如果想获得更大的胜利，可以考虑制作一张财务收据表格，计算每个用户和收据的总花费。分析查询可以有效地解决这个问题。其他解决方案效率较低。这就是为什么它们是2003 SQL标准的一部分。(不幸的是Postgres还没有。叽阿…)

2008-09-23 15:47:54

在PostgreSQL 8.4或更高版本中，你可以这样使用:

select user_id, user_value_1, user_value_2
  from (select user_id, user_value_1, user_value_2, row_number()
          over (partition by user_id order by user_date desc) 
        from users) as r
  where r.row_number=1

2011-11-01 13:22:23

在Oracle 12c+中，你可以使用Top n查询和分析函数排名来实现这一点，而且不需要子查询:

select *
from your_table
order by rank() over (partition by user_id order by my_date desc)
fetch first 1 row with ties;

上面的代码返回每个用户my_date最大的所有行。

如果你只想要一个最大日期的行，那么用row_number替换秩:

select *
from your_table
order by row_number() over (partition by user_id order by my_date desc)
fetch first 1 row with ties;

2017-03-26 12:07:40

我没有Oracle来测试它，但最有效的解决方案是使用分析查询。它应该看起来像这样:

SELECT DISTINCT
    UserId
  , MaxValue
FROM (
    SELECT UserId
      , FIRST (Value) Over (
          PARTITION BY UserId
          ORDER BY Date DESC
        ) MaxValue
    FROM SomeTable
  )

我怀疑您可以摆脱外部查询，并在内部放置distinct，但我不确定。与此同时，我知道这招管用。

如果您想了解分析查询，我建议您阅读http://www.orafaq.com/node/55和http://www.akadia.com/services/ora_analytic_functions.html。这是一个简短的总结。

在底层，分析查询对整个数据集进行排序，然后按顺序进行处理。当你处理它的时候，你根据特定的标准对数据集进行分区，然后对每一行查看一些窗口(默认为当前行分区中的第一个值-默认也是最有效的)，并可以使用许多分析函数(其列表非常类似于聚合函数)计算值。

在本例中，下面是内部查询的功能。整个数据集先按UserId排序，再按Date DESC排序，然后一次处理。对于每一行，您返回UserId和该UserId看到的第一个日期(因为日期是按DESC排序的，所以这是最大日期)。这就得到了重复行的答案。然后外部的DISTINCT压缩重复项。

这并不是一个特别引人注目的分析查询示例。如果想获得更大的胜利，可以考虑制作一张财务收据表格，计算每个用户和收据的总花费。分析查询可以有效地解决这个问题。其他解决方案效率较低。这就是为什么它们是2003 SQL标准的一部分。(不幸的是Postgres还没有。叽阿…)

2008-09-23 15:47:54

难道一个qualified子句不是既简单又最好吗?

select userid, my_date, ...
from users
qualify rank() over (partition by userid order by my_date desc) = 1

对于上下文，在Teradata这里一个像样的大小测试运行在17秒与这个合格版本和在23秒与“内联视图”/Aldridge解决方案#1。

2011-10-19 16:17:08

使用ROW_NUMBER()为每个UserId按递减日期分配唯一的排名，然后为每个UserId过滤到第一行(即ROW_NUMBER = 1)。

SELECT UserId, Value, Date
FROM (SELECT UserId, Value, Date,
        ROW_NUMBER() OVER (PARTITION BY UserId ORDER BY Date DESC) rn
      FROM users) u
WHERE rn = 1;

2017-10-31 13:07:35

为另一列的每个不同值获取某列的Max值的行

推荐文章

最新文章

标签