SQL仅选择列上具有最大值的行

我有一张文件表（此处为简化版）：

id	rev	content
1	1	...
2	1	...
1	2	...
1	3	...

如何为每个id选择一行，并且仅选择最大的rev？对于上面的数据，结果应该包含两行：[1，3，…]和[2，1，…]。我使用的是MySQL。

目前，我在while循环中使用检查来检测和重写结果集中的旧版本。但这是实现结果的唯一方法吗？没有SQL解决方案吗？

当前回答

当您将rev和id组合为MAX（）的一个maxRevId值，然后将其拆分为原始值时，可以在不进行联接的情况下进行选择：

SELECT maxRevId & ((1 << 32) - 1) as id, maxRevId >> 32 AS rev
FROM (SELECT MAX(((rev << 32) | id)) AS maxRevId
      FROM YourTable
      GROUP BY id) x;

当存在复杂联接而不是单个表时，这一速度特别快。使用传统方法，复杂连接将进行两次。

当rev和id为INT UNSIGNED（32位）并且组合值适合BIGINT UNSIGNED时（64位），上述组合对于位函数很简单。当id和rev大于32位值或由多个列组成时，需要将该值合并为二进制值，例如，为MAX（）添加适当的填充。

2018-09-17 09:08:22

其他回答

不是mySQL，但对于其他发现此问题并使用SQL的人，另一种解决最大的每组问题的方法是在MS SQL中使用交叉应用

WITH DocIds AS (SELECT DISTINCT id FROM docs)

SELECT d2.id, d2.rev, d2.content
FROM DocIds d1
CROSS APPLY (
  SELECT Top 1 * FROM docs d
  WHERE d.id = d1.id
  ORDER BY rev DESC
) d2

下面是SqlFiddle中的一个示例

2014-05-30 13:47:53

我会用这个：

select t.*
from test as t
join
   (select max(rev) as rev
    from test
    group by id) as o
on o.rev = t.rev

子查询SELECT可能不太有效，但在JOIN子句中似乎是可用的。我不是优化查询的专家，但我在MySQL、PostgreSQL和FireBird上都做过尝试，而且效果非常好。

您可以在多个联接中使用此模式，也可以使用WHERE子句。这是我的工作示例（用表格“firmy”解决与您相同的问题）：

select *
from platnosci as p
join firmy as f
on p.id_rel_firmy = f.id_rel
join (select max(id_obj) as id_obj
      from firmy
      group by id_rel) as o
on o.id_obj = f.id_obj and p.od > '2014-03-01'

这是在有十几张唱片的桌子上被要求的，在不太强的机器上只需要不到0.01秒的时间。

我不会使用IN子句（如上所述）。IN用于常量的短列表，而不是构建在子查询上的查询过滤器。这是因为in中的子查询是针对每个扫描的记录执行的，这可能会使查询花费很长时间。

2015-03-04 18:12:10

下面是另一个解决方案，用于仅检索具有该字段最大值的字段的记录。这适用于我工作的平台SQL400。在本例中，字段FIELD5中具有最大值的记录将由以下SQL语句检索。

SELECT A.KEYFIELD1, A.KEYFIELD2, A.FIELD3, A.FIELD4, A.FIELD5
  FROM MYFILE A
 WHERE RRN(A) IN
   (SELECT RRN(B) 
      FROM MYFILE B
     WHERE B.KEYFIELD1 = A.KEYFIELD1 AND B.KEYFIELD2 = A.KEYFIELD2
     ORDER BY B.FIELD5 DESC
     FETCH FIRST ROW ONLY)

2017-10-16 23:48:32

由于这是关于这个问题最流行的问题，我将在这里重新发布另一个答案：

看起来有更简单的方法（但仅在MySQL中）：

select *
from (select * from mytable order by id, rev desc ) x
group by id

请感谢用户Bohemian在这个问题上的回答，因为它为这个问题提供了如此简洁而优雅的答案。

编辑：虽然这个解决方案对很多人都有效，但从长远来看它可能并不稳定，因为MySQL不能保证GROUP BY语句会为不在GROUP BY列表中的列返回有意义的值。因此，使用此解决方案的风险自负！

2014-07-03 14:33:34

我的偏好是使用尽可能少的代码。。。

您可以使用IN试试看：

SELECT * 
FROM t1 WHERE (id,rev) IN 
( SELECT id, MAX(rev)
  FROM t1
  GROUP BY id
)

在我看来，这不那么复杂。。。易于阅读和维护。

2011-10-12 19:47:41

SQL仅选择列上具有最大值的行

推荐文章

最新文章

标签