SQL仅选择列上具有最大值的行

我有一张文件表（此处为简化版）：

id	rev	content
1	1	...
2	1	...
1	2	...
1	3	...

如何为每个id选择一行，并且仅选择最大的rev？对于上面的数据，结果应该包含两行：[1，3，…]和[2，1，…]。我使用的是MySQL。

目前，我在while循环中使用检查来检测和重写结果集中的旧版本。但这是实现结果的唯一方法吗？没有SQL解决方案吗？

当前回答

这个怎么样：

SELECT all_fields.*  
FROM (SELECT id, MAX(rev) FROM yourtable GROUP BY id) AS max_recs  
LEFT OUTER JOIN yourtable AS all_fields 
ON max_recs.id = all_fields.id

2013-07-14 16:09:41

其他回答

像这样吗？

SELECT yourtable.id, rev, content
FROM yourtable
INNER JOIN (
    SELECT id, max(rev) as maxrev
    FROM yourtable
    GROUP BY id
) AS child ON (yourtable.id = child.id) AND (yourtable.rev = maxrev)

2011-10-12 19:48:45

我不能保证它的性能，但这里有一个受Microsoft Excel限制启发的技巧。它有一些好的特点

好东西

即使有平局，它也应该强制返回一个“最大记录”（有时有用）它不需要联接

接近，接近

它有点难看，需要您了解rev列的有效值范围。假设我们知道rev列是一个介于0.00和999之间的数字，包括小数，但小数点右侧只有两位数字（例如，34.17是一个有效值）。

这件事的要点是，通过将主比较字段与所需数据串接/打包，可以创建一个单独的合成列。通过这种方式，您可以强制SQL的MAX（）聚合函数返回所有数据（因为它已打包到一列中）。然后您必须解压缩数据。

下面是上面用SQL编写的示例的外观

SELECT id, 
       CAST(SUBSTRING(max(packed_col) FROM 2 FOR 6) AS float) as max_rev,
       SUBSTRING(max(packed_col) FROM 11) AS content_for_max_rev 
FROM  (SELECT id, 
       CAST(1000 + rev + .001 as CHAR) || '---' || CAST(content AS char) AS packed_col
       FROM yourtable
      ) 
GROUP BY id

包装开始时，将rev列强制为已知字符长度的数字，而不考虑rev的值，例如

3.2变为1003.20157变为1057.001923.88变为1923.881

如果你做得对，两个数字的字符串比较应该产生与两个数字数字比较相同的“最大值”，并且很容易使用substring函数转换回原始数字（这在任何地方都可以使用一种或另一种形式）。

2013-06-30 06:02:30

这是另一个解决方案，希望它能帮助某人

Select a.id , a.rev, a.content from Table1 a
inner join 
(SELECT id, max(rev) rev FROM Table1 GROUP BY id) x on x.id =a.id and x.rev =a.rev

2017-06-20 10:10:35

另一种解决方案是使用相关子查询：

select yt.id, yt.rev, yt.contents
    from YourTable yt
    where rev = 
        (select max(rev) from YourTable st where yt.id=st.id)

在（id，rev）上设置索引几乎可以将子查询呈现为一个简单的查找。。。

以下是与@AdrianCarneiro的答案（subquery，leftjoin）中的解决方案的比较，基于MySQL的测量结果，InnoDB表的记录约为100万条，组大小为：1-3。

虽然对于全表扫描，子查询/左连接/相关定时彼此之间的关系为6/8/9，但当涉及到直接查找或批处理（（1，2，3）中的id）时，子查询比其他查询慢得多（由于重新运行子查询）。然而，我无法在速度上区分左连接和相关解决方案。

最后一点，当leftjoin在组中创建n*（n+1）/2个连接时，它的性能会受到组大小的严重影响。。。

2014-01-23 14:16:11

注意：在MySQL 8+天中，我可能不会再推荐这种方法了。好几年没用了。

第三种解决方案是MySQL特有的，看起来像这样：

SELECT id, MAX(rev) AS rev
 , 0+SUBSTRING_INDEX(GROUP_CONCAT(numeric_content ORDER BY rev DESC), ',', 1) AS numeric_content
FROM t1
GROUP BY id

是的，它看起来很糟糕（转换为字符串和返回等），但根据我的经验，它通常比其他解决方案更快。也许这只是我的用例，但我已经在具有数百万条记录和许多唯一ID的表上使用了它。也许是因为MySQL在优化其他解决方案方面非常糟糕（至少在我提出这个解决方案的5.0天）。

一件重要的事情是GROUP_CONCAT对于它可以建立的字符串有一个最大长度。您可能希望通过设置group_concat_max_len变量来提高此限制。请记住，如果您有大量的行，这将是缩放的限制。

无论如何，如果您的内容字段已经是文本，则上述操作不会直接起作用。在这种情况下，您可能需要使用不同的分隔符，例如\0。您还将更快地达到group_concat_max_len限制。

2014-10-10 11:57:00

SQL仅选择列上具有最大值的行

推荐文章

最新文章

标签