SQL仅选择列上具有最大值的行

我有一张文件表（此处为简化版）：

id	rev	content
1	1	...
2	1	...
1	2	...
1	3	...

如何为每个id选择一行，并且仅选择最大的rev？对于上面的数据，结果应该包含两行：[1，3，…]和[2，1，…]。我使用的是MySQL。

目前，我在while循环中使用检查来检测和重写结果集中的旧版本。但这是实现结果的唯一方法吗？没有SQL解决方案吗？

当前回答

解释

这不是纯SQL。这将使用SQLAlchemy ORM。

我来这里寻求SQLAlchemy帮助，所以我将使用python/SQLAlchemi版本复制Adrian Carneiro的答案，特别是外部连接部分。

此查询回答了以下问题：

“你能把这组记录（基于相同id）中版本号最高的记录还给我吗”。

这允许我复制记录，更新它，增加它的版本号，并以一种可以显示随时间变化的方式复制旧版本。

Code

MyTableAlias = aliased(MyTable)
newest_records = appdb.session.query(MyTable).select_from(join(
    MyTable, 
    MyTableAlias, 
    onclause=and_(
        MyTable.id == MyTableAlias.id,
        MyTable.version_int < MyTableAlias.version_int
    ),
    isouter=True
    )
).filter(
    MyTableAlias.id  == None,
).all()

在PostgreSQL数据库上测试。

2019-02-22 15:18:26

其他回答

我想，你想要这个吗？

select * from docs where (id, rev) IN (select id, max(rev) as rev from docs group by id order by id)

SQL Fiddle：在此处检查

2018-12-29 11:00:18

我惊讶地发现，没有答案提供SQL窗口函数解决方案：

SELECT a.id, a.rev, a.contents
  FROM (SELECT id, rev, contents,
               ROW_NUMBER() OVER (PARTITION BY id ORDER BY rev DESC) ranked_order
          FROM YourTable) a
 WHERE a.ranked_order = 1

在SQL标准ANSI/ISO标准SQL:2003中添加了窗口（或窗口）功能，后来又用ANSI/ISO标准SQL：2008进行了扩展。有更多类型的秩函数可用于处理平局问题：rank、DENSE_rank、PERSENT_rank。

2016-08-09 15:29:17

不是mySQL，但对于其他发现此问题并使用SQL的人，另一种解决最大的每组问题的方法是在MS SQL中使用交叉应用

WITH DocIds AS (SELECT DISTINCT id FROM docs)

SELECT d2.id, d2.rev, d2.content
FROM DocIds d1
CROSS APPLY (
  SELECT Top 1 * FROM docs d
  WHERE d.id = d1.id
  ORDER BY rev DESC
) d2

下面是SqlFiddle中的一个示例

2014-05-30 13:47:53

我不能保证它的性能，但这里有一个受Microsoft Excel限制启发的技巧。它有一些好的特点

好东西

即使有平局，它也应该强制返回一个“最大记录”（有时有用）它不需要联接

接近，接近

它有点难看，需要您了解rev列的有效值范围。假设我们知道rev列是一个介于0.00和999之间的数字，包括小数，但小数点右侧只有两位数字（例如，34.17是一个有效值）。

这件事的要点是，通过将主比较字段与所需数据串接/打包，可以创建一个单独的合成列。通过这种方式，您可以强制SQL的MAX（）聚合函数返回所有数据（因为它已打包到一列中）。然后您必须解压缩数据。

下面是上面用SQL编写的示例的外观

SELECT id, 
       CAST(SUBSTRING(max(packed_col) FROM 2 FOR 6) AS float) as max_rev,
       SUBSTRING(max(packed_col) FROM 11) AS content_for_max_rev 
FROM  (SELECT id, 
       CAST(1000 + rev + .001 as CHAR) || '---' || CAST(content AS char) AS packed_col
       FROM yourtable
      ) 
GROUP BY id

包装开始时，将rev列强制为已知字符长度的数字，而不考虑rev的值，例如

3.2变为1003.20157变为1057.001923.88变为1923.881

如果你做得对，两个数字的字符串比较应该产生与两个数字数字比较相同的“最大值”，并且很容易使用substring函数转换回原始数字（这在任何地方都可以使用一种或另一种形式）。

2013-06-30 06:02:30

这是另一个解决方案，希望它能帮助某人

Select a.id , a.rev, a.content from Table1 a
inner join 
(SELECT id, max(rev) rev FROM Table1 GROUP BY id) x on x.id =a.id and x.rev =a.rev

2017-06-20 10:10:35

SQL仅选择列上具有最大值的行

推荐文章

最新文章

标签