SQL仅选择列上具有最大值的行

我有一张文件表（此处为简化版）：

id	rev	content
1	1	...
2	1	...
1	2	...
1	3	...

如何为每个id选择一行，并且仅选择最大的rev？对于上面的数据，结果应该包含两行：[1，3，…]和[2，1，…]。我使用的是MySQL。

目前，我在while循环中使用检查来检测和重写结果集中的旧版本。但这是实现结果的唯一方法吗？没有SQL解决方案吗？

当前回答

我会用这个：

select t.*
from test as t
join
   (select max(rev) as rev
    from test
    group by id) as o
on o.rev = t.rev

子查询SELECT可能不太有效，但在JOIN子句中似乎是可用的。我不是优化查询的专家，但我在MySQL、PostgreSQL和FireBird上都做过尝试，而且效果非常好。

您可以在多个联接中使用此模式，也可以使用WHERE子句。这是我的工作示例（用表格“firmy”解决与您相同的问题）：

select *
from platnosci as p
join firmy as f
on p.id_rel_firmy = f.id_rel
join (select max(id_obj) as id_obj
      from firmy
      group by id_rel) as o
on o.id_obj = f.id_obj and p.od > '2014-03-01'

这是在有十几张唱片的桌子上被要求的，在不太强的机器上只需要不到0.01秒的时间。

我不会使用IN子句（如上所述）。IN用于常量的短列表，而不是构建在子查询上的查询过滤器。这是因为in中的子查询是针对每个扫描的记录执行的，这可能会使查询花费很长时间。

2015-03-04 18:12:10

其他回答

SELECT *
FROM Employee
where Employee.Salary in (select max(salary) from Employee group by Employe_id)
ORDER BY Employee.Salary

2017-07-30 18:12:46

解释

这不是纯SQL。这将使用SQLAlchemy ORM。

我来这里寻求SQLAlchemy帮助，所以我将使用python/SQLAlchemi版本复制Adrian Carneiro的答案，特别是外部连接部分。

此查询回答了以下问题：

“你能把这组记录（基于相同id）中版本号最高的记录还给我吗”。

这允许我复制记录，更新它，增加它的版本号，并以一种可以显示随时间变化的方式复制旧版本。

Code

MyTableAlias = aliased(MyTable)
newest_records = appdb.session.query(MyTable).select_from(join(
    MyTable, 
    MyTableAlias, 
    onclause=and_(
        MyTable.id == MyTableAlias.id,
        MyTable.version_int < MyTableAlias.version_int
    ),
    isouter=True
    )
).filter(
    MyTableAlias.id  == None,
).all()

在PostgreSQL数据库上测试。

2019-02-22 15:18:26

由于这是关于这个问题最流行的问题，我将在这里重新发布另一个答案：

看起来有更简单的方法（但仅在MySQL中）：

select *
from (select * from mytable order by id, rev desc ) x
group by id

请感谢用户Bohemian在这个问题上的回答，因为它为这个问题提供了如此简洁而优雅的答案。

编辑：虽然这个解决方案对很多人都有效，但从长远来看它可能并不稳定，因为MySQL不能保证GROUP BY语句会为不在GROUP BY列表中的列返回有意义的值。因此，使用此解决方案的风险自负！

2014-07-03 14:33:34

我会用这个：

select t.*
from test as t
join
   (select max(rev) as rev
    from test
    group by id) as o
on o.rev = t.rev

子查询SELECT可能不太有效，但在JOIN子句中似乎是可用的。我不是优化查询的专家，但我在MySQL、PostgreSQL和FireBird上都做过尝试，而且效果非常好。

您可以在多个联接中使用此模式，也可以使用WHERE子句。这是我的工作示例（用表格“firmy”解决与您相同的问题）：

select *
from platnosci as p
join firmy as f
on p.id_rel_firmy = f.id_rel
join (select max(id_obj) as id_obj
      from firmy
      group by id_rel) as o
on o.id_obj = f.id_obj and p.od > '2014-03-01'

这是在有十几张唱片的桌子上被要求的，在不太强的机器上只需要不到0.01秒的时间。

2015-03-04 18:12:10

这是一个很好的方法

使用以下代码：

with temp as  ( 
select count(field1) as summ , field1
from table_name
group by field1 )
select * from temp where summ = (select max(summ) from temp)

2015-01-07 11:36:08

SQL仅选择列上具有最大值的行

推荐文章

最新文章

标签