在SQL表中查找重复值

使用一个字段很容易找到重复项：

SELECT email, COUNT(email) 
FROM users
GROUP BY email
HAVING COUNT(email) > 1

所以如果我们有一张桌子

ID   NAME   EMAIL
1    John   asd@asd.com
2    Sam    asd@asd.com
3    Tom    asd@asd.com
4    Bob    bob@asd.com
5    Tom    asd@asd.com

这个查询将告诉我们John、Sam、Tom和Tom，因为他们都有相同的电子邮件。

然而，我想要的是获得相同电子邮件和名称的副本。

也就是说，我想得到“汤姆”，“汤姆”。

我需要这个的原因是：我犯了一个错误，允许插入重复的名称和电子邮件值。现在我需要删除/更改重复项，所以我需要先找到它们。

当前回答

如果您希望查看表中是否有重复的行，我使用以下查询：

create table my_table(id int, name varchar(100), email varchar(100));

insert into my_table values (1, 'shekh', 'shekh@rms.com');
insert into my_table values (1, 'shekh', 'shekh@rms.com');
insert into my_table values (2, 'Aman', 'aman@rms.com');
insert into my_table values (3, 'Tom', 'tom@rms.com');
insert into my_table values (4, 'Raj', 'raj@rms.com');


Select COUNT(1) As Total_Rows from my_table 
Select Count(1) As Distinct_Rows from ( Select Distinct * from my_table) abc

2014-08-26 10:07:17

其他回答

这是我想出的最简单的办法。它使用一个公共表表达式（CTE）和一个分区窗口（我认为这些特性在SQL 2008和更高版本中）。

此示例查找所有具有重复名称和dob的学生。要检查重复的字段位于OVER子句中。可以在投影中包含任何其他字段。

with cte (StudentId, Fname, LName, DOB, RowCnt)
as (
SELECT StudentId, FirstName, LastName, DateOfBirth as DOB, SUM(1) OVER (Partition By FirstName, LastName, DateOfBirth) as RowCnt
FROM tblStudent
)
SELECT * from CTE where RowCnt > 1
ORDER BY DOB, LName

2016-07-01 19:09:40

SELECT
    name, email, COUNT(*)
FROM
    users
GROUP BY
    name, email
HAVING 
    COUNT(*) > 1

只需在两列上分组。

注意：旧的ANSI标准是在GROUP BY中包含所有非聚合列，但这已经随着“功能依赖性”的思想而改变：

在关系数据库理论中，函数依赖是数据库关系中两组属性之间的约束。换句话说，函数依赖是描述关系中属性之间关系的约束。

支持不一致：

最近的PostgreSQL支持它。SQL Server（截至SQL Server 2017）仍然需要GROUP BY中的所有非聚合列。MySQL是不可预测的，您需要sql_mode=only_full_group_by：GROUP BY lname ORDER BY显示错误结果；在缺少ANY（）的情况下，这是最便宜的聚合函数（请参阅公认答案中的注释）。甲骨文还不够主流（警告：幽默，我不了解甲骨文）。

2010-04-07 18:20:18

SELECT id，COUNT（id）FROM table1 GROUP BY id HAVING COUNT；

我认为这可以正确地搜索特定列中的重复值。

2015-05-08 06:41:06

 SELECT name, email 
    FROM users
    WHERE email in
    (SELECT email FROM users
    GROUP BY email 
    HAVING COUNT(*)>1)

2015-07-22 07:12:07

select name, email
, case 
when ROW_NUMBER () over (partition by name, email order by name) > 1 then 'Yes'
else 'No'
end "duplicated ?"
from users

2016-09-08 06:41:06

在SQL表中查找重复值

推荐文章

最新文章

标签