在MySQL中查找重复的值

我有一个varchar列的表，我想找到在这个列中有重复值的所有记录。我可以使用什么查询来查找重复项?

当前回答

SELECT  *
FROM    mytable mto
WHERE   EXISTS
        (
        SELECT  1
        FROM    mytable mti
        WHERE   mti.varchar_column = mto.varchar_column
        LIMIT 1, 1
        )
ORDER BY varchar_column

这个查询返回完整的记录，而不仅仅是不同的varchar_column。

这个查询不使用COUNT(*)。如果有很多重复项，COUNT(*)是昂贵的，并且不需要整个COUNT(*)，只需要知道是否有两行具有相同的值。

这是通过相关查询底部的LIMIT 1,1来实现的(本质上意味着“返回第二行”)。EXISTS只在前面提到的第二行存在时才返回true(即至少有两行具有相同的varchar_column值)。

当然，在varchar_column上建立索引将大大加快此查询的速度。

2009-03-27 10:54:39

其他回答

我更喜欢使用窗口函数(MySQL 8.0+)来查找副本，因为我可以看到整行:

WITH cte AS (
  SELECT *
    ,COUNT(*) OVER(PARTITION BY col_name) AS num_of_duplicates_group
    ,ROW_NUMBER() OVER(PARTITION BY col_name ORDER BY col_name2) AS pos_in_group
  FROM table
)
SELECT *
FROM cte
WHERE num_of_duplicates_group > 1;

DB小提琴演示

2018-07-12 17:40:11

SELECT * 
FROM `dps` 
WHERE pid IN (SELECT pid FROM `dps` GROUP BY pid HAVING COUNT(pid)>1)

2014-05-22 14:48:09

如果要删除具有多个字段的重复行，首先将它们取消为唯一不同的行指定的新唯一键，然后使用group by命令删除具有相同新唯一键的重复行:

Create TEMPORARY table tmp select concat(f1,f2) as cfs,t1.* from mytable as t1;
Create index x_tmp_cfs on tmp(cfs);
Create table unduptable select f1,f2,... from tmp group by cfs;

2016-02-04 09:58:03

对GROUP BY子句执行SELECT操作。假设name是你想要在其中找到重复项的列:

SELECT name, COUNT(*) c FROM table GROUP BY name HAVING c > 1;

这将返回一个在第一列中包含名称值的结果，以及该值在第二列中出现次数的计数。

2009-03-27 04:24:08

Select column_name, column_name1,column_name2, count(1) as temp from table_name group by column_name having temp > 1

2015-12-18 18:21:50

在MySQL中查找重复的值

推荐文章

最新文章

标签