在MySQL中，选择DISTINCT或GROUP BY哪个更快?

如果我有一张桌子

CREATE TABLE users (
  id int(10) unsigned NOT NULL auto_increment,
  name varchar(255) NOT NULL,
  profession varchar(255) NOT NULL,
  employer varchar(255) NOT NULL,
  PRIMARY KEY  (id)
)

我想获得所有专业领域的独特价值，什么会更快(或建议):

SELECT DISTINCT u.profession FROM users u

SELECT u.profession FROM users u GROUP BY u.profession

当前回答

在mySQL中，我发现GROUP BY将NULL视为不同的，而distinct不是。采取完全相同的DISTINCT查询，删除了DISTINCT，并将所选字段添加为GROUP BY，并且由于其中一个字段为NULL，我得到了更多的行。

所以. .我倾向于相信mySQL中有更多的DISTINCT。

2021-10-09 23:06:04

其他回答

经过大量的测试，我们得出的结论是GROUP BY更快

选择sql_no_cache opnamegroep_intern 从telwerken WHERE opnemergroep IN (7,8,9,10,11,12,13) group by opnamegroep_intern

总共0.0944秒显示记录0 - 29(共635条，查询持续0.0484秒)

选择sql_no_cache 不同的(opnamegroep_intern) 从telwerken WHERE opnemergroep IN (7,8,9,10,11,12,13)

635总共0.2117秒(几乎慢了100%) 韦格弗面包车记录0 - 29(总共635，查询时间0.3468秒)

2015-06-09 09:12:37

对于单个列上的DISTINCT和单个列上的GROUP BY，上面的所有答案都是正确的。每个db引擎都有自己的实现和优化，如果你只关心一点点差异(在大多数情况下)，那么你必须针对特定的服务器和特定的版本进行测试!由于实现可能会改变…

但是，如果在查询中选择多个列，则DISTINCT本质上是不同的!因为在这种情况下，它将比较所有行的所有列，而不仅仅是一列。

如果你有这样的东西:

// This will NOT return unique by [id], but unique by (id,name)
SELECT DISTINCT id, name FROM some_query_with_joins

// This will select unique by [id].
SELECT id, name FROM some_query_with_joins GROUP BY id

认为DISTINCT关键字通过指定的第一列来区分行是一个常见的错误，但DISTINCT是这种方式的通用关键字。

所以朋友们，你们要小心，不要把上面的答案当成所有情况下的正确答案……你可能会感到困惑，得到错误的结果，而你想要的只是优化!

2013-05-16 10:49:53

如果你有一个关于职业的索引，这两个是同义词。

如果没有，那么使用DISTINCT。

MySQL中的GROUP BY对结果进行排序。你甚至可以这样做:

SELECT u.profession FROM users u GROUP BY u.profession DESC

把你的职业按照DESC的顺序排序。

DISTINCT创建一个临时表并使用它存储副本。GROUP BY执行同样的操作，但随后对不同的结果进行排序。

SELECT DISTINCT u.profession FROM users u

更快，如果你没有职业索引的话。

2009-02-27 14:50:08

所以. .我倾向于相信mySQL中有更多的DISTINCT。

2021-10-09 23:06:04

如果问题允许，请尝试使用EXISTS，因为它被优化为只要找到结果就结束(并且不缓冲任何响应)，因此，如果您只是试图为这样的WHERE子句规范化数据

SELECT FROM SOMETHING S WHERE S.ID IN ( SELECT DISTINCT DCR.SOMETHING_ID FROM DIFF_CARDINALITY_RELATIONSHIP DCR ) -- to keep same cardinality

更快的回答是:

SELECT FROM SOMETHING S WHERE EXISTS ( SELECT 1 FROM DIFF_CARDINALITY_RELATIONSHIP DCR WHERE DCR.SOMETHING_ID = S.ID )

这并不总是可行的，但当可用时，你会看到一个更快的响应。

2014-06-09 19:37:04

在MySQL中，选择DISTINCT或GROUP BY哪个更快?

推荐文章

最新文章

标签