在MySQL中，选择DISTINCT或GROUP BY哪个更快?

如果我有一张桌子

CREATE TABLE users (
  id int(10) unsigned NOT NULL auto_increment,
  name varchar(255) NOT NULL,
  profession varchar(255) NOT NULL,
  employer varchar(255) NOT NULL,
  PRIMARY KEY  (id)
)

我想获得所有专业领域的独特价值，什么会更快(或建议):

SELECT DISTINCT u.profession FROM users u

SELECT u.profession FROM users u GROUP BY u.profession

当前回答

对于单个列上的DISTINCT和单个列上的GROUP BY，上面的所有答案都是正确的。每个db引擎都有自己的实现和优化，如果你只关心一点点差异(在大多数情况下)，那么你必须针对特定的服务器和特定的版本进行测试!由于实现可能会改变…

但是，如果在查询中选择多个列，则DISTINCT本质上是不同的!因为在这种情况下，它将比较所有行的所有列，而不仅仅是一列。

如果你有这样的东西:

// This will NOT return unique by [id], but unique by (id,name)
SELECT DISTINCT id, name FROM some_query_with_joins

// This will select unique by [id].
SELECT id, name FROM some_query_with_joins GROUP BY id

认为DISTINCT关键字通过指定的第一列来区分行是一个常见的错误，但DISTINCT是这种方式的通用关键字。

所以朋友们，你们要小心，不要把上面的答案当成所有情况下的正确答案……你可能会感到困惑，得到错误的结果，而你想要的只是优化!

2013-05-16 10:49:53

其他回答

这不是规则

对于每个查询....试着分开，然后按…分组比较完成每个查询的时间，并使用更快的....

在我的项目中，有时我使用group by和other distinct

2015-07-16 23:24:28

它们本质上是等价的(事实上，这就是一些数据库在底层实现DISTINCT的方式)。

如果其中一个更快，它就是DISTINCT。这是因为，尽管两者是相同的，但查询优化器必须捕获这样一个事实，即GROUP BY没有利用任何组成员，只利用了它们的键。DISTINCT将此显式化，因此可以使用稍微笨一点的优化器。

有疑问的时候，测试一下!

2009-02-24 12:09:22

如果你不需要执行任何组函数(如果你想将数值数据添加到表中，可以使用sum, average等)，请使用SELECT DISTINCT。我怀疑它更快，但我没有任何表现。

在任何情况下，如果您担心速度，可以在列上创建索引。

2009-02-24 12:09:28

下面是一个简单的方法，它将为每个查询打印2个不同的运行时间。

DECLARE @t1 DATETIME;
DECLARE @t2 DATETIME;

SET @t1 = GETDATE();
SELECT DISTINCT u.profession FROM users u; --Query with DISTINCT
SET @t2 = GETDATE();
PRINT 'Elapsed time (ms): ' + CAST(DATEDIFF(millisecond, @t1, @t2) AS varchar);

SET @t1 = GETDATE();
SELECT u.profession FROM users u GROUP BY u.profession; --Query with GROUP BY
SET @t2 = GETDATE();
PRINT 'Elapsed time (ms): ' + CAST(DATEDIFF(millisecond, @t1, @t2) AS varchar);

或尝试设置统计时间(Transact-SQL)

SET STATISTICS TIME ON;
SELECT DISTINCT u.profession FROM users u; --Query with DISTINCT
SELECT u.profession FROM users u GROUP BY u.profession; --Query with GROUP BY
SET STATISTICS TIME OFF;

它简单地显示了解析、编译和执行每条语句所需的毫秒数，如下所示:

 SQL Server Execution Times:
   CPU time = 0 ms,  elapsed time = 2 ms.

2016-06-03 09:56:42

Group by比Distinct代价更大，因为Group by对结果进行排序，而Distinct则避免排序。但如果你想让group by产生与distinct相同的结果，请给order by null ..

SELECT DISTINCT u.profession FROM users u

等于

SELECT u.profession FROM users u GROUP BY u.profession order by null

2013-06-21 01:09:18

在MySQL中，选择DISTINCT或GROUP BY哪个更快?

推荐文章

最新文章

标签