我有以下疑问:

select column_name, count(column_name)
from table
group by column_name
having count(column_name) > 1;

如果我将所有对count(column_name)的调用替换为count(*),会有什么不同?

这个问题的灵感来自于如何在Oracle中查找表中的重复值。


为了澄清接受的答案(可能是我的问题),将count(column_name)替换为count(*)将在结果中返回一个额外的行,其中包含null值和列中空值的计数。


当前回答

我们可以使用Stack Exchange Data Explorer通过一个简单的查询来说明两者的区别。Stack Overflow数据库中的Users表的列通常为空,就像用户的Website URL一样。

-- count(column_name) vs. count(*)
-- Illustrates the difference between counting a column
-- that can hold null values, a  'not null' column, and  count(*)

select count(WebsiteUrl), count(Id), count(*) from Users

如果您在Data Explorer中运行上述查询,您将看到count(Id)和count(*)的计数是相同的,因为Id列不允许空值。但是,WebsiteUrl计数要低得多,因为该列允许为空。

其他回答

最好使用

Count(1) in place of column name or * 

要计算表中的行数,它比任何格式都要快,因为它从不检查表中的列名是否存在

如果您的表中有一个列是固定的,如果您想使用多个列,那么您必须指定需要计算多少列......

谢谢,

另一个细微的区别是,在某些数据库实现中,count(*)是通过查看相关表上的索引来计算的,而不是实际的数据行。由于没有指定特定的列,因此不需要考虑实际的行及其值(如果计算特定的列,就会遇到这种情况)。允许数据库使用索引数据比让它计算“真实的”行要快得多。

基本上COUNT(*)函数返回表中的所有行,而COUNT(COLUMN_NAME)不返回;也就是说它排除了空值在座的各位也都回答过了。 但最有趣的部分是为了优化查询和数据库,最好使用COUNT(*),除非进行多个计数或复杂的查询,而不是COUNT(COLUMN_NAME)。否则,在处理大量数据时,这会降低您的DB性能。

正如前面的回答中提到的,Count(*)甚至对NULL列进行计数,而Count(Columnname)仅在列有值时计数。

最好的做法是避免* (Select *, count *,…)