在一个非常大的表中计算准确行数的最快方法?

我曾经读过一些文章，说当表有很多行和很多列时，SELECT COUNT(*) FROM TABLE_NAME将会很慢。

我有一个可能包含数十亿行的表(它大约有15列)。有没有更好的方法来获得一个表的行数的精确计数?

在回答之前请考虑以下问题:

我正在寻找一个数据库供应商独立的解决方案。如果是也可以涵盖MySQL, Oracle, MS SQL Server。但如果真的没有数据库供应商独立的解决方案，然后我会接受不同的解决方案吗针对不同的数据库供应商。我不能使用任何外部工具这样做。我主要是在找一个基于SQL的解决方案。我不能规范化我的数据库设计任何进一步的。它已经在3NF中，而且很多代码已经写好了围绕它。

当前回答

PostgreSQL:

SELECT reltuples AS approximate_row_count FROM pg_class WHERE relname = 'table_name'

2018-06-30 21:21:35

其他回答

select rows from sysindexes
where id = Object_ID('TableName') and indid <2

2011-11-03 09:00:23

如果你正在使用Oracle，那么这个怎么样(假设表的统计信息更新了):

select <TABLE_NAME>, num_rows, last_analyzed from user_tables

Last_analyzed将显示上次收集统计数据的时间。

2011-05-26 08:30:52

为我准备了一张很大的桌子，

SELECT COUNT(1) FROM TableLarge

花了37秒

SELECT COUNT_BIG(1) FROM TableLarge

只需要4秒钟。

2020-08-16 14:20:13

使用SQL Server 2019，您可以使用APPROX_COUNT_DISTINCT，它:

返回组中唯一非空值的大致数目

医生说:

APPROX_COUNT_DISTINCT是为大数据场景而设计的针对以下条件进行优化: 访问数百万行或更高的数据集一个或多个具有不同值的列的聚合

还有，函数

实现保证在97%的概率内高达2%的错误率比穷举COUNT DISTINCT操作需要更少的内存与精确的COUNT DISTINCT操作相比，较小的内存占用不太可能将内存溢出到磁盘。

该算法背后实现了HyperLogLog。

2020-11-12 06:43:42

我远不及其他回答问题的专家，但我在从表中选择随机行(不太相关)的过程中遇到了问题，但我需要知道我的参考表中的行数来计算随机索引。使用传统的Count(*)或Count(1)可以工作，但我偶尔需要2秒才能运行查询。所以相反(对于我的表命名为'tbl_HighOrder')我使用:

Declare @max int

Select @max = Row_Count
From sys.dm_db_partition_stats
Where Object_Name(Object_Id) = 'tbl_HighOrder'

它工作得很好，在Management Studio中的查询时间为零。

2013-06-30 01:43:37

在一个非常大的表中计算准确行数的最快方法?

推荐文章

最新文章

标签