在一个非常大的表中计算准确行数的最快方法?

我曾经读过一些文章，说当表有很多行和很多列时，SELECT COUNT(*) FROM TABLE_NAME将会很慢。

我有一个可能包含数十亿行的表(它大约有15列)。有没有更好的方法来获得一个表的行数的精确计数?

在回答之前请考虑以下问题:

我正在寻找一个数据库供应商独立的解决方案。如果是也可以涵盖MySQL, Oracle, MS SQL Server。但如果真的没有数据库供应商独立的解决方案，然后我会接受不同的解决方案吗针对不同的数据库供应商。我不能使用任何外部工具这样做。我主要是在找一个基于SQL的解决方案。我不能规范化我的数据库设计任何进一步的。它已经在3NF中，而且很多代码已经写好了围绕它。

当前回答

在SQL server 2016中，我可以检查表属性，然后选择“存储”选项卡-这给了我行数，表使用的磁盘空间，使用的索引空间等。

2019-05-08 19:45:19

其他回答

我使用

select /*+ parallel(a) */  count(1) from table_name a;

2011-07-03 08:09:54

也许有点晚，但这可能会帮助其他人的MSSQL

;WITH RecordCount AS (  SELECT      ROW_NUMBER() OVER (ORDER BY
COLUMN_NAME) AS [RowNumber]     FROM        TABLE_NAME )  SELECT
MAX(RowNumber) FROM RecordCount

2013-08-30 14:46:11

select rows from sysindexes
where id = Object_ID('TableName') and indid <2

2011-11-03 09:00:23

使用SQL Server 2019，您可以使用APPROX_COUNT_DISTINCT，它:

返回组中唯一非空值的大致数目

医生说:

APPROX_COUNT_DISTINCT是为大数据场景而设计的针对以下条件进行优化: 访问数百万行或更高的数据集一个或多个具有不同值的列的聚合

还有，函数

实现保证在97%的概率内高达2%的错误率比穷举COUNT DISTINCT操作需要更少的内存与精确的COUNT DISTINCT操作相比，较小的内存占用不太可能将内存溢出到磁盘。

该算法背后实现了HyperLogLog。

2020-11-12 06:43:42

我说这个问题有点晚了，但下面是你可以用MySQL做什么(就像我使用MySQL一样)。我在这里分享我的观察:

1) SELECT COUNT(*) AS TOTAL_ROWS FROM <TABLE_NAME>

结果行数:508534 控制台输出:受影响的行:0发现的行:1警告:0一次查询的持续时间:0.125秒。对于有大量行的表需要一些时间，但是行数非常精确。

2) SHOW TABLE STATUS or SHOW TABLE STATUS WHERE NAME="<TABLE_NAME>"

结果行数:511235 控制台输出:受影响的行:0发现的行:1警告:0一次查询的持续时间:0.250秒总结:行数不准确。

3) SELECT * FROM information_schema.tables WHERE table_schema = DATABASE();

结果行数:507806 控制台输出:受影响的行:0发现的行:48警告:0查询一次的持续时间:1.701秒。行数不准确。

我不是MySQL或数据库专家，但我发现对于非常大的表，你可以使用选项2或3，并得到一个“公平的想法”有多少行。

我需要获得这些行数，以便在UI上显示一些统计信息。通过上面的查询，我知道总行数超过了50万，所以我提出了显示“超过50万行”这样的统计信息，但没有显示确切的行数。

也许我没有真正回答OP的问题，但我在分享我在需要这样的统计数据的情况下所做的事情。在我的情况下，显示大致的行是可以接受的，所以上面的工作对我来说。

2017-09-18 16:40:02

在一个非常大的表中计算准确行数的最快方法?

推荐文章

最新文章

标签