如何在SQL请求一个随机行?

如何在纯SQL中请求随机行(或尽可能接近真正的随机)?

当前回答

你没说你用的是哪台服务器。在旧版本的SQL Server中，你可以使用这个:

select top 1 * from mytable order by newid()

在SQL Server 2005及以上版本中，你可以使用TABLESAMPLE来获取一个可重复的随机样本:

SELECT FirstName, LastName
FROM Contact 
TABLESAMPLE (1 ROWS) ;

其他回答

在SQL Server中，您可以将TABLESAMPLE与NEWID()结合使用，以获得相当好的随机性，并且仍然具有速度。如果您真的只想要1行或少量的行，这尤其有用。

SELECT TOP 1 * FROM [table] 
TABLESAMPLE (500 ROWS) 
ORDER BY NEWID()

在MSSQL(在11.0.5569上测试)中使用

SELECT TOP 100 * FROM employee ORDER BY CRYPT_GEN_RANDOM(10)

明显快于

SELECT TOP 100 * FROM employee ORDER BY NEWID()

你没说你用的是哪台服务器。在旧版本的SQL Server中，你可以使用这个:

select top 1 * from mytable order by newid()

在SQL Server 2005及以上版本中，你可以使用TABLESAMPLE来获取一个可重复的随机样本:

SELECT FirstName, LastName
FROM Contact 
TABLESAMPLE (1 ROWS) ;

ORDER BY NEWID()

耗时7.4毫秒

WHERE num_value >= RAND() * (SELECT MAX(num_value) FROM table)

只需要0.0065毫秒!

我肯定会选择后一种方法。

最好的方法是在新列中放入一个随机值，并使用如下代码(伪代码+ SQL):

randomNo = random()
execSql("SELECT TOP 1 * FROM MyTable WHERE MyTable.Randomness > $randomNo")

这是MediaWiki代码采用的解决方案。当然，对于较小的值会有一些偏差，但他们发现，在没有获取行的情况下，将随机值包装为0就足够了。

Newid()解决方案可能需要全表扫描，以便为每一行分配一个新的guid，这将大大降低性能。

rand()解决方案可能根本不起作用(即与MSSQL)，因为函数将只计算一次，并且每一行将被分配相同的“随机”数字。

推荐文章