我想知道以下内容在性能上是否有区别

SELECT ... FROM ... WHERE someFIELD IN(1,2,3,4)

SELECT ... FROM ... WHERE someFIELD between 0 AND 5

SELECT ... FROM ... WHERE someFIELD = 1 OR someFIELD = 2 OR someFIELD = 3 ... 

或者MySQL会像编译器优化代码一样优化SQL吗?


EDIT

根据评论中说明的原因,将AND改为OR。


当前回答

我敢打赌它们是一样的,你可以通过执行以下操作来运行测试:

循环遍历“in(1,2,3,4)”500次,看看需要多长时间。循环“=1 or= 2 or=3…”版本500次,看看它运行了多长时间。

你也可以尝试一个连接的方式,如果someField是一个索引,你的表很大,它可以更快…

SELECT ... 
    FROM ... 
        INNER JOIN (SELECT 1 as newField UNION ALL SELECT 2 UNION ALL SELECT 3 UNION ALL SELECT 4) dt ON someFIELD =newField

我在我的SQL Server上尝试了上面的join方法,它几乎与in(1,2,3,4)相同,它们都导致了一个聚集索引查找。我不确定MySQL将如何处理它们。

其他回答

我需要确定这一点,所以我对这两种方法都进行了基准测试。我始终发现IN比OR要快得多。

不要相信那些发表“意见”的人,科学就是测试和证据。

我运行了1000倍的等效查询循环(为了一致性,我使用sql_no_cache):

: 2.34969592094秒

或者:5.83781504631秒

更新: (我没有原始测试的源代码,因为它是6年前的,尽管它返回的结果与此测试相同)

为了要求一些示例代码来测试这一点,这里是最简单的可能用例。使用Eloquent来简化语法,原始的SQL等价执行相同的操作。

$t = microtime(true); 
for($i=0; $i<10000; $i++):
$q = DB::table('users')->where('id',1)
    ->orWhere('id',2)
    ->orWhere('id',3)
    ->orWhere('id',4)
    ->orWhere('id',5)
    ->orWhere('id',6)
    ->orWhere('id',7)
    ->orWhere('id',8)
    ->orWhere('id',9)
    ->orWhere('id',10)
    ->orWhere('id',11)
    ->orWhere('id',12)
    ->orWhere('id',13)
    ->orWhere('id',14)
    ->orWhere('id',15)
    ->orWhere('id',16)
    ->orWhere('id',17)
    ->orWhere('id',18)
    ->orWhere('id',19)
    ->orWhere('id',20)->get();
endfor;
$t2 = microtime(true); 
echo $t."\n".$t2."\n".($t2-$t)."\n";

1482080514.3635 1482080517.3713 3.0078368186951

$t = microtime(true); 
for($i=0; $i<10000; $i++): 
$q = DB::table('users')->whereIn('id',[1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20])->get(); 
endfor; 
$t2 = microtime(true); 
echo $t."\n".$t2."\n".($t2-$t)."\n";

1482080534.0185 1482080536.178 2.1595389842987

我敢打赌它们是一样的,你可以通过执行以下操作来运行测试:

循环遍历“in(1,2,3,4)”500次,看看需要多长时间。循环“=1 or= 2 or=3…”版本500次,看看它运行了多长时间。

你也可以尝试一个连接的方式,如果someField是一个索引,你的表很大,它可以更快…

SELECT ... 
    FROM ... 
        INNER JOIN (SELECT 1 as newField UNION ALL SELECT 2 UNION ALL SELECT 3 UNION ALL SELECT 4) dt ON someFIELD =newField

我在我的SQL Server上尝试了上面的join方法,它几乎与in(1,2,3,4)相同,它们都导致了一个聚集索引查找。我不确定MySQL将如何处理它们。

公认的答案并不能解释原因。

下面引用自高性能MySQL,第三版。

在许多数据库服务器中,In()只是多个OR子句的同义词,因为这两个子句在逻辑上是等价的。在MySQL中不是这样,它对in()列表中的值进行排序,并使用快速的二进制搜索来查看一个值是否在列表中。这是列表大小的O(Log n),而等效的OR子句系列的列表大小是O(n)(即,对于大列表来说要慢得多)

根据我对编译器优化这些类型查询的方式的理解,使用IN子句比多个OR子句更有效。如果您有可以使用BETWEEN子句的值,那么仍然更有效。

这取决于你在做什么;范围有多宽,数据类型是什么(我知道你的例子使用数字数据类型,但你的问题也可以适用于许多不同的数据类型)。

这是一个你想以两种方式编写查询的实例;让它工作,然后使用EXPLAIN来找出执行差异。

我相信这个问题有一个具体的答案,但这就是我如何,实际上,找出我给定问题的答案。

这可能会有一些帮助:http://forge.mysql.com/wiki/Top10SQLPerformanceTips

问候, 弗兰克