SQL JOIN - WHERE子句与ON子句

在阅读它之后，这不是显式与隐式SQL连接的副本。答案可能相关(甚至相同)，但问题是不同的。

它们之间有什么不同?每一种都应该有什么不同?

如果我正确地理解了这个理论，那么查询优化器应该能够互换地使用这两种方法。

当前回答

为了补充Joel Coehoorn的回答，我将添加一些特定于sqlite的优化信息(其他SQL风格的行为可能不同)。在原来的例子中，LEFT JOIN有不同的结果，这取决于你是否使用JOIN on…在哪里或加入…和。下面是一个稍微修改过的例子:

SELECT *
FROM Orders
LEFT JOIN OrderLines ON Orders.ID = OrderLines.OrderID
    WHERE Orders.Username = OrderLines.Username

与

SELECT *
FROM Orders
LEFT JOIN OrderLines ON Orders.ID = OrderLines.OrderID 
    AND Orders.Username = OrderLines.Username

现在，最初的答案指出，如果使用普通的内部连接而不是左连接，两个查询的结果将是相同的，但执行计划将有所不同。我最近意识到，两者之间的语义差异是，前者强制查询优化器使用与ON子句关联的索引，而后者允许优化器选择ON子句中的任何索引……AND子句，这取决于它认为最有效的方式。

有时，优化器会猜错，您会想强制执行某个执行计划。在本例中，假设SQLite优化器错误地得出结论，认为执行此连接的最快方法是使用Orders上的索引。用户名，当您从经验测试中知道，对订单的索引。ID可以更快地传递查询。

在这种情况下，前者JOIN ON…WHERE语法实际上允许您强制对ID参数执行主连接操作，只有在主连接完成之后才对Username执行辅助过滤。相反，JOIN ON…AND语法允许优化器选择是否在Orders上使用索引。ID或订单。用户名，理论上有可能它会选择一个速度较慢的。

2021-06-09 01:44:34

其他回答

通常，一旦两个表已经连接，就在WHERE子句中处理筛选。这是有可能的，不过您可能希望在连接它们之前过滤一个或两个表。也就是说，where子句适用于整个结果集，而on子句只适用于相关的连接。

2018-02-16 05:29:45

我认为这种区别可以通过SQL中操作的逻辑顺序来最好地解释，这是简化的:

FROM(包括连接) 在哪里集团聚合有窗口选择截然不同的并，相交，除命令抵消获取

联接不是select语句的子句，而是FROM语句中的操作符。因此，当逻辑处理到达WHERE子句时，属于相应JOIN运算符的所有ON子句在逻辑上“已经发生”。这意味着在LEFT JOIN的情况下，例如，在应用WHERE子句时，外部连接的语义已经发生。

我已经在这篇博文中更深入地解释了下面的例子。运行此查询时:

SELECT a.actor_id, a.first_name, a.last_name, count(fa.film_id)
FROM actor a
LEFT JOIN film_actor fa ON a.actor_id = fa.actor_id
WHERE film_id < 10
GROUP BY a.actor_id, a.first_name, a.last_name
ORDER BY count(fa.film_id) ASC;

LEFT JOIN实际上没有任何有用的效果，因为即使演员没有在电影中演出，演员也会被过滤，因为它的FILM_ID将为NULL, WHERE子句将过滤这样的一行。结果是这样的:

ACTOR_ID  FIRST_NAME  LAST_NAME  COUNT
--------------------------------------
194       MERYL       ALLEN      1
198       MARY        KEITEL     1
30        SANDRA      PECK       1
85        MINNIE      ZELLWEGER  1
123       JULIANNE    DENCH      1

也就是说，就好像我们内部连接了两个表。如果我们移动ON子句中的筛选谓词，它现在成为外部连接的标准:

SELECT a.actor_id, a.first_name, a.last_name, count(fa.film_id)
FROM actor a
LEFT JOIN film_actor fa ON a.actor_id = fa.actor_id
  AND film_id < 10
GROUP BY a.actor_id, a.first_name, a.last_name
ORDER BY count(fa.film_id) ASC;

这意味着结果将包含没有任何影片的演员，或者没有任何影片且FILM_ID < 10的演员

ACTOR_ID  FIRST_NAME  LAST_NAME     COUNT
-----------------------------------------
3         ED          CHASE         0
4         JENNIFER    DAVIS         0
5         JOHNNY      LOLLOBRIGIDA  0
6         BETTE       NICHOLSON     0
...
1         PENELOPE    GUINESS       1
200       THORA       TEMPLE        1
2         NICK        WAHLBERG      1
198       MARY        KEITEL        1

简而言之

总是把谓词放在逻辑上最有意义的地方。

2019-04-09 13:37:42

就优化器而言，使用ON或WHERE定义连接子句应该没有区别。

然而，恕我直言，我认为在执行连接时使用ON子句更清楚。这样，您就有了查询的特定部分，该部分规定了如何处理连接，而不是与其余WHERE子句混合。

2008-12-09 20:21:36

为了获得更好的性能，表应该有一个用于join的特殊索引列。

所以如果你的条件列不是那些索引列之一，那么我怀疑最好把它保存在WHERE。

所以你使用索引列来JOIN，然后在JOIN之后你在无索引列上运行条件。

2014-12-12 21:10:14

您正在尝试连接数据还是过滤数据?

为了可读性，将这些用例分别隔离到ON和WHERE是最有意义的。