mysql查询条件not in 和 in的区别

先写一个SQL

SELECT DISTINCT from_id
FROM cod
WHERE cod.from_id NOT IN (37, 56, 57)

今天在写SQL的时候,发现这个查的结果不全,少了NULL值的情况,not in 的时候竟然把null也排除了

用 in 的时候却没有包含null

感觉是mysql设计的不合理

因为一直认为in 和 not in 正好应该互补才是,就像这样查的应该是全部的一样:

SELECT DISTINCT from_id
FROM cod
WHERE cod.from_id NOT IN (37, 56, 57) or cod.from_id IN (37, 56, 57)

结果正如猜测的那样,少了个null

后来上网上查了下,有一个解释挺合理的,即:

null与任何值比较都是false

比如from_id有(37, 56, 57,28,null), not in (37, 56, 57)与28比较时是true,所以结果集中出现28,

null与not in (37, 56, 57)这个条件比较时,结果false,所以不出现在结果集中

补充:MySQL条件查询IN和NOT IN左右两侧包含NULL值的处理方式

题目

给定一个表 tree,id 是树节点的编号, p_id 是它父节点的 id 。

+----+------+

| id | p\_id |

+----+------+

| 1 | NULL |

| 2 | 1 |

| 3 | 1 |

| 4 | 2 |

| 5 | 2 |

+----+------+

树中每个节点属于以下三种类型之一:

叶子:如果这个节点没有任何孩子节点。

根:如果这个节点是整棵树的根,即没有父节点。

内部节点:如果这个节点既不是叶子节点也不是根节点。

写一个查询语句,输出所有节点的编号和节点的类型,并将结果按照节点编号排序。上面样例的结果为:

+----+------+

| id | TYPE |

+----+------+

| 1 | Root |

| 2 | INNER|

| 3 | Leaf |

| 4 | Leaf |

| 5 | Leaf |

+----+------+

解释

节点 ‘1' 是根节点,因为它的父节点是 NULL ,同时它有孩子节点 ‘2' 和 ‘3' 。

节点 ‘2' 是内部节点,因为它有父节点 ‘1' ,也有孩子节点 ‘4' 和 ‘5' 。

节点 ‘3', ‘4' 和 ‘5' 都是叶子节点,因为它们都有父节点同时没有孩子节点。

样例中树的形态如下:

1

/ \\

2 3

/ \\

4 5

首先先建表

1.建表

CREATE TABLE tree(
id INT ,
p_id INT 
)

下面是我的做法:

SELECT id,(
CASE 
WHEN tree.p_id IS NULL THEN 'Root'
WHEN tree.id NOT IN ( -- id不在父结点p_id列时,认为是叶子结点,逻辑上没有问题!
SELECT p_id
FROM tree
GROUP BY p_id
) THEN 'Leaf'
ELSE 'Inner'
END
)TYPE
FROM tree

我觉得当id不在父结点p_id列时,认为是叶子结点,这在逻辑上完全没有任何问题,然而事情并没有这么简单,查询结果如下:从id=3开始没有查到我想要的结果!神奇吧!

于是又过了一晚上,终于解决了问题,我先给出正确的做法:

SELECT id,(
CASE 
WHEN tree.p_id IS NULL THEN 'Root'
WHEN tree.id NOT IN (
SELECT p_id
FROM tree
WHERE p_id IS NOT NULL -- 添加了一句SQL
GROUP BY p_id
) THEN 'Leaf'
ELSE 'Inner'
END
)TYPE
FROM tree

为什么会这样呢?

我们都知道

MySQL 中的 IN 运算符用来判断表达式的值是否位于给出的列表中;如果是,返回值为 1,否则返回值为 0。

NOT IN 的作用和 IN 恰好相反,NOT IN 用来判断表达式的值是否不存在于给出的列表中;如果不是,返回值为 1,否则返回值为 0。

一般情况下我们都是这样用的,结果也是我们想要的。但是下面的特殊情况我们却经常遇到!

(1)in和not in左右两侧都没有NULL值的情况

【实例1】在 SQL 语句中使用 IN 和 NOT IN 运算符:

mysql> SELECT 2 IN (1,3,5,'thks'),'thks' IN (1,3,5, 'thks');
+---------------------+---------------------------+
| 2 IN (1,3,5,'thks') | 'thks' IN (1,3,5, 'thks') |
+---------------------+---------------------------+
|     0 |       1 |
+---------------------+---------------------------+
1 row in set, 2 warnings (0.00 sec)

mysql> SELECT 2 NOT IN (1,3,5,'thks'),'thks' NOT IN (1,3,5, 'thks');
+-------------------------+-------------------------------+
| 2 NOT IN (1,3,5,'thks') | 'thks' NOT IN (1,3,5, 'thks') |
+-------------------------+-------------------------------+
|      1 |        0 |
+-------------------------+-------------------------------+
1 row in set, 2 warnings (0.00 sec)

由结果可以看到,IN 和 NOT IN 的返回值正好相反。

但是忽略了一个NULL值问题

对空值 NULL 的处理

当 IN 运算符的两侧有一个为空值 NULL 时,如果找不到匹配项,则返回值为 NULL;如果找到了匹配项,则返回值为 1。

(2)NULL值在in左右两侧

请看下面的 SQL 语句如下:

mysql> SELECT NULL IN (1,3,5,'thks'),10 IN (1,3,NULL,'thks');
+------------------------+-------------------------+
| NULL IN (1,3,5,'thks') | 10 IN (1,3,NULL,'thks') |
+------------------------+-------------------------+
|     NULL |     NULL |
+------------------------+-------------------------+
1 row in set, 1 warning (0.00 sec)

mysql> SELECT NULL IN (1,3,5,'thks'),10 IN (1,10,NULL,'thks');
+------------------------+--------------------------+
| NULL IN (1,3,5,'thks') | 10 IN (1,10,NULL,'thks') |
+------------------------+--------------------------+
|     NULL |      1 |
+------------------------+--------------------------+
1 row in set (0.00 sec)

(3)NULL在NOT IN 的其中一侧

NOT IN 恰好相反,当 NOT IN 运算符的两侧有一个为空值 NULL 时,如果找不到匹配项,则返回值为 NULL;如果找到了匹配项,则返回值为 0。

请看下面的 SQL 语句如下:

mysql> SELECT NULL NOT IN (1,3,5,'thks'),10 NOT IN (1,0,NULL,'thks');
+----------------------------+-----------------------------+
| NULL NOT IN (1,3,5,'thks') | 10 NOT IN (1,0,NULL,'thks') |
+----------------------------+-----------------------------+
|      NULL |      NULL |
+----------------------------+-----------------------------+
1 row in set, 1 warning (0.00 sec)

mysql> SELECT NULL NOT IN (1,3,5,'thks'),10 NOT IN (1,10,NULL,'thks');
+----------------------------+------------------------------+
| NULL NOT IN (1,3,5,'thks') | 10 NOT IN (1,10,NULL,'thks') |
+----------------------------+------------------------------+
|      NULL |       0 |
+----------------------------+------------------------------+
1 row in set (0.00 sec)

根据(3)NULL在NOT IN 的其中一侧的结果,这就可以看出问题

先来查询下面SQL语句,慢慢发现问题

SELECT p_id
FROM tree
GROUP BY p_id

上面查询结果包含了NULL值

所以查询下面SQL语句就查不到任何东西,这是因为NOT IN返回了NULL

SELECT id 
FROM tree
WHERE id NOT IN (
SELECT p_id
FROM tree
GROUP BY p_id
)

所以要想查询出来结果就要先把NULL值给处理掉!好了,Bug搞定!

这题还有另外一种做法:

SELECT id,(
CASE 
WHEN tree.p_id IS NULL THEN 'Root'
WHEN tree.id IN (
SELECT p_id
FROM tree
GROUP BY p_id
) THEN 'Inner'
ELSE 'Leaf'
END
)TYPE
FROM tree

为什么是对的?留给大家想想吧~

以上为个人经验,希望能给大家一个参考,也希望大家多多支持编程宝库。如有错误或未考虑完全的地方,望不吝赐教。

我称这种bug是一个典型的“哈姆雷特”bug,就是指那种“报错情况相同但网上却会有各种五花缭乱解决办法”的bug,让我们不知道哪一个才是症结所在。先看导入命令: ...