29、MySQL REGEXP 子句正则表达式查询

前面章节中我们已经了解到 MySQL 可以通过 LIKE ...% 子句来进行模糊匹配,但这都只是简单的模糊查询,也是速度最快的模糊查询

除此之外,MySQL 同样也支持其它正则表达式的匹配

MySQL 通过使用 REGEXP 操作符来进行正则表达式匹配

如果你了解过其它语言的正则表达式,比如 PHP 或 Perl 等,那么你会对 MySQL 的正则表达式元字符非常熟悉,因为它们都类似

MySQL REGEXP 操作符支持以下几种元子符

元字符 描述
^ 匹配输入字符串的开始位置
如果设置了 Multiline 属性,^ 也匹配 ‘\n’ 或 ‘\r’ 之后的位置
`$` 匹配输入字符串的结束位置
如果设置了 Multiline 属性, `$` 也匹配 ‘\n’ 或 ‘\r’ 之前的位置
. 匹配除 “\n” 之外的任何单个字符
如果要匹配包括 ‘\n’ 在内的任何字符,请使用象 ‘[.\n]’ 的模式
[…] 字符集合。匹配所包含的任意一个字符
例如, ‘[abc]’ 可以匹配 “plain” 中的 ‘a’
[^…] 负值字符集合。匹配未包含的任意字符
例如, ‘[^abc]’ 可以匹配 “plain” 中的’p’
p1|p2|p3 匹配 p1 或 p2 或 p3
例如,’z|food’ 匹配 “z” 或 “food”。'(z|f)ood’ 则匹配 “zood” 或 “food”
* 匹配前面的子表达式零次或多次
例如,zo 能匹配 “z” 以及 “zoo”。 等价于{0,}。
+ 匹配前面的子表达式一次或多次
例如,’zo+’ 能匹配 “zo” 以及 “zoo”,但不能匹配 “z”。+ 等价于
{n} n 是一个非负整数。匹配确定的 n 次
例如,’o{2}’ 不能匹配 “Bob” 中的 ‘o’,但是能匹配 “food” 中的两个 o
{n,m} m 和 n 均为非负整数,其中n <= m。最少匹配 n 次且最多匹配 m 次

在MySQL 中正则表达式用的不多,但也有那么几个时刻还是很有用处的

下面我们就拿几个伪需求来看看如何使用

说是伪需求,是因为除了全文检索,其实都可以用 LIKE 语句代替

测试数据

首先运行下面的 SQL 语句准备测试数据

DROP TABLE IF EXISTS tbl_language;

CREATE TABLE IF NOT EXISTS tbl_language(
id INT UNSIGNED AUTO_INCREMENT,
name VARCHAR(64) NOT NULL,
url VARCHAR(128) NOT NULL,
founded_at DATE,
PRIMARY KEY ( id )
)ENGINE=InnoDB DEFAULT CHARSET=utf8mb4;

INSERT INTO tbl_language VALUES
(1,'Python','https://ddkk.com','1991-2-20'),
(2,'PHP','http://www.php.net','1994-1-1'),
(3,'Ruby','https://www.ruby-lang.org/','1996-12-25'),
(4,'Kotlin','http://kotlinlang.org/','2016-02-17');

INSERT INTO tbl_language (name,url) VALUES
('Perl','http://www.perl.org/'),
('Scala','http://www.scala-lang.org/');

使用SELECT * FROM tbl_language 显示数据如下

+----+--------+----------------------------+------------+
|id | name   | url                        | founded_at |
+----+--------+----------------------------+------------+
|1 | Python | https://ddkk.com        | 1991-02-20 |
|2 | PHP    | http://www.php.net         | 1994-01-01 |
|3 | Ruby   | https://www.ruby-lang.org/ | 1996-12-25 |
|4 | Kotlin | http://kotlinlang.org/     | 2016-02-17 |
|5 | Perl   | http://www.perl.org/       | NULL       |
|6 | Scala  | http://www.scala-lang.org/ | NULL       |
+----+--------+----------------------------+------------+

范例

1、 查找name字段中以Py为开头的所有name;

SELECT name FROM tbl_language WHERE name REGEXP '^Py';

运行结果如下

+--------+
| name   |
+--------+
| Python |
+--------+

2、 查找url字段中以org/结尾的所有name;

SELECT name FROM tbl_language WHERE url REGEXP 'org/$';

运行结果如下

+--------+
| name   |
+--------+
| Ruby   |
| Kotlin |
| Perl   |
| Scala  |
+--------+

3、 查找url字段中包含lang字符串的所有name;

SELECT name FROM tbl_language WHERE url REGEXP 'lang';

运行结果如下

+--------+
| name   |
+--------+
| Ruby   |
| Kotlin |
| Scala  |
+--------+

4、 来一个复杂的,查找url字段中包含-lan且以rg/结尾的所有name;

SELECT name FROM tbl_language WHERE url REGEXP '-lan.*rg/$';

运行结果如下

+-------+
| name  |
+-------+
| Ruby  |
| Scala |
+-------+