在MySQL中,可以使用
REGEXP(或
RLIKE)操作符进行正则表达式匹配查询。它比
LIKE更灵活,支持复杂的模式匹配。下面介绍常见用法和实用示例。
基本语法
SELECT * FROM 表名 WHERE 字段名 REGEXP '正则表达式';
如果匹配成功,返回该行数据。不区分大小写,默认行为类似于
REGEXP_LIKE(field, pattern, 'i')(在支持的版本中)。
常用正则表达式模式
以下是常用的正则符号及其含义:
^:匹配字符串开头 $:匹配字符串结尾 .:匹配任意单个字符 *:匹配前面的字符零次或多次 +:匹配前面的字符一次或多次 ?:匹配前面的字符零次或一次 [abc]:匹配括号内的任意一个字符 [a-z]:匹配指定范围内的字符 [^abc]:不匹配括号内的任意字符 (ab|cd):匹配多个选项之一实用查询示例
假设有一张用户表
users,包含字段
name。
1. 查找以特定字符开头的数据
查找名字以 "J" 开头的用户:
SELECT * FROM users WHERE name REGEXP '^J';
2. 查找以特定字符结尾的数据
查找邮箱以 ".com" 结尾的记录:
SELECT * FROM users WHERE email REGEXP '.com$';注意:点号需要转义为 \.,因为 . 在正则中表示任意字符。
3. 包含某些字符或模式
查找名字中包含 "ai" 的用户:
SELECT * FROM users WHERE name REGEXP 'ai';
4. 匹配多个可能值(使用 | )
查找名字是 "John" 或 "Jane" 的用户:
SELECT * FROM users WHERE name REGEXP '^(John|Jane)$';
5. 排除特定模式
查找邮箱中不包含 "gmail" 的用户:
SELECT * FROM users WHERE email REGEXP '^[^g]|g[^m]|gm[^a]'(较复杂)
更推荐使用
NOT REGEXP:
SELECT * FROM users WHERE email NOT REGEXP 'gmail';
6. 匹配数字或特定格式
查找邮箱中包含数字的用户:
SELECT * FROM users WHERE email REGEXP '[0-9]';
或者匹配纯数字姓名(极少情况):
SELECT * FROM users WHERE name REGEXP '^[0-9]+$';
大小写敏感控制
MySQL的
REGEXP默认不区分大小写。如需区分,可使用
BINARY关键字:
SELECT * FROM users WHERE name REGEXP BINARY '^A';这将只匹配大写 A 开头的名字。
基本上就这些。掌握常用正则符号后,就能灵活地在MySQL中实现复杂文本匹配查询。实际使用时建议先在小数据集测试正则表达式是否符合预期。
