MySQL 字符串函数不是“统一语法”,每个函数都有独立签名,
CONCAT()要传多个字符串,
SUBSTRING()必须指定起始位置,
REPLACE()的三个参数缺一不可——硬套“基本语法”反而容易写错。
CONCAT()
拼接字符串时 NULL 会污染整个结果
它不忽略
NULL,只要任意一个参数是
NULL,返回值就是
NULL。这不是 bug,是设计行为。 用
IFNULL(col, '')或
COALESCE(col, '')预处理空值 想拼接带分隔符的多列(如姓名+电话),优先考虑
CONCAT_WS(',', col1, col2),它自动跳过 NULL
CONCAT()参数类型宽松,数字会隐式转字符串,但显式用
CAST(n AS CHAR)更可控
SUBSTRING()
和 SUBSTR()
是同一个函数,起始位置从 1 开始
别被名字迷惑:
SUBSTR()是
SUBSTRING()的同义词,两者完全等价。而且 MySQL 的索引从 1 起算,不是 0 —— 这和 Python、JS 完全相反,容易切错。 提取前 3 个字符:
SUBSTRING(str, 1, 3),不是
SUBSTRING(str, 0, 3)从第 5 位到末尾:
SUBSTRING(str, 5),第二个长度参数可省略 负数起始位置表示从末尾倒数:
SUBSTRING('abcde', -2) 返回 'de'
REPLACE()
是全局替换,且区分大小写
它不做正则,只做精确子串替换;默认大小写敏感,
REPLACE('Abc', 'a', 'X') 不会改变原字符串。
需要大小写无关替换?先用 LOWER()统一再操作,或改用正则方案(MySQL 8.0+ 支持
REGEXP_REPLACE()) 只换第一次出现?MySQL 原生不支持,得靠变量+循环模拟,实际中建议在应用层处理 注意性能:在 WHERE 条件里用
REPLACE(col, 'x', 'y') = 'z'会导致全表扫描,无法走索引
LENGTH()
和 CHAR_LENGTH()
的字节 vs 字符区别
中文、emoji 等多字节字符下,二者结果可能不同:
LENGTH()返回字节数,
CHAR_LENGTH()返回字符数。
SELECT
LENGTH('你好'), -- 返回 6(utf8mb4 下每个汉字占 3 字节)
CHAR_LENGTH('你好'); -- 返回 2
判断字符串“长度”是否超限(比如用户名最多 10 个字),必须用 CHAR_LENGTH()截断存储前校验空间占用?用
LENGTH()更贴近磁盘实际消耗 字段定义为
VARCHAR(255),指的是最多 255 个字符,不是 255 字节 —— 所以
CHAR_LENGTH()才匹配语义
字符串函数看着简单,但 NULL 处理、索引失效、字节/字符混淆这三点,是线上 SQL 出问题最频繁的源头。写完记得用真实数据测一遍 NULL 和中文场景。
