在 MySQL 中正确配置字符集和排序规则,能有效避免乱码问题并提升多语言支持能力。核心是设置合适的字符集(如 utf8mb4)和对应的排序规则(如 utf8mb4_unicode_ci),从服务器、数据库、表到字段逐层生效。
1. 查看当前字符集和排序规则
执行以下命令查看当前 MySQL 实例的默认设置:
查看全局字符集:SHOW VARIABLES LIKE 'character_set_%';查看排序规则设置:
SHOW VARIABLES LIKE 'collation_%';
这些变量中,
character_set_server和
collation_server决定新数据库的默认值。
2. 配置服务器级字符集
修改 MySQL 配置文件(my.cnf 或 my.ini)来设定全局默认:
在[mysqld]段添加:
[mysqld] character-set-server = utf8mb4 collation-server = utf8mb4_unicode_ci
重启 MySQL 服务后,新建数据库将自动使用这些设置。
3. 设置数据库和表的字符集
创建数据库时显式指定字符集:
CREATE DATABASE mydb CHARACTER SET utf8mb4 COLLATE utf8mb4_unicode_ci;
建表时也可单独设置:
CREATE TABLE users ( id INT PRIMARY KEY, name VARCHAR(100) ) CHARACTER SET utf8mb4 COLLATE utf8mb4_general_ci;
字段级别也能自定义:
ALTER TABLE users MODIFY name VARCHAR(100) CHARACTER SET utf8mb4 COLLATE utf8mb4_bin;
4. 推荐使用的字符集与排序规则
现代应用建议统一使用:
字符集:utf8mb4(支持完整 UTF-8,包括 emoji) 排序规则:utf8mb4_unicode_ci:基于 Unicode 标准,排序更准确
utf8mb4_general_ci:速度更快但精度略低(已弃用)
utf8mb4_bin:区分大小写和重音
生产环境推荐使用
utf8mb4_unicode_ci。
基本上就这些。只要在配置文件中设好 server 级别,并在建库建表时明确指定,就能避免大多数编码问题。
