
查看当前字符集设置
在调整之前,先确认当前MySQL的字符集配置:
<font color="#000000">SHOW VARIABLES LIKE 'character_set_%';</font>
<font color="#000000">SHOW VARIABLES LIKE 'collation_%';</font>重点关注以下变量: character_set_client:客户端发送语句使用的字符集 character_set_connection:连接层使用的字符集 character_set_database:当前数据库默认字符集 character_set_server:服务器默认字符集 character_set_results:查询结果返回的字符集
设置服务器级别字符集
最根本的方法是在MySQL配置文件中统一设置默认字符集。配置文件通常为: Linux: /etc/my.cnf 或 /etc/mysql/my.cnf Windows: my.ini 在[mysqld]段落中添加以下内容:[mysqld] character-set-server = utf8mb4 collation-server = utf8mb4_unicode_ci保存后重启MySQL服务生效。 注意:推荐使用utf8mb4而非utf8,因为MySQL的utf8是伪UTF-8,最多支持3字节,无法存储emoji等4字节字符;而utf8mb4才是真正的UTF-8实现。
创建数据库和表时指定字符集
在创建数据库时显式指定字符集:<font color="#000000">CREATE DATABASE mydb CHARACTER SET utf8mb4 COLLATE utf8mb4_unicode_ci;</font>建表时也可以单独设置:
<font color="#000000">CREATE TABLE users ( id INT PRIMARY KEY, name VARCHAR(100) ) ENGINE=InnoDB CHARACTER SET utf8mb4 COLLATE utf8mb4_unicode_ci;</font>如果不指定,则继承数据库或服务器的默认设置。
修改已有对象的字符集
若需更改现有数据库或表的字符集,可用ALTER命令:<font color="#000000">ALTER DATABASE mydb CHARACTER SET utf8mb4 COLLATE utf8mb4_unicode_ci;</font>
<font color="#000000">ALTER TABLE users CONVERT TO CHARACTER SET utf8mb4 COLLATE utf8mb4_unicode_ci;</font>此操作会重新构建表结构并转换数据,建议在低峰期执行,并提前备份。
连接时设置字符集
应用程序连接MySQL时也应声明正确的字符集。例如: PHP(PDO):$pdo = new PDO($dsn, $user, $pass, [
PDO::MYSQL_ATTR_INIT_COMMAND => "SET NAMES utf8mb4"
]);
Java(JDBC)**:jdbc:mysql://localhost:3306/mydb?characterEncoding=utf8mb4命令行客户端**:
登录时加上默认字符集:
mysql -u root -p --default-character-set=utf8mb4
验证设置是否生效
完成配置后再次运行:<font color="#000000">SHOW VARIABLES LIKE 'character_set_%';</font>确保关键变量均为utf8mb4。同时插入一条包含中文或emoji的数据测试显示效果。 基本上就这些。只要从配置文件、数据库、表、连接四个层面统一使用utf8mb4,就能有效避免乱码问题。
