主键就是表里那个“身份证号”
MySQL 主键(
PRIMARY KEY)不是可有可无的装饰,而是数据库强制要求你为每张表指定的唯一标识字段(或字段组合)。它必须满足两个铁律:
NOT NULL(不能为
NULL)和
UNIQUE(整张表内绝不重复)。比如一张
users表,用
id字段当主键,插入时若漏填、填重复、或填
NULL,MySQL 会直接报错:
ERROR 1048 (23000): Column 'id' cannot be null或
ERROR 1062 (23000): Duplicate entry '1' for key 'PRIMARY'。
为什么非设不可?关键在 InnoDB 的聚簇索引
如果你用的是默认存储引擎 InnoDB(绝大多数情况都是),主键就决定了整张表数据怎么物理存放。InnoDB 把数据直接存在主键索引的叶子节点上——这叫聚簇索引(
Clustered Index)。这意味着: 按主键查询最快,通常 1–3 次磁盘 I/O 就能定位到行; 没有主键时,InnoDB 会悄悄生成一个隐藏的
GEN_CLUST_INDEX(6 字节 rowid),但这个 ID 对业务完全不可控,且无法用于外键或显式查询; 如果主键是自增整数(如
BIGINT AUTO_INCREMENT),新记录基本追加写入,避免页分裂;而用 UUID 或字符串作主键,容易导致随机插入、频繁页分裂,性能明显下降。
怎么设主键?建表时最稳妥
推荐在
CREATE TABLE时一次性定义主键,避免后期修改引发锁表或数据迁移。常见写法:
CREATE TABLE orders ( id BIGINT UNSIGNED NOT NULL AUTO_INCREMENT, order_no VARCHAR(32) NOT NULL, created_at DATETIME DEFAULT CURRENT_TIMESTAMP, PRIMARY KEY (id), UNIQUE KEY uk_order_no (order_no) );
注意几个硬约束:
AUTO_INCREMENT字段必须是主键(或主键的一部分),且只能有一个; 类型推荐
INT或
BIGINT UNSIGNED(避免负值干扰); 不要用带业务含义的字段(比如
phone、
PRIMARY KEY (user_id, product_id))可行,但会加大二级索引体积,且
INSERT/
UPDATE语句更易出错,日常开发中尽量避免。
已有表补主键?小心锁表和数据冲突
对大表执行
ALTER TABLE t ADD PRIMARY KEY (id)是高危操作:MySQL 会重建整张表(copy & rebuild),期间表被锁,写入阻塞。更麻烦的是,如果该字段已有
NULL值或重复值,命令会直接失败,必须先清理: 查空值:
SELECT COUNT(*) FROM t WHERE id IS NULL;查重复:
SELECT id, COUNT(*) FROM t GROUP BY id HAVING COUNT(*) > 1;补全空值(如用自增模拟):
SET @row := 0; UPDATE t SET id = (@row := @row + 1) WHERE id IS NULL;(慎用,需提前备份)
线上大表务必在低峰期操作,并确认 binlog 格式为
ROW,否则主从延迟可能飙升。
主键看着简单,但它牵一发而动全身——既是数据安全的底线,也是查询性能的基石。很多人只记得加
AUTO_INCREMENT,却忽略类型选择、是否允许负数、以及隐式聚簇行为带来的写放大问题。这些细节,往往在百万级数据量时才突然暴露。
