测试环境:MySQL 5.7 创建测试表:
mysql> create table test1 -> (id bigint auto_increment, -> aaa varchar(40), -> PRIMARY key(id) -> ); Query OK, 0 rows affected (0.01 sec) mysql> create table test2 -> (id varchar(40), -> aaa varchar(40), -> PRIMARY key(id) -> ); Query OK, 0 rows affected (0.01 sec)
找了个源表,一千多万的数据
mysql> select count(*) from test01; +----------+ | count(*) | +----------+ | 11888222 | +----------+ 1 row in set (2.34 sec) mysql> select * from test01 limit 10; +-----------------+-----------------+ | id | aaa | +-----------------+-----------------+ | 150213115534159 | 150213115534159 | | 150213115537467 | 150213115537467 | | 150213115559466 | 150213115559466 | | 150213115611916 | 150213115611916 | | 150213115612852 | 150213115612852 | | 150213115622783 | 150213115622783 | | 150213115632760 | 150213115632760 | | 150213115640633 | 150213115640633 | | 150213115738657 | 150213115738657 | | 150213115742291 | 150213115742291 | +-----------------+-----------------+ 10 rows in set (0.00 sec)
分别将数据插入到test1表和test2表,test1表的id值靠auto_increment自动生成,test2表的id为源表的id(随机字符串)
mysql> insert into test1(aaa) select aaa from test01; Query OK, 11888222 rows affected (54.43 sec) mysql> insert into test2 select * from test01; Query OK, 11888222 rows affected (1 min 43.67 sec)
可以看到随机字符串做主键的话,耗时比自增主键慢得多。 1、如果表使用自增主键,那么每次插入新的记录,记录就会顺序添加到当前索引节点的后续位置,当一页写满,就会自动开辟一个新的页 2、如果使用非自增主键(如果身份证号或学号等),由于每次插入主键的值近似于随机,因此每次新纪录都要被插到现有索引页得中间某个位置,此时MySQL不得不为了将新记录插到合适位置而移动数据,甚至目标页面可能已经被回写到磁盘上而从缓存中清掉,此时又要从磁盘上读回来,这增加了很多开销,同时频繁的移动、分页操作造成了大量的碎片,得到了不够紧凑的索引结构,后续不得不通过OPTIMIZE TABLE来重建表并优化填充页面。
