大厂为什么要禁止使用数据库自增主键

2024/10/23 14:39:54 来源：https://blog.csdn.net/liangmengbk/article/details/143166583 浏览: 次关键词：大厂为什么要禁止使用数据库自增主键

大表为何不能用自增主键？

数据库自增主键，以mysql为例，设置表的ID列为自动递增，便可以在插入数据时，ID字段值自动从1开始自动增长，不需要人为干预。

在小公司，或者自己做项目时，设置ID为自动递增，是没有问题的。但是在分布式系统中，自增主键会带来问题，下面举例说明：

有一张商品信息表，表中有3亿条数据，但是3亿条数据是分布在3个数据库中（3个表分片）。前1亿条数据分布在分片1中；中间1亿条数据，分布在分片2；最后1亿条数据分布在分片3中。

问题1：如果单条数据量比较小，在分片1中实际可以容纳1.5亿数据，就无法再进行数据扩展了，因为数据是按照ID范围进行分片的，ID是固定死的，无法在运行期间，进行动态扩展。

问题2：自增主键是数据库层面生成的自增序列，数据库集群只能采用“范围分片”的形式，也就是提前规划好每个分片存储的记录ID。此操作会产生“尾部热点”。

何为尾部热点，在使用范围分片的情况下，测试程序的生成主键是单调递增的，所以新写入的数据往往集中在一个范围范围内，而范围又是数据调度的最小单位，只能存在于单节点，那么这时集群就退化成单机的写入性能，不能充分利用分布式读写的扩展优势了。当所有写操作都集中在集群的一个节点时，就出现了我们常说的数据访问热点（Hotspot）。

以上面的商品表为例，当数据量达到2.5亿时，数据再进行插入操作时，数据都会进入到分片3中，也就是集中会对分片3这个数据库进行操作，前面两个数据库（分片1、分片2），几乎没有压力。