当前位置:首页 > 技术分析 > 正文内容

完蛋!又被分库分表坑惨了……

ruisui883周前 (04-11)技术分析18


前言


分库分表是解决单库单表性能瓶颈的有效手段,但也会引入新的复杂性和技术挑战。


这篇文章跟大家一起聊聊,分库分表后带来的7个问题,以及相关的解决方案,希望对你会有所帮助。


一、全局唯一 ID 问题


1、问题描述


在分库分表后,每张表的自增 ID 只在本表范围内唯一,但无法保证全局唯一。


例如:


  • 订单表_1 的主键从 1 开始,订单表_2 的主键也从 1 开始。
  • 在需要全局唯一 ID 的场景(如订单号、用户 ID)中会发生冲突。


2、解决方案


1)使用分布式 ID 生成器


推荐工具:


  • Snowflake:Twitter 开源的分布式 ID 算法。
  • 百度 UidGenerator:基于 Snowflake 的改进版。
  • Leaf:美团开源,号段模式和 Snowflake 双支持。


代码示例:Snowflake 算法



public class SnowflakeIdGenerator {
    private final long epoch = 1622476800000L; // 自定义时间戳
    private final long workerIdBits = 5L; // 机器ID
    private final long datacenterIdBits = 5L; // 数据中心ID
    private final long sequenceBits = 12L; // 序列号


    private final long maxWorkerId = ~(-1L << workerIdBits);
    private final long maxDatacenterId = ~(-1L << datacenterIdBits);
    private final long sequenceMask = ~(-1L << sequencebits private long workerid private long datacenterid private long sequence='0L;' private long lasttimestamp='-1L;' public snowflakeidgeneratorlong workerid long datacenterid if workerid> maxWorkerId || workerId < 0 throw new illegalargumentexceptionworker id out of range if datacenterid> maxDatacenterId || datacenterId < 0) throw new IllegalArgumentException("Datacenter ID out of range");
        this.workerId = workerId;
        this.datacenterId = datacenterId;
    }


    public synchronized long nextId() {
        long timestamp = System.currentTimeMillis();
        if (timestamp < lastTimestamp) throw new RuntimeException("Clock moved backwards");


        if (timestamp == lastTimestamp) {
            sequence = (sequence + 1) & sequenceMask;
            if (sequence == 0) timestamp = waitNextMillis(lastTimestamp);
        } else sequence = 0L;


        lastTimestamp = timestamp;
        return ((timestamp - epoch) << (workerIdBits + datacenterIdBits + sequenceBits))
                | (datacenterId << (workerIdBits + sequenceBits))
                | (workerId << sequenceBits)
                | sequence;
    }


    private long waitNextMillis(long lastTimestamp) {
        long timestamp = System.currentTimeMillis();
        while (timestamp <= lastTimestamp) timestamp = System.currentTimeMillis();
        return timestamp;
    }
}


2)数据库号段分配


原理:维护一个独立的 global_id 表,分库按步长分配 ID:

  • 库 1:ID 步长为 2,从 1 开始(1, 3, 5...)。
  • 库 2:ID 步长为 2,从 2 开始(2, 4, 6...)。


示例

CREATE TABLE global_id (
    id INT PRIMARY KEY AUTO_INCREMENT,
    stub CHAR(1) NOT NULL UNIQUE
);
-- 步长设置:
SET @@auto_increment_increment = 2;
SET @@auto_increment_offset = 1;


二、跨库跨表查询复杂性


1、问题描述


分库分表后,聚合查询(如总数统计、分页查询)需要跨多个分片表执行,增加了查询复杂度。


例如:

  • 查询所有订单总数,需要跨 10 个订单表聚合。
  • 按创建时间分页查询所有订单。


2、解决方案


1)使用中间件(推荐)


  • ShardingSphere 或 MyCAT:支持 SQL 分片执行和结果合并。
  • 优点:业务代码无需修改,中间件完成分库分表逻辑。


2)手动分片查询


  • 按分片逐一查询数据,在业务层合并结果。


示例代码:聚合查询


public int countAllOrders() {
    int total = 0;
    for (String db : List.of("db1", "db2", "db3")) {
        String sql = "SELECT COUNT(*) FROM " + db + ".orders";
        total += jdbcTemplate.queryForObject(sql, Integer.class);
    }
    return total;
}


示例代码:跨分片分页查询


public List paginateOrders(int page, int size) {
    List allOrders = new ArrayList<>();
    for (String table : List.of("orders_1", "orders_2")) {
        String sql = "SELECT * FROM " + table + " LIMIT 100";
        allOrders.addAll(jdbcTemplate.query(sql, new OrderRowMapper()));
    }
    allOrders.sort(Comparator.comparing(Order::getCreatedAt));
    return allOrders.stream()
            .skip((page - 1) * size)
            .limit(size)
            .collect(Collectors.toList());
}


手动分片查询的方案,如果数据比较多,性能会比较差。


三、分布式事务问题


1、问题描述


分布式事务(如订单表在库 A,库存表在库 B)无法使用单库事务,导致可能会出现数据的一致性问题。


2、解决方案


1)分布式事务框架


  • Seata:支持跨库的分布式事务。


示例代码:


@GlobalTransactional
public void createOrder(Order order) {
    orderService.saveOrder(order); // 写入库A
    stockService.reduceStock(order.getProductId()); // 更新库B
}


2)柔性事务


  • 使用消息中间件实现最终一致性。
  • 典型实现:RocketMQ 消息事务。


四、分片键设计问题


1、问题描述


分片键选择不当可能导致数据倾斜(热点问题)或查询路由效率低。


2、解决方案


1)分片键设计原则


  • 数据分布均匀:避免热点问题。
  • 常用查询字段:尽量选高频查询字段。


2)路由表


  • 维护全局路由表,映射分片键到分表。


示例代码:路由表查询


public String getTargetTable(int userId) {
    String sql = "SELECT table_name FROM routing_table WHERE user_id = ?";
    return jdbcTemplate.queryForObject(sql, new Object[]{userId}, String.class);
}


五、数据迁移问题


1、问题描述


扩容(如从 4 个分片扩展到 8 个分片)时,旧数据需要迁移到新分片,迁移复杂且可能影响线上服务。


2、解决方案


1)双写策略


  • 数据迁移期间,旧表和新表同时写入。
  • 待迁移完成后,切换到新表。


2)增量同步


  • 使用 Canal 监听 MySQL Binlog,将数据迁移到新分片。


示例:Canal 配置


canal.destinations:
  example:
    mysql:
      hostname: localhost
      port: 3306
      username: root
      password: password
    kafka:
      servers: localhost:9092
      topic: example_topic




六、分页查询问题


1、问题描述


分页查询需要从多个分片表合并数据,再统一分页,逻辑复杂度增加。


2、解决方案


各分片分页后合并:先按分片分页查询,业务层合并排序后分页。

中间件支持分页:如 ShardingSphere。


示例代码:跨分片分页


public List queryPagedOrders(int page, int size) {
    List results = new ArrayList<>();
    for (String table : List.of("orders_1", "orders_2")) {
        results.addAll(jdbcTemplate.query("SELECT * FROM " + table + " LIMIT 100", new OrderRowMapper()));
    }
    results.sort(Comparator.comparing(Order::getCreatedAt));
    return results.stream().skip((page - 1) * size).limit(size).collect(Collectors.toList());
}


但如果分的表太多,可能会有内存占用过多的问题,需要做好控制。


七、运维复杂性


1、问题描述


分库分表后,运维难度增加:


  • 数据库实例多,监控和备份复杂。
  • 故障排查需要跨多个库。


2、解决方案


自动化运维平台:如阿里云 DMS。

监控工具:使用 Prometheus + Grafana 实现分片监控。


总结


分库分表本质上是“性能换复杂度”,它虽然能有效提升系统的性能和扩展性,但问题也随之而来。


分库分表后带来的问题总结如下:



问题

解决方案

全局唯一 ID

雪花算法、号段分配、Leaf

跨库跨表查询

中间件支持(如 ShardingSphere)或手动合并

分布式事务

分布式事务框架(Seata)、消息最终一致性

分片键设计问题

路由表或高效分片键

数据迁移问题

双写策略或增量同步(如 Canal)

分页查询问题

分片查询后合并排序

运维复杂性

自动化工具(DMS)、监控工具(Prometheus + Grafana)


应根据业务场景选择适合的分库分表策略,并通过工具和技术方案,解决由此带来的一些问题,最终实现系统的高性能与高可靠性。


作者丨苏三

来源丨公众号:苏三说技术(ID:susanSayJava)

dbaplus社群欢迎广大技术人员投稿,投稿邮箱:editor@dbaplus.cn

扫描二维码推送至手机访问。

版权声明:本文由ruisui88发布,如需转载请注明出处。

本文链接:http://www.ruisui88.com/post/3432.html

分享给朋友:

“完蛋!又被分库分表坑惨了……” 的相关文章

摄影后期必看 | PS插件camera raw 16.4教程 | 范围蒙版

范围蒙版Camera Raw 【蒙版】模块中提供了三个范围蒙版工具,可以通过特定的范围来创建蒙版。此次新增的【范围蒙版】大大加强了acr插件对局部调整的能力。点击下拉小箭头可以看到【颜色范围】,可用于快速选择想要编辑的颜色。快捷键:Shift + C【明亮度范围】,可用于快速选择想要调整的明亮度。快...

「干货」FPGA设计中深度约束技巧及调试经验总结

今天跟大家分享的内容很重要,也是我们调试FPGA经验的总结。随着FPGA对时序和性能的要求越来越高,高频率、大位宽的设计越来越多。在调试这些FPGA样机时,需要从写代码时就要小心谨慎,否则写出来的代码可能无法满足时序要求。另外,最近跟网友聊天时,有谈到公众号寿命的问题,我觉得网络交换FPGA公众号应...

数组、去重、排序、合并、过滤、删除

ES6数字去重 Array.from(new Set([1,2,3,3,4,4])) //[1,2,3,4] [...new Set([1,2,3,3,4,4])] //[1,2,3,4]2、ES6数字排序 [1,2,3,4].sort(); // [1, 2,3,4],默认是升序...

前端路由简介以及vue-router实现原理

作者:muwoo 来源:https://zhuanlan.zhihu.com/p/37730038后端路由简介路由这个概念最先是后端出现的。在以前用模板引擎开发页面时,经常会看到这样http://www.xxx.com/login 大致流程可以看成这样:浏览器发出请求服务器监听到80 端口(或443...

分享15个基于Vue3.0全家桶的优秀开源项目

大家好,我是 Echa。今天来分享 15 个基于 Vue3.0 全家桶的优秀开源项目!1. Vue Admin Bettergithub : https://github.com/chuzhixin/vue-admin-bettervue admin better 对比其他来源 admin 框架有如...

一套代码,多端运行——使用Vue3开发兼容多平台的小程序

介绍Vue3发布已经有一段时间了,从目前来看,其生态还算可以,也已经有了各种组件库给予了支持,但是不管是Vue3还是Vue2都无法直接用来开发小程序,因此国内一些技术团队针对Vue开发了一些多端兼容运行的开发框架,今天来体验一下使用Taro来体验一下使用Vue3开发多平台运行的小程序,以便于兼容各大...