mysql，sqlserver 数据库单表数据过大的处理方式

经常混迹于技术社区，频繁看到这个题目，今天干脆在自己博客重复一遍解决办法：

针对 mysql，sqlserver 等关系型数据库单表数据过大的处理方式

如果不是阿里云的分布式数据库 DRDS那种多机器集群方案的话：先考虑表分区；然后考虑分表；然后考虑分库。

这个题目是我所经历过的，我的 GPS 汽车定位系统，早期就是选用的 Sql Server 数据库。当时我选取的方案就是第一种：表分区。表分区的优势是，如果表结构合理，可以不涉及到程序修改。也就是说，对程序来讲依然是单表读写的效果！

所有轨迹数据存入到一个巨大的表里。有多大呢？

最大存储量超过 10 亿行。具体数值应该是 12 亿多点，由于系统设计为只存储 30 天轨迹，所以线上期间最大存储只到这个数，再后来采用云架构，上云替换成非关系性数据库，获得了更高的写入性能和存储压缩能力。
每日写入量就超过 1500 万行。上下班交通高峰时候每秒写入量平均超过 500 行。也就是 500iops，距离系统设计的压测指标 3000 还有一大截

这张大型单表设计要点：（一个聚集索引用于写入，一个联合索引用于查询，没有主键，使用表分区）

明确主键用途：

真的需要查询单行数据时候才需要主键！

我采用无主键设计，用于避免写入时候浪费维护插入数据的性能。最早使用聚集的类似自增的 id 主键，压测写入超过 5 亿行的时候，写入性能缩减一半

准确适用聚集：

写入的数据在硬盘物理顺序上是追加，而不是插入！

我把时间戳字段设置为聚集索引，用于聚集写入目的设计。保证硬盘上的物理写入顺序，不浪费性能用于插入数据

职责足够单一：

用于精准索引！

使用时间 + 设备联合索引，保证这张表只有一个查询用途。保证系统只有一种查询目的：按照设备号，查询一个时间段的数据。

精确的表分区：

要求查询时候限定最大量或者最大取值范围！

按天进行表分区，实现大数据量下的高效查询。这里是本文重点，按照聚集索引进行，可以让目标数据局限在更小的范围进行，虽然单表数据上亿，但是查询基本上只在某一天的的几千万里进行索引查询

每张表会有各自的特点，不可生搬硬套，总结下我这张表的特点：

只增，不删，不改！

关于不删除中：每天使用作业删除超过 30 天的那个分区数据除外，因为要清空旧的表分区，腾出新的表分区！

只有一个业务查询：只按照设备编码查询某个时间段

只有一个运维删除：删除旧的分区数据

这张表，是我技术生涯中进步的一个大阶梯，让我我体会到了系统架构的意义。

虽然我的这张举行表看似只有 4 个关键点，但是这四个非常精准的关键点设计，耗费了我一个月之久！正是这么足够精准的表结构设计，才撑起了后来压测并发量超过 3000 的并发写入量！压测的指标跟数据库所在的硬盘有直接关系，当时选取的硬盘是 4 块 10000 转的 SAS 盘做了 Raid10 的环境

关于后来为什么没有更高的实际应用数值，是因为系统后来改版为云架构，使用了阿里云，更改为写入性能更高的非关系型数据库 MongoDB 存储轨迹数据。所以虽然距离压测指标还差很远，但是也没有实际跑到这个数据！单机应用再怎么改造，每次升级都是一件麻烦事，所以应当尽可能将瓶颈点提高，甚至消除，云架构的意义就在于弹性扩展，虽然我在数据库方面还没有这方面的成功案例可分享，但是这种架构的意义很明白：将来面对更大的压力，只需要增加服务器数量！

最后提一句，很多人觉得 SSD 就足够高的性能了，但是对于云服务器，ssd 的性能才跟传统物理机的 iops 相持平，这是由于虚拟化层面的损失导致的！

原文地址：https://www.opengps.cn/Blog/View.aspx?id=284 文章的更新编辑依此链接为准。欢迎关注源站原创文章！

SqlServer 触发器获取变更的数据

[图片] 1、Inserted 和 Deleted Inserted 表用于存储 INSERT 和 UPDATE 语句所影响的行的副本。在一个插入或更新事务处理中，新建行被同时添加到 inserted 表和触发器表中。Inserted 表中的行是触发器表中新行的副本。插入操作 Inserted 表有数据，Delete ..

事故

[图片] 起因目前公司数据库全部部署在一台服务器上（就叫 S1 吧）（主要是正式库和测试库），导致目前服务器磁盘压力太大，领导提出，将测试库与正式库分离，将测试库迁移到另一台服务器（S2）。操作梳理 S1 上所有的测试库，像同事询问他们的测试库，然后将所有的测试库备份，之后还原到 S2 上面，之后协调同事进行测试 ..

关于将远古级数据库 SqlServer 2000 配置 Druid 数据库连接池

起因因为开发系统时遇到某些需求，需要配置连接 SqlServer 2000 数据源于是查询了相关文档发现 Druid 本身是支持 SqlServer 数据库的但是对于 SqlServer 本身，如何使用正确的 JDBC 版本才是头疼的地方。结论 Yml 配置信息先给出配置信息： datasource: ma ..

有没有用 jdbctemplate 连过存储过程的各位？

用 JDBCTemplate 调用 Sqlserver 数据库存储过程报错,其中存储过程中带 EXEC 其他的存储过程（存储过程里边有 exec 存储过程），各位看看有没有好的处理方案（领导是数据库 Player 必须让我调用他写的存储过程）报错类型如下[图片]

配置 Oracle 透明网关用以连接 SQLServer 经验总结

情景介绍 1、需求：业务中设计两个不同的系统，系统 1 和系统 2，两个系统分别使用的是 Oracle 和 SQLServer 数据库。现需要在系统 1 的数据库中直接查询系统 2 数据库的数据。即在 Oracle 中执行 SQL 脚本可以直接查询 SQLServer 数据库中的数据。 2、Oracle 透明网关即 O ..

数据库显示进度百分比、估算时间

用数据库管理要看的书和课程时，发现要用到“模板”功能来实现“进度”、“耗时估算”的展现，而模板功能要通过代码实现，经过对论坛大佬教程和 GPT 的参考，有了点眉目，这里分享下本编程小白的实践过程，以及加减乘数运算模板代码。首先，在汇总页旁的“+”号新建“进行中”、“时间统计”，专门显示进度百分比和估算时间，右击列可以 ..

欢迎来到这里！

我们正在构建一个小众社区，大家在这里相互信任，以平等 • 自由 • 奔放的价值观进行分享交流。最终，希望大家能够找到与自己志同道合的伙伴，共同成长。

关于

mysql，sqlserver 数据库单表数据过大的处理方式

相关帖子

SqlServer 触发器获取变更的数据

SQLServer 的 HTTP 请求功能

事故

关于将远古级数据库 SqlServer 2000 配置 Druid 数据库连接池

有没有用 jdbctemplate 连过存储过程的各位？

配置 Oracle 透明网关用以连接 SQLServer 经验总结

数据库显示进度百分比、估算时间

欢迎来到这里！

近期热议

推荐标签标签

最新标签

mysql，sqlserver 数据库单表数据过大的处理方式

相关帖子

SqlServer 触发器获取变更的数据

SQLServer 的 HTTP 请求功能

事故

关于将远古级数据库 SqlServer 2000 配置 Druid 数据库连接池

有没有用 jdbctemplate 连过存储过程的各位？

配置 Oracle 透明网关用以连接 SQLServer 经验总结

数据库显示进度百分比、估算时间

欢迎来到这里！

近期热议

推荐标签 标签

最新标签

推荐标签标签