MySQL 导入大批量数据 这些优化不生效吗?

2022-02-14 09:16:04 +08:00
815979670  815979670

最近在看《 MySQL 深入浅出》这本书,里面提到了几个 InnoDB 表批量导入数据时的一些优化方案,按照书上的演示来看确实有效,但我实际测试发现,几乎没有效果,不知道是哪里出了问题。

测试数据是导入 102w 条数据,表结构、存储引擎与例子一致,MySQL 版本是 5.7.30

方法 1:导入数据前执行 SET UNIQUE_CHECKS = 0 ,关闭唯一性校验;在导入数据后执行 SET UNIQUE_CHECKS = 1 ,恢复唯一性校验,可以提高导入的效率。

书中效果:关闭前耗时 22.92s 关闭后降低为 19.92s
测试效果:关闭前耗时 26.07s 关闭后耗时:25.70s

多次测试,耗时的差异几乎都差不多,并没有书中 3 秒这么大的差异

方法 2:在导入前执行 SET AUTOCOMMIT = 0,来关闭自动提交,导入结束后再打开自动提交,也可以提高导入效率

书中效果:关闭前耗时 22.92s 关闭后降低为 20.87s
测试效果:关闭前耗时 25.18s 关闭后耗时:25.04s

也是经过多次测试的效果,书中的例子也是 5.7 的版本。 不太清楚导致这个结果的原因是 MySQL 版本差异还是其他什么原因?

3068 次点击
所在节点   MySQL  MySQL
17 条回复
GM
GM
2022-02-14 09:26:55 +08:00
有没有可能作者测试的时候是 HDD ,你是 SSD ?
markgor
markgor
2022-02-14 10:02:13 +08:00
这个是相对的,而不是绝对的。
比如
SET UNIQUE_CHECKS = 0 ,关闭唯一性校验;
如果作者测试的时候瓶颈大部分是 CPU 进行检验,而你测试的时候 CPU 并非瓶颈,那就会出现 你测试的效率和作者测试的效率不一样。

这就是调优存在的意义,并不是把配置复制黏贴就完事,而是根据实际情况找到瓶颈所在,再进行优化。
maocat
maocat
2022-02-14 10:27:38 +08:00
数据量再大一点,再试试
eW91IHNlZSBtZQ
eW91IHNlZSBtZQ
2022-02-14 10:33:23 +08:00
@GM 从他的测试结果看,不太可能
815979670
815979670
2022-02-14 11:00:28 +08:00
@GM 我确实是 SSD 不过我认为这个差距是一个相对的差距,我的两次测试都是 SSD 作者两次测试都是 HDD ,变量一致的情况下 感觉不应该是这个问题。
@maocat 作者演示的时候数据是 52w ,而我测试的时候 数据翻了一倍 102w ,感觉已经到了可以测出差距的地步了。
@markgor 目前看来 这个原因的可能性很大,你的总结对我也有一些启发,调优更重要的是综合判断给出调优方案,而不是一股脑地照前人总结的方案去做。
DinnyXu
DinnyXu
2022-02-14 11:02:01 +08:00
要考虑一个问题,你的 MySQL 部署在哪?比如云服务器 1 核 2G 的 MySQL 性能如何? 你电脑 4 核 8G MySQL 性能又如何?
815979670
815979670
2022-02-14 11:06:15 +08:00
@DinnyXu 没有在云服务器上测试过,只是在本地测试的,我认为在 同一台机器上 如果配置项是唯一的变量,其他不变的情况下 前后还是有对比性的
yulgang
yulgang
2022-02-14 13:10:43 +08:00
感觉你也是有效果的,书中的也不那么明显。
DinnyXu
DinnyXu
2022-02-14 16:30:51 +08:00
@815979670 这个也不一定,因为看你测试的数据和书上的数据秒数相差也就是 2-3 秒内。2-3 秒的波动哪怕是你自己的电脑,同样的数据操作 2 次波动也会不一样,就好比一段 select 语句每次查询返回的时间都不一样,要考虑时间和空间的复杂度
Chinsung
Chinsung
2022-02-14 17:29:19 +08:00
个人感觉 begin;
insert……
Chinsung
Chinsung
2022-02-14 17:29:41 +08:00
@Chinsung #10 commit;
这种最明显,别的都有点玄学
keke88168
keke88168
2022-02-14 17:32:04 +08:00
非要方案,那:
sync_binlog
innodb_flush_log_at_trx_commit
调成双 0 。
opengps
opengps
2022-02-14 20:34:10 +08:00
有些环境因素会导致差异比如磁盘分区时候的块大小
littlewing
littlewing
2022-02-14 21:11:00 +08:00
表结构、存储引擎与例子一致,MySQL 版本是 5.7.30
MySQL 版本一致吗?
配置一致吗?
815979670
815979670
2022-02-15 10:18:25 +08:00
@littlewing 表结构 、存储引擎 MySQL 版本(都是 5.7 ,第三位不一致),电脑配置与书中的例子不一致
littlewing
2022-02-15 10:58:09 +08:00
@815979670 不是电脑配置,是 MySQL 配置
815979670
2022-02-15 11:21:13 +08:00
@littlewing 其他更深入的配置都是保持默认,在测试的这几个配置项上,与例子保持一致

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/833652

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX