Java -多线程事务无法完美实现吗

2023-12-14 16:42:24 +08:00
 RichardX2023

      如果遇到高耗时操作肯定首先想到的就是通过多线程来实现,但是如果再加上一层事务控制就比较难办。之前根据二阶段提交的思路实现了多线程事务的控制,感觉好像没问题了。

      但是最近遇到一个问题,看起来很无解。如果任务量少,需要使用的线程数量也少,这种场景通过二阶段提交实现多线程事务控制是没有问题的。

      但是如果任务量很多的情况下:线程池的池子内部线程数量是有限的,所以任务量再大,同时在运行的也只能是线程池容量大小的任务数。在这个前提下,二阶段提交是需要等所有线程一阶段执行结束后,进入二阶段,统一回滚或者提交,回滚或者提交都是需要在各自线程内部进行

      比如任务量是 20 个,线程池容量是 10 ,一次性只能有 10 个任务在执行,这个限制下,仅仅能实现 10 个任务的统一提交或者回滚。描述大概就这样,需要代码的话再贴

      看有没有别的思路,我卡住了。

3208 次点击
所在节点    Java
37 条回复
monmon
2023-12-15 10:58:29 +08:00
我理解你想要的可能是下面这两种方法
普通多线程处理的方法
``` Java

TaskExecutor taskExecutor = SpringUtil.getTaskExecutor();
CompletableFuture<Integer>[] tasks = new CompletableFuture[100];
for (int i = 0; i < 100; i++) {
int fi = i;
tasks[i] = CompletableFuture.supplyAsync(() -> fi / 2, taskExecutor);
}
// 等待所有任务完成
CompletableFuture.allOf(tasks);
for (CompletableFuture<Integer> task : tasks) {
Integer result = null;
try {
result = task.get();
} catch (InterruptedException | ExecutionException e) {
throw new RuntimeException(e);
}
System.out.println(result);
}

```
如果使用了 JDK21 可以尝试结构化并发 Shutdown policies 处理
https://openjdk.org/jeps/453#:~:text=custom%20shutdown%20policies.-,Shutdown%20policies,-When%20dealing%20with
RichardX2023
2023-12-18 09:48:04 +08:00
@ZZ74 当然有关系,所有任务跑完 commit ,线程池只有 10 个线程一次只能执行 10 个任务怎么全跑完,10 个任务执行完了是 commit 还是 rollback ,后边还有任务呢
RichardX2023
2023-12-18 09:48:46 +08:00
@jli100 差不多,能看得清晰一点
RichardX2023
2023-12-18 09:49:24 +08:00
@monmon 老项目升级 jdk 比较困难
Plutooo
2023-12-18 10:18:20 +08:00
好问题,但是我能想到的跟大伙想到的差不多,无非就是扩大线程池或者使用无边界线程池,在业务上控制提交任务的数量避免资源耗尽,楼主要是有好的解决办法了圈一下
RichardX2023
2023-12-18 13:35:48 +08:00
@BQsummer https://developer.aliyun.com/article/1203834
这种方式的确是可行的,它实实在在的解决了事务的提交回滚在各个子线程处理的问题,但是,它也有自己的局限性,
```sqlSession.getMapper() ```问题就在这行代码,就是说只有通过这个方法获取的 Mapper 才能进行事务控制,通过 spring 周期管理的 Mapper 还是不受这个事务控制的,这个方法获取的 Mapper 是通过代理又创建了一个新的实例。

那么它的实现逻辑也就不能实现我的诉求,我希望是这个多线程工具对业务代码没有侵入性,也就是业务代码只要实现一个 Runnable 或者 Callable 就可以直接使用,这个显然需要对业务代码进行改动的
ppto
2023-12-18 14:38:54 +08:00
@ZZ74 #19 我的理解里,不仅数据库连接,网络操作,都不会放到多线程里共用一个 fd ,如果多个线程并发的读写 fd ,那数据不就乱套了。
ZZ74
2023-12-18 15:28:38 +08:00
@ppto
每次用到 fd 去操作时 加锁就好了。
RichardX2023
2023-12-18 15:47:49 +08:00
@ZZ74
@ppto 多线程操作适合用于查询、插入、删除,可能不适合更新。
更新操作数据库会自动上行锁,假如两个任务操作了同一行数据。
任务一拿到行锁-完成任务-等待任务二完成一起 commit 并释放锁,
任务二等待行锁占用者释放行锁,它得拿到锁才能进行更新,
所以任务一一直等待事务提交释放行锁任务二一直处于行锁等待
RichardX2023
2023-12-18 15:49:40 +08:00
多线程操作适合用于查询、插入、删除,可能不适合更新。
更新操作数据库会自动上行锁,假如两个任务操作了同一行数据。

任务一拿到行锁-完成任务-等待任务二完成一起 commit 并释放锁,
任务二等待行锁占用者释放行锁,它得拿到锁才能进行更新。

所以任务一 一直等待事务提交释放行锁
任务二一直处于行锁等待状态。
这就是一个死锁状态。
ppto
2023-12-18 16:16:13 +08:00
我理解不是这样,例如一个 mysql 连接,被 A 线程 和 B 线程共享,A 线程发起一个查询请求,mysql 服务返回查询结果。这时,可能是 B 线程因为 fd 可读事件被唤醒,也可能是 A ,或者 A 和 B 都会被唤醒。我记不太清了但是倾向于 AB 都会因为 fd 可读事件被唤醒。
ZZ74
2023-12-18 16:28:11 +08:00
@ppto
OP 和我们说的不在同一个线~~~~~ 所以我才说上锁
lock conn
exec select & read result
unlock
这样就不会了。

@RichardX2023
共享同一个数据连接的两个任务 是不会死锁的。
Aresxue
2023-12-18 16:32:07 +08:00
@RichardX2023 核心原因是 java.sql.Connection 不是线程安全的,所以每个线程只能独占一个链接,对于你说的 20 个任务 10 个 work 线程的情况可以对线程池加以改造,提交任务(必须是批量提交)的时候根据剩余可用连接分配一定数目的链接(这个算法决定了这个策略的健壮性),比如 20 个任务可以分配 5 个链接,然后每 4 个任务共享一个链接,当然这四个之间就要排队了对耗时的优化肯定没有一个任务一个线程效果这么好,但并发度确实也从 1 变成了 5 。
siweipancc
2023-12-18 17:56:36 +08:00
@monmon 昨天在看虚拟线程,第三方库甚至 spring 对这个的兼容也不是很好,瞅了一下结构化这个孵化项目,我觉得会难产,除非 JPA4.0 规范大改。
当然结构化对楼主这种需求确实是符合的(可以实现快速失败),还有个局部作用域值(预览版本)可以使用。
RichardX2023
2023-12-18 18:48:10 +08:00
@ZZ74 实际操作下应该就可以明白了,可能我的表述有问题,但是结果就是我说的那样,多个线程操作并且事务手动情况下,更新同一条数据就是会陷入无限的锁等待,可能我说死锁说法有问题

ZZ74
2023-12-19 08:46:45 +08:00
@RichardX2023
trx_id 说明了一切....
RichardX2023
2023-12-19 09:39:58 +08:00
@ZZ74 说明什么,我从头到尾写的多线程,本来就是多事务

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1000408

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX