requests 线程池无法中止子线程问题

2023-08-08 11:35:02 +08:00
 evemoo

后面会接触断点续传、aiohttp 、httpx (

线程池提交完任务(哪怕只开了一个 worker ),tqdm 显示进度条后按 Ctrl + C 并不会中断正在下载的任务。

from concurrent.futures import ThreadPoolExecutor, as_completed

import requests
from tqdm import tqdm


def download(url):
    try:
        filesize = int(requests.get(url, stream=True).headers['Content-length']) or 0
        filename = requests.get(url, stream=True).headers['content-disposition']
        with requests.get(url, stream=True) as responese:
            with tqdm(
                total=filesize,
                desc=f"Downloading: ",
                 unit="B",
                 unit_divisor=1024,
                 ascii=True,
                 unit_scale=True,
                ) as bar:
                with open(filename, mode="ab") as f:  # 追加模式
                    for chunk in responese.iter_content(1024):
                        f.write(chunk)
                        bar.update(len(chunk))
    except (SystemExit, KeyboardInterrupt):
        raise "KeyboardInterrupt"
              

urls = [...]
with ThreadPoolExecutor(maxworkers=8) as pool:
	tasks = pool.map(download, urls)

for task in as_completed(tasks):
	print(task.result())

1277 次点击
所在节点    Python
6 条回复
t133
2023-08-08 11:55:08 +08:00
指定 daemon thread 可解
evemoo
2023-08-08 13:13:59 +08:00
@t133
实际测试,join() 还要带 timeout 参数才能 raise "KeyboardInterrupt"

```python
tasks = []
for url in urls:
task = threading.Thread(target=download, args=(url,))
task.setDaemon(True)
tasks.append(task)
task.start()

for task in tasks:
task.join(2)
```
evemoo
2023-08-08 13:15:00 +08:00
搜了下 concurrent.futrues 的 daemon ,没有找到相似解法。
ruanimal
2023-08-08 14:08:29 +08:00
你需要的是 graceful shutdown 吧,看看 signal 处理
ClericPy
2023-08-08 18:40:02 +08:00
和 Requests 无关, 多线程本来就很难终止, 不然我也不会 all-in 协程去了.
chaoshui
2023-08-11 10:54:01 +08:00
如果不关心子线程的任务情况的话,可以直接在主线程关闭线程池 pool. shutdown(wait=False) 。
如果关心子线程的任务情况,比如正在下载的文件继续下载完毕或者怎样,可以通过一个 threading.Event 通知正在进行的任务退出,配合 Future 对象的 cancel 方法可以干净地处理所有的任务。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/963330

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX