初学 Python 自己写了个程序爬自己博客

2019-08-21 17:39:44 +08:00
 lzj307077687

https://github.com/straightedge4life/roblograbber
有什么不足麻烦大佬们指正

2159 次点击
所在节点    Python
7 条回复
CallMeReznov
2019-08-21 21:56:15 +08:00
看到楼主头像,我下意识就想脱裤子.
Iamnotfish
2019-08-21 22:50:06 +08:00
干嘛存 SQL,存 CSV,TXT 不是更方便吗(认真脸
wzwwzw
2019-08-22 00:32:44 +08:00
with ThreadPoolExecutor(max_workers) as pool:
for item in args :
future = pool.submit(fn , **item)
futures.append(future)
pool.shutdown()

用了 with 会自动帮你上下文管理的 pool 的,不需要写 shutdown()
lzj307077687
2019-08-22 09:15:12 +08:00
@Iamnotfish #2 一开始是写入 TXT 的 确实简单很多
现在存 MYSQL 主要是之前安装 mysqlclient 填了个坑
感觉不稍微试用下的话有点辜负之前的折腾 嘿嘿
lzj307077687
2019-08-22 09:15:54 +08:00
@wzwwzw #3 又学到了~ 谢谢指正
locoz
2019-08-22 17:23:46 +08:00
看起来你之前应该不是写 Python 的?有些地方 PEP8 规范可以注意一下。
然后为了提高效率可以试试 ayncio,用 aiohttp 这类异步的库。
还有就是像 type(headers) is dict 这种可以写成 isinstance(headers, dict)。
lzj307077687
2019-08-22 17:57:22 +08:00
@locoz #6 谢回复指导,下班回去了解一下~
现在主要是写 PHP。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/593938

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX