fushshanpupil's recent timeline updates
fushshanpupil

fushshanpupil

V2EX member #241786, joined on 2017-07-20 09:00:08 +08:00
fushshanpupil's recent replies
@xiang578 随便写了一版,比较粗糙
Jan 23, 2024
Replied to a topic by fushshanpupil 程序员 打算用 echarts 实现航旅纵横的航线图
@qicaisedeyun 不多,16 年到现在就 37 次
Nov 20, 2019
Replied to a topic by siagasky 全球工单系统 Apple 官网这个是什么情况?
上海电信,版本 78.0.3904.108 (正式版本) ( 64 位)
无法复现
Jan 22, 2018
Replied to a topic by fushshanpupil 问与答 100w 个小文件存储问题
@swulling 最新调试结果,最后发现还是由于坑爹的 GIL+threading 库,导致我程序实际上是 IO 密集了,改用 multiprocessing 就跟爬的时候一样 70 个每秒了。

另外感谢各位,提供了很多其他思路,确实还有改进的地方。
Jan 22, 2018
Replied to a topic by fushshanpupil 问与答 100w 个小文件存储问题
@swulling 对顺序没要求,每个网页都有个 id 的,用 id 选的,我参考下 sqlite blob
Jan 22, 2018
Replied to a topic by fushshanpupil 问与答 100w 个小文件存储问题
@rrfeng 提取数据的逻辑随时可能变,不可能每次都再去请求的吧,肯定得保存下来
Jan 22, 2018
Replied to a topic by fushshanpupil 问与答 100w 个小文件存储问题
@em70 怪不得,scrapy 的 cache 就是取 hash 后的前两位创建了一层目录
Jan 22, 2018
Replied to a topic by fushshanpupil 问与答 100w 个小文件存储问题
@ovear 确实全扔一个文件夹下了。。
About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   3284 Online   Highest 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 16ms · UTC 11:33 · PVG 19:33 · LAX 04:33 · JFK 07:33
♥ Do have faith in what you're doing.