pycurl 相比 requests 是不是效率要高一些?

2014-02-21 14:04:16 +08:00
 yakczh
4240 次点击
所在节点    Python
6 条回复
zhwei
2014-02-21 16:37:39 +08:00
pycurl是封装的curl, 效率要高点,但是requests更加人性化,更易用,如果用于爬虫的话推荐requests,毕竟效率可以通过多线程或者异步提高。
piglei
2014-02-21 17:14:54 +08:00
如楼上所说,“效率”这个东西到了网络库上来说,最大的问题是IO,所以库本身的执行效率来说并不是那么重要。和效率有关的指标还是IO相关的,比如这个库是不是支持keep-alive,是不是支持异步化等等等等。
cute
2014-02-21 17:16:57 +08:00
搜索human_curl

import human_curl
r = human_curl.get('http://v2ex.com')

requests不支持100 continue.
wangfengmadking
2014-02-21 17:37:10 +08:00
还有就是requests原生不支持socket5代理。。。
pubby
2014-02-21 18:20:26 +08:00
一直用gearman

再用node写一个worker,支持socks5代理

爬虫直接将抓取任务交给gearman,异步执行
zhwei
2014-02-21 19:26:18 +08:00
@cute api和requests一样啊,好东西!

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/101220

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX