Python 是最适合用来做爬虫和模拟登录的语言吗?

2019-05-13 09:32:06 +08:00
 Counter

对于这两个方面,只讨论开发效率的话

2139 次点击
所在节点    问与答
10 条回复
Arnie97
2019-05-13 10:06:46 +08:00
只考虑开发效率的话,应该是 JS + headless Chrome,自己模拟浏览器肯定不会比直接用真的浏览器更方便
locoz
2019-05-13 11:59:52 +08:00
只讨论开发效率的话,通常来说是的,因为现有的库很多很完善了,各种加解密、字节操作都能随意地搞,实在不行再调用其他语言搞就好了。
murmur
2019-05-13 13:02:50 +08:00
现在的爬虫在语言已经没优势了,拼的是反扒,反扒这块就跟 python 没关了
102400
2019-05-13 14:35:55 +08:00
不是
Counter
2019-05-13 15:33:11 +08:00
@102400 愿闻其详
mooncakejs
2019-05-13 15:36:48 +08:00
nodejs 出来之前是,nodejs 成熟后,最适合的是 js
q8164305
2019-05-13 15:42:19 +08:00
我觉得是 js
102400
2019-05-13 15:42:31 +08:00
@Counter Python 所谓的爬虫框架和各种爬虫入门教程,确实容易让人觉得是写爬虫的不二之选,然而用其它语言来做对比并不见得有优势,唯一的优点就是教程和库多,复杂验证惨景的爬虫或者说模拟登陆 python 并没有优势,说句大实话,甚至不如易语言
Orciorc
2019-05-13 15:43:30 +08:00
就模拟登录和信息获取这一块,curl 和 python 的 request 深得我心,java 的 okhtttp 正在尝试
superalsrk
2019-05-13 20:02:57 +08:00
手动狗头。。其实这俩需求, 使用最广的技术栈其实是易语言

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/563505

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX