有些网站指明要求必须用 IE 打开,这样的网站应该怎么爬?

2017-01-25 19:46:17 +08:00
 omg21
可能是这些网站用了 activeX ,只有 IE 才支持,这样的网站怎么爬 ?
5204 次点击
所在节点    Python
14 条回复
plqws
2017-01-25 19:50:04 +08:00
用 webbrowser 组件爬
grac
2017-01-25 22:23:21 +08:00
伪造 user-agent
vibbow
2017-01-26 04:13:41 +08:00
selenium
liuzhiyong
2017-01-26 12:22:36 +08:00
伪造 user-agent ——用 IE 的控件( webbrowser )效率应该非常低。
suduo1987
2017-01-26 14:34:12 +08:00
抓包解析
TaMud
2017-01-26 15:30:03 +08:00
@vibbow selenium 支持 IE???我们乡下人读书少,你不要骗我
TaMud
2017-01-26 15:30:30 +08:00
@grac 你确定??能行???你实验过没有??
grac
2017-01-26 15:35:47 +08:00
为啥不行?为啥不是你去实验?@TaMud
vibbow
2017-01-26 17:19:36 +08:00
@TaMud Selenium 支持 IE 的啊。
justjavac
2017-01-30 14:32:12 +08:00
模拟 IE
junyi233
2017-01-30 16:17:39 +08:00
楼上说的很清楚了,伪造 User-agent 。
另外我要吐槽楼主,你不自己去尝试,反而让回答者去试验,楼主你是有多懒?
cio
2017-01-30 19:09:27 +08:00
你真懒
omg21
2017-02-03 20:43:54 +08:00
@junyi233 话说我哪里有让回答者去试验了。。。
elfsong
2017-02-09 00:08:36 +08:00
Selenium + PhantomJs

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/336917

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX