有对 casperjs 熟悉的吗,请教个问题(或者对页面抓取/爬虫比较熟悉的)

2014-10-16 21:58:08 +08:00
 leedstyh

这个页面:https://www.briefing.com/login/PlatinumLogin.aspx

我用casperjs获取的时候,得不到正确的页面,请问是他是通过什么判断是程序来访问的。我也设置了UA,之前一直都可以获取的,就今天不行了!

2796 次点击
所在节点    问与答
3 条回复
xiaozi
2014-10-17 00:26:55 +08:00
https的问题,你会发现实际截图的页面地址变成了about:blank,你截图github的时候也会这样
leedstyh
2014-10-17 01:23:42 +08:00
@xiaozi 但是,我写的脚本之前一直可以正常工作的,就今天突然就不好使了

返回的是`<html><head></head><body></body></html>`
xiaozi
2014-10-18 07:57:29 +08:00
@leedstyh 是这样的,你可以升级一下openssl库,我本来也这样,现在好了

http://tool.lu/site/

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/139393

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX