好久不更,这次先一个问题,大家试着自己能不能解决哦~~
主角就是这个网站中的美女学霸照片。
https://www.zhinsta.com/profile/527439732/首先分析一下思路,这个网站明显也是抓 instagram 上的照片导入过来的,至于 instagram 爬虫又现成的解决方案,先按下不表。你要解决的只是抓美女照片这个需求的话,直接墙外搞个服务器爬下来即可。
现在的限定是,在墙内的情况下只是抓在这个服务器上的照片。
注意,我分析的时候发现有 tricky 的地方,明显没有妹子图这么好抓。下一页和更多没有使用显式的链接,没有什么规律。
这个时候,就可以放出比较高级的爬虫技巧,比如,之前我做的笔记里
大侠先试试看
上图,剑桥化学系女学霸~~
这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。
https://www.v2ex.com/t/193227
V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。
V2EX is a community of developers, designers and creative people.