用 python 写爬虫,如何获取网站的 logo 或者缩略图了

2014-08-12 10:48:43 +08:00
 larkifly
如题,大家有什么好办法了。
4020 次点击
所在节点    Python
6 条回复
Zuckonit
2014-08-12 10:56:41 +08:00
缩略图,
<link rel="shortcut icon" href="/static/img/icon_rayps_64.png" type="image/png" />
<link rel="apple-touch-icon" href="/static/apple-touch-icon.png" />
类似
Zuckonit
2014-08-12 10:57:39 +08:00
Zuckonit
2014-08-12 10:58:51 +08:00
ChiChou
2014-08-12 11:36:04 +08:00
缩略图需要开 phantomjs 之类的软件渲染,成本(流量,系统硬件资源等)比较高。
beordle
2014-08-12 22:29:33 +08:00
Google Favicon API
http://www.google.com/s2/favicons?domain=twitter.com
而缩略图非常不好办了
只能用Phantomjs这种 Headless 的浏览器截图.我见过的 API 都不完美.首先PNG不全.另外比如说国外的API抓不了国内.国内的抓不了国外.最好的办法就是自己抓 异步入库.
hayao650
2014-08-19 18:49:40 +08:00
urllib.urlretrieve()应该可以

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/127370

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX