写了一个抓取图片的网站

2015-06-15 12:23:04 +08:00
 hao1032
http://ouyuimg.sinaapp.com/ 现在抓了腾讯活着,网易看客,必应背景3个网站的。

放在sae上面,不要用IE访问。
4276 次点击
所在节点    分享创造
28 条回复
xavierskip
2015-06-15 12:54:31 +08:00
图片浏览用的是什么插件?
hao1032
2015-06-15 13:14:29 +08:00
@xavierskip
电脑上: http://www.woothemes.com/flexslider/
手机上:没有插件,就是bootstrap的缩略图 http://v3.bootcss.com/components/#thumbnails
Anybfans
2015-06-15 13:16:59 +08:00
为什么点击图片不居中啊。。。一直靠左好难受。
imn1
2015-06-15 13:17:58 +08:00
不考虑版权么?我写了个抓几十个站的都不敢发
hao1032
2015-06-15 13:29:12 +08:00
@Anybfans 居中文字就没有地方显示了
hao1032
2015-06-15 13:30:15 +08:00
@imn1 哪有钱考虑版权啊
hao1032
2015-06-15 13:31:44 +08:00
@imn1 抓的都是什么站啊,方便说吗?
Front
2015-06-15 13:35:03 +08:00
打开某张图片之后怎么返回到图片列表?浏览器后退么?
imn1
2015-06-15 13:35:25 +08:00
@hao1032
我的是通用程序,不同站点只是改参数(regex or xpath),当然这个参数需要自己手动分析
反正北都除了dmm这货搞不定,其他全抓完了
hao1032
2015-06-15 13:38:34 +08:00
@Front 当前是的。
Front
2015-06-15 13:43:33 +08:00
@hao1032 这交互有点不习惯。
hao1032
2015-06-15 14:06:39 +08:00
@Front 问下,现在你看完的这个v2ex帖子,怎么回列表?
2015
2015-06-15 14:16:39 +08:00
@imn1 求分享通用程序
或者名字 :)
hao1032
2015-06-15 14:33:33 +08:00
imn1
2015-06-15 15:08:13 +08:00
@2015
@hao1032
没有传出去
其实就是个爬虫,输出是aria2下载列表,不过改成html也很容易,只是没这个需求
imn1
2015-06-15 15:13:01 +08:00
我最疯的一次是13年底把 mm.taobao 全抓了下来,300G左右,然后把 aria2 列表给了朋友就全删掉了
图太杂,只有少于3%看得上眼,没法分类,就删了
ajan
2015-06-15 20:24:40 +08:00
@imn1 共享代码
492162921
2015-06-16 09:51:40 +08:00
求指教,如何抓取新浪微博的图片? 492162921@qq.com
hao1032
2015-06-16 11:39:56 +08:00
@492162921 新浪微博有api吧
hao1032
2015-06-16 14:16:45 +08:00
@Front 已经打算在新窗口打开连接了。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/198641

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX