关于抓煎蛋网的妹子图

2017-12-19 17:21:48 +08:00
 maxmin

问下各位大大,现在煎蛋网貌似都进行加密处理了。

抓下来的一个图片 ID,一个 blank.gif 的下载 url,还有一个 hash 值。

这三个值如何解码出来正常显示图片呢?

抓到的个人认为的要素如下: 3648355 https://img.jandan.net/img/blank.gif" 01aexN/JQkzwK5MKgiyoaue8DQ9zMRZr4rz1KeCOQVq1EekJSnMbfNfGlKbm2CVqXaqpImm8PAuZ29rChMe2nUbuwx0Pv2UCiDll8p9rtOZwTd2O6IpXbw

3648352 https://img.jandan.net/img/blank.gif" a4f5BIbDxuQq88bWJ+CVqW/cfY55/DidJsXn4+37ojvaAHzLf123VMLuIQuCM5ozRhAWmegBHNrnIjiem9Q0IzQAKHEz/RMkbCjaqZkdhqyxGHifpp0Kpg

3648284 https://img.jandan.net/img/blank.gif" 44cecM9LLAGYeTYiqI9VDlkemzZBt+vsPtLkDrWtvrl8Oudu15MStxxbMH9Zf9kRce4Jwd8oeeoWp1wMMh1LDrJlifMf6rDbvYsbSGKA5JxXVUpUIo09dw

3648265 https://img.jandan.net/img/blank.gif" 1ce8Fy73YNsQZRmpVYoAILPEUA3C/xKbMwxyB2uFGmGL/hITirtXNk+t12XZbiYeZdOj477fTB6CjcMcSuzfNaDUsDvquQJ2kYYl/hptSsoTMbklaZwkHg

3648255 https://img.jandan.net/img/blank.gif" f9c3olrMbfJo4mQ1g9SVblXOg9HCSEXNKvbdVeXZu7ZnxCbqZgSqcfzQ6Ro1zoVk6m2MTIIZ9oJ2s0nhU4rspURiRrLOZuB4koOjhOOBz81lR5u3zZD8AA

3648249 https://img.jandan.net/img/blank.gif" 978eHutjCethv14sXsm0c8+sLVWhFkDMOdmEs4MlLFZvyQyO0eU/jkqVRK7QU7C6qy5YZwptyEKAA9SOXQMLhz/SgT30/MaMoz3wiBeRYOoRFcM6ejLwgw

9124 次点击
所在节点    问与答
28 条回复
SourceMan
2017-12-19 17:22:40 +08:00
煎蛋又要被爬挂了吗?
chen2016
2017-12-19 17:23:07 +08:00
估计要被煎蛋粉喷
mohoumk2
2017-12-19 17:24:25 +08:00
已拉黑楼主
wekw
2017-12-19 17:28:21 +08:00
@chen2016 我们叫“蛋友”
maxmin
2017-12-19 17:40:11 +08:00
@mohoumk2 就抓一下而已,怎么就委屈的拉黑了呢。
maxmin
2017-12-19 17:41:12 +08:00
@SourceMan 抓某一个页面的几个数据,不会这么容易挂的,只是测试而已。

现在抓下来的数据都是加密的,不知道怎么解密
onsale
2017-12-19 17:47:50 +08:00
换个 bat 的网站爬一爬
airycanon
2017-12-19 17:49:48 +08:00
@maxmin 既然是测试,不需要解密吧?
lingo
2017-12-19 18:00:33 +08:00
心疼煎蛋。。。
lalalakakaka
2017-12-19 18:07:52 +08:00
煎蛋人家都发文求你们了,承认自己小破站,没钱买流量,也没有足够的技术能力和人力跟你们玩猫捉老鼠似的反爬虫。。。

你知道你的这种行为给别人带来多少麻烦么
013231
2017-12-19 19:07:08 +08:00
@lalalakakaka
User-agent: *

Disallow: /wp-admin/
Disallow: /wp-content/
Disallow: /wp-includes/
Disallow: /trackback/
Disallow: /xmlrpc.php
Disallow: /category/
Disallow: /author/
Disallow: /feed/
Disallow: /search/
Disallow: /*?*

Crawl-delay: 5
Request-rate: 30/1m

Sitemap: https://jandan.net/sitemap-index.xml

User-agent: ia_archiver
Disallow:

User-agent: Mediapartners-Google
Disallow:

User-agent: Baiduspider
Disallow:

User-agent: YisouSpider
Disallow: /

User-agent: grapeshot
Disallow: /

User-agent: dotbot
Disallow: /

user-agent: AhrefsBot
disallow: /

User-agent: Exabot
Disallow: /

哪有声明不让爬妹子图?
3dwelcome
2017-12-19 20:43:27 +08:00
@013231 管理员贴过爬虫流量图、表示流量太大、小网站耗不起。
xmi
2017-12-19 22:44:39 +08:00
还有人在爬..
mengli
2017-12-19 22:51:30 +08:00
以煎蛋无聊图为内容源的网站可不少,去爬他们把。
onsale
2017-12-19 22:58:23 +08:00
@013231 #11
gyteng
2017-12-19 23:41:33 +08:00
为何大家都喜欢爬煎蛋,有没有其他类似煎蛋妹子图的网站可以爬呢?
cxd44
2017-12-20 00:03:01 +08:00
@3dwelcome 耗不起就不要玩,关机啦
jininij
2017-12-20 00:06:53 +08:00
没用过煎蛋,记忆里煎蛋的图用的不是新浪的图床么。游客请求的页面,本体都该走的 cache。不是很能理解,一个人的爬虫能有多大的并发,能把网站弄垮。
zhaojjxvi
2017-12-20 00:07:46 +08:00
豆瓣有个请不要害羞的小组,去爬那个吧,一般夜间有福利
greatbody
2017-12-20 00:10:22 +08:00
@zhaojjxvi GitHub 上面有通用的美女图爬虫脚本,nodejs 写的通俗易懂好变更。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/416043

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX