应对无下限无节操爬虫,是不是可以尝试sql注入?或是有更好的方法?

2013-12-14 01:01:55 +08:00
 BeanYoung
最近发现一个ip(杭州某家信用卡app的服务器,对就是某1信用卡管家)以每秒200次的频率爬取我们的数据,虽然禁掉ip还是不能让其停止,联系对方工作人员依然无果。

刚才去掉了ip限制,然后对该ip的请求返回假数据,貌似对方的爬虫脚本被搞挂掉了。

突然想起来,对付这样的爬虫,是不是可以尝试一下sql注入,大家有没有类似的对付爬虫的经验?
6000 次点击
所在节点    程序员
20 条回复
liuxurong
2013-12-14 01:12:11 +08:00
好玩点的话 针对那个IP给他返回垃圾信息 让他采美女图片去 XDDD..
Flyfish
2013-12-14 03:35:59 +08:00
楼上好邪恶啊,哈哈哈
vibbow
2013-12-14 06:37:45 +08:00
之前被某H****z空间商恶意采集(攻击)过。
我的做法是301跳转到Ubuntu镜像去...
kendisk
2013-12-14 08:23:18 +08:00
@vibbow 应该跳转到ccav
ufo22940268
2013-12-14 08:26:13 +08:00
笑尿,好想知道lz在哪家公司的
humiaozuzu
2013-12-14 09:53:29 +08:00
话说有什么工具可以发现有人在扒你数据。有什么工具可以定制策略吗?
jason52
2013-12-14 10:01:15 +08:00
思路不错哟!!!
bombless
2013-12-14 10:26:56 +08:00
你应对的是一个移动的目标……
如果对方的确暴露出一些特征,当然可以对应的去攻击……
比如对方用了一个很脆弱的HTTP解析库,遇到非预期的HTTP响应就崩溃,那……
subpo
2013-12-14 11:14:53 +08:00
带上他们公司的信息301到政府网站,不日,对方公司网站被墙。
34D
2013-12-14 11:23:44 +08:00
@ufo22940268 目测是51信用卡,我同事之前在这公司帮他们写正则表达式,他说千万不要用他们的东西,你邮件内容他们都可以看到的。
shiny
2013-12-14 11:26:03 +08:00
iptables block 之就差不多了。
lovedboy
2013-12-14 11:29:23 +08:00
可以在返回的信息中插入sql代码。
subpo
2013-12-14 11:30:32 +08:00
@34D 都是这么查账单的
BeanYoung
2013-12-14 11:31:05 +08:00
@humiaozuzu 通过nginx日志可以发现ip访问记录 找出异常的ip
BeanYoung
2013-12-14 11:33:52 +08:00
@liuxurong
@vibbow
@subpo 是个post请求 原本想301到他们自己的网站 找了半天 没在他们网站发现可以post的地址
loveshouhu
2013-12-14 12:37:28 +08:00
@subpo 好邪恶啊。我喜欢 XD
humiaozuzu
2013-12-14 13:10:22 +08:00
@BeanYoung 301 没法重定向 post 的,需要307,https://gist.github.com/humiaozuzu/7333277
forgottencoast
2013-12-14 14:10:20 +08:00
找一个大文件,然后重定向到大文件,最好是大的HTML文件,非常复杂的DOM。
无论他用DOM分析还是正则表达式,都有可能挂掉。哈哈。
wwek
2013-12-14 15:06:26 +08:00
大家很淫荡的说·
zhonghua
2013-12-14 15:14:25 +08:00
好欢乐

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/93092

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX