因为爬虫教程,一个网站似乎被 DDOS 了

2020-06-11 20:48:21 +08:00
 favourstreet

不是我的网站。详情可见: https://mp.weixin.qq.com/s/ibmitCYw7Txu5xQYsECI-w

爬虫教程以一个特定网站为目标,偏偏这目标是个人制作的,没那么多资源的小网站。实践教程的人一多,效果就成了 DDOS 。

网站当然是挂了,但是能说人家是恶意攻击吗?我感觉完全无法从法律上维权,好像只能在技术上设置一些限制,让爬虫教程望而却步。可是这样一来,个人维护的小网站越来越难做了,如果不解决这类问题,互联网上的信息会进一步向资源雄厚的经营者集中。

能有什么办法?买 DDOS 的商业保险?

4350 次点击
所在节点    程序员
18 条回复
misty8873
2020-06-11 21:04:25 +08:00
嗯 先买个便宜点的试试
tanghongkai
2020-06-11 21:11:50 +08:00
cf 一套大部分没事找事的都走了,拿别人的网站写爬虫教程真是有够**的
rayhy
2020-06-11 21:13:08 +08:00
煎蛋就经常被爬,很多爬虫贴拿它做例子。其实这种情况下只能在技术上加限制,一般加到需要用无头浏览器爬就好很多了,毕竟都是入门教程,上来就要配置无头浏览器很劝退。
also24
2020-06-11 21:21:48 +08:00
大概翻了一下,爬虫教程的地址是:
https://www.zhihu.com/people/1425827033

目前已删除,在快照里还可以看到记录。

根据这个爬虫教程的代码,加上大部分爬虫小白其实不会改代码的事实。
我觉得站长应该可以通过设定简单的 nginx 策略来解决问题。
另:在微博上看到站长的抱怨,感觉应该只是数据库负载太高,Web Server 应该还活着。


部分代码:
https://i.loli.net/2020/06/11/uyMcamsXoSUYCjD.png
also24
2020-06-11 21:25:44 +08:00
also24
2020-06-11 21:28:34 +08:00
根据相应的代码,提一个简单的思路。

在 WordPress 后台修改伪静态规则,将页面地址修改为:
http://www.cbaigui.com/?biepale=1

同时在 nginx 内匹配带有 ?page= 的请求,全部 deny


这样可以在短时间内解决掉大部分只会复制粘贴代码的小白。
crella
2020-06-11 22:48:22 +08:00
借楼,一个 211 大学的招生网站挂了一张 11MB 大小的图片,导致网页打开缓慢。恶意多次下载这张图片会导致服务器反应缓慢吗?那个服务器的描述是 Oracle iPlanet Server 7.0 。
yujiang
2020-06-11 22:56:10 +08:00
@crella 你得看那个图是挂在图床上还是嵌在网站里,网站有没有 cdn 。。。另外怀疑你的动机
tigerstudent
2020-06-11 23:29:36 +08:00
即使拿来做教程,影响也不会很大吧,站方禁掉 ip 或其他特征就好了。
baiduyixia
2020-06-12 00:11:56 +08:00
heiheidewo
2020-06-12 00:27:15 +08:00
@tanghongkai 别人是备案网站,在国内,套 CF 不是减速么
abcbuzhiming
2020-06-12 09:13:48 +08:00
@crella 会,多个下载连接把你的 IO 打满,和 ddos 的原理差不多的
ccraohng
2020-06-12 09:16:14 +08:00
@tigerstudent 不是几个人。。韭菜多顶不住啊
CodeCodeStudy
2020-06-12 10:15:24 +08:00
那么多人学他那个教程?
sudoy
2020-06-12 12:45:51 +08:00
想做教程,为啥不自己搭个网站做试验呢?拿别人地网站不管个人还是公司都不合适
qq7790586
2020-06-12 14:13:14 +08:00
借楼问下各位大雕,哪里有买 ddos 滴。[狗头]
tanghongkai
2020-06-12 18:00:58 +08:00
@heiheidewo 先保证能上再说,v2 也套的 cf 没见谁有意见嘛 www
crella
2020-06-13 10:11:22 +08:00
cbaigui.com 网页已能正常打开,主要收集妖怪的信息,每页 15 个妖怪,共 110 页还多,也存了一些其他文章。

爬这些有什么用处?想不懂

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/680806

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX