求分享阿里和腾讯云 ip 段,发现这些云上面太多的 bot 爬虫,要封掉它们

2021-08-10 14:19:38 +08:00
 herozzm

或者求运营同学的爬虫 ip 黑名单谢谢

1672 次点击
所在节点    问与答
8 条回复
DavZhn
2021-08-10 18:15:02 +08:00
0.0.0.0/0
DavZhn
2021-08-10 18:15:33 +08:00
然后再搞个白名单
Foxkeh
2021-08-10 18:47:08 +08:00
你看是不是要的这个 http://as.chacuo.net/company
DT27
2021-08-10 19:09:18 +08:00
分享个我自己的垃圾屏蔽规则
#禁垃圾蜘蛛
if ($http_user_agent ~* "YandexBot|DotBot|SeznamBot|SemrushBot|YisouSpider|serpstatbot|Bytespider|TinEye-bot|WordPress|Datanyze|woorankreview|CCBot|BPImageWalker|SabsimBot|MJ12bot|SEOkicks|SlurpChina|1subscribers|DomainStatsBot|Qwantify|AhrefsBot") {
return 400;
break;
}

#禁部分爬取工具
if ($http_user_agent ~* "crawl|curb|git|Wtrace|Scrapy|python-requests|Go-http-client|python-requests" ) {
return 400;
break;
}

#禁特殊后缀
location ~* \.(asp|aspx|ashx|htaccess|ini|env|git|project|cgi|java|action|jsp|cfg|tpl|sql)$ {
return 400;
break;
}
herozzm
2021-08-10 22:53:54 +08:00
@DavZhn 不行的 网址还是要给陌生人看的

@DT27 这是封锁 user_agent 啊,我遭遇的爬虫都是 win10 chrome 的特征,封了就变
@Foxkeh 没看到阿里云,腾讯云,亚马逊云,甲骨文云,google 云,微软云这些 ip 段,实际上这些爬虫都是不是在这些云上
leoking6
2021-08-11 09:08:22 +08:00
套 cf,源站给 cf 的 ip 白名单,再设置 cf 的防火墙规则,比如高威胁分数要求验证
cydian
2021-08-11 12:53:16 +08:00
查 ip whois 。根据公司反查整个公司注册的段。然后全部段拉黑。
FlyingShark
2021-08-11 14:27:53 +08:00
查 as 号,阿里云 IP 段封了

套 cf,国外 IP 威胁分数高的要验证。国内家宽 IP 早被艹烂了,就算了吧

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/794840

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX