一个小脚本,定时登录校园网完成签到任务(脚本每天定时运行 3 次就行了,也不算高频),UA 使用 fake_useragent, 还是依旧被识别是非人类操作然后 ip 被 ban 了。在本月护网运动之前脚本一直正常运行好几个月,甚至不加 ua 都没问题。 发 post 请求的时候用的 cookie 是使用 selenium 模拟登陆从浏览器中获取的。很好奇是通过什么特征被检测到的,不知道还有哪些伪装可以做,避免被检测?
更换 ip 应该也没啥用,因为换了台云服务器来跑,跑一下就被 banip 了,所以很迷惑。
1
Gloomyer 2020-10-27 20:34:09 +08:00
selenium 要做一定的伪装 服务器可以拿到一些特征信息
|
2
opengps 2020-10-27 20:43:17 +08:00 via Android 1
不改 ua 的爬虫,就跟兔子用胡萝卜当诱饵钓鱼似的🤣
|
3
zzzain46 OP 哈哈哈哈不过我感觉也不是通过 UA 来检测的
|
4
hellos 2020-10-27 21:17:55 +08:00
“发 post 请求的时候用的 cookie 是使用 selenium 模拟登陆从浏览器中获取的。”
所以,你是通过 python 或其他语言直接发的包?那这样识别起来太容易了 |
5
Sunben 2020-10-27 21:37:13 +08:00
我猜原因就是你用的是云服务器,每隔一个周期,后台把 i 所有访问者 ip 查一下,哦,原来是阿里云、腾讯云的机子,ban 了。
|
7
fansangg 2020-10-27 22:05:37 +08:00
那就跑之前拉一批免费的代理,然后循环一波
|
8
misaka19000 2020-10-27 22:57:47 +08:00
把签到时间点随机一下,别太固定了
|
9
zzzain46 OP @hellos 对的,主要是考虑到学校里的系统都是外包做的,也没想到会被检测,还是地低估了哈哈哈
|
10
zzzain46 OP |
14
zarte 2020-10-28 10:06:42 +08:00
用自己电脑试,先排除 ip 问题,然后再查 cookie,ua,一般外包的不会太严。
|