超级奇怪的爬虫!

2021-06-22 12:07:56 +08:00
 wdssmq

博客有用插件记录进入 404 的访问然后输出成 RSS,今天出现了一堆奇怪的访问:

/tag/MySQL/zqxjuAaoYnUufB.html
/category/说点什么 /zqxjuAaoYnUufB.html
/tag/折腾 /zqxjuAaoYnUufB.html
/date/2014-05-12/zqxjuAaoYnUufB.html

所以页面中出现过的网址目录,都拼接了如上文件名访问,包括一些 JS 或 CSS 的引入路径。

下边网址内是截图:

沉冰浮水:“#PubWord 这个神秘字符串是啥意思? zqxjuAaoYnUufB” - 呜呜 w(> ʌ <)w

https://wxw.moe/@wdssmq/106452341395928554

访问 IP 也不固定

其中一个:

128.31.0.13 Mozilla/5.0 (Windows NT 6.1; rv:45.0) Gecko/20100101 Firefox/45.0

1689 次点击
所在节点    站长
3 条回复
delectate
2021-06-22 12:58:53 +08:00
还别说,google 搜全网也只有这个帖子。

看起来不像是随机字符串,base64 也乱码。可能是其他博客类似的 url,触发了爬虫的某个行为模式。
sworgod
2021-06-30 08:58:57 +08:00
这个一看就像是黑客在扫描你网站呀。很典型,用代理 ip,扫描关键目录
wdssmq
2021-06-30 09:30:05 +08:00
zqxjAucbeTECbh

zqxjlHlllOrZMd

↑↑ 补充

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/785036

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX