v2ex plus 用户们,你们知道你们的浏览器被用来跑分布式爬虫了吗

2023-05-12 13:50:20 +08:00
 Xianmua
首先承认标题夸张了点,但是事实确实如此。
看到有个 V2EX plus 插件,很多人都装了的,准备也安装来用用。插件功能不少,这个没错,有些方便的小功能。
进设置页面的时候,发现有个 vdaily 默认开启,比较有意思的是这句话“同时接受等量的爬取任务”。有点好奇接受任务这件事,于是看了看怎么回事。哦只要安装了插件,会不断地从服务器获取爬虫任务。
vdaily 作者的网站,有非常详细的请求统计和快速滚动的爬虫任务日志分析,想看的自己去看吧,都是公开的(在请求统计和日志那里)。这里有一堆截图,可以看看。
当然可以说作者做的一点毛病也没有,毕竟在插件设置内都写明了,开启 vdaily 会接受爬取的任务,至于爬取的数据,那就是 vdaily 的资产了对吧。分布式爬虫人家也没什么遮遮掩掩的,都是正大光明的,本篇帖子也没有有技术含量的分析。只是说我是不太喜欢这个 feature ,删了。提醒一下大家,不知道的或者是介意的,都知道知道。
图片合辑: https://imgur.com/a/shPfy8I













https://i.imgur.com/N4TK3FG.mp4
40618 次点击
所在节点    程序员
185 条回复
lambdaq
2023-05-12 13:51:51 +08:00
这思路不错。。。
coolair
2023-05-12 13:55:51 +08:00
没用这个插件,用的“V2EX 增强”这个油猴脚本。
cuixiao603
2023-05-12 13:59:09 +08:00
谢谢提醒 已关闭
xloger
2023-05-12 14:00:36 +08:00
在用,且知道。不过不知道这个是不是默认开启的
AoEiuV020JP
2023-05-12 14:10:53 +08:00
这种东西居然默认开启,恶心到了,删除+举报,
kamal
2023-05-12 14:16:10 +08:00
谢谢提醒,关掉这个功能了,不过插件其他功能还是挺不错的,目前还没找到替代,我就继续用不卸载了。
Greatshu
2023-05-12 14:17:18 +08:00
找到了 https://vdaily.huguotao.com/report.html
这个面板挺好看的,有没有大佬知道名字
gaobh
2023-05-12 14:20:04 +08:00
恶心到了,自动更新就开启了
1120101929
2023-05-12 14:22:25 +08:00
@Greatshu 看左下角,GoAccess
raycool
2023-05-12 14:28:59 +08:00
原来我也装了这个插件,谢谢, 已删除。
Drumming
2023-05-12 14:29:40 +08:00
好思路....但是很恶心
Excepti0n
2023-05-12 14:30:42 +08:00
谢谢提醒 已关闭
glaucus
2023-05-12 14:32:17 +08:00
shinession
2023-05-12 14:36:30 +08:00
用的 V2 Polish, 没发现这个功能
fg990
2023-05-12 14:39:11 +08:00
谢谢,已经卸载了。

作者也要吃饭,能理解,但不喜欢。
hxzhouh1
2023-05-12 14:40:12 +08:00
感谢,已经卸载+举报
mht
2023-05-12 14:41:32 +08:00
@Greatshu 好像是 goaccess 生成的模板
pota
2023-05-12 14:43:36 +08:00
感谢 已卸载
HFX3389
2023-05-12 14:53:47 +08:00
@sciooga 呼唤作者
shyrock
2023-05-12 14:54:10 +08:00
这个分布式爬虫是用于生成 vdaily 这个功能的数据吗?还是爬取其他用途的数据?

这个插件的作者似乎也在 v2 呢,要不出来领一下工单?

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/939486

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX