感觉,我可能发现了阿里云的一个秘密

2018-05-12 23:27:20 +08:00
 realpg

我维护了几十个公立医院的官方网站服务器……

它们都在阿里云

每个网站一个 ECS,每个网站独立账号,医院主体注册方便发票直接开给他们

所有网站附件都在七牛,静态资源都在 cdn 服务器,webserver 只提供动态内容

大部分都是单一 ECS,25Mbps 峰值带宽,按流量计费,预存一点钱,按流量计费,流量都很少,都是纯动态内容 少量医院不接受这种预存费之后消费开发票的,采用 5Mbps 带宽方式购买

大部分网站 5000~8000 个新闻动态输出的 HTML 页(超过一万就会删除一部分到归档数据 基本维持这个范围)

每个页基本净 HTML 文件大小 15KB-30KB

不知道从哪天起,我这里管理的所有阿里云的按流量计费的医院网站,都开始流量暴涨,以前 10G 流量包一般可用 5 个月,现在可用两天……

经过深入分析日志,所有的按流量计费的 ECS,都有大量的 UA 为 360Spider 的 bot,24 小时疯狂刷全站,每小时都把我的整站几千个新闻刷一遍……

而通过跟 360 搜索提供的资料比对,这些 BOT 的 UA 跟 360 官方 UA 不一致,且 IP 段不在 360 官方公布的爬虫 IP 段范围

它们的 IP 地址: 106.120.161.0/24 111.206.52.0/24 111.206.59.0/24 36.110.211.0/24

而我的这么多同样体量的医院网站里面,所有按带宽计费的都没出现这情况……

所以,我可能得出了一个可怕的结论:

避免被告索赔千万,算了,我啥结论也没得出,大家散了吧

25501 次点击
所在节点    程序员
131 条回复
fakevam
2018-05-13 15:47:39 +08:00
@realpg 去微博上 @宫一鸣
easylee
2018-05-13 16:08:23 +08:00
细思极恐
dourgulf
2018-05-13 16:25:19 +08:00
火钳刘明
lemonda
2018-05-13 16:38:07 +08:00
维护的企业站基本都是按流量计费的,目前还未发现,得留意一下了
ctsed
2018-05-13 16:53:39 +08:00
@feather12315 钉钉客户 a 找客服处理问题的时候发了一个钉钉软件聊天界面的截图,客服又把这个截图发给另一个同公司的客户 b 核实问题,这个 b 很疑惑,问朋友 D:我们公司的聊天记录怎么到了客服手上,这个 D 就在 v 站知乎各种科技媒体站带节奏:阿里偷看客户公司的聊天记录,后来客户 ab 一沟通才知道乌龙了,这对于一款 2B 的 im 来说直接就是致命的信任危机,钉钉和客户澄清后,猜测 D 大概处理的不积极,收到被立案的单子什么的,才到处道歉,联系投稿过的媒体澄清求删帖,当然事情过去之后道歉澄清之类的黑历史能删的都删了。至今还是有些人认为真的是阿里的问题,拿一千万起诉为要挟公关掉了 D,到处刷一千万的梗。
ctsed
2018-05-13 16:57:24 +08:00
realpg
2018-05-13 17:32:47 +08:00
@CRVV #80

我不认为是阿里云这个大公司层面上去做这种事,根本无法获得公司通过
但是一些自身 KPI 相关的部门小决策会不会这么搞就不好说了

另外,阿里确实没法控制 360,但是架设这个之前有人说的态势感知是一种 360 公开提供的服务(没搜到相关,但是在 360 的网站安全里感觉可能有这个),你如果有个目标列表,自己申请一个,利用一点 360 的验证漏洞或者干脆做个手脚毕竟 IP 地址是自己家的,然后为我订阅个每小时全站扫描一次的态势感知服务,就实现了增加 KPI 的目的了不是
zeinipiyan
2018-05-13 19:17:37 +08:00
你光想一想也得被索赔 1000 万
irryal
2018-05-13 19:41:04 +08:00
goodryb
2018-05-13 20:17:19 +08:00
阿里云差你这 10G 流量的钱,出现问题不排查问题,而是在这里臆测,还要搞个大新闻

只能说玛德制杖
firesun
2018-05-13 21:40:42 +08:00
动动脑子想想怎么可能这么做么?
分布式的爬虫,筛查目标机子,维护服务器,都不是一两个人能做完的
有一个人说出去了阿里云是不是 gg 了
是有多脑残的领导会同意这么干?
收益在哪?去查查阿里云的财报,这么搞能给财报增加个零头么?
yylzcom
2018-05-13 22:16:57 +08:00
楼主的和之前各位的分析都很正常,至少依据自己所知事实在理性分析。作为围观群众我看的也蛮有意思。
直到我上面两位 g 开头和 f 开头的回复…
wafm
2018-05-13 22:41:44 +08:00
@yylzcom 有意思,GF 两位大兄弟应该是比较有发言权的了。
blless
2018-05-13 22:51:43 +08:00
@yylzcom 贪官怎么会瞧得起一个贫困户几百块的补贴嘛,做假账,转移资金,还要安抚那些人,怎么可能是一个人做得完。有一个人说出去了,乌纱帽还要不要了。有多脑残的官员会干这种事?收益在哪,去查查这些当官的账户,这么搞能多加个零头吗?
blless
2018-05-13 22:52:13 +08:00
哟…不小心回错了
alexkh
2018-05-13 22:56:58 +08:00
感觉也没啥实质证据啊。有 2 点建议:
1. 用 robots.txt 把 360 爬虫屏蔽抓取,看数据是不是有减少
2. 每个搜索引擎不会公布所有的 IP 段,会被恶意利用。
HaEx
2018-05-13 23:31:02 +08:00
@realpg 这种公有云的 KPI,服务质量比营收更重要,因为公有云业务都不怎么赚钱,面向大企业的云才是主要盈利来源;这种系统性的攻击不能说绝对不是内部搞的,可能性大概是 0.000001% 吧;建议直接把问题反馈给阿里云,至少他们不会不愿意帮你解决问题,当然能不能解决是另外一个话题
mingyun
2018-05-13 23:31:24 +08:00
这里有阿里云官方账号吗
Myprincess
2018-05-13 23:37:46 +08:00
某域名平台空间,20GB/月流量。三天用完。投诉说流量异常,但是流量用完,网站关闭,继续投诉,平台加送 30GB,,一周内用完。后网站备份,转移。流量正常。
realpg
2018-05-14 08:01:03 +08:00
@alexkh #96
动不动就屏蔽搜索引擎爬虫?这不是自己私人小站随便玩,这些官网认证为了排第一个都是医院花了钱上去的(别看是正规医院官方网站 有时候也是要交保护费的 这方面医院的信息化省里有考核 不排到第一个 有虚假的排到第一个 导致患者找错医院是要被追责的) 搜索引擎收录量都是有考核指标的


@wafm #93
确实挺有发言权的

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/454381

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX