质疑阿里云 CDN 资源监控中的文件响应占比数据

2016-04-21 00:55:34 +08:00
 qgy18

首先声明,我发现这个问题后,第一时间走正常途径通过系统工单反馈(后面有截图)。

阿里云客服给我的回复是:

您好,我这边用测试账号测试是存在差异的,请您查看附件。
建议您可以将时间选择多几个时间段测试下,谢谢。 

但是我这边确实所有时间段都有问题,于是陷入僵局(让我想起了那个段子:测试同学提了一个 BUG ,开发同学说我这里是好的,你环境问题吧)。

所以我发这个帖的目的是:请大家帮忙看看你们的统计是否正常,是不是只有我的帐号才有这个问题。

问题描述

我阿里云帐号下的 CDN 管理 -> 资源监控 -> 热点分析 -> 文件响应占比 报表中,所有时段中 >1M 和 <1M 的比例都完全一致。而且我的源站显然没有 > 1M 的资源,所以我怀疑这个统计数据有问题。

小于 1M 的统计截图:

大于 1M 的统计截图:

联系客服的工单截图:

6071 次点击
所在节点    云计算
55 条回复
qgy18
2016-04-21 11:33:35 +08:00
@b821025551b

请问,你的源站有 > 1M 的内容么?
akira
2016-04-21 12:39:59 +08:00
图片仅供参考?
kn007
2016-04-21 13:20:21 +08:00
图片仅供参考 +1

话说之前百度也是,提了很多 bug 和 enhancement ,然后许多等了几个月才解决。。。还好就是有承认,但未能解决。。
qgy18
2016-04-21 13:48:20 +08:00
客服后续回复:

售后工程师 : 您反馈的问题需要转交到后端专员,能否在明天白天工作时间处理呢
2016-04-21 02:40:55

售后工程师 : 您好,您的问题后端专员还在定位中,您先忙您的事情,有结果会第一时间工单反馈您。
2016-04-21 11:33:15

看来之前是客服内部给的答复,不被我认可之后转到技术那边查了。其实阿里的客服反映还是很及时的,也很辛苦(凌晨 2 点多还在回复),只是解决问题的能力
lslqtz
2016-04-21 13:56:02 +08:00
@lianghaijian 666 大晚上的可能 timeout 吗?
lslqtz
2016-04-21 13:56:29 +08:00
@lianghaijian 一天 pv 20 人,大晚上根本没人。仍然有流量
b821025551b
2016-04-21 13:58:55 +08:00
@qgy18 有,但是我感觉这两个曲线如此相似真的有点不正常(话说刚刚的图居然被压缩了)
chousb
2016-04-21 14:32:49 +08:00
.......
zonghua
2016-04-21 14:48:24 +08:00
昨天就发现 ququ 的博客访问不了了
zonghua
2016-04-21 14:50:44 +08:00
@b821025551b 写了个 random ?
est
2016-04-21 14:58:45 +08:00
> 而且我的源站显然没有 > 1M 的资源

可能 CDN 会做一些 chunked encoding , http keepalive 之类的。把多个<1M 的资源合并到同一个连接里去响应。这样就会有统计的出入。

一种相反的情况就是>1M 的资源会被 gzip 到 <1M
qgy18
2016-04-21 15:00:50 +08:00
@zonghua 不是吧。。。

为啥访问不了,现在好了么?
qgy18
2016-04-21 15:01:42 +08:00
@lslqtz 这个很有可能吧,比如爬虫,比如被盗链了。
shudu
2016-04-21 15:12:32 +08:00
我是阿里云 CDN 研发负责人叔度,非常感谢屈大大的反馈!

经过排查,这是我们统计代码的一个 bug 。我们的数据监控代码在统计 1M 以上响应文件时,错误的把<=1M 的文件也累加上了,所以导致用户看到的该数据是错的。

这个 bug 会导致用户看到的 1M 以上响应监控统计是错的。但不会影响用户的计费准确性。

我们很抱歉给屈大大和其他用户带来了这个困扰。现在代码已经修复。以往数据的清洗也会在两天内重新计算完毕。

再次感谢屈大大的反馈,也赞一下您的细心!
lslqtz
2016-04-21 15:14:05 +08:00
@qgy18 爬虫的流量是有的,但偏差太大了。我接 cdn 有半个月,然后转回来后用到现在。
shudu
2016-04-21 15:15:56 +08:00
@lslqtz 您是否对照过访问日志?另外能否私信我一下您的用户名?谢谢!
qgy18
2016-04-21 15:45:19 +08:00
@shudu

感谢解答,原文已经 APPEND 。终于真相大白了!

其实倒不是因为细心,我一直比较在意个人博客访问速度,无论如何也不允许有 > 1M 的图片出现在我的博客。所以看到这个统计时,一眼就感觉出不对劲。

这个也印证了我之前的猜想(见 17 楼):我怀疑只有在源站完全不存在 > 1M 的资源时,才会出现这种问题。

只有源站完全不存在 > 1M 文件时,这个 BUG 才会导致两条曲线完全一致,所以客服的测试帐号看不出来问题。
qgy18
2016-04-21 15:52:55 +08:00
已正常。

shudu
2016-04-21 16:58:28 +08:00
@qgy18 谢谢屈大大。后续使用上碰到问题也可以私信我的新浪微博 @淘叔度 ,我看到消息会响应比较快些, V2EX 平时上得少。再次感谢!
lslqtz
2016-04-21 17:04:38 +08:00
@shudu 也是属于统计问题 扣费没有。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/273250

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX