aliyun ECS 云服务器,在业务量没有明显变动的情况下,突然 CPU 是平时负荷的两倍了。
流量没变、内存使用没变、各个指标都稳定。就是 CPU 翻倍。虽然整体水平不高,但是担心业务出故障啊。
几个工程师,排查了一上午,没有结果,正在一筹莫展的时候,刚刚突然又降下来了,恢复到正常了。
感觉就像 CPU 降频一样的效果。
1
yuzo555 3 天前
我不了解,就我的感觉来说,正常的 100% 基础性能实例,不会这样,是不是用的突发性能型?
|
2
opengps 3 天前
利用率检查不下来? windows 系统的话很可能是杀毒软件工作了
|
3
ayelky 3 天前 1
你那台机器刚好在业务开通高峰期吧,我有的机器每个月月底的性能和月初的差距 30%
|
4
decken 3 天前 1
阿里云应该有超卖的
|
5
PureWhiteWu 3 天前 1
超售基操了
|
6
panzhc 3 天前
什么规格的?
|
7
standchan 3 天前 1
不是独占机器的话,可能因为同一母机的其他 ecs 影响到了
|
8
wangyzj 3 天前 1
超售
|
9
daimaosix 3 天前
说规格啊大哥
|
10
zhwguest OP 感谢各位大哥的热心帮助,不知道规格是什么意思啊?是说 CPU/Mem/Disk/Band 么?这个应该没有影响吧。
还是说有共享型和独占型的么?我这个是 e 系列的,估计是共享的吧。不知道在什么地方看。 |
12
daimaosix 3 天前 1
几个工程师,排查了一上午,找个靠谱的运维都不会去买 e
|
13
salmon5 3 天前 1
不错了,几个工程师没有甩锅 CPU 的 bug ,都挺靠谱的
|
15
MangozZ 3 天前
有排除过睿频影响吗?
《调整 C-state 状态以降低 vCPU 的响应延迟》 https://help.aliyun.com/zh/ecs/use-cases/change-c-state-status-to-reduce-vcpu-response |
16
qq1427168550 3 天前
阿里云 e 系列和突发性 t 系列都不要买来用来主业务,我的客户最次也推荐购买 u 实例,可以聊聊沟通一下+alyunflc
|
18
sampeng 3 天前
一般不会。就算是竞技性实例规格也不会。反应到你的业务负载上。
但突发性的会,因为没积分了。限额。表现就是 cpu 突然炸了 |
19
ccde8259 3 天前
如果有进程使用了 AVX512 指令集的话……
|
20
dfdd1811 2 天前
我司还出现过 cpu 突然爆满,磁盘读写爆满,然后机器卡死只能重启的情况。不知道阿里的问题还是操作系统的问题
|
21
p1gd0g 2 天前
看不到进程吗?没日志?没 atop ?
我们有过业务 bug 导致 cpu 暴涨的 |
22
xuanbg 2 天前
非计算型主机一律买突发性能实例,只要你自己的 cpu 不超,别人是影响不到你的。
|
23
zhangxudong 2 天前 1
@daimaosix #12 我是运维,我们公司用的性能突发实例。没办法实在是太便宜了
|
24
iceking156300 2 天前
资源是可以动态分配的,在你开机情况下是可以调整你的内存和处理器的。
|
25
daimaosix 2 天前
@zhangxudong 对不起哥,冒昧了
|
26
wzw 2 天前 via iPhone
@zhangxudong #23 你们使用经验看:业务机器用突发实例够用稳定?
|
27
zhangxudong 2 天前
@wzw 总体来说还是挺稳定的,一年可能会出现个几次虚拟机卡住或者说是突发的 cpu 性能跟不上的情况
|
28
spritecn 2 天前
@zhangxudong 最低配的那个版本性能没经济版实例好(主要是偶尔需要 cpu 的时候不够用),价格差不多,主要是经济版现在 4 拆,我都切到经济版了
|
30
wzw 1 天前 via iPhone
@zhangxudong #27 那岂不是偶尔影响业务,老板不介意?
|
31
zhangxudong 1 天前
@wzw #30 我们是 to b saas 业务,影响不大。而且出问题基本都是半夜,应该是底层宿主机半夜要做什么操作,影响到了
|
32
zhangxudong 1 天前
@spritecn 我们买机器都是直接买 5 年的,之前是 3 折
|