被阿里云坑了

2012-03-16 22:01:49 +08:00
 Livid
一台 B 套餐 2.5G 内存的机器,内存不够用了,于是和团队商量之后,决定升级到 D 套餐 8G 内存 4 核。

然后,1 个多小时过去了,机器起不来了……

Request timeout for icmp_seq 3919
19246 次点击
所在节点    云计算
78 条回复
zhuzhuor
2012-03-17 08:39:29 +08:00
貌似redhat不收授权费?
muxi
2012-03-17 09:23:22 +08:00
@hilyjiang 弹性云计算和网站云之前都是可以平滑升级的,这次出现这个情况是因为将一些业务做了整合,回归测试没有做到位,确实是我们的责任,因为调整的时间不长,最近没有用户使用这个功能,我们未能及时发现。

作为V2EX前100位用户和LIVID微博的粉丝,这个帖子一发出来我就看到了,我之所以到一个小时之后才回复,是因为我看到内部很多的邮件在追查此问题,在收到Livid的信息之前,实际上已经做了处理,我出来回答这个问题,是因为从反馈中来看一时半会儿无法根除,云计算是个非常庞大系统,定位一个问题并且解决没有那么容易。

从出问题到最后恢复到原来配置,花了近两个小时,而且没有及时告知客户,确实暴露了运营和客户服务的应急处理能力的不足,但我不同意楼上各位所说的态度有问题,我们确实第一时间在处理这个问题,没有及时告知客户是我们的责任。

不管这件事情是不是Livid,我们都会第一时间处理,在我介入此事之前,已经有数十封邮件都在追查这个问题,这个时候还没人认识Livid,凌晨1点半左右,运营部门的负责人还专门给我打过电话,咨询Livid是谁
nonozone
2012-03-17 09:34:32 +08:00
当每次关机需要5分钟,开机需要5分钟,重启也需要5分钟的时候,我就无力吐槽了...
安装的debian,果然桌面都安装了,问了客服服务器干嘛装这个,客服回答说有些用户基础比较差,希望能远程桌面什么的...我说windows这样可以理解,用户基础差谁会用Linux啊...好在那个时候客服响应速度还是蛮快的,小MM声音还蛮好听,蛮客气的,忍忍吧...

还有一次让我挺无语的,有一次客服打来电话,说系统要升级,技术人员需要首先检查一下俺们的系统又没有问题,需要我提供vps的管理员账号密码...俺顿时就黑线了...服务器的Root权限再怎么滴也都在你们那里啊,问我做毛线啊...反正最后还是给他们账号密码了。

由于域名的备案的问题,虽然还有4个多月到期也空着懒得用了...话说国外的有些vps速度作为网站访问起来也是不错的。只是,在运营方面,有时候不得不用国内主机,比如你想整个新浪微博的官方网站账号,不备案是不可以滴...
nonozone
2012-03-17 09:35:43 +08:00
@zhuzhuor Redhat肯定是要授权的,但是一般都会用CentOS
zhuzhuor
2012-03-17 09:43:13 +08:00
@nonozone 恩...但是阿里云的redhat和centos一个价钱。猜测没有购买服务的redhat?
muxi
2012-03-17 09:48:49 +08:00
@nonozone 5分钟你说的是那个字后台点重启按钮后转圈效果吧?实际上没这么长时间,只是保守的放了个时间在上面,下次你重启时候可以自己ping 监听一下试试

Linux镜像中放了桌面的包,是因为真的有很多用户不喜欢使用SSH登录,喜欢使用VNC连接,不过倒是可以提供一个精简的Linux安装包,方便用户的高级需求,确实也省点内存占用,磁盘一般都用不完,倒是不是太大的问题


@zhuzhuor Redhat是可以不付钱授权的,前提是,不能从官方下载软件,不能获得任何Redhat的相关技术支持,不能安装RedHat的二进制包,软件兼容性之类也不会保证,总之一句话:授权了其实就是买服务,自己折腾就不用付钱
nonozone
2012-03-17 09:51:58 +08:00
@muxi 就是试过了才这样说啊...我用国外的VPS,reboot以后,不过十几秒就可以登陆了,用了阿里云过了一两分钟都没法登陆,还真的要等后台显示已经运行起来才好...

当然可能现在的阿里云的技术团队比之前会好一些,并且看到现在linux默认的操作系统都是RH了吧,不像之前可以自己选择很多发行版。
muxi
2012-03-17 10:01:58 +08:00
@nonozone 这个可能跟阿里云使用系统是桌面版有关系,服务比较多,还有一个可能跟文件系统检测有关系,阿里云主机的文件系统检测是有点慢,是因为完全模拟硬件的原因,隔离性做的太好其实也挺悲剧,看来这个虚拟化得折中。
zhuzhuor
2012-03-17 10:27:52 +08:00
@muxi 额,我的意思是没有服务的redhat还不如centos呢,至少有community能维护下。到时redhat用centos的repo出了问题也没人能解决
aliyun可以弄个不带服务自己折腾的centos和带服务的redhat,当然redhat可以贵一些。amazon的ec2就是这样
amom
2012-03-17 10:40:11 +08:00
跟着吐槽阿里云,买了网站云,公司是北京的,被告知不能给备案,只能退款。为什么不在产品页面上加上说明!出来这么长时间了,很多备案和技术的文档还是简单的一点点,真差!非常差!
hilyjiang
2012-03-17 10:59:09 +08:00
@muxi 感谢你的耐心解惑,现在对阿里云的信心又涨了些,嘿嘿。

刚才楼上 @nonozone 提到的技术人员要求提供 vps 的管理员账号密码,技术人员是否有直接访问存储的权限?这样提供账号密码给技术人员后,还是会存在一定风险的。

不知道现在阿里云在客户的数据保密方面做到什么程度了呢?是否有一套流程或机制防止技术人员破坏或窃取数据(不管是有意还是无意)?
hilyjiang
2012-03-17 11:01:29 +08:00
@amom 你说的这个确实难以理解呀。。
貌似备案和公司在哪里没有什么关系吧。
备案主体属实,阿里云只要负责新增接入登记就可以了。
muxi
2012-03-17 11:02:31 +08:00
@zhuzhuor 好建议,一定转达到。

@amom 咨询了一下相关人员,某些地方确实目前备案比较难,在努力协商中,主要由备案号开头的字决定的,跟各个地方的通信管理局打交道,国内的目前环境你也知道,一言难尽。
muxi
2012-03-17 11:18:02 +08:00
@hilyjiang 这个技术人员还真没有直接访问数据的权限,之前我在回答上面的问题提到过,隔离性做的太好也挺悲催的,目前所有本地存储数据,都是隔离存放的,做硬件层面的虚拟化。很多云计算公司没有做这一层的东西,只是做系统层面隔离,所有数据还是写到物理磁盘上,直接从母机就可以访问到所有的数据,和访问普通机器没啥区别,阿里云的主机文件系统也做到虚拟化里面去了,母机上访问不了虚拟机里面的数据,所以需要用户的密码能登入才能访问到数据。当然,这样做最大的问题就是文件读写性能会下降,其实不光是文件系统,CPU之类的也做了虚拟化处理,所以一个母机上,如果有其他用户CPU使用100%,并不会太影响其他的用户,所以整个io性能就没有直接使用那么高,好处就是做了尽可能的保证每个用户资源的稳定。

至于你说数据保密这个执行的是整个阿里集团的风控体系,阿里系的数据大部分都是跟钱有关,级别等同金融行业
nonozone
2012-03-17 11:18:13 +08:00
@hilyjiang 服务器托管在别人手里,完全杜绝技术人员访问数据这本来就不大现实,并且基本上都是web应用,说数据要多么多么安全那也么必要。我只是觉得,在检测服务器升级的时候,阿里云应该是有root权限的,根本就不需要经过我这里啊,这就类似一个系统管理员问我要一个普通user权限一样...难道说跟windows一样,或者说完全虚拟化了,没有我的权限他们技术人眼压根动不了服务器?从安全角度和管理角度这都是不可能的吧...
muxi
2012-03-17 11:22:05 +08:00
@hilyjiang 是这样的, @amom 使用的是公司用户备案,公司用户备案就跟公司的所在地有关系,比如北京的公司,就只能备案京字开头的备案号,个人就无所谓,可以选择任何字开头,更推荐个人用户使用浙字开头,备案速度相对可控
muxi
2012-03-17 11:24:47 +08:00
@nonozone 阿里云任何人员都没有客户机器的root权限,root密码生成是随机的,也没有记录
hilyjiang
2012-03-17 11:43:44 +08:00
@muxi 阿里云可以考虑下把数据保密和安全这个放产品页上多介绍介绍,我想这是其它云服务商无可比拟的优势哈。
至于你说的母机上访问不了虚拟机里面的数据,我想应该是能访问的吧,你们不至于去加密数据吧,只是不知道是哪个客户的数据吧嘿嘿。
计算资源和存储资源全虚拟化了,你们做得可真是够彻底的,后期的弹性实现很值得期待呀。
另外,这样全虚拟化,存储和计算的性能有损失了多少呢?在10%以内我觉得都是可以接受的。

@nonozone 阿里云上面除了web应用,还有各种各样的应用,比如商业数据,游戏等等。还是要防止数据和代码泄露,不然私服又要多了。

能做和做得专业是两个层次哈,我相信阿里云走的是专业路线。
muxi
2012-03-17 12:12:12 +08:00
@hilyjiang 母机上的确可以通过工具访问虚拟机内部文件,前提是需要有虚拟机的root密码,目前root密码是在创建虚拟机的时候随机生成的,而且不保存,在Windows上玩过虚拟机的人都知道,实际上你给虚拟机分配的磁盘空间,对于母机来说,就是一个文件,这个可能数十G大小,对于阿里云主机来说,除了这个数十G大小的虚拟磁盘,还有一个云存储,如果你用fdisk或者df之类的命令去查看的话,应该能看到两个盘挂在那里,空间大的是云存储,空间小的是本地存储(虚拟磁盘)

云存储的可用性可以达到99.99%,可以保证数据不丢,对于本地存储使用的是镜像备份,云存储有自己的策略保证数据安全性,可以把数据放到云存储这个分区,即使你的主机哪天起不来了或者真的磁盘毁了数据也是可以恢复
hilyjiang
2012-03-17 12:54:20 +08:00
@muxi 刚才看了楼上同学给的链接里的评测,如果属实,CPU和存储的性能真的降得有些过份呀。。

http://www.douban.com/note/187254979/

http://d.pr/MVYb 盛大云4G,性能
http://d.pr/Uwx 盛大云1G,性能
http://d.pr/ZZtd 阿里云1.5G,性能
http://d.pr/XZ8P linode 512M,性能

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/29841

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX