阿里云将根据相关产品的SLA协议进行赔付
微wx笑 2022-12-19【云服务】 3 0关键字: 阿里云 宕机
阿里云宕一次机,是怎么赔偿的?昨天还以为是我自己原因导致服务不可用了,折腾了很久,实在没办法了提交工单才看到公告,是香港PCCW机房制冷设备故障所致。
从昨天下午1点到两点吧,具体时间记不清了,服务器就开始出现问题,响应特别慢,以为是自己的原因导致的,就开始查找原因。
BT面板监控显示cpu使用率在5%以下,内存硬盘也正常,但是负载状态确定是100%的,当时就觉得奇怪。
宝塔的负载状态图表中百分比的含意:50% 以下 - 此时服务器正以低负载状态运行50 ~ 90% - 服务器负载正常,用户的请求可以及时得到服务器响应90% ~ 100% - 表示服务器资源已耗尽,无法及时响应用户请求,需尽快排查项目是否运行异常,或增加服务器配置
开始的时候一些功能还可以用,后来就逐渐的都不能用了,按自己想到的检查的顺序大概是:
1、BT面板
通过BT面板服务器状态中的 连接管理、进程管理查看有没有异常,刚开始能用,后来就不行了,整个面板不能访问了。
2、SSH
尝试通过 XShell 连接服务器,失败。
Connection established. To escape to local shell, press 'Ctrl+Alt+]'. Connection closed by foreign host.
3、ECS控制台的远程连接
先是想通过发送远程命令,发了一个 top 看进程情况
BT面板显示CPU负载很低,ECS控制台的监控面板看到的CPU却是100%
但是一直没有响应。
然后通过 VNC远程连接
无法使用Workbench和远程连接软件(例如PuTTY、Xshell、SecureCRT等)连接Linux实例时,您可以通过控制台的VNC远程连接登录实例,查看云服务器操作界面的实时状态。
3389安全组不能删除,否则网页的VNC连接不上。
VNC连接上了,能看到系统桌面了,但是鼠标键盘都不能用。
然后又尝试 Workbench,结果连实例都找不到了。
重启实例
最后在ECS控制台也看不到实例了,各种错误
没办法了,提交工单吧,看到公告了
这公告太不明显了。
既然是机房的问题,那就只能等他们的工程师解决了。
根据工单服务记录,到 23:43 问题才解决。
SLA协议就怎么赔付的?
计算了一下,如果是送时间的赔偿的话,即使是百倍的,也就才一个月左右的时间。
本文由 微wx笑 创作,采用 署名-非商业性使用-相同方式共享 4.0 许可协议,转载请附上原文出处链接及本声明。
原文链接:https://www.ivu4e.cn/blog/cld-services/2022-12-19/1622.html