.
O Alibaba Cloud perdeu a calma no fim de semana depois que uma falha de refrigeração tornou vários serviços indisponíveis em uma das zonas de disponibilidade do provedor de nuvem em Hong Kong.
A interrupção afetou vários grandes clientes, incluindo a exchange cripto OKX, que mostrou saldos vazios de clientes, e vários sites e aplicativos administrados pela autoridade monetária de Macau, o South China Morning Post. relatado segunda-feira cedo.
De acordo com o Alibaba Cloud, o fonte do problema foi inicialmente descrito como uma “anomalia de equipamento” em sua Hong Kong IDC Zona C, que resultou na falha de seu Elastic Compute Service (ECS), banco de dados em nuvem, armazenamento e produtos de rede. Uma investigação mais tarde rastreou a interrupção de uma unidade de refrigeração com falha em um data center de propriedade da PCCW, um provedor de serviços de informação e comunicação com sede em Hong Kong (e colaborador da Lenovo).
“Os engenheiros da Alibaba Cloud estão trabalhando em estreita colaboração com os engenheiros da PCCW para agilizar o processo de reparo, e alguns equipamentos de refrigeração já foram restaurados”, disse o Alibaba em seu comunicado. página de statusna madrugada de domingo.
Cerca de três horas depois que o Alibaba começou a rastrear a interrupção, a empresa anunciou que os reparos no equipamento de refrigeração do datacenter PCCW haviam sido concluídos e os engenheiros estavam trabalhando para colocar os serviços novamente online.
“Para os clientes que foram afetados por esta anomalia, faremos uma compensação de acordo com os acordos de produtos/serviços com os clientes”, disse o Alibaba em sua página de status. “Pedimos sinceras desculpas pelo inconveniente causado.”
Na segunda-feira, a página de status do Alibaba informou que todos os sistemas estavam online novamente.
PCCW parece não ter postado informações sobre a interrupção. Strong The One abordou a empresa para comentar. Também observamos que o clima de Hong Kong está atualmente ameno: temperaturas noturnas de 12°C e máximas diurnas de cerca de 17°C não devem sobrecarregar um data center.
O Alibaba Cloud está longe de ser o único provedor de nuvem a perder a calma este ano. Em meio a uma onda de calor recorde em julho, Google e Oracle sofrido falhas relacionadas ao resfriamento em dois datacenters no Reino Unido.
As falhas permitiram que as temperaturas dentro das instalações subissem tanto que os operadores foram forçados a desligar os sistemas e as cargas de trabalho dos clientes para evitar danos ao hardware e limitar a perda de dados.
Todas as três interrupções ressaltam o fato de que, embora a resiliência do aplicativo seja um dos principais pontos de venda da nuvem, muitas vezes o ímpeto está no cliente para implementar redundância adicional. No entanto, como o Uptime Institute recentemente encontrado, a grande maioria dos clientes acredita incorretamente que a resiliência do aplicativo é responsabilidade do provedor de nuvem. ®
.







