.
O Banco de Dados SQL do Azure causou algum incômodo no fim de semana, com administradores na costa leste dos EUA incapazes de se conectar ao serviço após uma falha de energia na infraestrutura de rede.
A interrupção começou às 07h33 UTC de 16 de setembro e não foi totalmente mitigada até mais de 12 horas depois, às 21h38, a Microsoft confirmou em seu página de status.
A Microsoft disse: “Alguns clientes que usam o Banco de Dados SQL do Azure no leste dos EUA podem ter enfrentado problemas ao tentar se conectar aos bancos de dados. As conexões com o banco de dados hospedado na região leste dos EUA podem ter resultado em erros persistentes ou tempos limite.”
Como um cliente observou na plataforma anteriormente conhecida como Twitter: “Conexão SQL DB perdida na produção. O failover não entra em ação, causando impacto nas atividades diárias. Graças a Deus (sic) sábado.”
A causa exata das sessões instáveis ainda não foi determinada. A Microsoft disse: “Identificamos que durante um breve período de tempo uma infraestrutura de rede subjacente apresentou problemas de energia. Isso fez com que os nós de computação não funcionassem, resultando em falhas e tempos limite para o Banco de Dados SQL”.
Como costuma acontecer, o efeito dominó entrou em ação e os serviços downstream que dependem do Banco de Dados SQL tiveram dificuldades para funcionar normalmente.
“Fomos notificados deste problema através dos nossos sistemas de monitoramento interno, o que nos levou a iniciar uma investigação completa”, disse a Microsoft. “Para mitigar o impacto inicial, reinicializamos os nós de computação afetados, restaurando assim a funcionalidade da maioria dos bancos de dados. Posteriormente, as instâncias restantes do banco de dados SQL foram colocadas online novamente e sobreviveram à funcionalidade total.”
A questão energética na origem dos serviços degradados ainda é fonte de investigações por parte dos engenheiros da Microsoft enquanto tentam “estabelecer um fluxo de trabalho para prevenir ocorrências futuras”.
Portanto, não é exatamente a mãe de todas as interrupções que fizeram os clientes rangerem os dentes ou arrancarem os cabelos, mas também não é uma boa aparência para o Microsoft SQL DBV no Azure. Ainda assim, não foi tão embaraçoso quanto o incidente relatado há uma semana que eliminou os serviços do Azure na região de nuvem do Leste da Austrália.
Neste caso, “uma queda de energia da concessionária desligou um subconjunto de unidades de resfriamento off-line em um datacenter, dentro de uma das zonas de disponibilidade”. A Microsoft concluiu que a falta de pessoal e a automação levaram ao desafio. ®
.