.
O serviço US-EAST-1, notoriamente sujeito a gafes, da Amazon Web Services, apresentou mais um dia de interrupções na terça-feira, quando seu serviço Lambda sem servidor local apresentou problemas por três horas e meia.
Conforme detalhado em um AWS atualização de statusàs 12h08 PDT (1908 UTC) em 13 de junho, o colosso da nuvem notou “taxas de erro e latências aumentadas na região US-EAST-1”.
Onze minutos depois, veio a notícia de que “a invocação da função AWS Lambda está apresentando taxas de erro elevadas”.
Apenas sete minutos depois, a AWS anunciou que havia identificado o problema e iniciado o trabalho necessário para corrigi-lo.
Mas, enquanto os administradores de nuvem da Amazon trabalhavam para resolver a situação, a equipe relatou “taxas de erro e latências aumentadas para vários serviços da AWS na região US-EAST-1”.
Esses problemas deixaram até o console da AWS indisponível para alguns, levando a conselhos de que os usuários deveriam procurar essa ferramenta vital de gerenciamento de nuvem “usando um endpoint específico da região”.
Organizações como a Delta Airlines e o Burger King foram afetadas pelo incidente, com a primeira lutando para vender passagens online e o aplicativo móvel da segunda perdendo o fôlego.
O que quer que a AWS tenha feito para restaurar os serviços funcionou rápido: às 13h48 (2048 UTC), o equipamento nublado relatou “Estamos começando a ver uma melhoria nas taxas de erro da função Lambda”.
E, ao mesmo tempo, veio um relatório básico de incidente, culpando a bagunça por “um problema com um subsistema responsável pelo gerenciamento de capacidade do AWS Lambda, que causava erros diretamente para os clientes (inclusive por meio do API Gateway) e indiretamente pelo uso por outros serviços da AWS .”
Às 21:00 UTC, a AWS declarou “Muitos serviços da AWS agora estão totalmente recuperados e marcados como Resolvidos neste evento” – mas não foi até 22:42 UTC que soou tudo limpo, informando que todos os seus serviços foram restaurados para operação total e todas as pendências limpas.
As nuvens não deveriam quebrar assim. E os problemas com um único serviço não deveriam ter um grande impacto nos serviços de um operador de nuvem.
US-EAST-1 é a região mais antiga da AWS e a mais esquisita. Cobrimos interrupções ou falhas nos celeiros de bits com sede na Virgínia em setembro 2021, Dezembro 2021e novembro de 2020. A empresa de análise Gartner tem avaliou a região como um ponto fraco para o líder do mercado nebuloso.
Apesar do fraco desempenho da região, a AWS se comprometeu a expanda-o, acrescentando vários datacenters como parte de um plano de expansão de US$ 35 bilhões. ®
.