.
Na sexta-feira, muitos servidores Microsoft Windows e os serviços que rodam neles ficaram fora do ar por uma boa parte da manhã. Você provavelmente não foi muito afetado (nem eu), mas milhares de corporações e negócios foram, incluindo a indústria aérea e ferroviária, paralisando o transporte e outros serviços.
Nem preciso dizer que foi confuso e vai acabar custando milhões às empresas afetadas. Erros técnicos confusos e caros são fascinantes para mim e uma das coisas que acho que sempre vale a pena explorar mais. Correndo o risco de soar como o proverbial quarterback da segunda-feira de manhã, vamos dar uma olhada nisso.
Android e Relaxar
Uma das colunas de tecnologia mais antigas da web, Android & Chill é sua discussão de sábado sobre Android, Google e tudo relacionado à tecnologia.
Embora eu ache que a culpa geral deva ser atribuída à Microsoft, a gigante de Redmond não causou essa interrupção. Um componente opcional de terceiros do Windows da CrowdStrike — outro fornecedor de segurança do Windows — enviou uma atualização que travou os sistemas de baixo nível dos computadores afetados e os enviou para a famosa tela azul do Windows. A única coisa que a Microsoft fez de errado foi construir um sistema que permite que isso aconteça, mas essa também é a parte mais importante do que aconteceu.
Essa também deve ser sua maior lição, porque da próxima vez que acontecer — e haverá uma próxima vez — você pode ser afetado, e pode ser muito pior. CrowdStrike pode ter causado isso, mas foi culpa da Microsoft.
Como o CloudStrike se encaixa em tudo isso?
Vamos falar um pouco mais sobre o que é CrowdStrike e por que tantas grandes empresas usam seus produtos. De acordo com o site da empresa, CrowdStrike “redefiniu a segurança”, protegendo “as áreas de risco mais críticas – endpoints e cargas de trabalho em nuvem, identidade e dados”. Definitivamente não sou um profissional de segurança do Windows, mas consigo reconhecer um discurso de vendas quando vejo um.
Tenho certeza de que o software oferece um serviço importante. Tenho certeza de que a decisão de usar o que a CrowdStrike oferece é financeiramente baseada tanto ou mais do que tecnicamente. Os vendedores existem porque são bons em vender um bem ou serviço e, se o serviço for legítimo, é muito mais fácil de fazer.
Não tenho problema com um empreendedor encontrando uma maneira de fazer o mundo corporativo comprar seu produto. Acho duas coisas muito preocupantes aqui.
Primeiro, e mais importante, se a CrowdStrike oferece algo tão importante, por que ela ainda não faz parte do Windows Server? A Microsoft é uma das maiores, e ouso dizer, melhor, empresas de software do mundo. Se houver uma necessidade legítima de um produto como os que a CrowdStrike oferece, a Microsoft poderia fornecê-lo ela mesma. Com o licenciamento do Windows Server sendo tão caro, provavelmente deve ser fornecido.
Minha próxima preocupação é como um pedaço opcional de software pode obter acesso de SO de nível tão baixo e prejudicar uma máquina se estiver corrompido ou mal configurado. A Microsoft nunca deveria permitir que software de outra empresa sequestre seu sistema operacional dessa forma.
É por isso que vou colocar a culpa dessa interrupção em particular na Microsoft, embora a empresa não tenha feito nada para causá-la diretamente. Sempre vou exigir padrões mais altos das melhores empresas.
Nenhuma dessas ideias é louca ou nova. Garanto que os engenheiros da Microsoft sabiam que isso poderia acontecer, analisaram como isso poderia ser prevenido e o que a empresa precisava fazer para “consertá-los”. Está na moda odiar a empresa, mas a Microsoft é uma das melhores empresas do mundo quando se trata de computação, tanto na ponta quanto na nuvem. Mesmo que você não seja fã de seus produtos, pode ver isso facilmente. A infraestrutura crítica depende da Microsoft porque ela é muito boa no que faz.
E da próxima vez?
Mas chega de análise amadora. Tudo isso é preocupante porque dessa vez saímos bem. Sim, seu voo foi cancelado se você estava viajando hoje, e talvez você não tenha tido sinal de celular no seu novo telefone por algumas horas esta manhã. Se você teve sorte, você conseguiu relaxar em vez de trabalhar no seu escritório esta manhã. Se você não tiver sorte, você consegue passar o fim de semana consertando os danos que a interrupção causou ao seu departamento de TI.
E se, da próxima vez, a rede elétrica nacional cair? Imagine um país inteiro no escuro por um longo período de tempo por causa de um módulo kernel mal configurado de um fornecedor terceirizado. Sei que há várias proteções contra falhas em vigor para evitar algo assim, mas você nunca deve dizer nunca.
Mais realisticamente, e se a próxima interrupção global afetar dispositivos móveis? Esqueça a inconveniência do Gmail ou iMessage caindo e, em vez disso, imagine cada laptop Android, iPhone ou Surface quebrando por algumas horas. É fácil dizer que seria uma oportunidade de sair e tomar um ar fresco muito necessário, mas bilhões e bilhões de dólares seriam perdidos, e empresas inteiras iriam à falência por causa disso.
Tenho certeza de que incidentes como o que aconteceu esta semana são ótimas ferramentas educacionais e ajudam a evitar que um incidente mais sério aconteça. Espero que as pessoas certas — aquelas que controlam os cordões da bolsa — os usem como uma oportunidade de aprendizado.
.