technology

As falhas de SSD seguem a curva da banheira? Pergunte ao Backblaze • Strong The One

.

O provedor de armazenamento e backup baseado em nuvem Backblaze publicou o último relatório sobre os dados de uso coletados de suas unidades de estado sólido (SSDs), perguntando se eles mostram o mesmo padrão de falha dos discos rígidos.

Contraluz usa SSDs como unidades de inicialização na infraestrutura de servidores para sua plataforma Cloud Storage, enquanto unidades rotativas de alta capacidade são normalmente usadas para armazenar e servir dados.

No entanto, eles fazem mais do que apenas inicializar os servidores de armazenamento, armazenando arquivos de log e arquivos temporários produzidos por cada servidor. O volume de dados que uma unidade de inicialização irá ler, gravar e excluir depende, portanto, da atividade do próprio servidor de armazenamento.

A empresa relatado anteriormente que seus SSDs pareciam ser pelo menos tão confiáveis ​​quanto os discos rígidos, mas alertou que isso poderia mudar, pois não coleta dados de SSD há tanto tempo quanto os discos rígidos e o acúmulo de mais dados poderia alterar as estatísticas.

Backblaze afirma que adicionou 238 SSDs à sua infraestrutura desde o último relatório SSD, terminando no quarto trimestre de 2022. Estes incluíam 110 unidades Crucial (modelo: CT250MX500SSD1), 62 unidades WDC (WD Blue SA510 2.5) e 44 unidades Seagate (ZA250NM1000).

Olhando para os números do primeiro e segundo trimestre de 2023, Backblaze observa que algumas unidades parecem ter taxas de falha anualizadas excepcionalmente altas, com o modelo SSDSCKKB240GZR da Seagate listado com uma taxa de falha anualizada (AFR) de mais de 800 por cento, por exemplo.

Isto é um acaso das estatísticas devido ao baixo número de unidades; no primeiro trimestre havia apenas dois deste modelo, um dos quais falhou logo após ser instalado. Durante o segundo trimestre, o motor restante não falhou e, portanto, o AFR nesse período foi zero.

Esses números ilustram por que a Backblaze considera pelo menos 100 instâncias de um modelo de unidade específico e 10.000 dias de unidade de operação em um trimestre específico como um mínimo antes que o AFR calculado possa ser considerado razoável, de acordo com Andy Klein, evangelista de nuvem de armazenamento da Backblaze.

Olhando para o AFR ao longo do tempo, Backblaze relata que o AFR em seus SSDs foi de 0,96 por cento durante o primeiro trimestre de 2023 e 1,05 por cento durante o segundo trimestre. Esta taxa de insucesso aumentou, portanto, em relação ao trimestre anterior, mas diminuiu ligeiramente em relação ao mesmo trimestre do ano anterior. Na verdade, um gráfico da AFR por trimestre ao longo dos últimos três anos mostra que esta flutuou entre 0,36% e 1,72%, sem qualquer padrão aparente subjacente.

No entanto, Backblaze diz que os dados trimestrais ainda são vitais, pois podem revelar problemas como um modelo de unidade específico que foi a principal causa de um salto no AFR de 0,58 por cento no primeiro trimestre de 2021 para 1,51 por cento no segundo trimestre e depois 1,72 por cento no terceiro trimestre.

“Acontece de vez em quando que um determinado modelo de drive não é compatível com nosso ambiente, e moderaremos ou até mesmo removeremos o efeito desse drive no sistema como um todo”, disse Klein.

A Backblaze calculou no início deste ano a idade média em que ocorreu a falha em toda a sua coleção de discos rígidos e repetiu o cálculo para SSDs neste último relatório.

Isso envolveu a coleta de dados SMART para as 63 unidades SSD com falha que a empresa teve até o momento, o que não é um grande tamanho de conjunto de dados para análise estatística, como admitiu Klein. O valor resultante calculado a partir dos dados é de 14 meses, em comparação com dois anos e sete meses em todos os discos rígidos.

Mas a Backblaze adverte que este número provavelmente não será representativo, já que a idade média de toda a frota de SSDs em operação é de apenas 25 meses.

Observando três modelos de unidades para os quais a empresa possui uma quantidade razoável de dados, Klein descobriu que a idade média das unidades com falha aumenta à medida que aumenta a idade média das unidades em operação e, portanto, é razoável esperar que a idade média de um A falha do SSD aumentará com o tempo.

Voltando-se para a taxa de falha anualizada vitalícia para todos os seus SSDs, a Backblaze relata um número de 0,9 por cento, cobrindo um período do quarto trimestre de 2018 até o final do segundo trimestre de 2023. Este número é ligeiramente superior aos 0,89 por cento encontrados no final de 4º trimestre de 2022, mas abaixo do mesmo trimestre do ano anterior, quando o número era de 1,08 por cento.

No entanto, isso inclui unidades que apresentam altas taxas de falhas aparentes porque simplesmente não há dados suficientes para tornar o cálculo confiável.

Se o cálculo for limitado apenas aos modelos de acionamento para os quais há 100 unidades em operação e mais de 10.000 dias de acionamento, e também com um intervalo de confiança de 1 por cento ou menos entre os valores baixo e alto, então ele reduz os dados para apenas três unidades e um AFR de apenas 0,6%.

Enquanto isso, a Backblaze também produziu um gráfico de falhas de SSD ao longo do tempo para ver até que ponto os dados correspondem à clássica curva de banheira usada na engenharia de confiabilidade, como faz o gráfico comparável para seus discos rígidos.

De acordo com Klein, embora a curva real (linha azul) que mostra as falhas de SSD em cada trimestre seja um pouco “irregular”, a linha de tendência (vermelha) tem “uma aparência de curva de banheira definida”.

A linha de tendência corresponde a cerca de 70 por cento dos dados reais, então Backblaze diz que não pode estar totalmente confiante neste ponto, mas para a quantidade limitada de dados disponíveis, parece que as ocorrências de falhas de SSD estão no caminho da conformidade. à curva da banheira testada e comprovada.

Como sempre, o Backblaze disponibiliza os dados brutos usados ​​em seu relatório em um Dados de estatísticas do Drive página para qualquer um baixar e analisar – desde que você cite Backblaze como fonte se usar os dados, e não os venda, é claro. ®

.

Mostrar mais

Artigos relacionados

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Botão Voltar ao topo