.

As atualizações trimestrais da Backblaze sobre taxas de falha anualizadas (AFRs) para seu arsenal de unidades de disco rígido (HDDs) forneceram informações exclusivas sobre o uso de armazenamento de longo prazo por mais de 10 anos. Hoje, a empresa de backup e armazenamento em nuvem divulgou os dados do segundo trimestre de 2023, que exploram um aumento intrigante nas AFRs.
A postagem do blog de hoje detalha os dados de 240.940 HDDs que o Backblaze usa para armazenamento de dados em todo o mundo. Existem 31 modelos diferentes, e Andy Klein, da Backblaze, autor do blog, estimou em um e-mail para a Strong The One que 15% dos HDDs no conjunto de dados, incluindo algumas das unidades de 4, 6 e 8 TB, são de nível de consumidor. O conjunto de dados não inclui unidades de inicialização, unidades em comissão para fins de teste ou modelos de unidade para os quais o Backblaze não tinha pelo menos 60 unidades.

Uma das maiores revelações do exame das unidades de 1º de abril de 2023 a 30 de junho de 2023 foi um aumento na AFR do primeiro trimestre de 2023 (1,54%) para o segundo trimestre de 2023 (2,28 por cento). O conjunto de dados do primeiro trimestre do Backblaze examinou 237.278 HDDs em 30 modelos.
Claro, esse aumento de AFR por si só não é suficiente para justificar qualquer pânico. Como os números AFR trimestrais são “voláteis”, disse Klein à Strong The One, o Backblaze avalia ainda as tendências trimestrais e vitalícias “para ver se o que aconteceu foi uma anomalia ou algo mais”.
Assim, Klein começou a cavar ainda mais, agrupando as unidades por capacidade. Isso porque, como Klein explicou a Ars:
Um cofre de armazenamento Backblaze consiste em 1.200 unidades do mesmo tamanho, com 60 unidades em 20 servidores de armazenamento. Se agruparmos as unidades estritamente por idade e quisermos substituir apenas as unidades mais antigas em um determinado cofre Backblaze, substituiremos apenas as unidades no cofre que atendem aos critérios de idade antiga, não todas as unidades. Então, daqui a um ano, faríamos isso de novo, e no ano seguinte, etc. Usando a idade média por tamanho da unidade, podemos, conforme apropriado, substituir/atualizar todas as unidades em um cofre de uma só vez.
Depois de eliminar as unidades que o Backblaze considerava jovens (com menos de 5 anos), o Backblaze criou o gráfico de linhas abaixo, concentrando-se em AFRs trimestrais para seus HDDs de 4, 6, 8 e 10 TB. E olhando o gráfico abaixo, destacam-se as linhas para os modelos de 10 e 8 TB:

Mudança para AFRs vitalícios
Indo ainda mais fundo para ver se são realmente unidades de 8 TB e 10 TB que aumentam o AFR das unidades, o Backblaze voltou-se para AFRs vitalícios, que analisam dados de unidades com idade de 10 anos, 2 meses, 10 dias, com a unidade mais antiga (uma unidade de 6 TB Seagate ST6000DX000) com cerca de 10 anos e 2 meses.

A AFR vitalícia para os discos rígidos do Backblaze aumentou 0,05 por cento desde o trimestre anterior (1,4 por cento) até agora (1,45 por cento). Os grandes impulsionadores dessa mudança foram os HDDs de 10 TB, bem como os de 8 TB.

O Backblaze tem muito mais unidades de 8 TB (24.891) do que as de 10 TB (1.124). Assim, Klein agrupou as unidades de 8 TB por modelo. Klein disse à Ars que cada um dos modelos de direção abaixo teve mais de 50.000 dias de direção no trimestre e mais de 2 milhões de dias de direção em sua vida útil.

“Para todos os três modelos, o aumento da taxa de falha anualizada da vida útil do primeiro para o segundo trimestre é de 10 por cento ou mais, o que é estatisticamente semelhante ao aumento de 12 por cento para todos os modelos de unidade de 8 TB. Se você tivesse que selecionar um modelo de unidade para foco na migração, qualquer um dos três seria um bom candidato”, diz o blog de Klein.
O que aprendemos?
O executivo disse à Ars que anos de coleta de dados como esse ensinaram à Backblaze que a taxa de falha de um determinado modelo não prevê a taxa de falha de outros modelos do mesmo tamanho ou do mesmo fabricante:
É por isso que, assim que identificamos as unidades de 8 TB como o problema em potencial, tivemos que pesquisar os números específicos do modelo. Nesse caso, todos os modelos foram semelhantes em seu aumento nas taxas de falha, mas poderia ser igualmente provável que não fossem.
Uma coisa a lembrar é que estamos olhando para a mudança nas taxas de falha ao longo do tempo, não para as próprias taxas de falha reais. Estamos à procura de mudanças incomuns fora do que esperaríamos.
Observar dados detalhados da unidade como este dá ao Backblaze uma visão íntima de seu ambiente de armazenamento para que ele possa fazer os ajustes necessários.
“Temos um programa de migração de unidade para mover de unidades menores para unidades maiores para melhorar a densidade de armazenamento em um determinado cofre Backblaze. Por razões econômicas, começamos com as unidades menores e depois consideramos outros detalhes, como taxas de falha, no processo. Para esse fim, a análise que fizemos está sendo usada para ajudar a priorizar quais cofres Backblaze são atualizados”, disse Klein à Ars.
Para os consumidores que consideram um novo HDD para uso pessoal (mas não como parte de uma matriz RAID), Klein aconselhou a procurar um modelo que eles “acreditassem que falharia menos”.
Ele adicionou:
Mas a diferença entre uma taxa de falha de 1% e 2% é discutível se você não fizer backup de suas coisas em outro lugar. Contar com uma única unidade, HDD ou SSD, como sua única fonte de armazenamento de dados é uma bomba-relógio. Quer uma unidade dure 2 ou 10 anos, ela falhará.
O conjunto de dados completo do Backblaze está disponível ao público gratuitamente em seu site.
.