technology

Los Alamos Lab coloca o pragmatismo de código aberto em primeiro lugar para HPC • Strong The One

.

Estabelecido há 80 anos este ano, Los Alamos National Labs continua mais famoso por seu papel central no desenvolvimento da primeira bomba atômica. Mas isso desmente a amplitude da pesquisa científica que empreendeu desde então, abrangendo física, química e biologia e abordando a ameaça do COVID-19.

Apesar da amplitude dos assuntos que a instituição do Departamento de Energia dos EUA pesquisa, seus milhares de cientistas têm uma necessidade em comum: dados. Uma das pessoas que garante que eles consigam é Steven Senator, vice-líder do grupo da divisão de computação de alto desempenho do laboratório.

“Alto desempenho talvez seja uma palavra da moda em demasia, mas, neste contexto, o que significa é que construímos clusters, que atendem físicos, biólogos computacionais e químicos computacionais”, disse ele na conferência MariaDB OpenWorks esta semana na cidade de Nova York.

“Os que podem olhar para o dobramento de proteínas e a propagação de doenças, mais recentemente. Estes não são exemplos inventados; são experimentos reais, modelos reais e simulações que meus clientes usam.”

A organização com orçamento de US$ 4,6 bilhões emprega cerca de 18.000 pessoas em seus laboratórios e cerca de dois terços deles precisam de acesso regular a computação de alto desempenho para fazer seu trabalho. É uma carga de trabalho difícil de gerenciar.

Senator iniciou sua carreira em computação na Tandem, que construiu sistemas para dar suporte a empresas de telecomunicações e bolsas de valores em todo o mundo. Embora o impacto do tempo de inatividade possa não ser tão imediato na pesquisa científica, o impacto econômico relativo pode ser igualmente severo.

“Nossos níveis de serviço impactam esses usuários: se eles podem enviar um trabalho; se eles podem depurar seu código; se eles podem executar o trabalho e vê-lo enquanto ele está calculando”, disse ele Strong The One.

“Tudo isso significa tempo para a solução. Não é a métrica de dólares, como a comunidade FinTech ou a comunidade de transações, mas seu custo de trabalho em uma comunidade relativamente pequena de cientistas de alto valor.”

Mais velho não é necessariamente ruim

Pode surpreender alguns, então, que o cluster de 20.000 nós, apelidado de Trinity, executado no hardware Cray depende de uma edição comunitária de código aberto do MariaDB. É a iteração 10.6.7: nem mesmo a versão mais recente. Mas os requisitos de segurança e confiabilidade tornam a escolha necessária.

“O código executado em nossos sistemas tem supervisão. Podemos realmente olhar para o código-fonte aberto e executá-lo por meio de auditoria, supervisão, teste e todos os tipos de outros mecanismos de inspeção necessários para nosso ambiente”, disse o senador.

Podemos olhar para o código-fonte aberto e executá-lo por meio de auditoria, supervisão, teste

“Parte disso é medição de comprimento de braço para olhar para capacidades e modos de falha. O fato de que o código é inspecionável, que é de código aberto, é um grande negócio.”

A escolha do MariaDB, em oposição às alternativas de código aberto relacionadas, como MySQL ou PostgreSQL, também foi influenciada por sua capacidade de executar “bloqueio refinado”.

“Isso significa que posso fazer um backup do banco de dados em segundos, em vez de minutos. E quando o banco de dados está bloqueado, não consigo atualizá-lo. Não consigo adicionar um usuário, mas ainda mais importante, talvez não consiga prosseguir com alguns dos cálculos. Se você tiver bloqueio de granulação grossa, é como bloquear todos na sala. E ninguém pode nem entrar na sala”, disse o senador.

O bloqueio refinado – que permite uma abordagem mais detalhada para bloquear usuários dentro ou fora do sistema, agora é suportado pelo MySQL, mas na época era um diferencial para o MariaDB, disse ele.

“Se você comparar o dump tradicional do MySQL com o backup do MariaDB, pelo menos em nosso ambiente, [in MySQL] você está falando de dezenas de minutos para fazer é um backup dos dados. Devido ao trabalho de bloqueio de granulação fina [in MariaDB], consigo fazer um backup completo em menos de um minuto e geralmente em aproximadamente 35 segundos. Sem isso, não conseguiria cumprir meus acordos de nível de serviço”, disse ele.

Uma mistura de software, mas funciona?

Os sistemas operacionais empregados nos supercomputadores do centro são uma mistura de Red Hat e SUSE Linux.

O principal cluster executa o banco de dados da comunidade devido à sua idade e à natureza conservadora da organização científica, mas protótipos e outros sistemas de produção começaram a usar o MariaDB’s Enterprise Edition. O aplicativo no Trinity super passará para uma versão corporativa do MariaDB quando esse sistema for retirado, disse o senador.

A diferença entre as duas edições é um problema para alguns na comunidade de código aberto. Assim como o MongoDB e o CockroachDB, o MariaDB emprega um contrato de licenciamento personalizado, que é de código aberto no sentido de que os usuários podem ver o código, mas impõem restrições à comercialização de produtos baseados no código.

A diferença entre código aberto supostamente puro e mais voltado para os negócios ou restritivo causou um cisma entre alguns desenvolvedores e comentaristas de código aberto, embora não seja uma prioridade ou dor de cabeça para o senador.

“Eu leio colunas sobre o assunto. Embora não tenha certeza se tenho conhecimento suficiente para caracterizar a comunidade, do meu ponto de vista, como engenheiro, desde que eu possa ver o código, não importa. Para mim, é [not] quais são suas intenções; são suas ações”, explicou ele.

“Suas ações colocadas no código são suficientes para me dar um recurso que eu preciso com benefícios ou não. Se acontecer de beneficiar alguma outra empresa, isso não importa para mim. De qualquer forma, é sobre o código, não sobre o que motivou alguém a agir apropriadamente.”

A LANL opera seus sistemas de alto desempenho em seus próprios datacenters. Refletindo sobre uma conferência MariaDB itinerário que colocou uma forte ênfase em bancos de dados em nuvem modernos, Senator incentivou colegas engenheiros a se lembrarem do básico.

“Ser capaz de explodir na nuvem é maravilhoso, mas não negligencie o motor central do seu carro. Basta ter um banco de dados de desempenho que você pode restaurar para atingir seus acordos de nível de serviço”, disse ele. ®

.

Mostrar mais

Artigos relacionados

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Botão Voltar ao topo