Estudos/Pesquisa

IA generativa ‘engana’ cientistas com dados artificiais, aproximando a análise automatizada de dados – Strong The One

.

A mesma tecnologia de IA usada para imitar a arte humana agora pode sintetizar dados científicos artificiais, avançando nos esforços em direção à análise de dados totalmente automatizada.

Pesquisadores da Universidade de Illinois Urbana-Champaign desenvolveram uma IA que gera dados artificiais a partir de experimentos de microscopia comumente usados ​​para caracterizar estruturas de materiais em nível atômico. Com base na tecnologia subjacente aos geradores de arte, a IA permite que os pesquisadores incorporem ruído de fundo e imperfeições experimentais nos dados gerados, permitindo que os recursos do material sejam detectados com muito mais rapidez e eficiência do que antes.

“IAs generativas pegam informações e geram coisas novas que não existiam antes no mundo, e agora aproveitamos isso para o objetivo da análise automatizada de dados”, disse Pinshane Huang, professor de ciência de materiais e engenharia e um co-líder de projeto. “O que é usado para fazer pinturas de lhamas no estilo de Monet na internet agora pode fazer dados científicos tão bons que enganam a mim e meus colegas.”

Outras formas de IA e aprendizado de máquina são usadas rotineiramente na ciência de materiais para auxiliar na análise de dados, mas exigem intervenção humana frequente e demorada. Tornar essas rotinas de análise mais eficientes requer um grande conjunto de dados rotulados para mostrar ao programa o que procurar. Além disso, o conjunto de dados precisa levar em conta uma ampla gama de ruído de fundo e imperfeições experimentais para ser eficaz, efeitos difíceis de modelar.

Como coletar e rotular um conjunto de dados tão vasto usando um microscópio real é inviável, Huang trabalhou com o professor de física da U. of I. Bryan Clark para desenvolver uma IA generativa que pudesse criar um grande conjunto de dados de treinamento artificial a partir de um conjunto comparativamente pequeno de dados reais. , dados rotulados. Para conseguir isso, os pesquisadores usaram uma rede adversária generativa de ciclo, ou CycleGAN.

“Você pode pensar em um CycleGAN como uma competição entre duas entidades”, disse Clark. “Existe um ‘gerador’ cujo trabalho é imitar um conjunto de dados fornecido, e há um ‘discriminador’ cujo trabalho é identificar as diferenças entre o gerador e os dados reais. Eles se revezam tentando frustrar um ao outro, melhorando a si mesmos com base em o que o outro foi capaz de fazer. Em última análise, o gerador pode produzir dados artificiais que são virtualmente indistinguíveis dos dados reais.”

Ao fornecer ao CycleGAN uma pequena amostra de imagens reais de microscopia, a IA aprendeu a gerar imagens que foram usadas para treinar a rotina de análise. Agora ele é capaz de reconhecer uma ampla gama de características estruturais, apesar do ruído de fundo e das imperfeições sistemáticas.

“A parte notável disso é que nunca tivemos que dizer à IA o que são coisas como ruído de fundo e imperfeições como aberrações no microscópio”, disse Clark. “Isso significa que, mesmo que haja algo em que não tenhamos pensado, o CycleGAN pode aprendê-lo e executá-lo.”

O grupo de pesquisa de Huang incorporou o CycleGAN em seus experimentos para detectar defeitos em semicondutores bidimensionais, uma classe de materiais promissora para aplicações em eletrônica e óptica, mas difícil de caracterizar sem o auxílio da IA. No entanto, ela observou que o método tem um alcance muito mais amplo.

“O sonho é um dia ter um microscópio ‘autônomo’, e a maior barreira era entender como processar os dados”, disse ela. “Nosso trabalho preenche essa lacuna. Mostramos como você pode ensinar um microscópio a encontrar coisas interessantes sem ter que saber o que está procurando.”

.

Mostrar mais

Artigos relacionados

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Botão Voltar ao topo