.
Os dados experimentais geralmente não são apenas altamente dimensionais, mas também ruidosos e cheios de artefatos. Isso dificulta a interpretação dos dados. Agora, uma equipe da HZB projetou um software que usa redes neurais de autoaprendizagem para compactar os dados de maneira inteligente e reconstruir uma versão de baixo ruído na próxima etapa. Isso permite reconhecer correlações que de outra forma não seriam discerníveis. O software já foi usado com sucesso em diagnósticos de fótons no laser de elétrons livres FLASH no DESY. Mas é adequado para aplicações muito diferentes na ciência.
Mais nem sempre é melhor, mas às vezes é um problema. Com dados altamente complexos, que têm muitas dimensões devido aos seus inúmeros parâmetros, muitas vezes as correlações não são mais reconhecíveis. Especialmente porque os dados obtidos experimentalmente são adicionalmente perturbados e ruidosos devido a influências que não podem ser controladas.
Ajudar os humanos a interpretar os dados
Agora, um novo software baseado em métodos de inteligência artificial pode ajudar: é uma classe especial de redes neurais (NN) que os especialistas chamam de “rede autoencoder variacional desvinculada (β-VAE)”. Simplificando, a primeira NN se encarrega de compactar os dados, enquanto a segunda NN subsequentemente reconstrói os dados. “No processo, os dois NNs são treinados para que a forma comprimida possa ser interpretada por humanos”, explica o Dr. Gregor Hartmann. O físico e cientista de dados supervisiona o Joint Lab on Artificial Intelligence Methods no HZB, que é administrado pelo HZB em conjunto com a Universidade de Kassel.
Extraindo princípios básicos sem conhecimento prévio
O Google Deepmind já havia proposto o uso de β-VAEs em 2017. Muitos especialistas assumiram que a aplicação no mundo real seria desafiadora, pois os componentes não lineares são difíceis de separar. “Depois de vários anos aprendendo como os NNs aprendem, finalmente funcionou”, diz Hartmann. Os β-VAEs são capazes de extrair o princípio básico subjacente dos dados sem conhecimento prévio.
Energia do fóton de FLASH determinada
No estudo agora publicado, o grupo usou o software para determinar a energia do fóton do FLASH a partir de espectros de fotoelétrons de disparo único. “Conseguimos extrair essas informações de dados de tempo de voo de elétrons ruidosos e muito melhor do que com métodos de análise convencionais”, diz Hartmann. Mesmo os dados com artefatos específicos do detector podem ser limpos dessa maneira.
Uma ferramenta poderosa para diferentes problemas
“O método é muito bom quando se trata de dados comprometidos”, enfatiza Hartmann. O programa é ainda capaz de reconstruir pequenos sinais que não eram visíveis nos dados brutos. Essas redes podem ajudar a descobrir efeitos físicos inesperados ou correlações em grandes conjuntos de dados experimentais. “A compactação de dados inteligente baseada em IA é uma ferramenta muito poderosa, não apenas na ciência de fótons”, diz Hartmann.
Agora plug and play
No total, Hartmann e sua equipe passaram três anos desenvolvendo o software. “Mas agora é mais ou menos plug and play. Esperamos que em breve muitos colegas venham com seus dados e possamos apoiá-los.”
.