.
A inteligência artificial, IA, que encontra padrões em dados biológicos complexos, poderá eventualmente contribuir para o desenvolvimento de cuidados de saúde personalizados. Pesquisadores da Universidade de Linköping, na Suécia, desenvolveram um método baseado em IA aplicável a várias questões médicas e biológicas. Os seus modelos podem, por exemplo, estimar com precisão a idade cronológica das pessoas e determinar se foram fumadoras ou não.
Existem muitos fatores que podem afetar quais de todos os nossos genes são usados em um determinado momento. Tabagismo, hábitos alimentares e poluição ambiental são alguns desses fatores. Esta regulação da atividade genética pode ser comparada a um interruptor que determina quais genes são ligados ou desligados, sem alterar os genes reais, e é chamada de epigenética.
Pesquisadores da Universidade de Linköping usaram dados com informações epigenéticas de mais de 75.000 amostras humanas para treinar um grande número de modelos de redes neurais de IA. Eles esperam que tais modelos baseados em IA possam eventualmente ser utilizados na medicina de precisão para desenvolver tratamentos e estratégias preventivas adaptadas ao indivíduo. Seus modelos são do tipo autoencoder, que auto-organiza as informações e encontra padrões de inter-relação na grande quantidade de dados.
Para testar o seu modelo, os pesquisadores da LiU compararam-no com os modelos existentes. Já existem modelos dos efeitos do tabagismo no corpo, baseados no facto de alterações epigenéticas específicas reflectirem o efeito do tabagismo no funcionamento dos pulmões. Esses vestígios permanecem no DNA muito depois de uma pessoa ter parado de fumar, e esse tipo de modelo pode identificar se alguém é atual, ex-fumante ou nunca. Outros modelos podem, com base em marcadores epigenéticos, estimar a idade cronológica de um indivíduo, ou agrupar indivíduos de acordo com o fato de terem uma doença ou serem saudáveis.
Os pesquisadores da LiU treinaram seu autoencoder e então usaram o resultado para responder a três perguntas diferentes: determinação de idade, status de fumante e diagnóstico da doença lúpus eritematoso sistêmico, LES. Embora os modelos existentes dependam de marcadores epigenéticos selecionados conhecidos por estarem associados à condição que pretendem classificar. No entanto, descobriu-se que os autoencoders dos pesquisadores da LiU funcionavam melhor ou igualmente bem.
“Nossos modelos não apenas nos permitem classificar indivíduos com base em seus dados epigenéticos. Descobrimos que nossos modelos podem identificar marcadores epigenéticos previamente conhecidos usados em outros modelos, mas também novos marcadores associados à condição que estamos examinando. Um exemplo disso é que o nosso modelo para o tabagismo identifica marcadores associados a doenças respiratórias, como o cancro do pulmão, e danos no ADN”, afirma David Martínez, estudante de doutoramento na Universidade de Linköping.
O objetivo dos modelos autoencoder é permitir a compressão de dados biológicos extremamente complexos em uma representação das características e padrões mais relevantes dos dados.
“Não orientamos o modelo e não tínhamos hipóteses baseadas no conhecimento biológico existente, mas deixamos os dados falarem por si. Ao analisarmos posteriormente o que estava acontecendo no autoencoder, vimos que os dados se autoorganizavam de maneira semelhante a como funciona no corpo”, diz Mika Gustafsson, professor de bioinformática translacional na Universidade de Linköping, que liderou o estudo agora publicado em Briefings em Bioinformática.
Na próxima etapa, os pesquisadores podem usar as características mais importantes encontradas pelo autoencoder para criar modelos capazes de classificar uma grande quantidade de fatores específicos do indivíduo relacionados ao ambiente, onde não há dados de treinamento suficientes para treinar modelos de IA mais complexos em .
Certos tipos de IA são por vezes comparados a uma caixa preta que fornece respostas, mas os humanos não conseguem ver como a IA chegou à resposta. Mika Gustafsson e os seus colegas esforçam-se, no entanto, por criar modelos de IA interpretáveis que, por assim dizer, permitam aos investigadores espreitar por baixo da tampa da “caixa preta” para compreender o que se passa lá dentro.
“Queremos ser capazes de compreender o que o modelo nos mostra sobre a biologia por detrás das doenças e outras condições. Assim, veremos não só se alguém está doente ou não, mas, ao interpretar os dados, também teremos a oportunidade de saiba por quê”, diz Mika Gustafsson.
Esta pesquisa foi financiada, entre outros, pelo Conselho Sueco de Pesquisa, pelo Wallenberg AI, pelo Programa de Sistemas Autônomos e Software (WASP) e pelo Programa Nacional SciLifeLab & Wallenberg para Ciências da Vida Orientadas a Dados (DDLS).
.