.
Um novo modelo de inteligência artificial desenvolvido por pesquisadores da USC e publicado em Métodos da Natureza pode prever como diferentes proteínas podem se ligar ao DNA com precisão em diferentes tipos de proteína, um avanço tecnológico que promete reduzir o tempo necessário para desenvolver novos medicamentos e outros tratamentos médicos.
A ferramenta, chamada Deep Predictor of Binding Specificity (DeepPBS), é um modelo geométrico de deep learning projetado para prever a especificidade de ligação proteína-DNA a partir de estruturas complexas proteína-DNA. O DeepPBS permite que cientistas e pesquisadores insiram a estrutura de dados de um complexo proteína-DNA em uma ferramenta computacional online.
“Estruturas de complexos proteína-DNA contêm proteínas que geralmente são ligadas a uma única sequência de DNA. Para entender a regulação genética, é importante ter acesso à especificidade de ligação de uma proteína a qualquer sequência de DNA ou região do genoma”, disse Remo Rohs, professor e presidente fundador do departamento de Biologia Quantitativa e Computacional da USC Dornsife College of Letters, Arts and Sciences. “DeepPBS é uma ferramenta de IA que substitui a necessidade de sequenciamento de alto rendimento ou experimentos de biologia estrutural para revelar a especificidade de ligação proteína-DNA.”
A IA analisa e prevê proteínas–Estruturas de DNA
O DeepPBS emprega um modelo geométrico de deep learning, um tipo de abordagem de machine learning que analisa dados usando estruturas geométricas. A ferramenta de IA foi projetada para capturar as propriedades químicas e os contextos geométricos da proteína-DNA para prever a especificidade de ligação.
Usando esses dados, o DeepPBS produz gráficos espaciais que ilustram a estrutura da proteína e a relação entre as representações de proteína e DNA. O DeepPBS também pode prever a especificidade de ligação entre várias famílias de proteínas, diferentemente de muitos métodos existentes que são limitados a uma família de proteínas.
“É importante que os pesquisadores tenham um método disponível que funcione universalmente para todas as proteínas e não seja restrito a uma família de proteínas bem estudada. Essa abordagem nos permite também projetar novas proteínas”, disse Rohs.
Grande avanço na previsão da estrutura de proteínas
O campo de predição de estrutura de proteína avançou rapidamente desde o advento do AlphaFold da DeepMind, que pode prever a estrutura de proteína a partir da sequência. Essas ferramentas levaram a um aumento nos dados estruturais disponíveis para cientistas e pesquisadores para análise. O DeepPBS trabalha em conjunto com métodos de predição de estrutura para prever especificidade para proteínas sem estruturas experimentais disponíveis.
Rohs disse que as aplicações do DeepPBS são numerosas. Este novo método de pesquisa pode levar à aceleração do design de novos medicamentos e tratamentos para mutações específicas em células cancerígenas, bem como levar a novas descobertas em biologia sintética e aplicações em pesquisa de RNA.
Sobre o estudo: Além de Rohs, outros autores do estudo incluem Raktim Mitra da USC; Jinsen Li da USC; Jared Sagendorf da Universidade da Califórnia, São Francisco; Yibei Jiang da USC; Ari Cohen da USC; e Tsu-Pei Chiu da USC; bem como Cameron Glasscock da Universidade de Washington.
Esta pesquisa foi apoiada principalmente pela bolsa R35GM130376 do NIH.
.






