Estudos/Pesquisa

Um projeto experimental mais eficaz para transformar uma célula em um novo estado

.

Uma estratégia para a reprogramação celular envolve o uso de intervenções genéticas direcionadas para transformar uma célula em um novo estado. A técnica é muito promissora na imunoterapia, por exemplo, onde os pesquisadores poderiam reprogramar as células T de um paciente para que sejam mais potentes no combate ao câncer. Algum dia, a abordagem também poderá ajudar a identificar tratamentos contra o cancro que salvam vidas ou terapias regenerativas que reparem órgãos devastados por doenças.

Mas o corpo humano tem cerca de 20.000 genes, e uma perturbação genética pode estar numa combinação de genes ou em qualquer um dos mais de 1.000 factores de transcrição que regulam os genes. Como o espaço de busca é vasto e os experimentos genéticos são caros, os cientistas muitas vezes lutam para encontrar a perturbação ideal para sua aplicação específica.

Pesquisadores do MIT e da Universidade de Harvard desenvolveram uma nova abordagem computacional que pode identificar com eficiência perturbações genéticas ideais com base em um número muito menor de experimentos do que os métodos tradicionais.

Sua técnica algorítmica aproveita a relação de causa e efeito entre fatores em um sistema complexo, como a regulação do genoma, para priorizar a melhor intervenção em cada rodada de experimentos sequenciais.

Os investigadores conduziram uma análise teórica rigorosa para determinar se a sua técnica identificou, de facto, as intervenções ideais. Com essa estrutura teórica estabelecida, eles aplicaram os algoritmos a dados biológicos reais projetados para imitar um experimento de reprogramação celular. Seus algoritmos foram os mais eficientes e eficazes.

“Muitas vezes, experimentos em grande escala são projetados empiricamente. Uma estrutura causal cuidadosa para experimentação sequencial pode permitir identificar intervenções ideais com menos ensaios, reduzindo assim os custos experimentais”, diz a coautora sênior Caroline Uhler, professora do Departamento de Engenharia Elétrica. e Ciência da Computação (EECS), que também é codiretor do Centro Eric e Wendy Schmidt do Broad Institute do MIT e Harvard, e pesquisador do Laboratório de Sistemas de Informação e Decisão (LIDS) do MIT e do Instituto de Dados, Sistemas e Sociedade (IDSS).

Juntando-se a Uhler no artigo, que aparece hoje em Inteligência da Máquina da Natureza, são o autor principal Jiaqi Zhang, estudante de pós-graduação e Eric e Wendy Schmidt Center Fellow; co-autor sênior Themistoklis P. Sapsis, professor de engenharia mecânica e oceânica no MIT e membro do IDSS; e outros em Harvard e MIT.

Aprendizado ativo

Quando os cientistas tentam conceber uma intervenção eficaz para um sistema complexo, como na reprogramação celular, muitas vezes realizam experiências sequencialmente. Essas configurações são ideais para o uso de uma abordagem de aprendizado de máquina chamada aprendizado ativo. Amostras de dados são coletadas e usadas para aprender um modelo do sistema que incorpora o conhecimento adquirido até o momento. A partir deste modelo, é projetada uma função de aquisição – uma equação que avalia todas as intervenções potenciais e escolhe a melhor para testar no próximo ensaio.

Este processo é repetido até que uma intervenção ideal seja identificada (ou os recursos para financiar experiências subsequentes se esgotem).

“Embora existam várias funções genéricas de aquisição para projetar experimentos sequencialmente, elas não são eficazes para problemas de tal complexidade, levando a uma convergência muito lenta”, explica Sapsis.

As funções de aquisição normalmente consideram a correlação entre fatores, como quais genes são coexpressos. Mas focar apenas na correlação ignora as relações regulatórias ou a estrutura causal do sistema. Por exemplo, uma intervenção genética só pode afectar a expressão de genes a jusante, mas uma abordagem baseada na correlação não seria capaz de distinguir entre genes que estão a montante ou a jusante.

“Você pode aprender parte desse conhecimento causal a partir dos dados e usá-lo para projetar uma intervenção de forma mais eficiente”, explica Zhang.

Os investigadores do MIT e de Harvard aproveitaram esta estrutura causal subjacente para a sua técnica. Primeiro, eles construíram cuidadosamente um algoritmo para que ele pudesse aprender apenas modelos do sistema que levassem em conta as relações causais.

Em seguida, os pesquisadores projetaram a função de aquisição para avaliar automaticamente as intervenções usando informações sobre essas relações causais. Eles criaram essa função para priorizar as intervenções mais informativas, ou seja, aquelas com maior probabilidade de levar à intervenção ideal em experimentos subsequentes.

“Ao considerar modelos causais em vez de modelos baseados em correlação, já podemos descartar certas intervenções. Então, sempre que obtermos novos dados, podemos aprender um modelo causal mais preciso e, assim, reduzir ainda mais o espaço de intervenções”, explica Uhler.

Este menor espaço de busca, aliado ao foco especial da função de aquisição nas intervenções mais informativas, é o que torna a sua abordagem tão eficiente.

Os pesquisadores melhoraram ainda mais sua função de aquisição usando uma técnica conhecida como ponderação de saída, inspirada no estudo de eventos extremos em sistemas complexos. Este método enfatiza cuidadosamente as intervenções que provavelmente estarão mais próximas da intervenção ideal.

“Essencialmente, vemos uma intervenção ideal como um ‘evento extremo’ dentro do espaço de todas as intervenções possíveis e subótimas e usamos algumas das ideias que desenvolvemos para estes problemas”, diz Sapsis.

Eficiência aprimorada

Eles testaram seus algoritmos usando dados biológicos reais em um experimento simulado de reprogramação celular. Para este teste, eles procuraram uma perturbação genética que resultaria em uma mudança desejada na expressão genética média. Suas funções de aquisição identificaram consistentemente intervenções melhores do que os métodos de linha de base em cada etapa do experimento de vários estágios.

“Se você interromper o experimento em qualquer estágio, o nosso ainda será mais eficiente do que as linhas de base. Isso significa que você poderia realizar menos experimentos e obter resultados iguais ou melhores”, diz Zhang.

Os pesquisadores estão atualmente trabalhando com experimentalistas para aplicar sua técnica à reprogramação celular em laboratório.

A sua abordagem também poderia ser aplicada a problemas fora da genómica, tais como a identificação de preços óptimos para produtos de consumo ou a habilitação de um controlo de feedback óptimo em aplicações de mecânica de fluidos.

No futuro, eles planejam aprimorar suas técnicas para otimizações além daquelas que buscam corresponder a uma média desejada. Além disso, o seu método pressupõe que os cientistas já compreendem as relações causais no seu sistema, mas trabalhos futuros também poderão explorar como usar a IA para aprender essa informação.

Este trabalho foi financiado, em parte, pelo Office of Naval Research, pelo MIT-IBM Watson AI Lab, pelo MIT J-Clinic for Machine Learning and Health, pelo Eric and Wendy Schmidt Center do Broad Institute, por um Simons Investigator Award, o Escritório de Pesquisa Científica da Força Aérea e uma bolsa de pós-graduação da National Science Foundation.

.

Mostrar mais

Artigos relacionados

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Botão Voltar ao topo