.
Uma nova abordagem para analisar dados de sequenciamento de RNA de célula única (scRNA-seq) foi revelada por pesquisadores da National University of Singapore (NUS). Este método promete aumentar tanto a precisão quanto a velocidade da interpretação de dados, potencialmente acelerando o progresso em várias áreas de investigação biomédica, incluindo estudos sobre câncer e doença de Alzheimer.
A estrutura inovadora, denominada scAMF (Single-cell Analysis via Manifold Fitting), foi desenvolvida por uma equipe de cientistas liderada pelo Professor Associado Zhigang Yao do Departamento de Estatística e Ciência de Dados da Faculdade de Ciências da NUS. A estrutura emprega técnicas matemáticas avançadas para ajustar uma variedade de baixa dimensão dentro do espaço de alta dimensão onde os dados de expressão genética são medidos. Ao fazer isso, o scAMF reduz efetivamente o ruído enquanto preserva informações biológicas cruciais. Isso permite uma caracterização mais precisa dos tipos e estados de células.
Esta pesquisa foi feita em colaboração com o Professor Yau Shing-Tung da Universidade de Tsinghua. Suas descobertas foram publicadas no Anais da Academia Nacional de Ciências em 3 de setembro de 2024.
Aproveitando técnicas de ajuste de coletores para superar obstáculos na análise de dados
O sequenciamento de RNA de célula única se tornou uma ferramenta crucial na pesquisa genômica, oferecendo insights sem precedentes sobre a diversidade celular e mecanismos de doenças. No entanto, o ruído inerente em dados de scRNA-seq, decorrente tanto da variabilidade biológica quanto de erros técnicos, há muito tempo representa desafios para análises precisas. Os métodos tradicionais de análise de scRNA-seq, incluindo abordagens de imputação genômica, métodos baseados em gráficos e algoritmos baseados em aprendizado profundo, muitas vezes lutam para caracterizar com precisão as relações celulares devido ao ruído inerente.
A estrutura scAMF representa um passo significativo para superar essas limitações. Ela opera no princípio de ajustar um coletor de baixa dimensão dentro do espaço ambiente de dados de expressão genética, reduzindo efetivamente o ruído enquanto preserva informações cruciais. No coração do scAMF está o módulo de ajuste de coletor que efetivamente reduz o ruído dos dados scRNA-seq ao desdobrar sua distribuição no espaço ambiente. Essa técnica visa reconstruir um coletor suave dentro do espaço original onde os dados são medidos, capturando a estrutura de baixa dimensão dos dados de uma maneira que minimize a perda de informações e efetivamente elimine o ruído.
A principal inovação do scAMF está na sua capacidade de melhorar a distribuição espacial dos dados, aproximando os vetores de expressão gênica de células do mesmo tipo, mantendo uma separação clara entre diferentes tipos de células. Esse aprimoramento leva a um agrupamento mais preciso e confiável em análises subsequentes.
“Nossa abordagem efetivamente reduz o ruído dos dados scRNA-seq ao ajustar uma variedade de baixa dimensão no espaço de alta dimensão”, explicou o Prof. Associado Yao. “Este método melhora significativamente a precisão da classificação do tipo de célula e a clareza da visualização de dados.”
O método scAMF emprega uma combinação única de transformação de dados, ajuste de coletor usando métricas de vizinho mais próximo compartilhadas e validação de agrupamento não supervisionada. Quando comparado a outros métodos, o scAMF demonstra desempenho superior em várias áreas-chave, incluindo redução de ruído mais eficaz, precisão de agrupamento aprimorada, melhor preservação de informações biológicas, eficiência computacional competitiva, visualização mais clara e desempenho robusto em diversos conjuntos de dados. Essas melhorias posicionam o scAMF como uma nova ferramenta poderosa na análise de células únicas, potencialmente permitindo que os pesquisadores descubram heterogeneidade celular anteriormente oculta e populações de células raras.
Trabalho futuro — Promover uma maior compreensão da diversidade e função celular
Com base no sucesso do scAMF, a equipe de pesquisa está agora desenvolvendo uma nova estrutura para construir atlas de células multiescala de alta resolução. Esta nova abordagem visa superar as limitações metodológicas atuais na construção de atlas de células, como desafios na identificação de pequenas populações de células e técnicas desatualizadas de aprendizado não supervisionado.
Um foco importante é o desenvolvimento de uma estrutura de análise de células de multirresolução baseada em scAMF. Esta estrutura avançada visa identificar populações de células raras e contribuir para a construção de atlas de células abrangentes. A abordagem de multirresolução permitirá que os pesquisadores analisem a heterogeneidade celular em vários níveis de granularidade, de tipos de células amplos a subpopulações sutis. Isso é particularmente crucial para identificar tipos de células raras que podem ser negligenciadas por métodos de análise convencionais.
“Nosso trabalho em andamento já mostrou resultados promissores em vários conjuntos de dados de referência, revelando novos insights biológicos”, observou o Prof. Associado Yao. “Nós o aplicamos ao Atlas de Células Cerebrais Humanas e identificamos novos subtipos e genes marcadores para vários tipos de células.”
Esta pesquisa em andamento promete expandir ainda mais os limites da análise de células individuais, potencialmente revolucionando nossa compreensão da diversidade e função celular em vários sistemas biológicos.
.