.
Pesquisadores do Reino Unido esperam que um novo banco de dados disponível ao público que eles criaram diminua, e não cresça, com o tempo. Isso porque é um compêndio de milhares de proteínas pouco estudadas codificadas por genes no genoma humano, cuja existência é conhecida, mas cujas funções, em sua maioria, não. O banco de dados, apelidado de “unknome”, é o trabalho de Matthew Freeman da Dunn School of Pathology, University of Oxford, Inglaterra, e Sean Munro do MRC Laboratory of Molecular Biology em Cambridge, Inglaterra, e colegas, e é descrito no jornal de acesso aberto PLOS Biologia. Suas próprias investigações de um subconjunto de proteínas no banco de dados revelam que a maioria contribui para funções celulares importantes, incluindo desenvolvimento e resiliência ao estresse.
O sequenciamento do genoma humano deixou claro que ele codifica milhares de prováveis sequências de proteínas cujas identidades e funções ainda são desconhecidas. Existem várias razões para isso, incluindo a tendência de concentrar os escassos dólares de pesquisa em alvos já conhecidos e a falta de ferramentas, incluindo anticorpos, para interrogar as células sobre a função dessas proteínas. Mas os riscos de ignorar essas proteínas são significativos, argumentam os autores, uma vez que é provável que algumas, talvez muitas, desempenhem papéis importantes em processos celulares críticos e possam fornecer informações e alvos para intervenção terapêutica.
Para promover uma exploração mais rápida dessas proteínas, os autores criaram o banco de dados unknome (www.unknome.org), que atribui a cada proteína uma pontuação de “conhecimento”, refletindo as informações da literatura científica sobre função, conservação entre espécies, compartimentalização subcelular , e outros elementos. Com base nesse sistema, existem muitos milhares de proteínas cujo conhecimento é próximo de zero. Proteínas de organismos modelo estão incluídas, juntamente com as do genoma humano. O banco de dados é aberto a todos e personalizável, permitindo que o usuário forneça seus próprios pesos para diferentes elementos, gerando assim seu próprio conjunto de pontuações de conhecimento para priorizar sua própria pesquisa.
Para testar a utilidade do banco de dados, os autores escolheram 260 genes em humanos para os quais havia genes comparáveis em moscas e que tinham pontuações de conhecimento de 1 ou menos em ambas as espécies, indicando que quase nada era conhecido sobre eles. Para muitos deles, um nocaute completo do gene era incompatível com a vida na mosca; knockdowns parciais ou knockdowns específicos do tecido levaram à descoberta de que uma grande fração contribuiu para funções essenciais que influenciam a fertilidade, o desenvolvimento, o crescimento do tecido, o controle da qualidade da proteína ou a resistência ao estresse.
Os resultados sugerem que, apesar de décadas de estudos detalhados, existem milhares de genes de moscas que ainda precisam ser compreendidos no nível mais básico, e o mesmo é claramente verdadeiro para o genoma humano. “Esses genes não caracterizados não merecem sua negligência”, disse Munro. “Nosso banco de dados fornece uma plataforma poderosa, versátil e eficiente para identificar e selecionar genes importantes de função desconhecida para análise, acelerando assim o fechamento da lacuna no conhecimento biológico que o unknome representa”.
Munro acrescenta: “O papel de milhares de proteínas humanas permanece obscuro e, no entanto, a pesquisa tende a se concentrar naquelas que já são bem compreendidas. Para ajudar a resolver isso, criamos um banco de dados Unknome que classifica as proteínas com base em quão pouco se sabe sobre elas realizou telas funcionais em uma seleção dessas proteínas misteriosas para demonstrar como a ignorância pode levar à descoberta biológica.”
.