.
Reduzir informações redundantes para encontrar padrões simplificadores em conjuntos de dados e redes complexas é um desafio científico em muitas áreas do conhecimento. Além disso, detectar a dimensionalidade dos dados ainda é um problema de difícil solução. Um artigo publicado na revista Comunicações da Natureza apresenta um método para inferir a dimensionalidade de redes complexas através da aplicação de geometrias hiperbólicas, que capturam a complexidade de estruturas relacionais do mundo real em diversos domínios.
Entre os autores do estudo estão os pesquisadores M. Ángeles Serrano e Marián Boguñá, da Faculdade de Física e do Instituto de Sistemas Complexos da UB (UBICS), e Pedro Almargo, da Escola Técnica Superior de Engenharia da Universidade de Sevilha. O estudo de pesquisa fornece um modelo hiperbólico multidimensional de redes complexas que reproduz sua conectividade, com uma dimensionalidade ultrabaixa e personalizável para cada rede específica. Isso permite uma melhor caracterização de sua estrutura – por exemplo, em escala comunitária – e o aprimoramento de sua capacidade preditiva.
O estudo revela regularidades inesperadas, como as dimensões extremamente baixas das redes moleculares associadas aos tecidos biológicos; a dimensionalidade um pouco maior exigida pelas redes sociais e pela Internet; e a descoberta de que os conectomas cerebrais estão próximos de três dimensões em sua organização automática.
Hiperbólico contra geometria euclidiana
A geometria intrínseca de conjuntos de dados ou redes complexas não é óbvia, o que se torna um obstáculo na determinação da dimensionalidade de redes reais. Outro desafio é que a definição de distância tem que ser estabelecida de acordo com sua estrutura relacional e de conectividade, e isso também requer modelos sofisticados.
Agora, a nova abordagem é baseada na geometria de redes complexas e, mais especificamente, no modelo geométrico configuracional ou SD modelo. “Este modelo, que desenvolvemos em trabalhos anteriores, descreve a estrutura de redes complexas com base em princípios fundamentais”, diz o professor M. Ángeles, pesquisador do ICREA no Departamento de Física da Matéria Condensada da UB.
“Mais especificamente — ele continua — , o modelo postula uma lei de interconexão dos elementos da rede (ou nós) que é gravitacional, então nós que estão mais próximos em um espaço de similaridade — de geometria esférica em dimensões D — e com mais popularidade – uma dimensão extra correspondente à importância do nó – são mais propensos a estabelecer conexões.”
No estudo, as variáveis de similaridade e popularidade são combinadas para dar origem à geometria hiperbólica do modelo, que surge como a geometria natural que representa a arquitetura hierárquica de redes complexas.
Em estudos anteriores, a equipe havia aplicado a versão mais simples do S unidimensionalD modelo – o S1 modelo — para explicar muitas características típicas das redes do mundo real: a propriedade do mundo pequeno (os seis graus de separação), as distribuições heterogêneas do número de vizinhos por nó e os altos níveis de relacionamentos transitivos (conexões triangulares que podem ser ilustrado com a expressão o amigo do meu amigo também é meu amigo).
“Além disso, a aplicação de técnicas de inferência estatística nos permite obter mapas de rede reais no plano hiperbólico que são congruentes com o modelo estabelecido”, diz ela. “Além da visualização, essas representações têm sido usadas em uma infinidade de tarefas, incluindo métodos de navegação eficientes, a detecção de padrões de auto-semelhança, a detecção de comunidades de nós que interagem fortemente e a implementação de um procedimento de renormalização de rede que revela simetrias ocultas em a organização multiescala de redes complexas e permite a produção de réplicas de rede em escalas reduzidas ou ampliadas.”
Agora, a equipe infere a dimensionalidade do espaço hiperbólico subjacente às redes reais a partir de propriedades relacionadas à dimensão de sua geometria. Em particular, o trabalho mede as estatísticas de ciclos de ordem superior (triângulos, quadrados, pentágonos) associados às conexões.
Uma metodologia aplicável a todas as redes complexas
Na informática, as técnicas aplicadas são baseadas em dados que normalmente fazem definições de distância de similaridade entre seus elementos, abordagem que envolve a construção de grafos que são mapeados em um espaço latente de feições euclidianas.
“Nossas estimativas da dimensionalidade de redes complexas estão bem abaixo de nossas estimativas baseadas no espaço euclidiano, uma vez que o espaço hiperbólico é mais adequado para representar a estrutura hierárquica de redes complexas reais. Por exemplo, a Internet requer apenas que D = 7 dimensões sejam mapeadas em o espaço hiperbólico do nosso modelo, enquanto este nome é multiplicado por seis e escala para D = 47 em uma das técnicas mais recentes usando o espaço euclidiano”, diz o professor Marián Boguñá.
Além disso, técnicas de mapeamento de dados complexos geralmente assumem um espaço latente, com um nome predeterminado de dimensões, ou implementam técnicas heurísticas para encontrar um valor adequado. Assim, o novo método é baseado em um modelo que não necessita do mapeamento espacial da rede para determinar a dimensão de sua geometria.
No campo da ciência de redes, muitas metodologias utilizam as distâncias mais curtas para estudar a estrutura de conectividade da rede (caminhos mais curtos) como um espaço métrico. No entanto, essas distâncias são fortemente afetadas pela propriedade de mundo pequeno e não fornecem uma ampla faixa de valores de distância.
“Nosso modelo usa uma definição de distância completamente diferente com base em um espaço hiperbólico subjacente, e não precisamos mapear a rede. Nossa metodologia é aplicável a qualquer rede real ou série de dados com estrutura complexa e tamanho que normalmente é de milhares ou dezenas de milhares de nós, mas pode chegar a centenas de milhares em um tempo computacional razoável”, diz M. Ángeles Serrano.
Qual é a real dimensionalidade das redes sociais e da Internet?
redes sociais e Internet é maior (entre 6 e 9) em comparação com redes em outros domínios, de acordo com os resultados do estudo. No entanto, ainda é muito baixo – 6 a 7 vezes menor – comparado ao obtido por outros métodos. Isso reflete o fato de que as interações nesses sistemas são mais complexas e determinadas por uma maior variedade de fatores.
Por outro lado, as redes sociais baseadas na amizade estão no topo do ranking de dimensionalidade. “Este é um resultado inesperado, pois pode-se pensar que a amizade é um tipo mais livre de relacionamento afetivo, mas nossos resultados se ligam ao fato de que a homofilia nas interações humanas é determinada por uma infinidade de fatores sociológicos, como idade, gênero, classe social, crenças, atitudes ou interesses”, diz M. Ángeles Serrano.
No caso da Internet, mesmo sendo uma rede tecnológica, sua maior dimensionalidade reflete o fato de que para um sistema autônomo, conectar-se não significa apenas acessar o sistema, como se poderia pensar a princípio. Pelo contrário, muitos fatores diferentes influenciam a formação dessas conexões e, como consequência, uma variedade de outros relacionamentos podem estar presentes (por exemplo, fornecedor-cliente, peer-to-peer, peering baseado em troca, etc.).
“O que é realmente surpreendente, tanto para as redes sociais quanto para a internet, é que nosso arcabouço teórico – que não usa nenhuma anotação sobre conexões além de sua existência – é capaz de capturar essa realidade multidimensional que não está explícita em nossos dados”. conclui a equipe, que atualmente trabalha na construção de mapas multidimensionais hiperbólicos de redes complexas congruentes com o arcabouço teórico estabelecido pelo SD modelo.
.