.
Os físicos desenvolveram um modelo dinâmico de comportamento animal que pode explicar alguns mistérios que cercam o aprendizado associativo desde os cães de Pavlov. O Proceedings of the National Academy of Sciences (PNAS) publicou as descobertas, baseadas em experimentos em um organismo comum de laboratório, a lombriga. C. elegans.
“Mostramos como as associações aprendidas não são mediadas apenas pela força de uma associação, mas por caminhos múltiplos e quase independentes – pelo menos nos vermes”, diz Ilya Nemenman, professor de física e biologia da Emory cujo laboratório liderou as análises teóricas para o papel. “Esperamos que resultados semelhantes também sejam válidos para animais maiores, incluindo talvez em humanos”.
“Nosso modelo é dinâmico e multidimensional”, acrescenta William Ryu, professor associado de física no Donnelly Center da Universidade de Toronto, cujo laboratório liderou o trabalho experimental. “Isso explica por que esse exemplo de aprendizado associativo não é tão simples quanto formar uma única memória positiva. Em vez disso, é uma interação contínua entre associações positivas e negativas que estão acontecendo ao mesmo tempo.”
O primeiro autor do artigo é Ahmed Roman, que trabalhou no projeto como aluno de pós-graduação da Emory e agora é pós-doutorando no Broad Institute. Konstaintine Palanski, ex-aluno de pós-graduação da Universidade de Toronto, também é autor.
Mais de 100 anos atrás, Ivan Pavlov descobriu o “reflexo condicionado” em animais através de seus experimentos com cães. Por exemplo, depois que um cachorro foi treinado para associar um som com a chegada subsequente de comida, o cachorro começava a salivar ao ouvir o som, mesmo antes de a comida aparecer.
Cerca de 70 anos depois, os psicólogos basearam-se nos insights de Pavlov para desenvolver o modelo Rescorla-Wagner de condicionamento clássico. Este modelo matemático descreve associações condicionadas por sua força dependente do tempo. Essa força aumenta quando o estímulo condicionado (no caso do cão Pavlov o som) pode ser utilizado pelo animal para diminuir a surpresa na chegada da resposta incondicionada (a comida).
Essas percepções ajudaram a preparar o terreno para as teorias modernas de aprendizado por reforço em animais, que por sua vez permitiram algoritmos de aprendizado por reforço em sistemas de inteligência artificial. Mas muitos mistérios permanecem, incluindo alguns relacionados aos experimentos originais de Pavlov.
Depois que Pavlov treinou cães para associar o som de um sino com comida, ele os expôs repetidamente ao sino sem comida. Durante as primeiras tentativas sem comida, os cães continuaram a salivar quando o sinal tocou. Se as tentativas durassem o suficiente, os cães “desaprenderiam” e parariam de salivar em resposta ao sino. A associação foi considerada “extinta”.
Pavlov descobriu, no entanto, que se esperasse um pouco e depois testasse novamente os cães, eles salivariam novamente em resposta ao sino, mesmo que não houvesse comida. Nem Pavlov nem as teorias de aprendizagem associativa mais recentes poderiam explicar com precisão ou modelar matematicamente essa recuperação espontânea de uma associação extinta.
Os pesquisadores exploraram esses mistérios por meio de experimentos com C. elegans. A lombriga de um milímetro tem apenas cerca de 1.000 células e 300 delas são neurônios. Essa simplicidade fornece aos cientistas um sistema simples para testar como o animal aprende. Ao mesmo tempo, C. elegansOs circuitos neurais são complicados o suficiente para conectar alguns dos insights obtidos com o estudo de seu comportamento a sistemas mais complexos.
Experimentos anteriores estabeleceram que C. elegans pode ser treinado para preferir uma temperatura mais fria ou mais quente, condicionando-o a uma determinada temperatura com alimentos. Em um experimento típico, os vermes são colocados em uma placa de Petri com um gradiente de temperatura, mas sem comida. Aqueles treinados para preferir uma temperatura mais baixa irão para o lado mais frio do prato, enquanto os vermes treinados para preferir uma temperatura mais quente vão para o lado mais quente.
Mas o que exatamente esses resultados significam? Alguns acreditam que os vermes rastejam em direção a uma determinada temperatura na expectativa de comida. Outros argumentam que os vermes simplesmente se acostumaram a essa temperatura, então eles preferem ficar lá mesmo sem uma recompensa de comida.
O quebra-cabeça não pôde ser resolvido devido a uma grande limitação de muitos desses experimentos – o longo tempo que leva para um verme atravessar uma placa de Petri de nove centímetros em busca da temperatura preferida.
Nemenman e Ryu buscaram superar essa limitação. Eles queriam desenvolver uma maneira prática de medir com precisão a dinâmica do aprendizado ou como o aprendizado muda com o tempo.
O laboratório de Ryu usou um dispositivo microfluídico para encolher o modelo experimental de placas de Petri de nove centímetros em gotículas de quatro milímetros. Os pesquisadores puderam realizar rapidamente experimentos em centenas de vermes, cada verme envolto em sua gotícula individual.
“Podemos observar em tempo real como um verme se move em um gradiente linear de temperaturas”, diz Ryu. “Em vez de esperar que rastejasse por 30 minutos ou uma hora, poderíamos ver muito mais rapidamente qual lado da gota, o lado frio ou o lado quente, que o verme preferia. E também poderíamos acompanhar como suas preferências mudavam com tempo.”
Seus experimentos confirmaram que, se um verme for treinado para associar comida a uma temperatura mais baixa, ele se moverá para o lado mais frio da gota. Com o tempo, porém, sem a presença de comida, essa preferência de memória aparentemente decai.
“Descobrimos que, de repente, os vermes queriam passar mais tempo no lado quente da gota”, diz Ryu. “Isso é surpreendente, porque os vermes desenvolveriam uma preferência diferente e até evitariam a temperatura que passaram a associar à comida?”
Eventualmente, o verme começa a se mover para frente e para trás entre as temperaturas mais frias e mais quentes.
Os pesquisadores levantaram a hipótese de que o verme não simplesmente esquece a memória positiva da comida associada a temperaturas mais baixas, mas começa a associar negativamente o lado mais frio com a falta de comida. Isso o estimula a ir para o lado mais quente. Então, com o passar do tempo, começa a formar uma associação negativa de nenhum alimento com a temperatura mais quente, que combinada com a associação positiva residual ao frio, faz com que ele migre de volta para o mais frio.
“O verme está sempre aprendendo, o tempo todo”, explica Ryu. “Há uma interação entre o impulso de uma associação positiva e uma associação negativa que faz com que ela comece a oscilar entre o frio e o calor.”
A equipe de Nemenman desenvolveu equações teóricas para descrever as interações ao longo do tempo entre as duas variáveis independentes – a associação positiva ou excitatória que leva um verme a uma temperatura e a associação negativa ou inibitória que o afasta dessa temperatura.
“O lado para o qual o verme gravita depende de quando exatamente você faz as medições”, explica Nemenman. “É como quando você perde suas chaves, você pode verificar primeiro a mesa onde você costuma guardá-las. Se você não as vê lá imediatamente, você corre por vários lugares procurando por elas. volte para a mesa original imaginando que você simplesmente não olhou com atenção o suficiente.”
Os pesquisadores repetiram os experimentos em diferentes condições. Eles treinaram os vermes em diferentes temperaturas iniciais e os deixaram passar fome por diferentes períodos de tempo antes de testar sua preferência de temperatura, e os comportamentos dos vermes foram previstos corretamente pelas equações.
Eles também testaram sua hipótese modificando geneticamente os vermes, eliminando a via de sinalização semelhante à insulina conhecida por servir como uma via de associação negativa.
“Perturbamos a biologia de maneiras específicas e, quando realizamos os experimentos, o comportamento do verme mudou conforme previsto por nosso modelo teórico”, diz Nemenman. “Isso nos dá mais confiança de que o modelo reflete a biologia subjacente da aprendizagem, pelo menos em C. elegans.”
Os pesquisadores esperam que outros testem seu modelo em estudos de animais maiores em todas as espécies.
“Nosso modelo fornece um modelo quantitativo alternativo de aprendizagem que é multidimensional”, diz Ryu. “Explica resultados que são difíceis, ou em alguns casos impossíveis, para outras teorias do condicionamento clássico explicarem.”
.