.
Dois cientistas da computação pioneiros venceram o 2024 Prêmio Turing Por seu trabalho no aprendizado de reforço, uma disciplina na qual as máquinas aprendem através de uma abordagem de avaliação e erro baseada em recompensa que permite que eles se adaptem em ambientes restritos ou dinâmicos.
Andrew G. Varentum professor emérito da Universidade de Massachusetts Amherst; e Richard S. Suttonum professor da Universidade de Alberta, desenvolveu algoritmos e teorias importantes através de uma série seminal de trabalhos a partir da década de 1980. Isso inclui trabalho em uma técnica de reforço chamada aprendizagem de diferença temporal; A dupla publicou mais tarde um livro acadêmico chamado Aprendizagem de reforço: uma introdução.
O estimado matemático Alan Turing (foto acima), após quem o prêmio Turing é nomeado, também produziu um artigo na década de 1950 chamado Máquinas de computação e inteligência Isso questionou se os computadores podem pensar e tocaram conceitos semelhantes em torno de aprender com a experiência.
Nos anos mais recentes, o aprendizado de reforço recebeu mais atenção depois que o Google Deepmind usou a técnica para construir uma IA que derrotou os melhores jogadores do mundo do mundo. E nos últimos meses, a IA chinesa A IA Up Deepseek chegou às manchetes para o seu modelo de raciocínio R1 que mudou o jogo, que se apoiava fortemente no aprendizado de reforço para criar modelos de fundação mais econômicos.

‘Prêmio Nobel de Computação’
O prêmio Turing, administrado pela Associação de Máquinas de Computação (ACM), tem sido frequentemente apelidado de “Prêmio Nobel de Computação”. No entanto, o próprio Prêmio Nobel tem invadido o domínio da computação, particularmente em torno da IA; Geoff Hinton e John Hopfield ganharam o Prêmio Nobel de Física por seu trabalho na IA fundamental no ano passado. Isso foi seguido logo depois pelos Demis Hassabis de Deepmind e John Jumper, que receberam o Prêmio Nobel de Química por seu trabalho em Alphafold.
“As áreas de pesquisa que variam de ciência cognitiva e psicologia à neurociência inspiraram o desenvolvimento da aprendizagem de reforço, que lançou os fundamentos para alguns dos avanços mais importantes da IA e nos deu uma melhor visão de como o cérebro funciona”, disse o presidente da ACM, Yannis Ioannidis Em um comunicado de imprensa. “O trabalho de Barto e Sutton não é um trampolim que agora seguimos. A aprendizagem de reforço continua a crescer e oferece grande potencial para novos avanços na computação e muitas outras disciplinas. É apropriado que estejamos honrando -os com o prêmio de maior prestígio em nosso campo. ”
Outros pioneiros notáveis da IA para ganhar o prêmio Turing incluem o chefe da AI da Meta, Yann Lecun, que foi premiado com o prêmio em 2018 Ao lado de Geoff Hinton e Yoshua Bengio por seu trabalho em redes neurais profundas.
Barto e Sutton compartilharão o prêmio em dinheiro de US $ 1 milhão, que recebeu suporte do Google.
.








