Estudos/Pesquisa

Usando IA para decodificar vocalizações de cães

.

Você já desejou poder entender o que seu cachorro está tentando lhe dizer? Pesquisadores da Universidade de Michigan estão explorando as possibilidades da IA, desenvolvendo ferramentas que podem identificar se o latido de um cachorro transmite brincadeira ou agressão.

Os mesmos modelos também podem colher outras informações das vocalizações dos animais, como idade, raça e sexo do animal. Uma colaboração com o Instituto Nacional de Astrofísica, Óptica e Eletrónica do México (INAOE) em Puebla, o estudo conclui que modelos de IA originalmente treinados na fala humana podem ser usados ​​como ponto de partida para treinar novos sistemas que visam a comunicação animal.

Os resultados foram apresentados na Conferência Internacional Conjunta sobre Lingüística Computacional, Recursos Linguísticos e Avaliação.

“Ao usar modelos de processamento de fala inicialmente treinados na fala humana, nossa pesquisa abre uma nova janela sobre como podemos aproveitar o que construímos até agora no processamento de fala para começar a compreender as nuances dos latidos de cães”, disse Rada Mihalcea, a Janice M. Jenkins. Professor Colegiado de Ciência da Computação e Engenharia e diretor do Laboratório de IA da UM.

“Ainda não sabemos muito sobre os animais que partilham este mundo connosco. Os avanços na IA podem ser usados ​​para revolucionar a nossa compreensão da comunicação animal, e as nossas descobertas sugerem que talvez não tenhamos de começar do zero.”

Um dos obstáculos predominantes ao desenvolvimento de modelos de IA que possam analisar vocalizações de animais é a falta de dados disponíveis publicamente. Embora existam inúmeros recursos e oportunidades para registrar a fala humana, coletar esses dados de animais é mais difícil.

“Vocalizações de animais são logisticamente muito mais difíceis de solicitar e registrar”, disse Artem Abzaliev, autor principal e estudante de doutorado em ciência da computação e engenharia da UM. “Devem ser registrados passivamente na natureza ou, no caso de animais domésticos, com autorização dos proprietários”.

Devido à escassez de dados utilizáveis, as técnicas para analisar as vocalizações dos cães têm se mostrado difíceis de desenvolver, e as que existem são limitadas pela falta de material de treinamento. Os pesquisadores superaram esses desafios reaproveitando um modelo existente que foi originalmente projetado para analisar a fala humana.

Esta abordagem permitiu aos investigadores explorar modelos robustos que formam a espinha dorsal das várias tecnologias habilitadas para voz que utilizamos hoje, incluindo voz para texto e tradução de idiomas. Esses modelos são treinados para distinguir nuances da fala humana, como tom, tom e sotaque, e converter essas informações em um formato que um computador pode usar para identificar quais palavras estão sendo ditas, reconhecer o indivíduo que está falando e muito mais.

“Esses modelos são capazes de aprender e codificar padrões incrivelmente complexos da linguagem e da fala humana”, disse Abzaliev. “Queríamos ver se poderíamos aproveitar essa capacidade de discernir e interpretar latidos de cães”.

Os pesquisadores usaram um conjunto de dados de vocalizações caninas gravadas em 74 cães de diversas raças, idades e sexos, em diversos contextos. Humberto Pérez-Espinosa, colaborador do INAOE, liderou a equipe que coletou o conjunto de dados. Abzaliev então usou as gravações para modificar um modelo de aprendizado de máquina – um tipo de algoritmo de computador que identifica padrões em grandes conjuntos de dados. A equipe escolheu um modelo de representação de fala chamado Wav2Vec2, que foi originalmente treinado em dados de fala humana.

Com este modelo, os pesquisadores conseguiram gerar representações dos dados acústicos coletados dos cães e interpretar essas representações. Eles descobriram que o Wav2Vec2 não só teve sucesso em quatro tarefas de classificação; também superou outros modelos treinados especificamente em dados de latidos de cães, com precisão de até 70%.

“Esta é a primeira vez que técnicas otimizadas para a fala humana foram desenvolvidas para ajudar na decodificação da comunicação animal”, disse Mihalcea. “Nossos resultados mostram que os sons e padrões derivados da fala humana podem servir de base para a análise e compreensão dos padrões acústicos de outros sons, como as vocalizações de animais”.

Além de estabelecer modelos de fala humana como uma ferramenta útil na análise da comunicação animal – o que poderia beneficiar biólogos, especialistas em comportamento animal e muito mais – esta pesquisa tem implicações importantes para o bem-estar animal. Compreender as nuances das vocalizações dos cães pode melhorar muito a forma como os humanos interpretam e respondem às necessidades emocionais e físicas dos cães, melhorando assim os seus cuidados e prevenindo situações potencialmente perigosas, disseram os investigadores.

.

Mostrar mais

Artigos relacionados

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Botão Voltar ao topo