Humanos incapazes de detectar mais de um quarto das amostras de fala deepfake – Strong The One

O estudo, publicado hoje na PLOS UMé o primeiro a avaliar a capacidade humana de detectar fala gerada artificialmente em um idioma diferente do inglês.

Deepfakes são mídias sintéticas destinadas a se assemelhar à voz ou aparência de uma pessoa real. Eles se enquadram na categoria de inteligência artificial generativa (IA), um tipo de aprendizado de máquina (ML) que treina um algoritmo para aprender os padrões e características de um conjunto de dados, como vídeo ou áudio de uma pessoa real, para que possa reproduzir som ou imagens originais.

Embora os primeiros algoritmos de fala deepfake possam ter exigido milhares de amostras da voz de uma pessoa para gerar o áudio original, os algoritmos pré-treinados mais recentes podem recriar a voz de uma pessoa usando apenas um clipe de três segundos dela falando¹. Algoritmos de código aberto estão disponíveis gratuitamente e, embora algum conhecimento seja benéfico, seria viável para um indivíduo treiná-los em alguns dias².

A empresa de tecnologia Apple anunciou recentemente um software para iPhone e iPad que permite ao usuário criar uma cópia de sua voz usando 15 minutos de gravações³.

Pesquisadores da UCL usaram um algoritmo de conversão de texto em fala (TTS) treinado em dois conjuntos de dados disponíveis publicamente, um em inglês e outro em mandarim, para gerar 50 amostras de fala deepfake em cada idioma. Essas amostras foram diferentes das usadas para treinar o algoritmo para evitar a possibilidade de ele reproduzir a entrada original.

Essas amostras geradas artificialmente e amostras genuínas foram tocadas para 529 participantes para ver se eles podiam detectar a coisa real da fala falsa. Os participantes só conseguiram identificar a fala falsa em 73% das vezes, o que melhorou apenas um pouco depois de receberem treinamento para reconhecer aspectos da fala deepfake.

Kimberly Mai (UCL Computer Science), primeira autora do estudo, disse: “Nossas descobertas confirmam que os humanos são incapazes de detectar de forma confiável a fala deepfake, tenham ou não recebido treinamento para ajudá-los a detectar conteúdo artificial. Também vale a pena notar que o as amostras que usamos neste estudo foram criadas com algoritmos relativamente antigos, o que levanta a questão de saber se os humanos seriam menos capazes de detectar a fala deepfake criada usando a tecnologia mais sofisticada disponível agora e no futuro.”

O próximo passo para os pesquisadores é desenvolver melhores detectores de fala automatizados como parte dos esforços contínuos para criar recursos de detecção para combater a ameaça de áudio e imagens gerados artificialmente.

Embora existam benefícios da tecnologia de áudio AI generativa, como maior acessibilidade para aqueles cuja fala pode ser limitada ou que podem perder a voz devido a doenças, há temores crescentes de que essa tecnologia possa ser usada por criminosos e estados-nação para causar danos significativos. aos indivíduos e às sociedades.

Casos documentados de discurso deepfake sendo usado por criminosos incluem um incidente de 2019 em que o CEO de uma empresa de energia britânica foi convencido a transferir centenas de milhares de libras para um fornecedor falso por meio de uma gravação deepfake da voz de seu chefe⁴.

O professor Lewis Griffin (UCL Computer Science), autor sênior do estudo, disse: “Com a tecnologia de inteligência artificial generativa ficando mais sofisticada e muitas dessas ferramentas disponíveis abertamente, estamos prestes a ver inúmeros benefícios, bem como riscos. Seria prudente que governos e organizações desenvolvessem estratégias para lidar com o abuso dessas ferramentas, certamente, mas também devemos reconhecer as possibilidades positivas que estão no horizonte.”

Satella Nortonagosto 4, 2023

0 2 minutos de leitura

Mostrar mais

Ler o Próximo

Humanos incapazes de detectar mais de um quarto das amostras de fala deepfake – Strong The One

Satella Norton

Ler o Próximo

Esta função do Google Sheets faz o Excel se sentir como um dinossauro

Não bloqueado arrecada US $ 20 milhões para a IA para ajudar os desenvolvedores a entender as bases de código

A Newlimit, fundada pelo CEO da Coinbase, Brian Armstrong, arrecada US $ 130 milhões para desenvolver tratamentos de reversão da idade

O Google estreia um modelo atualizado Gemini 2.5 Pro Ai antes da E/S

A relevância da IA levanta US $ 24 milhões para ajudar as empresas a criar agentes de IA

O novo Surface Pro da Microsoft é menor, mais leve e mais amigável

Impulsionado pela Defesa e Starlink, Orca AI recebe US $ 72,5 milhões para sua plataforma de remessa autônoma

Os agentes de fronteira dos EUA estão pedindo ajuda para tirar fotos de todos que entram no país de carro

Os Rovers da NASA acabaram de encontrar rochas retorcidas semelhantes em lados opostos de Marte

Centenas de sites de comércio eletrônico invadidos em ataques de cadeia de suprimentos

Esta função do Google Sheets faz o Excel se sentir como um dinossauro

Não bloqueado arrecada US $ 20 milhões para a IA para ajudar os desenvolvedores a entender as bases de código

A Newlimit, fundada pelo CEO da Coinbase, Brian Armstrong, arrecada US $ 130 milhões para desenvolver tratamentos de reversão da idade

O Google estreia um modelo atualizado Gemini 2.5 Pro Ai antes da E/S

A relevância da IA levanta US $ 24 milhões para ajudar as empresas a criar agentes de IA

O novo Surface Pro da Microsoft é menor, mais leve e mais amigável

Impulsionado pela Defesa e Starlink, Orca AI recebe US $ 72,5 milhões para sua plataforma de remessa autônoma

Os agentes de fronteira dos EUA estão pedindo ajuda para tirar fotos de todos que entram no país de carro

Os Rovers da NASA acabaram de encontrar rochas retorcidas semelhantes em lados opostos de Marte

Centenas de sites de comércio eletrônico invadidos em ataques de cadeia de suprimentos

Deixe um comentário Cancelar resposta

Ler o Próximo

Esta função do Google Sheets faz o Excel se sentir como um dinossauro

Não bloqueado arrecada US $ 20 milhões para a IA para ajudar os desenvolvedores a entender as bases de código

A Newlimit, fundada pelo CEO da Coinbase, Brian Armstrong, arrecada US $ 130 milhões para desenvolver tratamentos de reversão da idade

O Google estreia um modelo atualizado Gemini 2.5 Pro Ai antes da E/S

A relevância da IA ​​levanta US $ 24 milhões para ajudar as empresas a criar agentes de IA

O novo Surface Pro da Microsoft é menor, mais leve e mais amigável

Impulsionado pela Defesa e Starlink, Orca AI recebe US $ 72,5 milhões para sua plataforma de remessa autônoma

Os agentes de fronteira dos EUA estão pedindo ajuda para tirar fotos de todos que entram no país de carro

Os Rovers da NASA acabaram de encontrar rochas retorcidas semelhantes em lados opostos de Marte

Centenas de sites de comércio eletrônico invadidos em ataques de cadeia de suprimentos

Artigos relacionados

Deixe um comentário Cancelar resposta

A relevância da IA levanta US $ 24 milhões para ajudar as empresas a criar agentes de IA