Ciência e Tecnologia

AI pode clonar a voz do seu apresentador de podcast favorito

.

Balasubramaniyan diz que os serviços de IA de voz precisam oferecer segurança equivalente à de outras empresas que armazenam dados pessoais, como informações financeiras ou médicas.

“Você precisa perguntar à empresa: ‘como minha voz de IA será armazenada? Você está realmente armazenando minhas gravações? Você está armazenando criptografado? Quem tem acesso a ele?’”, diz Balasubramaniyan. “É uma parte de mim. É o meu eu íntimo. Eu preciso protegê-lo também.

Podcastle diz que os modelos de voz são criptografados de ponta a ponta e que a empresa não mantém nenhuma gravação após a criação do modelo. Somente o titular da conta que gravou os clipes de voz pode acessá-los. O Podcastle também não permite que outro áudio seja carregado ou analisado no Revoice. Na verdade, a pessoa que cria uma cópia de sua voz precisa gravar as linhas do texto pré-escrito diretamente no aplicativo Revoice. Eles não podem simplesmente carregar um arquivo pré-gravado.

“Você é quem dá permissão e cria o conteúdo”, diz Yeritsyan do Podcastle. “Seja artificial ou original, se não for uma voz deepfakeada, é a voz dessa pessoa e ela a divulgou. Não vejo problemas.”

O Podcastle espera que ser capaz de renderizar o áudio apenas com a voz clonada de uma pessoa que consente desincentiva as pessoas a se obrigarem a dizer algo muito horrível. Atualmente, o serviço não possui nenhuma moderação de conteúdo ou restrição de palavras ou frases específicas. Yeritsyan diz que cabe a qualquer serviço ou canal que publique o áudio – como Spotify, Apple Podcasts ou YouTube – policiar o conteúdo que é enviado para suas plataformas.

“Existem grandes equipes de moderação em qualquer plataforma social ou qualquer plataforma de streaming”, diz Yeritsyan. “Então esse é o trabalho deles para não deixar ninguém usar a voz falsa e criar algo estúpido ou algo não ético e publicá-lo lá.”

Mesmo que a questão muito espinhosa de deepfakes de voz e clones de IA não consensuais seja abordada, ainda não está claro se as pessoas aceitarão um clone computadorizado como um substituto aceitável para um ser humano.

No final de março, o comediante Drew Carey usou outro serviço de IA de voz, o ElevenLabs, para lançar um episódio inteiro de um programa de rádio lido por seu clone de voz. Na maioria das vezes, as pessoas odiavam. O podcasting é um meio íntimo, e a conexão humana distinta que você sente ao ouvir as pessoas conversando ou contando histórias é facilmente perdida quando os robôs se aproximam do microfone.

Mas o que acontece quando a tecnologia avança a ponto de você não perceber a diferença? Importa que não seja realmente seu podcaster favorito em seu ouvido? A fala de IA clonada tem um longo caminho a percorrer antes de ser indistinguível da fala humana, mas certamente está alcançando rapidamente. Há apenas um ano, as imagens geradas por IA pareciam caricaturais, e agora são realistas o suficiente para enganar milhões de pessoas, fazendo-as pensar que o Papa tinha roupas novas incríveis. É fácil imaginar que o áudio gerado por IA terá uma trajetória semelhante.

Há também outra característica muito humana que gera interesse nessas ferramentas com tecnologia de IA: a preguiça. A tecnologia de voz AI – supondo que chegue ao ponto em que possa imitar com precisão as vozes reais – tornará mais fácil fazer edições ou retomadas rápidas sem precisar levar o host de volta ao estúdio.

“Em última análise, a economia do criador vai vencer”, diz Balasubramaniyan. “Não importa o quanto pensemos sobre as implicações éticas, isso vai vencer porque você acabou de simplificar a vida das pessoas.”

.

Mostrar mais

Artigos relacionados

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Botão Voltar ao topo