technology

Spotify testa usando IA para clonar e traduzir automaticamente vozes de podcast

.

Um robô de brinquedo fala em uma lata e um barbante.

Na segunda-feira, o Spotify lançou um programa piloto limitado que usa IA para traduzir automaticamente podcasts em vários idiomas, usando tecnologia de síntese de voz da OpenAI para preservar a voz original do locutor. O recurso visa oferecer uma experiência auditiva mais autêntica em comparação à dublagem tradicional. Também poderia introduzir erros de linguagem que são difíceis de detectar pelos falantes não nativos, uma vez que a tradução automática está longe de ser uma tecnologia perfeita.

No comunicado de imprensa anunciando o programa, o Spotify afirma que é uma plataforma que permite aos criadores compartilhar seu trabalho em todo o mundo. Em seguida, faz uma pergunta: “Com os avanços recentes, temos nos perguntado: há mais maneiras de preencher a lacuna linguística para que essas vozes possam ser ouvidas em todo o mundo?”

A resposta do Spotify é Voice Translation, que supostamente pode traduzir vozes inglesas para espanhol, francês e alemão, mantendo as características vocais distintas do locutor. O recurso está sendo usado atualmente apenas com podcasters selecionados, como Dax Shepard, Monica Padman, Lex Fridman, Bill Simmons e Steven Bartlett.

“Acreditamos que uma abordagem cuidadosa à IA pode ajudar a construir conexões mais profundas entre ouvintes e criadores, um componente-chave da missão do Spotify de desbloquear o potencial da criatividade humana”, disse Ziad Sultan, vice-presidente de personalização do Spotify, no anúncio.

O Spotify afirma que os episódios traduzidos estarão disponíveis em todo o mundo para usuários Premium e Gratuitos. Os usuários podem acessar as traduções através do “Now Playing View” do Spotify para episódios suportados ou um Voice Translations Hub dedicado que continuará a adicionar mais conteúdo traduzido.

No X, Lex Friedman postou uma amostra de sua voz clonada e traduzida para o espanhol, escrevendo: “Este sou eu falando espanhol, graças ao trabalho incrível do Spotify Engenheiros de IA. A tradução e clonagem de voz são totalmente feitas por IA. A linguagem pode criar barreiras de compreensão e, assim, alimentar a divisão. Mal posso esperar para que a IA quebre esta barreira e revele a nossa humanidade comum.”

Perdido na tradução

Mas nem todos os podcasters estão entusiasmados com o potencial das traduções automatizadas de IA. Reagindo às notícias no BlueSky, o co-criador e co-apresentador do Retronauts, Jeremy Parish, postou: “Outro motivo para revirar os olhos quando as pessoas perguntam por que não disponibilizamos o podcast no Spotify.”

No passado, vimos a tecnologia de clonagem de voz da Microsoft e da Meta analisar amostras de áudio de origem e, em seguida, aumentar esse áudio com um grande conjunto de dados de treinamento de vozes para sintetizar uma voz nova e semelhante. Essa tecnologia pode falhar quando o estilo vocal de uma pessoa não está bem representado no conjunto de dados de amostras de treinamento, especialmente com certos sotaques.

Aqui, o Spotify está adicionando uma camada adicional de complexidade, na esperança de traduzir perfeitamente o significado entre os idiomas sem cometer erros, algo que Meta também tentou com o SeamlessM4T. Na última década, a tradução baseada em IA fez grandes avanços, mas não tirou completamente os tradutores humanos do jogo. Especialistas do setor apontam que esses sistemas ainda se atrapalham com nuances e não entendem o contexto cultural, afetando a qualidade do material traduzido.

Os usuários experientes em tecnologia provavelmente esperam erros de tradução quando a fonte é devidamente enquadrada como uma tradução automática, mas quando os erros ocorrem na voz do próprio podcaster, isso pode adicionar uma nova dimensão de problema, especialmente se o áudio traduzido for retirado do contexto e mais tarde presumido ser original. Além disso, se o falante original não souber o idioma traduzido, ele não poderá verificar se a tradução reflete com precisão suas intenções originais. Isso significa colocar muita confiança — e reputação pessoal — nas mãos de tecnologia de automação não comprovada.

Por enquanto, parece que o programa do Spotify está funcionando de forma limitada e opcional apenas entre podcasters selecionados, portanto, questões de consentimento sobre a clonagem de vozes de convidados de podcast não parecem estar em jogo, a menos que isso seja implementado de forma mais ampla. No futuro, o Spotify afirma que espera obter feedback de criadores e ouvintes para refinar o recurso de tradução de voz. No entanto, com mais de 100 milhões de ouvintes regulares de podcast na plataforma, são 100 milhões de maneiras pelas quais esse experimento poderia dar errado se a tecnologia de tradução cometesse erros embaraçosos.

.

Mostrar mais

Artigos relacionados

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Botão Voltar ao topo