News

Samsung Galaxy S23: Este novo recurso cria uma versão AI da sua voz para responder às chamadas

.

Segurando o Samsung Galaxy S23 Ultra.

Imagem: June Wan/Strong The One

A Samsung está lançando um novo recurso de clonagem de voz que as pessoas com um smartphone Galaxy podem usar para criar uma versão de voz gerada por IA para atender chamadas.

O recurso está chegando ao assistente de smartphone Bixby como um aprimoramento de IA para o recurso de “chamada de texto”, que permite aos usuários digitar respostas quando não podem usar a voz para atender uma chamada. Essa resposta é convertida em áudio pelo Bixby e, em seguida, responde ao chamador. Mas, em vez de usar a voz Bixby, a opção Bixby “Custom Voice Creator” permite que os usuários gravem frases com sua própria voz. Bixby então cria a cópia gerada por IA na voz do usuário e tom para mensagens.

“Usando o novo Bixby Custom Voice Creator, os usuários podem gravar frases diferentes para o Bixby analisar e criar uma cópia gerada por IA de sua voz e tom”, explica a Samsung.

Também: Melhor confronto de telefone: os principais modelos de iPhone, Galaxy e Pixel empilhados

A Samsung está lançando a chamada de texto Bixby para os mercados de língua inglesa agora, enquanto o gerador de voz personalizado está disponível apenas em coreano atualmente.

O recurso de clonagem de voz está limitado a chamadas no aplicativo Samsung Phone por enquanto, mas a Samsung planeja disponibilizá-lo para outros aplicativos Samsung.

A chamada de texto Bixby está disponível no Galaxy S23, S23+, S23 Ultra, Z Fold 4 e Z Flip 4, com One UI 5.1 ou superior para inglês. O recurso de criador de voz funciona no Galaxy S23, S23+ e S23 Ultra.

A voz gerada por IA é uma área de interesse crescente para grandes empresas de tecnologia. A Amazon recentemente decidiu mostrar as capacidades de geração de voz do Alexa, um tanto desajeitadamente, demonstrando-o lendo uma história infantil na voz da falecida avó da criança. “Embora a IA não possa eliminar a dor da perda, ela pode definitivamente fazer com que suas memórias durem”, disse um executivo da Amazon.

Existem preocupações sobre como a tecnologia de voz gerada por IA pode ser usada para criar deepfakes para campanhas de desinformação ou phishing de voz. O FBI alertou no ano passado que havia visto um aumento no uso de candidatos a emprego fraudulentos usando deepfakes de voz durante entrevistas online.

Também: Samsung pretende alcançar emissões líquidas zero de carbono até 2050

Parece que a decisão da OpenAI de lançar publicamente o ChatGPT abriu as comportas para outros lançarem recursos ou produtos generativos de IA, principalmente a Microsoft via Bing Chat e o Google no Google Bard, além das APIs que cada empresa está disponibilizando para desenvolvedores terceirizados.

Experimentei o gerador de sintetização de voz baseado em GPT-3 do Resemble.AI. Foi necessária uma amostra gravada de 30 segundos de mim repetindo os termos de uso do site para minha gravação de voz. A amostra foi carregada em seus servidores e sintetizada em cerca de um minuto. Em seguida, digitei uma breve frase que foi reproduzida no que foi uma cópia claramente enunciada e razoavelmente próxima do tom da minha voz, mas falada com um forte sotaque norte-americano que é muito diferente do meu leve sotaque australiano.

Separadamente, a Samsung também sinalizou melhorias futuras para o ditado de voz baseado em IA depois de integrar sua IA no dispositivo aos aplicativos da Samsung. Esta iniciativa parece que a Samsung está trabalhando em uma resposta ao recurso de ditado de voz do Google, disponível exclusivamente nos dispositivos Pixel 6 e 7 usando o Google Assistant.

.

Mostrar mais

Artigos relacionados

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Botão Voltar ao topo