.
Synthesia nem sempre foi considerada a ponta afiada da indústria de IA generativa. Por seis anos, Riparbelli e seus cofundadores trabalharam fora dos holofotes em busca de sua missão de inventar uma maneira de fazer vídeo sem usar nenhum equipamento de câmera. Em 2017, não havia muitos investidores que achavam isso muito interessante, diz Riparbelli, que agora tem 31 anos. Mas então surgiu o ChatGPT. E o CEO dinamarquês foi catapultado para a crescente elite de IA de Londres ao lado de fundadores de empresas como DeepMind, de propriedade da Alphabet desde 2014, que atualmente está trabalhando em um concorrente do ChatGPT, e Stability AI, a startup por trás do gerador de imagens Stable Diffusion.
Em junho, a Synthesia anunciou uma rodada de financiamento que a avaliou em US$ 1 bilhão. Esse não é exatamente o preço de $ 29 bilhões que a OpenAI recebeu em maio – mas ainda é um aumento gigantesco de $ 700 milhões em comparação com dois anos atrás, a última vez que os investidores investiram nos negócios da Synthesia.
Conheço Riparbelli pelo Zoom. Ele atende a chamada da casa de férias de sua família em uma ilha dinamarquesa, com seu beliche de infância atrás dele. Crescendo em Copenhague, Riparbelli se interessou por computadores por meio de jogos e música eletrônica. Olhando para trás, ele acredita que poder fazer techno apenas com seu laptop, da Dinamarca – não um lugar conhecido por seus clubes ou indústria musical – foi uma grande influência para o que ele faz agora. “Foi muito mais sobre quem pode fazer boa música e carregá-la no SoundCloud ou no YouTube do que sobre quem mora em Hollywood e tem um pai que trabalha na indústria da música”, diz ele. Para chegar a esse ponto, ele acredita que o vídeo ainda tem um longo caminho a percorrer porque ainda requer muitos equipamentos. “É inerentemente restritivo porque é muito caro de fazer.”
Após a formatura, Riparbelli entrou no cenário das startups dinamarquesas, construindo o que ele descreve como tecnologias “vanilla”, como software de contabilidade. Insatisfeito, mudou-se para Londres em busca de algo mais sci-fi. Depois de experimentar projetos de criptografia e VR, ele começou a ler sobre deepfakes e se viu dominado pelo potencial. Em 2017, ele se juntou ao colega dinamarquês Steffen Tjerrild e a dois professores de visão computacional, Lourdes Agapito e Matthias Niessner, e juntos lançaram o Synthesia.
Nos últimos seis anos, a empresa construiu uma biblioteca vertiginosa de avatares. Eles estão disponíveis em diferentes gêneros, tons de pele e uniformes. Existem descolados e trabalhadores de call center. Papai Noel está disponível em várias etnias. Dentro da plataforma da Synthesia, os clientes podem personalizar o idioma que seus avatares falam, seus sotaques, até mesmo em que ponto de um script eles levantam as sobrancelhas. Riparbelli diz que seu favorito é Alex, um avatar classicamente bonito, mas comum, que parece ter vinte e poucos anos e cabelos castanhos de comprimento médio. Existe uma versão humana real de Alex que está vagando pelas ruas em algum lugar. A Synthesia treina seus algoritmos em filmagens de atores filmados em seus próprios estúdios de produção.
Possuir esses dados é um grande atrativo para os investidores. “Basicamente, todos os seus algoritmos precisam de dados 3D, porque trata-se de entender como os humanos estão se movendo, como estão falando”, diz Philippe Botteri, sócio da empresa de capital de risco Accel, que liderou a última rodada de financiamento da Synthesia. “E para isso, você precisa de um conjunto muito específico de dados que não está disponível.”
.








