Ciência e Tecnologia

A plataforma de voz Ai Phonic recebe o apoio de Lux

.

A qualidade das vozes geradas pela IA é boa o suficiente para coisas como criar audiolivros e podcasts, que os artigos leiam em voz alta e o suporte básico ao cliente. Mas muitas empresas não acham a AI Voice Tech é bastante confiável o suficiente para implantar.

É por isso que dois graduados do MIT, Moin Nadeem e Nikhil Murthy, fundados Phônicouma empresa que oferece uma pilha de voz de ponta a ponta para aumentar a confiabilidade sintética da voz e diminuir a latência.

Nadeem e Murthy se conheceram no MIT e se conhecem há mais de sete anos. Quando a dupla começou a construir o Phonic no ano passado, eles sentiram que não havia muitas empresas elaborando soluções completas de tecnologia de voz.

“A voz Ai está em um lugar onde você amarra partes diferentes, como reconhecimento automático de voz [and] Text-to-fala, e [then integrate] inteligência ”, disse Murthy ao Strong The One.“ No entanto, quando conversamos com clientes reais, descobrimos que há uma falta de [solutions] que [are] confiável em escala. ”

Nadeem, que trabalhou anteriormente na MosaicML, um banco de dados da empresa adquirido por US $ 1,3 bilhão em 2023, disse que muitas empresas que estão construindo no espaço da IA ​​de voz (por exemplo, VAPI, arredondadas) estão criando fluxos de trabalho para reunir modelos de IA separados.

A Phonic adota uma abordagem diferente: treina seus modelos de ponta a ponta interna. Murthy disse que existem algumas vantagens nisso.

“Possuir os modelos nos permite integrar profundamente alguns […] peças de confiabilidade no [models themselves]”Ele disse.” Se você não possui essa camada […] Você está apenas amarrando peças díspares que realmente não se encaixam perfeitamente. ”

Murthy acrescentou que o método da Phonic também permite que a empresa hospede e execute modelos com eficiência. Ele afirma que a Phonic treina seus modelos em uma variedade de gravações, incluindo gravações de discurso acentuado e abafado, para tornar os modelos altamente robustos.

A Phonic está atualmente trabalhando com um conjunto limitado de parceiros, incluindo empresas nos espaços de seguros e saúde, mas planeja lançar seu produto amplamente em alguns meses. Em breve, clientes em potencial poderão experimentar a tecnologia da Phonic em seu site, disse Nadeem.

A Phonic levantou US $ 4 milhões em uma rodada de sementes liderada por Lux, com a participação do co-fundador da Replit, Amjad Masad, abraçando o co-fundador do rosto Clem Delangue, o co-fundador da Intuition, Qasar Younis, e o fundador da Modal Labs, Erik Bernhardson.

Grace Isford, parceira da Lux Capital, disse que a maneira interna de modelos de treinamento da empresa era atraente para a empresa de investimentos.

“Achamos que Moin e Nikhil são tecnólogos incríveis”, disse ele. “Eles fundaram [a] Machine Learning Club no MIT. E eles trabalham em modelos de treinamento há algum tempo. Além disso, sua abordagem de combinar difusão e modelos proprietários no setor de IA de voz é novo.

.

Mostrar mais

Artigos relacionados

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Botão Voltar ao topo