.
Principais conclusões
- Assistentes virtuais como Alexa, Siri e Google Assistant usam IA, principalmente aprendizado de máquina e processamento de linguagem natural, para compreender e responder a comandos de voz.
- Esses assistentes virtuais não são ferramentas puramente de IA, pois possuem outras funções que não dependem de PNL ou aprendizado de máquina, como lembretes e rotinas.
- Os provedores de assistentes virtuais estão trabalhando na integração de IA generativa, usando grandes modelos de linguagem (LLMs), para compreender melhor as solicitações de linguagem natural e fornecer respostas mais naturais. Amazon, Google e Apple estão desenvolvendo ativamente integrações baseadas em LLM para seus assistentes virtuais.
Se você tem uma casa inteligente, é provável que use um assistente como Alexa, Google Assistant ou Siri. Mas será que esses assistentes domésticos populares usam IA para funcionar e, em caso afirmativo, como?
Assistentes virtuais como Alexa usam IA?
Como os assistentes virtuais podem ouvir comandos de voz, eles se beneficiam do processamento de linguagem baseado em IA, pois os ajuda a compreender e responder melhor a comandos de voz e perguntas.
Todos os assistentes virtuais diferem uns dos outros e o tipo de IA que eles usam também difere. No entanto, o aprendizado de máquina é uma tecnologia comum usada pela maioria dos assistentes virtuais. Siri, Alexa e Google Assistant usam IA e aprendizado de máquina para interpretar solicitações e realizar tarefas.
Alexa usa aprendizado de máquina e PNL (processamento de linguagem natural) para atender às solicitações. “Linguagem natural” refere-se à linguagem usada nas conversas humanas, que flui naturalmente. Para processar melhor os comandos de voz, os assistentes virtuais contam com a PNL para entender completamente o que está sendo solicitado.
No entanto, a própria Amazon chama isso de compreensão de linguagem natural, ou NLU. A Amazon afirma que usa NLU para “deduzir o que um falante realmente quer dizer, e não apenas as palavras que ele diz”. A Amazon usa um exemplo aqui, afirmando que o NLU ajuda Alexa a fornecer uma previsão do tempo se um usuário perguntar como é lá fora. Sem dizer especificamente “previsão do tempo”, o NLU permite que Alexa ainda discerna o que o usuário está pedindo.
Além disso, a Amazon afirma que a NLU “tem como objetivo fornecer aos computadores o contexto necessário por trás do que dizemos e a flexibilidade para compreender as muitas variações em como podemos dizer coisas idênticas”. Resumindo, a NLU fornece os meios para determinar melhor o que um usuário está pedindo quando se comunica verbalmente.
O Google Assistant usa PNL e vários algoritmos complexos para processar solicitações de voz e participar de conversas bidirecionais. Recursos como Look and Talk, lançado em 2022, usam esses algoritmos para determinar se você, como usuário, está simplesmente passando pelo Nest Hub ou pretende interagir com ele.
Desde então, o Google Assistant passou por diversas atualizações. Em janeiro de 2024, o Google anunciou que removeria recursos menos utilizados, como alarmes de mídia e controle de voz do Google Play Livros.
Finalmente, há o Siri da Apple. A Siri atualmente usa IA para suas funções, usando PNL e aprendizado de máquina. Como os outros dois assistentes virtuais discutidos aqui, o Siri reconhece gatilhos de voz e pode captar a frase de gatilho “Ei, Siri” usando uma rede neural recorrente.
Os assistentes de IA também estão avançando no uso de IA generativa. Este é um tipo de IA mais recente que já está sendo utilizado em ferramentas como ChatGPT.
Tanto o Google quanto o Alexa estão atualmente desenvolvendo recursos generativos de IA para seus assistentes de voz. O Google está usando o Gemini, seu próprio modelo de linguagem grande (LLM). A Amazon, por outro lado, está desenvolvendo seu próprio LLM, atualmente conhecido como “Alexa AI”.
Conforme afirmado pela Amazon, Alexa AI permitirá algumas vantagens, incluindo conversas contínuas sem palavras de ativação repetidas, respostas mais personalizadas e controle de vários dispositivos conectados por meio de uma solicitação.
Em julho de 2023, foi anunciado que a Apple estava trabalhando em seu próprio LLM, conhecido como Ajax, que será utilizado em seu chatbot, Apple GPT. No início de 2024, começaram a surgir relatórios sobre o trabalho da Apple para melhorar a Siri usando IA generativa. Em um relatório Bloomberg Power On, foi afirmado que a Apple está “planejando uma grande reformulação” para a Siri.
Mais especificamente, foi relatado que a Apple está desenvolvendo código de IA, tanto para Siri quanto para seu serviço Apple Care. 2024 poderá revelar mais informações sobre estes desenvolvimentos.
Siri, Alexa e Google Assistant devem ser considerados IA?
Dado o quanto os assistentes virtuais dependem da IA, seja por meio de PNL ou aprendizado de máquina, é natural categorizá-los como IA. Assistentes de voz como Alexa, Google Assistant e Siri são frequentemente chamados de ferramentas de IA, devido ao uso constante de PNL e aprendizado de máquina.
Embora esses assistentes virtuais tenham muitos outros recursos que não usam IA, eles dependem fortemente da IA para funcionar. Portanto, eles podem ser considerados IA.
O futuro da IA em assistentes virtuais
Uma coisa que muitos provedores de assistentes virtuais têm em comum é que atualmente estão trabalhando no uso de IA generativa em seus sistemas.
IA generativa é um campo específico de IA que usa aprendizagem profunda e redes neurais para gerar texto ou mídia com base em solicitações do usuário (que também podem ser na forma de texto ou imagens). A introdução da IA generativa em assistentes virtuais está sendo feita através da integração de LLMs.
No futuro, a IA generativa poderá dar aos assistentes virtuais as seguintes capacidades:
- Personalizar ainda mais a experiência do usuário (com base na localização, preferências, etc.).
- Fornecer conselhos e recomendações para questões do dia a dia.
- Oferecendo conversas mais significativas com os usuários
À medida que a IA continua a se tornar mais sofisticada, poderemos ver nossos confiáveis assistentes de voz se tornarem altamente capazes, sendo capazes de nos ajudar em todos os tipos de coisas. A IA tem o potencial de catapultar as tecnologias existentes para uma nova era de capacidades, e os assistentes de voz não são exceção aqui.
.







