.
O que você precisa saber
- A Opera anunciou sua colaboração com o Google Cloud, que traz seus modelos Gemini AI e software Imagen 2 para seu navegador.
- Gemini se juntará à linha de LLMs da AI Aria para ajudar os usuários com instruções específicas que exigem seus cérebros específicos.
- O Imagen 2 dará ao Opera recursos gratuitos de geração de texto para imagem, além de saída de voz para respostas.
O conhecido navegador para PC e Android, Opera, destacou seu mais recente recurso de IA, e este vem com um pouco da magia do Google.
Hoje (28 de maio), a Opera anunciou que começou a colaborar com o Google Cloud para integrar seus modelos Gemini AI em sua IA no navegador, Aria. A empresa afirma que o Gemini permitirá que o navegador Opera forneça aos usuários “as informações mais atuais, com alto desempenho”.
Opera reitera o design do Aria, que é o de um mecanismo AI multi-LLM Composer. Isso dá ao navegador a chance de “selecionar” uma experiência melhor para os usuários com base no que eles podem precisar. Além disso, Aria pega carona em vários LLMs (grandes modelos de linguagem). Opera afirma que Aria escolherá o melhor modelo de IA para lidar com a tarefa de um usuário com base em sua “intenção”.
A IA é integrada tanto no navegador Opera normal quanto no navegador OperaGX, voltado para jogadores de PC. Gêmeos provavelmente aparecerá em ambos os casos, no entanto, a Opera não disse quando devemos esperar isso.
Esta colaboração continua enquanto o Opera afirma que o Aria em breve adquirirá recursos de geração de imagem e saída de voz. Cortesia do trabalho com o Google Cloud, o navegador Opera fornecerá recursos gratuitos de geração de imagens aos usuários por meio do modelo Imagen 2 do Google no Vertex AI.
Além disso, o Aria está sendo atualizado com saída de voz “semelhante a conversação”, que permite que a IA leia suas respostas em voz alta para os usuários.
O Google lançou o Imagen 2, um modelo de geração de texto para imagem, no final de 2023. Foi afirmado que o software poderia criar imagens “fotorrealistas” com base nas instruções dos usuários. Havia também a esperança de que o Imagen 2 pudesse livrar os usuários de alguns “problemas típicos” aos quais esses tipos de bots são propensos.
Desde então, durante o I/O 2024, a empresa revelou seu novo modelo Imagen 3. A ideia de criar imagens fotorrealistas e realistas permanece a mesma com este novo software. No entanto, o Google explicou que o Imagen 3 vai um passo além, pois os usuários devem experimentar um aumento nos detalhes em todos os níveis. A fala natural e a intenção por trás do seu prompt são áreas em que o Imagen 3 foi considerado melhor que seu antecessor.
.