technology

PaLM 2, Pixel Fold e IA absolutamente em todos os lugares • Strong The One

.

Em sua conferência de desenvolvedores reduzida na quarta-feira, o Google exibiu o hardware Pixel atual e planejado – um Pixel dobrável entre eles – e PaLM 2, um grande modelo de linguagem que segue os passos do Pathways Language Model (PaLM) inicial do ano passado e agora sussurra para vários produtos do Google.

Havia mais, também, amontoados em um único dia. Foi a primeira vez desde que o evento estreou em 2008 que o show não durou dois ou três dias, exceto sua ausência em 2020. Coincidentemente, a lista de funcionários da gigante da tecnologia é mais curto em 12.000 este ano, embora o Google ainda tenha muito por aí.

O pré-show poderia ter sido mais curto ainda. Um DJ, apoiado por gráficos gerados deselegantes, submeteu o público a melodias eletrônicas desagradáveis ​​abafadas por letras irritantes de vocoder. Mesmo assim, as pessoas aplaudiram no frio estádio ao ar livre.

O CEO da Alphabet, Sundar Pichai, subiu ao palco, aqui no Anfiteatro Shoreline, no Vale do Silício, para dizer que o Google está reinventando todos os seus principais produtos, incluindo a pesquisa, para aproveitar os avanços da IA ​​generativa. O que deu o tom da manhã.

Você pode assistir à blitz de relações públicas de três horas e meia usando o vídeo abaixo, confira nosso resumo aqui ou ambos. Ou nenhum. Nós não somos um policial.

Vídeo do youtube

O Google pesquisa e desenvolve sistemas artificialmente inteligentes há anos, criando a arquitetura transformadora que alimenta os chatbots badalados de hoje e inserindo esse tipo de tecnologia em seus produtos, serviços e pipelines internos durante esse período. Ele agora se vê tentando recuperar o atraso, pelo menos em termos de percepção do público.

O rival OpenAI, agora em grande parte ligado à Microsoft, causou sensação no ano passado ao disponibilizar publicamente seus modelos de aprendizado de máquina GPT-3, ChatGPT, GPT-4 e DALL-E, e a Microsoft os colocou papagaios estocásticos em produtos como GitHub Copilot, Bing e sua nuvem 365.

Simultaneamente, projetos de código aberto, incluindo Stable Diffusion em agosto e reproduções de Facebook’s LLaMA que apareceu em março, provocaram preocupação entre os Googlers sobre serem deixados para trás.

A resposta imediata do Google é PaLM 2, que pode lidar com escrita, codificação e cálculos com a competência ocasional que as pessoas esperam dos LLMs, disse Pichai. O modelo fundamental foi treinado em mais de 100 idiomas, em conjuntos de dados científicos e código. Ele vem em quatro tamanhos, conhecidos como: Gecko, Otter, Bison e Unicorn.

O PaLM 2 possui versões médicas e de segurança, conhecidas como Med-PaLM 2 e sec-PaLM. Há um modelo de acompanhamento em andamento chamado Gemini, que é multimodal, muito parecido com o do Meta ImageBind.

Pichai disse que o Google está apresentando 25 produtos e recursos baseados no PaLM 2. Vários desses recursos não totalmente elaborados podem ser testados antes do lançamento geral por meio de Pesquisar laboratórios.

Um bardo por qualquer outro nome

Bard, o chatbot AI, agora está rodando em PaLM 2, e está sendo usado entre outras coisas para ajudar os desenvolvedores a codificar. O serviço anteriormente em lista de espera é agora aberto ao públicoe 180 países estão incluídos.

Sissie Hsiao, vice-presidente e gerente geral do Google Assistant, disse que Bard agora conhece 20 linguagens de programação e, na próxima semana, o serviço de IA está programado para obter a capacidade de citar a fonte de suas sugestões. Ele também ganhará integrações com serviços externos como o Instacart e gerará imagens com a ajuda da Adobe.

Bard está sendo conectado a vários aplicativos do Google e serviços de terceiros, como Adobe Firefly, Instacart e outros. Hsiao demonstrou pedindo a Bard para retornar uma lista de faculdades com programas de animação, para mostrá-los em um mapa, depois converter a lista em uma tabela, adicionar uma coluna e mover os dados para o Planilhas Google.

Cathy Edwards, vice-presidente de engenharia, mostrou como a IA generativa está sendo inserida na interface de pesquisa do Google. Apresentado com a pergunta “o que é melhor para uma família com crianças menores de 3 anos e um cachorro, Bryce Canyon ou Arches?” – uma consulta que no passado provavelmente seria realizada como uma série de envios de palavras-chave, observou Edwards – A Pesquisa do Google retornou texto gerado por IA no topo da pilha mais familiar de links patrocinados e links de resultados de pesquisa.

Essencialmente, com a assistência da IA, várias consultas podem ser tratadas ao mesmo tempo, para fornecer uma única resposta recomendada. A apresentação desse resultado pode exigir mais ajustes de design, pois há um limite de informações que podem ser apresentadas na tela de maneira coerente. A experiência de pesquisa em evolução está disponível para aqueles que se inscrevem no Search Labs.

“A IA não é apenas um facilitador de mercado, mas também uma grande mudança de plataforma”, disse Pichai.

O Google também vai, nos próximos meses, adicionar recursos ao seu sistema de busca de imagens para ajudar as pessoas a entender onde as fotos provavelmente apareceram pela primeira vez, quando essas fotos foram indexadas pela primeira vez e onde mais você pode encontrá-las. Espera-se que essas informações, além do suporte para um rótulo de metadados no arquivo para imagens geradas por IA, ajudem os internautas a diferenciar fotos legítimas de fotos feitas à máquina ou falsificadas.

Um dueto na nuvem

Ainda este ano, os vários recursos de IA baseados em PaLM em desenvolvimento serão agrupados em um único pacote chamado Dueto AI para Workspace. O Apresentações Google permite gerar imagens de slides com poucas palavras. O Planilhas Google poderá organizar linhas e colunas sob demanda. No Google Meet, você poderá gerar planos de fundo exclusivos. E no Docs, você poderá obter ajuda na redação da IA, pelo que vale a pena.

Os clientes do Google Cloud terão acesso a Dueto AI para Google Cloud, com recursos como assistência de código, assistência de bate-papo e Duet AI para AppSheet – uma maneira sem código de criar aplicativos de negócios. Esses recursos estão sendo disponibilizados para aqueles no programa de testador confiável da empresa.

Essa ferramenta de assistente de código, apelidada de Codey, é apresentada como rival do GitHub Copilot da Microsoft.

Thomas Kurian, chefe do Google Cloud, comentou: “O Google está usando o poder da IA ​​para transformar a maneira como você trabalha”.

Os clientes do Google Cloud também podem entrar na lista de espera para VMs de GPU A3que incluem 8 GPUs H100 Nvidia, NVIDIA NVSwitch e NVLink 4.0 com largura de banda de 3,6 TB/s, processadores Intel Xeon Scalable de 4ª geração, 2 TB de memória via DIMMs DDR5 de 4800 MHz e largura de banda de rede 10 vezes maior.

A GCP está marcando esse conjunto de tecnologias como um supercomputador A3, projetado para treinar, testar e executar modelos de ML.

E depois há os pixels

Rick Osterloh, vice-presidente sênior do Google, falou sobre o Pixel 7a de 6,1 polegadasagora disponível por US$ 499 pelo menos nos EUA, apresentando um sensor de câmera 72% maior que seu antecessor e o mesmo chipset do modelo do ano passado.

“Desde o início, o Pixel foi concebido como um primeiro computador móvel com IA”, disse ele, apontando para o chip Tensor G2 do telefone para computação de IA.

O aparelho também inclui o Call Assist com tecnologia AI, com funções como Direct My Call, Call Screen, Hold for Me, Clear Calling (redução de ruído) e Wait Times (estimativa do tempo de espera).

Imagem de folheto do Pixel Fold

É um celular que dobra… É o Pixel Fold

Mas o Google também fabrica telefones caros, como mostrou com a tão esperada versão dobrável de seu aparelho, o Dobra de pixelsenvio no próximo mês.

A partir de US$ 1.799, o aparelho se desdobra para se tornar um tablet de 7,6 polegadas e pode executar truques como tradução ao vivo entre dois idiomas em painéis voltados para direções diferentes. Pré-encomendas vem com um Pixel Watch também.

O Pixel Fold desempenhou um papel na demonstração do projeto Universal Translator do Google – com uma tela em ambos os lados do dispositivo, parece uma maneira ideal de traduzir fala em texto em conversas em tempo real. Então, novamente, o Google vem promovendo esse conceito há anos, então já ouvimos isso antes.

E, finalmente, há o próximo Pixel Tablet, um fondleslab de 11 polegadas que pode ser integrado aos sistemas de automação residencial do Google. É seu por US $ 499 e o Google aproveitou muito o carregamento e o dock do alto-falante que vem de graça quando for lançado no próximo mês, possivelmente em uma escavação astuta nas empresas que cobram muito pelo kit e ainda mais pelos acessórios. ®

E o que mais do Google IO…

  • Você pode inscreva-se no MusicLMvisto pela primeira vez em janeiro, que pode transformar descrições de texto de música em áudio.
  • Se o seu carro for Android, nas próximas semanas você poderá executar coisas como YouTube, Waze, Zoom, Microsoft Teams e Cisco Webex em seu veículo.
  • Há algum tempo, o Google falou Projeto Starline, descrito como um novo sistema de videoconferência 3D. Ainda está em fase de protótipo, e encolheu para um dispositivo do tamanho de uma TV.
  • O Google abriu um lista de espera para o Project Tailwind, um aplicativo de notebook que inclui um chatbot que você pode consultar para obter informações do Google Drive, organizar pensamentos e citar fontes.
  • Android está recebendo algo chamado Composição Mágica que usa IA generativa para sugerir respostas às mensagens de texto que você recebe. A tecnologia também pode gerar papéis de parede para o seu telefone Pixel.
  • O Gmail agora irá alertá-lo se o seu endereço de e-mail aparecer na dark web, o que pode indicar que suas informações foram roubadas ou que criminosos estão de olho em você.
  • O Google Fotos receberá um Editor Mágico para fazer alterações complexas nas fotos.

.

Mostrar mais

Artigos relacionados

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Botão Voltar ao topo