News

Criador do ChatGPT anuncia modelo de IA atualizado que pode ‘ver’ | Notícias de ciência e tecnologia

.

O criador do ChatGPT está lançando uma versão atualizada da IA ​​por trás de seu poderoso chatbot que pode reconhecer imagens.

O impressionante software da OpenAI tomou a internet como uma tempestade no final do ano passado com sua capacidade de gerar respostas semelhantes às humanas para praticamente qualquer prompt de texto que você joga, de criando histórias para inventar Conversar linhas.

Foi uma revelação tão grande que a gigante da tecnologia Microsoft está usando uma versão da mesma tecnologia como backbone para seu novo motor de busca Bingenquanto rival Google está desenvolvendo seu próprio chatbot.

OpenAI acaba de revelar a próxima geração do modelo GPT, apelidado de GPT-4 (ChatGPT é alimentado por GPT-3.5).

É um “grande modelo multimodal” que a empresa diz “pode ​​resolver problemas difíceis com grande precisão, graças ao seu conhecimento geral mais amplo e habilidades de resolução de problemas”.

O que é um ‘modelo multimodal’?

Enquanto o ChatGPT é baseado em um modelo de linguagem capaz apenas de reconhecer e produzir texto, um modelo multimodal sugere a capacidade de fazê-lo com diferentes formas de mídia.

O professor Oliver Lemon, especialista em IA da Universidade Heriot-Watt em Edimburgo, explicou: “Isso significa que está combinando não apenas texto, mas potencialmente imagens.

“Você estaria interagindo não apenas em uma conversa com texto, mas seria capaz de fazer perguntas sobre imagens.”

Em uma postagem no blog anunciando o GPT-4, o OpenAI confirmou que pode aceitar entradas de imagem, reconhecê-las e explicá-las.

Em um exemplo, o modelo é solicitado a explicar por que uma determinada imagem é engraçada.

A OpenAI disse que o GPT-4 “exibe desempenho de nível humano em vários benchmarks profissionais e acadêmicos”, com resultados aprimorados na precisão factual em comparação com versões anteriores.

O lançamento é limitado a assinantes do ChatGPT Plus premium da empresa, enquanto outros devem entrar em uma lista de espera.

Nova IA pode ‘ver’

O anúncio da OpenAI ocorre depois que um executivo da Microsoft disse que o GPT-4 seria lançado esta semana.

A gigante da tecnologia dos EUA recentemente fez um investimento multibilionário na empresa.

Falando no palco na semana passada, conforme relatado pelo site de notícias alemão Heise, o diretor de tecnologia da Microsoft na Alemanha, Andreas Braun, brincou que o reconhecimento de imagem estaria de fato entre os recursos do GPT-4.

Andrej Karpathy, funcionário da OpenAI, twittou que o recurso significava que a IA podia “ver”.

No entanto, qualquer expectativa de que o GPT-4 possa realmente gerar imagens da mesma forma que o GPT-3.5 pode gerar texto parece estar longe do alvo.

Já existem ferramentas de IA dedicadas à geração de imagens, como o próprio Dall-E 2 da OpenAI. Ele pode criar imagens a partir de prompts de texto simples.

Outra IA generativa em andamento em empresas como Meta e Google pode produzir vídeo e música.

O nome apropriado Make-A-Video da Meta ainda não foi lançado ao público, mas a empresa diz que permite que as pessoas gerem videoclipes rápidos e compartilháveis ​​a partir de prompts de texto.

Pesquisadores do Google revelaram no início deste ano que criaram uma IA que pode criar faixas de música curtas, novamente com base em nada além de prompts de texto curtos. Assim como a ferramenta de vídeo da Meta, ela não está disponível ao público.

Consulte Mais informação:
Como os professores estão enfrentando o ChatGPT
ChatGPT recomendado para entrevista de emprego

Use o navegador Chrome para um player de vídeo mais acessível

Este chatbot substituirá os humanos?

O sucesso do ChatGPT aparentemente forçou a mão de empresas de tecnologia que pareciam dispostas a ser cautelosas sobre a implantação de suas próprias tecnologias de IA.

Como resultado, o Google supostamente acelerou seus planos para um chatbot ambicioso chamado Bard, tendo imposto restrições rigorosas em modelos lançados anteriormente.

As empresas de tecnologia costumam ser prejudicadas ao liberar IA mal cozida para uso do público. Em 2016, a Microsoft ficou com o rosto vermelho quando um chatbot chamado Tay foi ensinado a dizer coisas ofensivas.

.

Mostrar mais

Artigos relacionados

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Botão Voltar ao topo