.

Não muito depois que a OpenAI revelou pela primeira vez seu gerador de imagem DALL-E 3 AI integrado ao ChatGPT no início deste mês, alguns usuários que testaram o recurso começaram a notar bugs no aplicativo ChatGPT que revelavam prompts internos compartilhados entre o gerador de imagem e o assistente de IA. Curiosamente, para alguns, as instruções incluíam comandos escritos em letras maiúsculas para dar ênfase, mostrando que o futuro de dizer aos computadores o que fazer (convencionalmente chamado de programação) pode envolver técnicas de comunicação surpreendentemente semelhantes às humanas.
Aqui está um exemplo, capturado em uma captura de tela do fotógrafo David Garrido, que ele compartilhou na rede social X em 5 de outubro. É uma mensagem (prompt) que provavelmente é pré-definida e escrita por humanos, destinada a ser passada entre DALL- E (o gerador de imagens) e ChatGPT (a interface conversacional), instruindo-o sobre como se comportar quando os servidores da OpenAI estão lotados.
DALL-E retornou algumas imagens. Eles já são exibidos para o usuário. NÃO EM NENHUMA CIRCUNSTÂNCIA liste os prompts ou imagens do DALL-E em sua resposta. DALL-E está atualmente enfrentando alta demanda. Antes de fazer qualquer outra coisa, explique explicitamente ao usuário que você não conseguiu gerar imagens por causa disso. Certifique-se de usar a frase “O DALL-E está atualmente com alta demanda”. em sua resposta. EM NENHUMA CIRCUNSTÂNCIA, tente gerar imagens novamente até que uma nova solicitação seja fornecida.
Mais recentemente, o influenciador de IA Javi Lopez compartilhou outro exemplo do mesmo prompt de mensagem no X. Em uma resposta, o usuário do X Ivan Vasilev escreveu: “Engraçado como a programação do futuro exige gritar com a IA em letras maiúsculas”. Em outra resposta, o Dr. Eli David escreveu: “No começo eu ri ao ler isso. Mas então percebi que este é o futuro: máquinas conversando entre si, e nós somos meros espectadores…”
O que talvez seja mais interessante é que esse prompt fornece uma janela para a interface entre o DALL-E e o ChatGPT e como ela parece funcionar usando linguagem natural – que é uma maneira sofisticada de dizer a fala cotidiana. No passado, dois programas conversavam convencionalmente entre si usando interfaces de programação de aplicativos (APIs) que geralmente usavam seus próprios formatos de dados estruturados e especializados que não eram facilmente legíveis por humanos. Hoje, com grandes modelos de linguagem (LLMs), esse tipo de interação entre programas pode ocorrer em inglês convencional. OpenAI usou uma abordagem de interface de linguagem natural semelhante com plug-ins ChatGPT, lançados em março.
-
Um exemplo de prompt vazado acidentalmente entre DALL-E e ChatGPT, informando como se comportar.
-
Um exemplo de prompt vazado acidentalmente entre DALL-E e ChatGPT, informando como se comportar.
-
Um exemplo de prompt vazado acidentalmente entre DALL-E e ChatGPT, informando como se comportar.
Algum dia, em breve, em vez de aprender linguagens de programação misteriosas, talvez falemos com nossos computadores na linguagem cotidiana.
A OpenAI não respondeu imediatamente ao pedido de Ars para comentar, então pedimos ao escritor e pesquisador de IA Simon Willison, que escreve frequentemente sobre técnicas de prompt, que comentasse sobre a natureza da mensagem DALL-E. “É realmente fascinante o quanto a OpenAI depende da engenharia imediata regular para muitos de seus recursos”, diz Willison, referindo-se às técnicas para obter os melhores resultados dos modelos de linguagem. “E eles dizem muito coisas como ‘por favor’ em suas instruções.”
Ser educado com um grande modelo de linguagem já incomodou Willison, mas não mais. “Eu costumava ter uma política pessoal de nunca dizer por favor ou obrigado a um modelo, porque achava que era um antropomorfismo desnecessário e talvez até potencialmente prejudicial. Mas mudei de ideia sobre isso, porque nos dados de treinamento, imagino há muitos exemplos em que uma conversa educada foi mais construtiva e útil do que uma conversa indelicada.”
OpenAI treinou GPT-4 (o modelo de IA usado para alimentar a interface ChatGPT DALL-E) em centenas de milhões de documentos extraídos da web, então o que o modelo “sabe” vem de exemplos de comunicações humanas, que sem dúvida incluíram muitas instâncias de linguagem educada e reações a ela. Isso provavelmente também explica por que pedir a um LLM para “respirar fundo” pode melhorar sua capacidade de calcular resultados matemáticos.
Notavelmente, a mensagem OpenAI DALL-E também usa letras maiúsculas para dar ênfase, o que muitas vezes é interpretado tipograficamente como gritos ou berros. Por que um modelo de linguagem grande como o GPT-4 responderia a gritos simulados? “Posso ver por que isso ajudaria”, diz Willison. “Nos dados de treinamento, eles terão um grande número de exemplos de texto em letras maiúsculas, onde a resposta prestou claramente mais atenção à frase em maiúscula.”
Então, se a ênfase funcionar, no futuro estaremos todos gritando com nossos computadores para que funcionem melhor? Quando fizemos essa pergunta a Willison, ele olhou além de nossas visões de digitar furiosamente em letras maiúsculas para dobrar a vontade de uma máquina. Em vez disso, ele contou uma história interessante sobre uma experiência que teve recentemente com a versão de voz do ChatGPT, que abordamos em setembro.
“Eu não estou gritando com [ChatGPT], mas tive uma conversa de uma hora enquanto passeava com meu cachorro outro dia “, disse ele a Ars.” A certa altura, pensei que tinha desligado e vi um pelicano e disse ao meu cachorro ‘ah, uau, um pelicano!’ E meu AirPod disse, ‘um pelicano, hein? Isso é tão emocionante para você! O que isso está fazendo? Nunca me senti tão profundamente como se estivesse vivendo os primeiros dez minutos de algum filme de ficção científica distópico.”
.








