Os pesquisadores ficaram perplexos depois que o último programa da OpenAI, uma desenvolvedora de sistemas de inteligência artificial, parece ter criado uma linguagem que só ela pode entender.
DALL-E2 é um Gerador de aprendizagem de texto para imagem lançado em janeiro de 2022, sua principal função é usar prompts de texto fornecidos pelos usuários e produzir uma imagem para combinar as palavras junto com as legendas.
No entanto, de acordo com a Ciência da Computação O estudante de doutorado Giannis Daras, uma das limitações do DALL-E2 tem sido a capacidade de produzir texto, pois só é capaz de retornar palavras sem sentido quando solicitado.
Em um artigo publicado no arquivo científico, Arxiv, no início deste mês, Daras deu um exemplo dessa limitação, afirmando que ao alimentar o programa o prompt “dois agricultores falando sobre legumes, com legendas” retorna uma imagem que tem dois agricultores conversando uns para os outros enquanto seguram alguns vegetais nas mãos, mas o texto que aparece na imagem parece ser um gibb completo erish.
Uma limitação conhecida do DALLE-2 é que ele luta com o texto. Por exemplo, o prompt: “Dois fazendeiros conversando sobre vegetais, com legendas” fornece uma imagem que parece ter um texto sem sentido. No entanto, o texto não é tão aleatório quanto parece inicialmente… (2/n) pic.twitter.com/B3e5qVsTKu
— Giannis Daras (@giannis_daras) 31 de maio de 2022