technology

Por que os detectores de IA acham que a Constituição dos EUA foi escrita por IA

.

Uma imagem gerada por IA de James Madison escrevendo a Constituição dos EUA usando IA.
Prolongar / Uma imagem gerada por IA de James Madison escrevendo a Constituição dos EUA usando IA.

Midjourney / Benj Edwards

Se você alimentar o documento legal mais importante da América – a Constituição dos EUA – em uma ferramenta projetada para detectar texto escrito por modelos de IA como o ChatGPT, ela dirá que o documento quase certamente foi escrito por IA. Mas, a menos que James Madison fosse um viajante do tempo, esse não pode ser o caso. Por que as ferramentas de detecção de escrita AI fornecem falsos positivos? Conversamos com vários especialistas – e o criador do detector de escrita AI GPTZero – para descobrir.

Entre as notícias de professores excessivamente zelosos reprovando uma classe inteira devido à suspeita de uso de ferramentas de escrita de IA e crianças falsamente acusadas de usar o ChatGPT, a IA generativa deixa a educação em estado de confusão. Alguns acham que representa uma crise existencial. Os professores que contam com métodos educacionais desenvolvidos ao longo do século passado têm lutado por maneiras de manter o status quo – a tradição de contar com a redação como uma ferramenta para avaliar o domínio do aluno sobre um tópico.

Por mais tentador que seja confiar em ferramentas de IA para detectar a escrita gerada por IA, as evidências até agora mostraram que elas não são confiáveis. Devido a falsos positivos, os detectores de escrita AI, como GPTZero, ZeroGPT e o classificador de texto da OpenAI, não são confiáveis ​​para detectar texto composto por modelos de linguagem grandes (LLMs) como ChatGPT.

Se você alimentar o GPTZero com uma seção da Constituição dos EUA, ele diz que o texto “provavelmente foi escrito inteiramente por IA”. Várias vezes nos últimos seis meses, capturas de tela de outros detectores de IA mostrando resultados semelhantes viralizou nas redes sociais, gerando confusão e muitas piadas sobre os pais fundadores serem robôs. Acontece que a mesma coisa acontece com as seleções da Bíblia, que também aparecem como sendo geradas por IA.

Para explicar por que essas ferramentas cometem erros tão óbvios (e geralmente retornam falsos positivos), primeiro precisamos entender como elas funcionam.

Entendendo os conceitos por trás da detecção de IA

Diferentes detectores de escrita AI usam métodos ligeiramente diferentes de detecção, mas com uma premissa semelhante: há um modelo AI que foi treinado em um grande corpo de texto (consistindo em milhões de exemplos de escrita) e um conjunto de regras presumidas que determinam se a escrita é mais provável de ser gerado por humanos ou IA.

Por exemplo, no coração do GPTZero está uma rede neural treinada em “um corpus grande e diversificado de texto escrito por humanos e gerado por IA, com foco na prosa em inglês”, de acordo com as perguntas frequentes do serviço. Em seguida, o sistema utiliza propriedades como “perplexidade” e explosão” para avaliar o texto e fazer sua classificação.

Bonnie Jacobs / Getty Images

No aprendizado de máquina, a perplexidade é uma medida de quanto um trecho de texto se desvia do que um modelo de IA aprendeu durante seu treinamento. Como a Dra. Margaret Mitchell da empresa de IA Hugging Face disse à Ars, “A perplexidade é uma função de ‘quão surpreendente é essa linguagem baseada no que eu vi?’”

Portanto, o pensamento por trás da medição da perplexidade é que, quando estão escrevendo texto, modelos de IA como o ChatGPT buscarão naturalmente o que sabem melhor, que vem de seus dados de treinamento. Quanto mais próxima a saída estiver dos dados de treinamento, menor será o índice de perplexidade. Os seres humanos são escritores muito mais caóticos – ou pelo menos essa é a teoria -, mas também podem escrever com baixa perplexidade, especialmente quando imitam um estilo formal usado em direito ou certos tipos de redação acadêmica. Além disso, muitas das frases que usamos são surpreendentemente comuns.

Digamos que estamos adivinhando a próxima palavra na frase “Eu gostaria de uma xícara de _____”. A maioria das pessoas preencheria o espaço em branco com “água”, “café” ou “chá”. Um modelo de linguagem treinado em muitos textos em inglês faria o mesmo porque essas frases ocorrem com frequência na escrita em inglês. A perplexidade de qualquer um desses três resultados seria bastante baixa porque a previsão é bastante certa.

.

Mostrar mais

Artigos relacionados

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Botão Voltar ao topo