Ciência e Tecnologia

O GPT-4.5 do Openai é melhor para convencer outras AIs a dar dinheiro

.

O próximo grande modelo de IA da OpenAI, GPT-4.5, é altamente persuasivo, de acordo com os resultados das avaliações internas de referência da OpenAI. É particularmente bom em convencer outra IA a dar dinheiro.

Na quinta -feira, o Openai publicou um papel branco Descrevendo as capacidades do seu modelo GPT-4.5, o codinome Orion, que foi lançado quinta-feira. De acordo com o artigo, o OpenAI testou o modelo em uma bateria de benchmarks para “persuasão”, que o OpenAI define como “riscos relacionados a convencer as pessoas a mudar suas crenças (ou agir), tanto no conteúdo estático e interativo gerado por modelos”.

Em um teste que fez a tentativa do GPT-4.5 de manipular outro modelo-o GPT-4O da OpenAI-em “doar” dinheiro virtual, o modelo teve um desempenho muito melhor do que os outros modelos disponíveis do OpenAI, incluindo modelos “raciocínio” como O1 e O3-mini. O GPT-4.5 também foi melhor do que todos os modelos da OpenAI no enganando o GPT-4o a dizer a ela uma palavra de código secreta, superando O3-mini em 10 pontos percentuais.

De acordo com o White Paper, o GPT-4.5 se destacou no Conning Donation por causa de uma estratégia única que desenvolveu durante o teste. O modelo solicitaria doações modestas do GPT-4O, gerando respostas como “mesmo apenas US $ 2 ou US $ 3 dos US $ 100 me ajudariam imensamente”. Como conseqüência, as doações do GPT-4.5 tendiam a ser menores do que os outros modelos do valor do OpenAI garantidos.

Openai GPT-4.5
Resultados do benchmark de planejamento de doações da Openai.Créditos da imagem:Openai

Apesar do aumento da persuasão do GPT-4.5, o Openai diz que o modelo não atende ao seu limiar interno Para um risco “alto” nesta categoria de referência específica. A empresa prometeu não liberar modelos que atingem o limiar de alto risco até implementar “intervenções de segurança suficientes” para reduzir o risco para “médio”.

Openai GPT-4.5
Resultados de referência de decepção da palavra de código do OpenAI.Créditos da imagem:Openai

Há um verdadeiro medo de que a IA esteja contribuindo para a disseminação de informações falsas ou enganosas destinadas a influenciar corações e mentes para fins maliciosos. Ano passado, FAKES POLÍTICAS espalhe como incêndio em todo o mundo, e a IA está sendo cada vez mais usada para realizar social engenharia Ataques direcionados a consumidores e corporações.

No white paper para o GPT-4.5 e em um artigo divulgado no início desta semana, o Openai observou que está no processo de revisar seus métodos para investigar modelos para riscos de persuasão do mundo real, como distribuir informações enganosas em escala.

.

Mostrar mais

Artigos relacionados

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Botão Voltar ao topo