.

meio da jornada
Desde o lançamento da API GPT-4 da OpenAI no mês passado para testadores beta, um grupo frouxo de desenvolvedores vem experimentando fazer implementações semelhantes a agentes (“agentes”) do modelo de IA que tentam realizar tarefas de várias etapas com o mínimo de intervenção humana. que possível. Esses scripts homebrew podem repetir, iterar e gerar novas instâncias de um modelo de IA conforme necessário.
Dois projetos experimentais de código aberto, em particular, chamaram muita atenção nas mídias sociais, especialmente entre aqueles que moda Projetos de IA incansavelmente: Auto-GPT, criado por Toran Bruce Richardse BabyAGI, criado por Yohei Nakajima.
O que eles fazem? Bem, agora mesmo, não muito. Eles precisam de muita ajuda humana e apoio ao longo do caminho, então ainda não são tão autônomos quanto prometido. Mas eles representam os primeiros passos em direção a modelos de IA de encadeamento mais complexos que podem ser potencialmente mais capazes do que um único modelo de IA trabalhando sozinho.
“Alcance autonomamente qualquer objetivo que você definir”
Richards classifica seu script como “um aplicativo experimental de código aberto que mostra os recursos do modelo de linguagem GPT-4”. O script “encadeia ‘pensamentos’ do LLM para atingir autonomamente qualquer objetivo que você definir”.
Basicamente, o Auto-GPT obtém a saída do GPT-4 e o alimenta de volta para si mesmo com uma memória externa improvisada para que ele possa repetir uma tarefa, corrigir erros ou sugerir melhorias. Idealmente, esse script poderia servir como um assistente de IA que poderia executar qualquer tarefa digital sozinho.
Para testar essas declarações, executamos o Auto-GPT (um script Python) localmente em uma máquina Windows. Ao iniciá-lo, ele pede um nome para seu agente de IA, uma descrição de sua função e uma lista de cinco objetivos que tenta cumprir. Ao configurá-lo, você precisa fornecer uma chave de API OpenAI e uma chave de API de pesquisa do Google. Ao executar, Auto-GPT pede permissão para executar cada etapa que gera por padrão, embora também inclua um modo totalmente automático se você estiver se sentindo aventureiro.
Se for encarregado de fazer algo como “Compre um par vintage de Air Jordans”, o Auto-GPT desenvolverá um plano de várias etapas e tentará executá-lo. Por exemplo, ele pode pesquisar vendedores de sapatos e, em seguida, procurar um par específico que atenda aos seus critérios. Mas é aí que ele para porque não pode realmente comprar nada – no momento. Se conectado a uma API de compra apropriada, isso pode ser possível.
Se você quiser ter uma ideia do que o Auto-GPT faz sozinho, alguém criou uma versão baseada na web chamada AgentGPT que funciona de maneira semelhante.
Richards foi muito aberto sobre seu objetivo com o Auto-GPT: desenvolver uma forma de AGI (inteligência geral artificial). Em IA, “inteligência geral” geralmente se refere à capacidade ainda hipotética de um sistema de IA de executar uma ampla gama de tarefas e resolver problemas para os quais não foram especificamente programados ou treinados.

Strong The One
Como um ser humano razoavelmente inteligente, um sistema com inteligência geral deve ser capaz de se adaptar a novas situações e aprender com a experiência, em vez de apenas seguir um conjunto de regras ou padrões predefinidos. Isso contrasta com os sistemas com inteligência estreita ou especializada (às vezes chamados de “IA estreita”), que são projetados para executar tarefas específicas ou operar dentro de uma gama limitada de contextos.
Enquanto isso, o BabyAGI (que recebe esse nome de um objetivo aspiracional de trabalhar em direção à inteligência artificial geral) funciona de maneira semelhante ao Auto-GPT, mas com um sabor diferente orientado para a tarefa. Você pode experimentar uma versão dele na web em um site não tão modesto intitulado “God Mode”.
Nakajima, o criador do BabyAGI, nos conta que se inspirou para criar seu roteiro depois de testemunhar o movimento “HustleGPT” em março, que buscava usar o GPT-4 para construir negócios automaticamente como uma espécie de cofundador de IA, por assim dizer. “Fiquei curioso para saber se poderia construir um fundador totalmente AI”, diz Nakajima.
Por que o Auto-GPT e o BabyAGI ficam aquém do AGI é devido às limitações do próprio GPT-4. Embora impressionante como um transformador e analisador de texto, o GPT-4 ainda parece restrito a uma faixa estreita de inteligência interpretativa, apesar de algumas alegações de que a Microsoft viu “faíscas” de comportamentos do tipo AGI no modelo. Na verdade, a utilidade limitada de ferramentas como o Auto-GPT no momento pode servir como a evidência mais forte das atuais limitações dos grandes modelos de linguagem. Ainda assim, isso não significa que essas limitações não serão eventualmente superadas.
Além disso, a questão das confabulações – quando os LLMs apenas inventam coisas – pode ser uma limitação significativa para a utilidade desses assistentes semelhantes a agentes. Por exemplo, em um tópico do Twitter, alguém usou Auto-GPT para gerar um relatório sobre empresas que produzem calçados impermeáveis, pesquisando na web e analisando os produtos de cada empresa. Em qualquer etapa do caminho, o GPT-4 poderia ter potencialmente “alucinado” análises, produtos ou até mesmo empresas inteiras que foram consideradas em sua análise.
Quando questionado sobre a aplicação útil do BabyAGI, Nakajima não conseguiu apresentar exemplos substantivos além de “Do Anything Machine”, um projeto desenvolvido por Garrett Scott que aspira criar uma lista de tarefas autoexecutáveis, que está atualmente em desenvolvimento. Para ser justo, o projeto BabyAGI tem apenas cerca de uma semana. “É mais uma introdução a uma estrutura/abordagem, e o que é mais empolgante é o que as pessoas estão construindo em cima dessa ideia,” ele diz.
.