Ciência e Tecnologia

O futuro da codificação impulsionado pela IA está próximo

.

Não sou um programador habilidoso, mas graças a um programa gratuito chamado Agente SWE, eu estava consegui depurar e corrigir um problema sério envolvendo um arquivo com nome incorreto em diferentes repositórios de código no site de hospedagem de software GitHub.

Apontei o SWE-agent para um problema no GitHub e observei enquanto ele analisava o código e raciocinava sobre o que poderia estar errado. Ele determinou corretamente que a causa raiz do bug era uma linha que apontava para o local errado para um arquivo, então navegou pelo projeto, localizou o arquivo e alterou o código para que tudo funcionasse corretamente. É o tipo de coisa que um desenvolvedor inexperiente (como eu) pode passar horas tentando depurar.

Muitos programadores já usam inteligência artificial para escrever software mais rapidamente. O GitHub Copilot foi o primeiro ambiente de desenvolvedor integrado a aproveitar a IA, mas muitos IDEs agora completam automaticamente pedaços de código quando um desenvolvedor começa a digitar. Você também pode fazer perguntas à IA sobre o código ou pedir que ela ofereça sugestões sobre como melhorar o que você está trabalhando.

No verão passado, John Yang e Carlos Jimenez, dois estudantes de doutorado de Princeton, começaram a discutir o que seria necessário para que a IA se tornasse uma engenheira de software do mundo real. Isso os levou, e a outros em Princeton, a criar Banco SWEum conjunto de benchmarks para testar ferramentas de IA em uma variedade de tarefas de codificação. Após lançar o benchmark em outubro, a equipe desenvolveu sua própria ferramenta — SWE-agent — para dominar essas tarefas.

O SWE-agent (“SWE” é uma abreviação de “engenharia de software”) é um dos vários programas de codificação de IA consideravelmente mais poderosos que vão além de apenas escrever linhas de código e agem como os chamados agentes de software, aproveitando as ferramentas necessárias para controlar, depurar e organizar software. A startup Devin se tornou viral com uma demonstração em vídeo de uma dessas ferramentas em março.

Ofir Press, um membro da equipe de Princeton, diz que o SWE-bench pode ajudar a OpenAI a testar o desempenho e a confiabilidade dos agentes de software. “É apenas minha opinião, mas acho que eles vão lançar um agente de software muito em breve”, diz Press.

A OpenAI não quis comentar, mas outra fonte com conhecimento das atividades da empresa, que pediu para não ser identificada, disse à WIRED que “a OpenAI está definitivamente trabalhando em agentes de codificação”.

Assim como o GitHub Copilot mostrou que grandes modelos de linguagem podem escrever código e aumentar a produtividade dos programadores, ferramentas como o SWE-agent podem provar que agentes de IA podem trabalhar de forma confiável, começando com a construção e manutenção de código.

Várias empresas estão testando agentes para desenvolvimento de software. No topo da tabela de classificação do SWE-bench, que mede a pontuação de diferentes agentes de codificação em uma variedade de tarefas, está um de IA de fábricauma startup, seguida por AutoCodeRoveruma entrada de código aberto de uma equipe da Universidade Nacional de Cingapura.

Os grandes jogadores também estão entrando. Uma ferramenta de escrita de software chamada Amazonas Q é outro top performer no SWE-bench. “O desenvolvimento de software é muito mais do que apenas digitar”, diz Deepak Singh, vice-presidente de desenvolvimento de software na Amazon Web Services.

Ele acrescenta que a AWS usou o agente para traduzir pilhas de software inteiras de uma linguagem de programação para outra. “É como ter um engenheiro muito inteligente sentado ao seu lado, escrevendo e construindo um aplicativo com você”, diz Singh. “Eu acho que isso é bem transformador.”

Uma equipe da OpenAI ajudou recentemente a equipe de Princeton a melhorar um parâmetro para medir a confiabilidade e a eficácia de ferramentas como o SWE-agent, sugerindo que a empresa também pode estar aprimorando agentes para escrever código ou executar outras tarefas em um computador.

Singh diz que vários clientes já estão criando aplicativos de backend complexos usando o Q. Meus próprios experimentos com o SWE-bench sugerem que qualquer pessoa que programa em breve desejará usar agentes para aprimorar suas habilidades de programação, ou correrá o risco de ficar para trás.

.

Mostrar mais

Artigos relacionados

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Botão Voltar ao topo