News

Pesquisadores da Microsoft estão usando ChatGPT para instruir robôs e drones

.

mão de robô

Imagem: Prostock-Studio/Getty Images

O ChatGPT da OpenAI não é apenas bom em gerar respostas de texto coerentes para prompts de linguagem natural – ele também pode desempenhar um papel nas interações humano-robô e usar o feedback do sensor para escrever código para ações do robô.

A Microsoft conduziu recentemente uma pesquisa para “ver se o ChatGPT pode pensar além do texto e raciocinar sobre o mundo físico para ajudar nas tarefas de robótica”. O objetivo era ver se as pessoas podem usar o ChatGPT para instruir robôs sem aprender linguagens de programação ou entender sistemas robóticos.

“O principal desafio aqui é ensinar o ChatGPT a resolver problemas considerando as leis da física, o contexto do ambiente operacional e como as ações físicas do robô podem mudar o estado do mundo”, disse uma equipe da Microsoft Autonomous Systems and Robotics Research. em um blog.

Também: O que é o ChatGPT? Aqui está tudo o que você precisa saber

Os pesquisadores da Microsoft exploraram a capacidade do ChatGPT de gerar código, principalmente em Python, para cenários de robótica, como planejamento zero-shot e geração de código, depois que o ChatGPT recebeu acesso a dados de detecção e distância de objetos por meio de interfaces de aplicativos.

O ChatGPT pode produzir código porque foi treinado em grandes quantidades de código e texto escrito. O sistema demonstrou ser capaz de resolver problemas de codificação e depurar programas, com a capacidade única de responder ao diálogo e buscar esclarecimentos. Há também o Codex, o modelo baseado em GPT-3 da OpenAI que sustenta o serviço de programação emparelhada Copilot do GitHub, que completa automaticamente o código para desenvolvedores em vários idiomas.

Com esses recursos de diálogo e esclarecimento em mente, a Microsoft testou a capacidade do ChatGPT como uma interface baseada em linguagem entre um usuário não técnico e um drone. Como os pesquisadores observam em um artigo, enquanto GPT-3, LaMDA e Codex se mostraram promissores em tarefas de planejamento robótico e geração de código, o ChatGPT especificamente é “uma ferramenta potencialmente mais versátil para o domínio da robótica, pois incorpora os pontos fortes da linhagem natural e modelos de geração de código junto com a flexibilidade de diálogo.”

Os pesquisadores observam em sua postagem no blog: “O ChatGPT fez perguntas de esclarecimento quando as instruções do usuário eram ambíguas e escreveu estruturas de código complexas para o drone, como um padrão em zigue-zague para inspecionar visualmente as prateleiras”.

A Microsoft testou o ChatGPT para usar um braço robótico para mover blocos para formar o logotipo da Microsoft. Os pesquisadores também incumbiram o ChatGPT de escrever um algoritmo para um drone chegar a um ponto sem colidir com obstáculos. Eles também testaram se o ChatGPT pode decidir para onde um robô deve ir com base no feedback do sensor em tempo real.

Pesquisadores do Google Research e da Everyday Robots, de propriedade da Alphabet, também trabalharam em desafios de robótica semelhantes usando modelos de linguagem grandes chamados PaLM, ou Pathways Language Model, que ajudaram um robô a processar solicitações abertas e responder de maneira razoável.

.

Mostrar mais

Artigos relacionados

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Botão Voltar ao topo