.
Embora os pesquisadores da West Virginia University vejam potencial em ambientes educacionais para o mais novo plugin ChatGPT oficial, chamado Code Interpreter, eles encontraram limitações para seu uso por cientistas que trabalham com dados biológicos utilizando métodos computacionais para priorizar o tratamento direcionado para câncer e doenças genéticas.
“O Code Interpreter é uma coisa boa e útil em um ambiente educacional, pois torna a codificação nas áreas STEM mais acessível aos alunos”, disse Gangqing “Michael” Hu, professor assistente do Departamento de Microbiologia, Imunologia e Biologia Celular da WVU. Faculdade de Medicina e diretor do Núcleo de Bioinformática. “No entanto, ele não possui os recursos necessários para a bioinformática. Esses são problemas técnicos que podem ser superados. Os desenvolvimentos futuros do Code Interpreter provavelmente estenderão seu uso a muitos campos, como bioinformática, finanças e economia.”
Desde o seu lançamento em dezembro de 2022, o popular chatbot de inteligência artificial ChatGPT tem chamado a atenção de empresas, educadores e do público em geral. No entanto, não atendeu às necessidades das pessoas que trabalham em pesquisa biomédica, incluindo bioinformática – o campo onde a ciência da computação encontra a biologia – que aguardavam ansiosamente o plugin Code Interpreter da OpenAI, esperando que ele preenchesse as lacunas.
Hu e sua equipe testaram o Code Interpreter em uma variedade de tarefas para avaliar seus recursos. Suas descobertas, publicadas em Anais de Engenharia Biomédicamostre que o plugin quebra algumas barreiras, mas não todas.
Por exemplo, pessoas sem formação científica terão facilidade de acesso à codificação ou programação de computadores com o Code Interpreter. Hu disse que também é econômico e desperta a curiosidade dos alunos em explorar a análise de dados e aumenta seu interesse em aprender. Ele ressalta, porém, que os usuários precisarão entender como interpretar os dados e reconhecer se os resultados são precisos e saber como interagir com o chatbot.
Os bioinformáticos dependem de codificação precisa, programas de computador e acesso à Internet para armazenar, analisar e interpretar dados biológicos, como DNA e genoma humano, usados para avanços na medicina moderna.
Apesar da necessidade de melhorias específicas para a bioinformática, disse Hu, o Code Interpreter ajuda os usuários a determinar se uma resposta é precisa ou se é uma resposta fictícia apresentada com confiança, conhecida como alucinação.
“As pessoas sabem que o ChatGPT pode fazer muitas coisas impressionantes, mas não é bom em fornecer uma citação ou referência para apoiar a sua resposta. Se for questionado sobre a fonte para apoiar a afirmação de uma resposta, pode começar a inventar referências, ” Hu explicou. “O Code Interpreter fornece uma solução para minimizar alucinações. Para questões que podem ser abordadas por meio de codificação, o próprio código serve como fonte ou citação. Esse é um avanço significativo.”
Trabalhando com Hu estavam Lei Wang, pós-doutorado no Departamento de Microbiologia, Imunologia e Biologia Celular da WVU; Xijin Ge, da Universidade Estadual de Dakota do Sul; e Li Liu, da Universidade Estadual do Arizona.
A equipe encontrou resultados positivos na capacidade do Code Interpreter de converter dados em tabelas e gráficos.
As sugestões de atualização do Code Interpreter incluem acesso à internet para download de dados genômicos, instalação de software específico para bioinformática, ampliação da capacidade de armazenamento e suporte para linguagens de programação adicionais. Além disso, os pesquisadores descobriram a necessidade de que os aplicativos de privacidade e segurança cumpram regulamentações como a HIPAA.
Ao testar a análise de dados, eles descobriram diversas limitações. O plugin suporta apenas um programa de computador, Python, e poucos de seus pacotes de software são dedicados à bioinformática. Além disso, não permite acesso a dados da internet e não tem capacidade para trabalhar com arquivos grandes.
“Ele permite cerca de 100 megabytes, mas os arquivos que manipulamos estão no nível de gigabytes”, disse Hu. “Além disso, não oferece suporte ao processamento paralelo necessário para grandes conjuntos de dados, o que resulta em desempenho lento.”
Hu disse que embora antecipe mais atualizações para o Code Interpreter, ele planeja ajudar os alunos a aprender mais sobre as vantagens do plugin atual.
“Na minha aula na próxima primavera, pretendo apresentar este plugin para ajudar os alunos a aprender sobre visualização de dados”, disse Hu. “A IA é um campo em rápida evolução. Espero que até lá o OpenAI possa superar algumas das limitações para que possa ser usado para uma ampla gama de codificação de bioinformática.”
No início deste ano, Hu liderou outro estudo para preparar estudantes do ensino médio e universitários para aproveitar o poder do ChatGPT aprendendo mais sobre codificação. O processo empregou OPTIMAL – Otimização de Prompts por meio de Mentoria e Avaliação Iterativas – para melhorar a comunicação com um chatbot.
No longo prazo, Hu disse que continuará monitorando e testando novas programações e recursos de IA.
“À medida que novos produtos são desenvolvidos, continuarei”, disse Hu. “Há certamente muitos outros usos inovadores aguardando serem descobertos.”
.