Ciência e Tecnologia

A resposta da China ao ChatGPT falha em suas primeiras linhas

.

O regime de censura da China exige que a Baidu e outras empresas de internet bloqueiem o acesso a determinados sites e evitem assuntos politicamente sensíveis. As palavras ou frases que devem ser bloqueadas podem ser atualizadas rapidamente em resposta a protestos ou durante eventos especiais.

Mas Jeffrey Ding, professor assistente da Universidade de Georgetown que estuda a indústria de tecnologia da China, diz que as preocupações com a censura não parecem ter retardado o desenvolvimento de grandes modelos de linguagem na China. Ele observa que o Baidu disponibilizou o modelo de linguagem Ernie que sustenta seu novo bot por meio de uma API por algum tempo e que outras empresas ofereceram modelos semelhantes.

O Baidu não forneceu detalhes sobre os dados de treinamento de Ernie Bot, mas provavelmente foram extraídos da internet chinesa. Isso significa que a matéria-prima do bot já foi amplamente controlada pelas regras de censura da China, que, por exemplo, visam limitar as críticas ao governo.

A censura também pode afetar os chatbots chineses de maneiras mais sutis. Um projeto de pesquisa acadêmica de 2021 que treinou algoritmos na versão em chinês da Wikipedia, que está bloqueada na China, e Baidu’s Baike, uma enciclopédia de crowdsourcing sujeita à censura do governo, descobriu que o uso de dados de treinamento censurados mudou significativamente o significado que o software de IA atribuiu a palavras diferentes.

O algoritmo treinado na Wikipedia em chinês associou as palavras “democracia” mais próximas a palavras positivas, como “estabilidade”. O algoritmo treinado no material censurado de Baike representava a “democracia” mais próxima do “caos”, mais de acordo com a política do governo da China. Mas como os chatbots como o ChatGPT podem ser extremamente flexíveis e remixar o material em seus dados de treinamento, o Baidu provavelmente teve que introduzir proteções adicionais

Apesar de sua recepção mista, Ernie Bot parece ser um concorrente capaz do ChatGPT. Atualmente, o bot está disponível apenas para um número limitado de usuários, alguns dos quais dizem estar impressionados. O ChatGPT não está disponível na China, embora seja capaz de conversar em chinês.

Lei Li, professora da UC Sant Barbara especializada em IA e que trabalhou anteriormente na tecnologia usada para construir parte do aprendizado de máquina por trás do bot Ernie, aponta que o Baidu trabalha na tecnologia subjacente há cerca de uma década. A Microsoft, por outro lado, licenciou a tecnologia principal para o novo chatbot do Bing e alguns recursos futuros de geração de texto para o Office da OpenAI, na qual investiu bilhões de dólares em troca de direitos exclusivos para suas criações.

Li também diz que está impressionado com algumas das coisas que Ernie Bot pode fazer, incluindo sua capacidade de gerar histórias e relatórios de negócios. Ele acrescenta que o problema da alucinação é um desafio para todos esses modelos de linguagem. “É aqui que os pesquisadores ainda têm trabalho a fazer”, diz ele.

Um postador do WeChat comparou os recursos de demonstração do bot chinês com os do ChatGPT e achou melhor lidar com expressões idiomáticas chinesas e mais preciso em alguns casos. Por exemplo, o ChatGPT alegou incorretamente que o lar ancestral do autor de ficção científica Liu Cixin, que escreveu O problema dos três corpos, é Hubei, enquanto Ernie Bot respondeu corretamente a Henan. O ChatGPT está bloqueado na China, mas muitas pessoas encontraram maneiras de acessá-lo.

.

Mostrar mais

Artigos relacionados

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Botão Voltar ao topo