.
Fornecendo tecnologia GPT em um chatbot poderoso e fácil de usar, o ChatGPT se tornou a ferramenta de IA mais popular do mundo. Muitas pessoas usam o ChatGPT para fornecer conversas envolventes, responder a perguntas, oferecer sugestões criativas e ajudar na codificação e na escrita. No entanto, o ChatGPT é limitado, pois você não pode armazenar seus dados para uso pessoal de longo prazo e seu ponto de corte de dados de conhecimento em setembro de 2021.
Como solução alternativa, podemos usar a API e o LangChain da OpenAI para fornecer ao ChatGPT dados personalizados e informações atualizadas após 2021 para criar uma instância personalizada do ChatGPT.
Por que fornecer ao ChatGPT dados personalizados?
Alimentar o ChatGPT com dados personalizados e fornecer informações atualizadas além de sua data limite de conhecimento oferece vários benefícios em relação ao uso normal do ChatGPT. Aqui estão alguns deles:
- Interações personalizadas: Ao fornecer dados personalizados ao ChatGPT, os usuários podem criar uma experiência mais personalizada. O modelo pode ser treinado em conjuntos de dados específicos relevantes para usuários ou organizações individuais, resultando em respostas personalizadas para suas necessidades e preferências exclusivas.
- Especialização em Domínio Específico: A integração personalizada de dados permite que o ChatGPT se especialize em domínios ou setores específicos. Ele pode ser treinado em conhecimento, terminologia e tendências específicas do setor, permitindo respostas mais precisas e perspicazes nessas áreas específicas.
- Informações atuais e precisas: O acesso a informações atualizadas garante que o ChatGPT se mantenha atualizado com os últimos desenvolvimentos e conhecimentos. Ele pode fornecer respostas precisas com base em eventos, notícias ou pesquisas recentes, tornando-o uma fonte de informações mais confiável.
Agora que você entende a importância de fornecer dados personalizados para o ChatGPT, aqui está um passo a passo de como fazer isso em seu computador local.
Passo 1: Instale e baixe o software e o script pré-fabricado
Observe que as instruções a seguir são para uma máquina Windows 10 ou Windows 11.
Para fornecer dados personalizados ao ChatGPT, você precisará instalar e baixar o Python3, Git, Microsoft C++ mais recente e o script de recuperação ChatGPT do GitHub. Se você já possui algum software instalado em seu PC, verifique se eles estão atualizados com a versão mais recente para evitar soluços durante o processo.
Comece instalando:
Notas de instalação do Python3 e do Microsoft C++
Ao instalar o Python3, certifique-se de marcar o Adicionar python.exe ao PATH opção antes de clicar instale agora. Isso é importante, pois permite que você acesse o Python em qualquer diretório do seu computador.
Ao instalar o Microsoft C++, você desejará instalar Ferramentas de compilação do Microsoft Visual Studio primeiro. Uma vez instalado, você pode marcar o Desenvolvimento desktop com C++ opção e clique Instalar com todas as ferramentas opcionais marcadas automaticamente na barra lateral direita.
Agora que você instalou as versões mais recentes do Python3, Git e Microsoft C++, pode baixar o script Python para consultar facilmente dados locais personalizados.
Download: Script de recuperação ChatGPT (Grátis)
Para baixar o script, clique em Código, então selecione Baixar ZIP. Isso deve baixar o script Python em seu diretório padrão ou selecionado.
Uma vez baixado, agora podemos configurar um ambiente local.
Etapa 2: configurar o ambiente local
Para configurar o ambiente, você precisará abrir um terminal na pasta chatgpt-retrieval-main que você baixou. Para fazer isso, abra chatgpt-recuperação-principal pasta, clique com o botão direito do mouse e selecione Abrir no Terminal.
Quando o terminal estiver aberto, copie e cole este comando:
pip install langchain openai chromadb tiktoken unstructured
Este comando usa o gerenciador de pacotes Python para criar e gerenciar o ambiente virtual Python necessário.
Depois de criar o ambiente virtual, precisamos fornecer uma chave de API OpenAI para acessar seus serviços. Primeiro, precisamos gerar uma chave de API no site de chaves de API OpenAI clicando em Criar nova chave secretaadicionando um nome para a chave e pressionando o botão Criar botão de chave secreta.
Você receberá uma sequência de caracteres. Esta é a sua chave de API OpenAI. Copie-o clicando no ícone de cópia ao lado da chave de API. Observe que essa chave de API deve ser mantida em segredo. Não o compartilhe com outras pessoas, a menos que realmente pretenda que eles o usem com você.
Uma vez copiado, volte para a pasta chatgpt-retrieval-main e abra as constantes com Bloco de anotações. Agora substitua o espaço reservado pela sua chave de API. Lembre-se de salvar o arquivo!
Agora que você configurou com sucesso seu ambiente virtual e adicionou sua chave de API OpenAI como uma variável de ambiente. Agora você pode fornecer seus dados personalizados ao ChatGPT.
Etapa 3: adicionar dados personalizados
Para adicionar dados personalizados, coloque todos os seus dados de texto personalizados no dados dentro da pasta chatgpt-retrieval-main. O formato dos dados de texto pode estar na forma de PDF, TXT ou DOC.
Como você pode ver na captura de tela acima, adicionei um arquivo de texto contendo uma agenda pessoal inventada, um artigo que escrevi sobre AMD’s Instinct Accelerators e um documento PDF.
Etapa 4: consultando o ChatGPT por meio do terminal
O script Python nos permite consultar dados dos dados personalizados que adicionamos à pasta de dados e à Internet. Em outras palavras, você terá acesso ao backend usual do ChatGPT e a todos os dados armazenados localmente na pasta de dados.
Para usar o script, execute o script python chatgpt.py e adicione sua pergunta ou consulta como argumento.
python chatgpt.py "YOUR QUESTION"
Certifique-se de colocar suas perguntas entre aspas.
Para testar se fornecemos nossos dados ao ChatGPT com sucesso, farei uma pergunta pessoal sobre o Arquivo Pessoal.txt arquivo.
Funcionou! Isso significa que o ChatGPT conseguiu ler o Sched.txt pessoal fornecido anteriormente. Agora vamos ver se alimentamos com sucesso o ChatGPT com informações que ele não conhece devido à data limite de conhecimento.
Como você pode ver, ele descreveu corretamente o AMD Instinct MI250x, que foi lançado após a data limite de conhecimento do ChatGPT -3.
Limitações do ChatGPT personalizado
Embora alimentar o GPT-3.5 com dados personalizados abra mais maneiras de aplicar e usar o LLM, existem algumas desvantagens e limitações.
Em primeiro lugar, você precisa fornecer todos os dados sozinho. Você ainda pode acessar todo o conhecimento do GPT-3.5 até a data de corte do conhecimento; no entanto, você deve fornecer todos os dados extras. Isso significa que, se você deseja que seu modelo local tenha conhecimento de um determinado assunto na Internet que o GPT-3.5 ainda não saiba, você terá que ir à Internet e raspar os dados e salvá-los como um texto no pasta de dados de chatgpt-retrieval-main.
Outro problema é que consultar o ChatGPT dessa forma leva mais tempo para carregar quando comparado a perguntar diretamente ao ChatGPT.
Por fim, o único modelo atualmente disponível é o GPT-3.5 Turbo. Portanto, mesmo que você tenha acesso ao GPT-4, não poderá usá-lo para alimentar sua instância personalizada do ChatGPT.
O ChatGPT personalizado é incrível, mas limitado
Fornecer dados personalizados ao ChatGPT é uma maneira poderosa de obter mais do modelo. Por meio desse método, você pode alimentar o modelo com qualquer dado de texto que desejar e solicitá-lo como o ChatGPT normal, embora com algumas limitações. No entanto, isso mudará no futuro, pois ficará mais fácil integrar nossos dados ao LLM, juntamente com o acesso ao modelo GPT-4 mais recente.
.