ouça este conteúdo
OpenAI treinou o CriticGPT, baseado no GPT-4, para gerar respostas e sugestões, aprendendo com feedbacks de treinadores humanos.
A OpenAI desenvolveu uma nova ferramenta chamada CriticGPT, baseada no GPT-4, com o objetivo de identificar falhas em respostas geradas pelo ChatGPT. Segundo a empresa, ao utilizar o CriticGPT para revisar os textos produzidos pelo ChatGPT, os usuários conseguem resolver os possíveis problemas sem assistência extra em 60% das situações. A tecnologia por trás do ChatGPT, alimentada pela série de modelos GPT-4, é aprimorada por meio do ‘aprendizado de reforço a partir do feedback humano’ (RLHF), no qual a plataforma melhora sua performance à medida que os treinadores de inteligência artificial avaliam as respostas do ChatGPT e apontam possíveis correções.
Essa nova ferramenta, o CriticGPT, surge como uma solução inovadora para aprimorar a qualidade das interações geradas pelo ChatGPT. Ao incorporar o CriticGPT no processo de revisão, os usuários podem contar com uma correção mais eficiente e precisa, resultando em uma experiência aprimorada de geração de textos. A abordagem de ‘aprendizado de reforço a partir do feedback humano’ demonstra ser uma estratégia eficaz para aprimorar continuamente a performance do ChatGPT, garantindo respostas mais precisas e adequadas às necessidades dos usuários. respostas geradas
CriticGPT: A Nova Ferramenta de Correção para Treinadores de IA
À medida que o ChatGPT evolui, os erros se tornam mais sutis e especializados, dificultando a detecção por parte dos treinadores de IA. É aqui que o CriticGPT pode desempenhar um papel crucial. A empresa planeja integrar modelos semelhantes ao CriticGPT ao processo de RLHF, permitindo que os feedbacks humanos sejam aprimorados com insights da IA.
Embora as sugestões do CriticGPT nem sempre sejam precisas, elas podem ser valiosas para os treinadores de IA ao identificar problemas que poderiam passar despercebidos. Assim como o GPT-4, o CriticGPT melhora com o uso contínuo da ferramenta e os feedbacks dos usuários.
Um exemplo ilustrativo do CriticGPT é sua capacidade de apontar possíveis erros do ChatGPT, conforme divulgado pela OpenAI. Os testes entre os dois modelos mostraram que as correções feitas pelo CriticGPT foram superiores em 63% das vezes em comparação com as do ChatGPT. Além disso, a nova ferramenta apresentou menos alucinações, evitando que a IA invente informações falsas.
Apesar de suas vantagens, o CriticGPT possui limitações e só pode auxiliar até certo ponto de especialização. Em situações extremamente complexas, mesmo a combinação de especialistas e modelos pode não garantir uma avaliação precisa.
O CriticGPT está se destacando como uma ferramenta essencial para aprimorar a precisão e a qualidade das respostas geradas por sistemas de IA. Com o reforço contínuo do aprendizado e a integração de feedbacks humanos, essa nova abordagem promete elevar o padrão de excelência na interação entre humanos e inteligência artificial.
Fonte: © CNN Brasil
Comentários sobre este artigo