OpenAI treinou um modelo GPT-4 para auxiliar humanos a identificar erros, aperfeiçoando-o com feedbacks dos usuários.
A OpenAI desenvolveu uma nova ferramenta chamada CriticGPT, que é baseada no GPT-4 e tem como objetivo encontrar falhas em respostas produzidas pelo ChatGPT. Segundo a empresa, ao utilizar o CriticGPT para revisar os códigos gerados pelo ChatGPT, as pessoas conseguem resolver os problemas sem assistência extra em 60% das situações. O sistema de modelos GPT-4 que alimenta o ChatGPT passa por correção por meio do ‘aprendizado de reforço a partir do feedback humano’ (RLHF), o que implica em uma constante evolução da plataforma conforme os usuários, também conhecidos como treinadores de inteligência artificial, identificam possíveis erros.
Com a incorporação do CriticGPT, uma nova inteligência entra em ação para aprimorar a qualidade das respostas geradas pelo ChatGPT. Essa nova abordagem de correção, que se baseia no feedback dos usuários, demonstra como a OpenAI está constantemente inovando para garantir a eficácia de suas ferramentas de inteligência artificial. O CriticGPT se destaca como uma importante adição ao ecossistema de modelos da OpenAI, contribuindo significativamente para aprimorar a precisão e a confiabilidade das respostas fornecidas pelo ChatGPT.
CriticGPT: A Nova Ferramenta de Correção e Aperfeiçoamento
À medida que o modelo de aprendizado do ChatGPT evolui, os treinadores de inteligência artificial enfrentam desafios para identificar imprecisões sutis e especializadas. É nesse cenário que o CriticGPT se destaca, oferecendo auxílio na detecção desses problemas.
O próximo passo, de acordo com a empresa responsável, é integrar modelos semelhantes ao CriticGPT no processo de reforço com feedback humano. Dessa forma, os treinadores contarão com a contribuição valiosa dos feedbacks da IA. Embora as sugestões do CriticGPT não sejam infalíveis, elas podem ser úteis na identificação de questões que passariam despercebidas.
Assim como o próprio modelo GPT-4, o CriticGPT está em constante aperfeiçoamento, conforme mais usuários utilizam a ferramenta e fornecem feedbacks. Um exemplo prático disso é a atuação do CriticGPT ao apontar possíveis erros no ChatGPT, conforme divulgado pela OpenAI.
De acordo com a OpenAI, os testes comparativos entre os dois modelos revelaram que as correções feitas pelo CriticGPT superaram as do ChatGPT em 63% das vezes. Além disso, a nova ferramenta demonstrou menos casos de alucinações, situações em que a IA gera informações falsas e as apresenta como verdadeiras.
Apesar desses avanços, o CriticGPT ainda apresenta limitações e pode auxiliar apenas até certo ponto de especialização. Em situações extremamente complexas, mesmo um especialista com o suporte de um modelo pode enfrentar desafios na avaliação correta.
A evolução do CriticGPT é um reflexo do constante progresso na área de inteligência artificial, com o aprimoramento contínuo da ferramenta para atender às demandas dos usuários e garantir correções cada vez mais precisas e especializadas.
Fonte: © CNN Brasil
Comentários sobre este artigo