Modelo CriticGPT detecta bugs em código de IA, melhorando supervisão humana em sistemas avançados.
Todas as informações sobre OpenAI estão disponíveis para visualização. A OpenAI divulgou recentemente uma nova versão chamada CriticGPT, inspirada no GPT-4.
Além disso, o CriticGPT está sendo aclamado como uma ferramenta essencial para os caçadores de erros. A capacidade do CriticGPT de identificar e corrigir erros rapidamente é impressionante.
CriticGPT: O Caçador de Erros no Treinamento de Modelos de IA
Ao contrário dos outros modelos da empresa focados no consumidor, o CriticGPT, também conhecido como CriticGPT, foi desenvolvido com o propósito de gerar críticas às respostas do ChatGPT, auxiliando os humanos na detecção de erros durante o aprendizado por reforço através do feedback humano (RLHF). De acordo com a OpenAI, o código revisado pelo CriticGPT pode superar o código não revisado em até 60%.
A empresa está, neste momento, integrando modelos similares ao CriticGPT no pipeline de rotulagem RLHF para auxiliar os treinadores de IA na avaliação dos resultados de sistemas avançados de IA. A OpenAI afirma que modelos como o CriticGPT têm o potencial de aprimorar a precisão do ChatGPT, identificando erros sutis e detectando falhas que podem passar despercebidas pelos humanos, à medida que os modelos se tornam mais sofisticados.
Durante o processo de treinamento do CriticGPT, houve a necessidade de realizar edições manuais no código gerado pelo ChatGPT, introduzindo novos erros intencionalmente, juntamente com feedback de amostras para capacitar o modelo a identificar facilmente erros comuns e incomuns. É importante ressaltar que o CriticGPT não é infalível, assim como as sugestões humanas, podendo apresentar imprecisões em suas análises.
No entanto, a combinação entre a equipe humana e o CriticGPT tem se mostrado eficaz, superando os treinadores humanos não assistidos e auxiliando na redação de críticas abrangentes, reduzindo a ocorrência de alucinações. A OpenAI destaca que o CriticGPT pode introduzir erros do mundo real em diversas partes da resposta, sendo limitado na avaliação de tarefas ou respostas extremamente complexas.
Este novo modelo de IA, conforme divulgado pela empresa, contribuirá significativamente para a geração de dados de alta qualidade no aprendizado por reforço do GPT-4, com planos futuros de ampliação desse trabalho já em andamento. A presença do CriticGPT no processo de treinamento de modelos de IA promete revolucionar a forma como os sistemas avançados são avaliados e aprimorados, garantindo maior eficiência e confiabilidade nas respostas geradas.
Fonte: @Olhar Digital
Comentários sobre este artigo