17:28
OpenAI e Anthropic testam mutuamente problemas de alucinação e segurança dos modelos.
A OpenAI e a Anthropic avaliaram-se mutuamente os modelos de IA, para identificar potenciais problemas como segurança e tendência a ilusões. Este teste foi concluído antes do lançamento do GPT-5 pela OpenAI e do Opus 4.1 pela Anthropic.
GPT27.48%