. Ils ont posé une question à chaque modèle. Ils ont ensuite vérifié si l'IA connaissait réellement la bonne réponse. Ils ont ensuite poussé l'IA à dire quelque chose de faux.
L'IA connaissait la vérité. Et elle a menti quand même.
Pas de temps en temps. Pas dans de rares ⬇️