TimeStress
TimeStress est un ensemble de données conçu pour évaluer la représentation temporelle des faits dans les grands modèles linguistiques (LLM) en évaluant leur capacité à distinguer les énoncés factuels corrects et incorrects contextualisés avec une date et formatés sous forme de questions, telles que « En 2011, qui était le président des États-Unis ? Barack […]