La performance de ChatGPT a-t-elle reculé entre 2022 et 2023? C’est l’hypothèse qui circulait l’été dernier lorsque des programmeurs comparaient les versions 3.5 et 4.
Une recherche récente tend à confirmer l’intuition de certains de ces experts: le robot «performe» moins bien sur les tâches qui diffèrent de celles pour lesquelles ses concepteurs l’ont entraîné.
Autrement dit, il serait très bon pour refaire ce qu’on lui a déjà fait faire, mais moins bon quand il lui faut improviser. Or, dès le moment où un tel agent conversationnel est rendu accessible au public, il se retrouve inévitablement en train d’improviser.
ChatGPT n’aime pas la nouveauté
Une recherche, publiée le 26 décembre sur le serveur de prépublication ArXiv, parle de «contamination des tâches».
Pour le commun des mortels, la capacité de ChatGPT à fournir un texte en une fraction de seconde semble inégalée. Mais cette capacité serait «contaminée» par les tâches sur lesquelles ses concepteurs l’ont déjà entraîné, ou sur lesquelles ils ne l’ont pas entraîné.
Il serait un peu, compare l’auteure d’un guide sur les usages de l’IA dans l’enseignement de l’écriture, comme un étudiant qui a une bonne note seulement lorsqu’il a «déjà étudié les réponses de plusieurs tests».