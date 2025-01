Le «contenu de haute qualité» utilisable pour alimenter ces applications va être rattrapé en 2026, selon une évaluation sommaire qui avait été pondue en octobre 2022 par un groupe de chercheurs de la firme EpochAI.

Le même groupe a publié en 2024 une estimation plaçant cette limite en 2028. Mais la différence repose sur la définition que l’on donne à «contenu de haute qualité».

Entraîner les IA avec des contenus générés par d’autres IA?

Dans leur dernière estimation, la taille des bases de données utilisées pour entraîner l’IA croît de 100% par année, alors que la taille du contenu «utilisable» sur Internet ne croît que de 10% par année — d’où un «goulot d’étranglement» imminent.

L’une des solutions les plus troublantes serait de continuer à «entraîner» les IA génératives, mais avec des contenus conçus… par d’autres IA génératives.

Or, si l’on est déjà en manque de solutions pour limiter la production de fausses informations par ces IA, on entre dans un territoire encore plus flou si les IA doivent s’alimenter à des contenus créés par des IA.