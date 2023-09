Pour ce faire, il faut d’abord convertir les mots en nombre, grâce à une approche appelée la vectorisation de mots. Cela permet de regrouper les termes avec un sens similaire.

Or, dès 2016, une étude américaine avait montré que ces ensembles de mots contenaient des biais qui reflétaient les stéréotypes présents dans la société: la femme «ménagère» (homemaker) et l’homme informaticien, par exemple.

Une autre étude réalisée en 2017 a par ailleurs conclu que la vectorisation de mots associe généralement les femmes à des mots concernant la famille et les arts alors qu’elle associe les hommes à des mots en lien avec la carrière, la science et la technologie.

On peut observer soi-même ce phénomène en utilisant Google Translate. Si on demande à l’algorithme de traduire «la médecin et l’infirmier» en anglais, on obtient «the doctor and the nurse», des mots non genrés. Cependant, si on veut faire la traduction inverse, on obtient plutôt «le médecin et l’infirmière».

Des données biaisées au départ?

Dans un article récent discutant des enjeux éthiques de l’intelligence artificielle, l’International Peace Institute (IPI) s’est inquiété de cette question des biais et stéréotypes. Ceux-ci, rappelle le texte, peuvent survenir à différentes étapes de la création des applications: lors du développement de l’algorithme, lors de son entraînement grâce à des banques de données, ou à l’étape de la prise de décision par l’IA.