Les lettres et leur fréquence

Partagez
Tweetez
Envoyez

Je me suis remis à jouer au Scrabble dernièrement. Au Scrabble en ligne, plus exactement. Avec des adversaires qui sont dans mon cercle d’amis ou avec d’autres que je ne connais ni d’Ève ni d’Adam.

J’ai toujours aimé le Scrabble. Et en jouant régulièrement, on en vient à avoir des trucs, des combinaisons de lettres, des mots de deux ou trois lettres qui nous dépannent, des mots qui utilisent les terribles k, q, w, x ou z.

Inévitablement, en jouant au Scrabble, on prend conscience de la fréquence d’utilisation des lettres en français. Ce n’est pas un hasard si, dans un jeu, on compte un seul k mais quinze e ou neuf a. La distribution des lettres au Scrabble est assez fidèle à la fréquence de leur utilisation. À quelques exceptions près.

En fouillant un peu, sur le web principalement, on se rend compte qu’il est toujours un peu subjectif de quantifier la fréquence d’apparition des lettres en français. Sur quoi se base-t-on? Sur le contenu d’un dictionnaire? Cela fausserait un peu les données puisque les mots y sont au singulier. Il y a forcément moins de s. Et aussi parce que les verbes ne sont pas conjugués, ce qui exclut un nombre considérable de z pour les verbes à la deuxième personne du pluriel.

Alors peut-on se baser sur une œuvre littéraire ou sur un ensemble d’œuvres littéraires? Cela aurait, selon plusieurs, le mérite de donner une idée plus juste de la fréquence réelle des lettres.

l-express.ca remercie ses partenaires. En devenir.

Selon cette méthode, plusieurs sources s’entendent pour dire que la lettre la plus utilisée en français – et ce n’est assurément pas une surprise – est le e. En pourcentage de fréquence, le e (14,7%) double presque la deuxième lettre la plus utilisée, le s (7,9 %). Et c’est sans compter les é, è, ê ou ë. Certaines analyses donnent le a avant le s, mais les pourcentages sont sensiblement les mêmes.

En français, la lettre e est donc suivie des lettres s, a, r, t, i, n, u, l, o, d et c. On dit même que tous les mots de quatre lettres et plus comptent au moins une de ces douze lettres. Un moyen efficace de retenir les sept lettres les plus utilisées est de penser au mot «tsarine», même si les lettres ne sont pas dans l’ordre de leur fréquence d’utilisation.

J’avais déjà lu que le verbe «désinstitutionnaliser», avec ses vingt et une lettres, a la particularité d’être formé uniquement des onze lettres les plus fréquentes en français. Certaines, évidemment, sont répétées dans le mot. Il s’agit aussi d’un des plus longs verbes de la langue française.

Les francophones ne sont pas les seuls à avoir la lettre e en tête du palmarès de la fréquence des lettres. En anglais, en allemand, en espagnol et en italien, c’est aussi cette voyelle qui est la plus utile à la construction de mots. Fait intéressant à noter, dans la langue italienne, ce sont quatre voyelles (e, i, a, o) qui occupent les quatre premières positions. En russe, la lettre e n’arrive qu’en sixième position. C’est la lettre o qui revient le plus souvent dans cette langue.

D’ailleurs, en anglais, les lettres les plus fréquentes sont, dans l’ordre: e, s, d, n, t, r, y et o. Évidemment, des lettres comme le w et le k occupent un rang supérieur en anglais qu’en français. En français, ces consonnes sont, avec le z, le q, le x et le j, les moins utilisées. En excluant les digrammes comme les lettres accentuées ou les lettres liées (œ ou æ).

l-express.ca remercie ses partenaires. En devenir.

Il existe plusieurs phrases construites de manière à ce qu’elles contiennent toutes les lettres de l’alphabet. Souvent, c’est utile pour les tests d’imprimante ou de logiciels de traitement de texte. La plus célèbre demeure sans doute «Portez ce vieux whisky au juge blond qui fume.»

Pour chacune des dix lettres les plus fréquentes dans la langue française, des auteurs ont répertorié des mots qui, justement, font grimper leur nombre. Ainsi, pour la lettre e, on remercie les féminins. Notamment pour un participe passé comme «réensemencée», qui compte six e.

On ne s’étonnera pas d’apprendre que pour la lettre a, c’est le mot «abracadabra», qui l’emporte avec cinq apparitions. Les mots qui comptent le plus de s sont souvent des verbes à l’imparfait du subjonctif. En tête de liste : «ressassasses», qui en compte sept! N’oublions pas les Suissesses, avec leurs sept s.

Le mot «indivisibilité» fait grimper le nombre de i, avec six. Pour la lettre n, c’est le verbe «hannetonner» conjugué à la troisième personne du pluriel, qui l’emporte : «hannetonnent» ou «hannetonnèrent», «hannetonneront», «hannetonnaient» ou «hannetonneraient».

La «trottinette» et ses cinq t, le verbe «arriérer» et ses quatre r, la «cuniculiculture» et ses quatre u, ainsi que la «libellule» et ses quatre l – mais aussi ses quatre ailes! – suivent dans cet étrange palmarès. Celui-ci serait conclu par les cinq o du verbe «photocomposer» conjugué à la première personne du pluriel : «photocomposons».

Je n’ai pas poussé l’audace jusqu’à brosser un tableau de fréquence des lettres dans cette chronique. Je ne suis pas aussi gaga que ça…

Partagez
Tweetez
Envoyez
l-express.ca remercie ses partenaires. En devenir.

Pour la meilleur expérience sur ce site, veuillez activer Javascript dans votre navigateur