Les lettres et leur fréquence


17 février 2015 à 10h46

Je me suis remis à jouer au Scrabble dernièrement. Au Scrabble en ligne, plus exactement. Avec des adversaires qui sont dans mon cercle d’amis ou avec d’autres que je ne connais ni d’Ève ni d’Adam.

J’ai toujours aimé le Scrabble. Et en jouant régulièrement, on en vient à avoir des trucs, des combinaisons de lettres, des mots de deux ou trois lettres qui nous dépannent, des mots qui utilisent les terribles k, q, w, x ou z.

Inévitablement, en jouant au Scrabble, on prend conscience de la fréquence d’utilisation des lettres en français. Ce n’est pas un hasard si, dans un jeu, on compte un seul k mais quinze e ou neuf a. La distribution des lettres au Scrabble est assez fidèle à la fréquence de leur utilisation. À quelques exceptions près.

En fouillant un peu, sur le web principalement, on se rend compte qu’il est toujours un peu subjectif de quantifier la fréquence d’apparition des lettres en français. Sur quoi se base-t-on? Sur le contenu d’un dictionnaire? Cela fausserait un peu les données puisque les mots y sont au singulier. Il y a forcément moins de s. Et aussi parce que les verbes ne sont pas conjugués, ce qui exclut un nombre considérable de z pour les verbes à la deuxième personne du pluriel.

Alors peut-on se baser sur une œuvre littéraire ou sur un ensemble d’œuvres littéraires? Cela aurait, selon plusieurs, le mérite de donner une idée plus juste de la fréquence réelle des lettres.

Selon cette méthode, plusieurs sources s’entendent pour dire que la lettre la plus utilisée en français – et ce n’est assurément pas une surprise – est le e. En pourcentage de fréquence, le e (14,7%) double presque la deuxième lettre la plus utilisée, le s (7,9 %). Et c’est sans compter les é, è, ê ou ë. Certaines analyses donnent le a avant le s, mais les pourcentages sont sensiblement les mêmes.

En français, la lettre e est donc suivie des lettres s, a, r, t, i, n, u, l, o, d et c. On dit même que tous les mots de quatre lettres et plus comptent au moins une de ces douze lettres. Un moyen efficace de retenir les sept lettres les plus utilisées est de penser au mot «tsarine», même si les lettres ne sont pas dans l’ordre de leur fréquence d’utilisation.

J’avais déjà lu que le verbe «désinstitutionnaliser», avec ses vingt et une lettres, a la particularité d’être formé uniquement des onze lettres les plus fréquentes en français. Certaines, évidemment, sont répétées dans le mot. Il s’agit aussi d’un des plus longs verbes de la langue française.

Les francophones ne sont pas les seuls à avoir la lettre e en tête du palmarès de la fréquence des lettres. En anglais, en allemand, en espagnol et en italien, c’est aussi cette voyelle qui est la plus utile à la construction de mots. Fait intéressant à noter, dans la langue italienne, ce sont quatre voyelles (e, i, a, o) qui occupent les quatre premières positions. En russe, la lettre e n’arrive qu’en sixième position. C’est la lettre o qui revient le plus souvent dans cette langue.

D’ailleurs, en anglais, les lettres les plus fréquentes sont, dans l’ordre: e, s, d, n, t, r, y et o. Évidemment, des lettres comme le w et le k occupent un rang supérieur en anglais qu’en français. En français, ces consonnes sont, avec le z, le q, le x et le j, les moins utilisées. En excluant les digrammes comme les lettres accentuées ou les lettres liées (œ ou æ).

Il existe plusieurs phrases construites de manière à ce qu’elles contiennent toutes les lettres de l’alphabet. Souvent, c’est utile pour les tests d’imprimante ou de logiciels de traitement de texte. La plus célèbre demeure sans doute «Portez ce vieux whisky au juge blond qui fume.»

Pour chacune des dix lettres les plus fréquentes dans la langue française, des auteurs ont répertorié des mots qui, justement, font grimper leur nombre. Ainsi, pour la lettre e, on remercie les féminins. Notamment pour un participe passé comme «réensemencée», qui compte six e.

On ne s’étonnera pas d’apprendre que pour la lettre a, c’est le mot «abracadabra», qui l’emporte avec cinq apparitions. Les mots qui comptent le plus de s sont souvent des verbes à l’imparfait du subjonctif. En tête de liste : «ressassasses», qui en compte sept! N’oublions pas les Suissesses, avec leurs sept s.

Le mot «indivisibilité» fait grimper le nombre de i, avec six. Pour la lettre n, c’est le verbe «hannetonner» conjugué à la troisième personne du pluriel, qui l’emporte : «hannetonnent» ou «hannetonnèrent», «hannetonneront», «hannetonnaient» ou «hannetonneraient».

La «trottinette» et ses cinq t, le verbe «arriérer» et ses quatre r, la «cuniculiculture» et ses quatre u, ainsi que la «libellule» et ses quatre l – mais aussi ses quatre ailes! – suivent dans cet étrange palmarès. Celui-ci serait conclu par les cinq o du verbe «photocomposer» conjugué à la première personne du pluriel : «photocomposons».

Je n’ai pas poussé l’audace jusqu’à brosser un tableau de fréquence des lettres dans cette chronique. Je ne suis pas aussi gaga que ça…

Inscrivez-vous à nos infolettres gratuitement:

Récemment

Restez à jour dans votre propre fil d'actualité

Berlioz a changé le métier de compositeur

musique
De par le monde, de nombreux concerts ou festivals ou exécution d'une ou de plusieurs de ses œuvres marquent, en cette année 2019, le...
En lire plus...

24 mars 2019 à 11h00

Écriture soignée et soyeuse

roman Lévesque éditeur
Journaliste-photographe dans plusieurs médias québécois, Jean-François Villeneuve a publié un premier roman intitulé Les chambres obscures. Le titre renvoie aussi bien à des pièces...
En lire plus...

24 mars 2019 à 9h00

Quiz : Gestation et espérance de vie

Épaulard
Quiz : Quelques questions sur la gestation et l'expérance de vie des animaux.
En lire plus...

24 mars 2019 à 7h00

Les Rangers ont le dessus sur les Maple Leafs

Les Maple Leafs étaient de retour à domicile samedi soir pour la dernière rencontre du samedi de la saison après avoir été sur la...
En lire plus...

23 mars 2019 à 23h54

Le Thunder prend sa revanche sur les Raptors

Mike Laviolle
Il y avait comme une odeur de phases finales, vendredi soir à l’Aréna Scotiabank, pour la rencontre qui opposait les Raptors de Toronto au...
En lire plus...

23 mars 2019 à 17h00

Les Québécois sont bourrés de contradictions

Le sondeur et conseiller en mise en marché Jean-Marc Léger raffine depuis plusieurs années son expertise de la mentalité des Québécois, qu’il explique dans...
En lire plus...

23 mars 2019 à 15h00

Regagner du muscle pour contrer le vieillissement

vieux
Moins loin, moins souvent: les déplacements des personnes âgées se réduisent avec l’âge. De nombreux aînés préfèrent rester à la maison et limiter leurs...
En lire plus...

Appropriation culturelle: pour ou contre un droit de regard sur la création?

appropriation culturelle
Le débat québécois entourant l’appropriation culturelle gagne toute la francophonie. Chez nous, la réflexion amorcée fait-elle davantage référence à un réflexe défensif ou à...
En lire plus...

23 mars 2019 à 11h00

L’élimination des frais de scolarité: illusoire

Glendon
Dans un monde idéal, il serait très agréable de ne pas avoir à payer de frais de scolarité à l'université. Cependant, lorsque les étudiants...
En lire plus...

23 mars 2019 à 9h00

Il ne resterait que 10 marsouins du Pacifique

Le prochain animal à être officiellement déclaré éteint sera peut-être le vaquita, ou marsouin du Pacifique. Avec seulement 10 individus, il est devenu le...
En lire plus...

23 mars 2019 à 7h00

Pour la meilleur expérience sur ce site, veuillez activer Javascript dans votre navigateur