Statistiques sur quelques langues & contraintes littérales


Les histogrammes présentés sur cette page comptent les pourcentages de mots respectant diverses contraintes littérales, dans plusieurs langues.

Le nombre de mots utilisables est certes corrélé à la dureté des contraintes, mais il faut prendre garde à ne pas les confondre. Certaines contraintes agissent en effet aussi sur les enchaînements de mots, en plus de restreindre le vocabulaire, et elles sont donc plus dures que ce que ces simples pourcentages laissent croire.

Par ailleurs, la dureté d'une contrainte dépend aussi beaucoup du type de mots disponibles, l'absence de mots-outils étant souvent plus pénible que la pauvreté du vocabulaire. Cette subtilité n'apparaît évidemment pas dans les figures ci-dessous.

La comparaison des résultats des différentes langues présente aussi plusieurs pièges. Le premier est que ces figures donnent des pourcentages de mots et non des nombres de mots. Une langue au vocabulaire très riche, comme l'anglais, fournit donc plus de mots utilisables pour un même pourcentage affiché, donc conduit à une contrainte a priori moins dure.
Le second piège est que les listes de mots utilisées (provenant de l'excellent vérificateur d'orthographe Excalibur pour Macintosh, plus une ancienne version de l'Officiel du Scrabble) n'ont pas du tout les mêmes tailles. Elles sont notamment bien plus pauvres pour le norvégien, l'indonésien et le créole haïtien que pour les autres langues, et cela peut créer certains biais statistiques. La liste de mots du créole haïtien est même si pauvre que cela conduit à plusieurs bizarreries de ses histogrammes, auxquels on ne peut donc pas faire une confiance aveugle.

Toutes les figures peuvent être agrandies à la taille de votre fenêtre en cliquant dessus. Notez que leur hauteur est chaque fois celle du plus grand pourcentage trouvé, qui peut varier considérablement d'une langue à une autre. Prenez donc garde à ne pas seulement comparer les couleurs et les hauteurs des rectangles, mais tenez compte aussi des valeurs numériques indiquées sur l'axe des ordonnées.


Lipogrammes
Monovocalismes
Monoconsonantismes
Tautogrammes
Télotautogrammes
Mésotautogrammes
Distanciation
Mouvements conjoints
Mouvements disjoints
Clavier conjoint
Hétéropolygrammes
Singletons
Doublets
Triplets
Quadruplets
Quintuplets
Sextuplets
Rapport consonnes/voyelles
Aléa furtif
Semi-palindromes
Aléa furtif généralisé
Semi-bègues
Bivocalismes
Biconsonantismes
Oligogrammes
N-oligogrammes
N-bambochades
Quelques cas particuliers

• Lipogrammes (la lettre indiquée en abscisse est interdite)

Le lipogramme le plus dur en français est en E, comme Perec le savait bien. Cette page de statistiques laisse entendre que la même voyelle E est aussi la plus fréquente en espagnol, quand on considère des textes et non une liste de mots. Cela semble remettre en question le choix des traducteurs du roman de Perec en espagnol, qui ont supprimé le A à la place du E. Mais l'histogramme ci-dessous prouve qu'ils ont très bien fait, car c'est en effet ce qui conduit au vocabulaire le plus restreint.

Le lipogramme en E est statistiquement plus dur en allemand et en danois. Cela confirme la réputation de tour de force de la traduction allemande de la Disparition par Eugen Helmlé.

Les lipogrammes sont statistiquement plus doux en anglais qu'en la plupart des autres langues — en pourcentages de mots, indépendamment du très riche vocabulaire anglais, qui implique donc encore davantage de mots disponibles. Ils semblent aussi plus doux en créole haïtien, mais la courte liste de mots utilisée pour cette langue biaise les résultats.

Lipogrammes en français Lipogrammes en français (ODS)
Lipogrammes en anglais des USA Lipogrammes en anglais britannique
Lipogrammes en espagnol Lipogrammes en catalan
Lipogrammes en italien Lipogrammes en portugais
Lipogrammes en allemand Lipogrammes en néerlandais
Lipogrammes en danois Lipogrammes en norvégien
Lipogrammes en suédois Lipogrammes en indonésien
Lipogrammes en créole haïtien

• Monovocalismes (la voyelle indiquée en abscisse est la seule autorisée)

Les monovocalismes sont évidemment bien plus durs que les lipogrammes. En français, ceux en E sont environ dix fois moins nombreux que les lipogrammes en E.

Tous les monovocalismes sont plus doux en anglais qu'en français. Notez que l'échelle verticale n'est pas la même dans ces histogrammes.

Les monovocalismes en E sont relativement doux en allemand, néerlandais, danois & norvégien, et ceux en A en suédois & indonésien.

L'histogramme du créole haïtien est particulièrement bizarre, mais cela vient probablement de la trop courte liste de mots utilisée : les monovocalismes en E ou A sont à peu près aussi nombreux (8 %), idem pour ceux en I ou O (4 %), et encore idem pour ceux en U ou Y (0,5 %).

Monovocalismes en français Monovocalismes en français (ODS)
Monovocalismes en anglais des USA Monovocalismes en anglais britannique
Monovocalismes en espagnol Monovocalismes en catalan
Monovocalismes en italien Monovocalismes en portugais
Monovocalismes en allemand Monovocalismes en néerlandais
Monovocalismes en danois Monovocalismes en norvégien
Monovocalismes en suédois Monovocalismes en indonésien
Monovocalismes en créole haïtien

• Monoconsonantismes (la consonne indiquée en abscisse est la seule autorisée)

Les monoconsonantismes sont encore plus durs que les monovocalismes.

Ils sont un peu plus doux en norvégien, indonésien & créole haïtien que dans les autres langues, mais les listes de mots de ces trois langues sont chaque fois assez pauvres, donc il s'agit probablement d'un biais statistique.

Monoconsonantismes en français Monoconsonantismes en français (ODS)
Monoconsonantismes en anglais des USA Monoconsonantismes en anglais britannique
Monoconsonantismes en espagnol Monoconsonantismes en catalan
Monoconsonantismes en italien Monoconsonantismes en portugais
Monoconsonantismes en allemand Monoconsonantismes en néerlandais
Monoconsonantismes en danois Monoconsonantismes en norvégien
Monoconsonantismes en suédois Monoconsonantismes en indonésien
Monoconsonantismes en créole haïtien

• Tautogrammes (tous les mots commencent par la même lettre)

Le tautogramme en S est particulièrement doux en italien (et en danois).

Tautogrammes en français Tautogrammes en français (ODS)
Tautogrammes en anglais des USA Tautogrammes en anglais britannique
Tautogrammes en espagnol Tautogrammes en catalan
Tautogrammes en italien Tautogrammes en portugais
Tautogrammes en allemand Tautogrammes en néerlandais
Tautogrammes en danois Tautogrammes en norvégien
Tautogrammes en suédois Tautogrammes en indonésien
Tautogrammes en créole haïtien

• Télotautogrammes (tous les mots terminent par la même lettre)

Les télotautogrammes sont généralement dominés par les marques de pluriel, c'est-à-dire S en français, anglais, espagnol, catalan, portugais, danois, suédois ; N en allemand & néerlandais ; E en norvégien ; et presque toutes les voyelles (OEIA) en italien — qui n'autorise presque jamais d'autre lettre finale.

Télotautogrammes en français Télotautogrammes en français (ODS)
Télotautogrammes en anglais des USA Télotautogrammes en anglais britannique
Télotautogrammes en espagnol Télotautogrammes en catalan
Télotautogrammes en italien Télotautogrammes en portugais
Télotautogrammes en allemand Télotautogrammes en néerlandais
Télotautogrammes en danois Télotautogrammes en norvégien
Télotautogrammes en suédois Télotautogrammes en indonésien
Télotautogrammes en créole haïtien

• Mésotautogrammes (tous les mots ont un nombre impair de lettres, et leur lettre centrale est toujours la même)

Les mésotautogrammes les plus doux sont en I, E ou A selon la langue, mais ils donnent des pourcentages de mots autorisés du même ordre de grandeur. Les E centraux sont clairement privilégiés en allemand, néerlandais, danois, norvégien, et les A centraux en suédois & indonésien.

Mésotautogrammes en français Mésotautogrammes en français (ODS)
Mésotautogrammes en anglais des USA Mésotautogrammes en anglais britannique
Mésotautogrammes en espagnol Mésotautogrammes en catalan
Mésotautogrammes en italien Mésotautogrammes en portugais
Mésotautogrammes en allemand Mésotautogrammes en néerlandais
Mésotautogrammes en danois Mésotautogrammes en norvégien
Mésotautogrammes en suédois Mésotautogrammes en indonésien
Mésotautogrammes en créole haïtien

• Distanciation (deux occurrences d'une même lettre sont séparées par au moins D autres lettres, nombre indiqué en abscisse)

Cette contrainte (inventée par Nicolas Graner) atteint assez vite l'asymptote des mots hétérogrammatiques, c'est-à-dire n'utilisant aucune lettre plus d'une fois. Mais elle est bien plus dure que ces pourcentages ne le laissent croire, car elle doit être respectée partout, même entre les mots.

Elle est légèrement plus douce en anglais qu'en français (sans doute à cause des nombreux mots courts de l'anglais), mais surtout bien plus douce en espagnol & portugais pour D = 1, car les lettres répétées y sont très rares.

Distanciation en français Distanciation en français (ODS)
Distanciation en anglais des USA Distanciation en anglais britannique
Distanciation en espagnol Distanciation en catalan
Distanciation en italien Distanciation en portugais
Distanciation en allemand Distanciation en néerlandais
Distanciation en danois Distanciation en norvégien
Distanciation en suédois Distanciation en indonésien
Distanciation en créole haïtien

• Mouvements conjoints (l'écart alphabétique entre deux lettres successives ne dépasse jamais le nombre D indiqué en abscisse)

Cette contrainte devient abordable pour un écart alphabétique maximal D de l'ordre de 10.

Pour la même raison que pour la distanciation ci-dessus, elle est un peu plus dure en espagnol & portugais qu'en français (cf. D = 16).

Mouvements conjoints en français Mouvements conjoints en français (ODS)
Mouvements conjoints en anglais des USA Mouvements conjoints en anglais britannique
Mouvements conjoints en espagnol Mouvements conjoints en catalan
Mouvements conjoints en italien Mouvements conjoints en portugais
Mouvements conjoints en allemand Mouvements conjoints en néerlandais
Mouvements conjoints en danois Mouvements conjoints en norvégien
Mouvements conjoints en suédois Mouvements conjoints en indonésien
Mouvements conjoints en créole haïtien

Cette contrainte des mouvements conjoints devient bien plus douce si l'on considère un alphabet cyclique, où le A suit le Z.

Mouvements conjoints (avec alphabet cyclique)en français Mouvements conjoints (avec alphabet cyclique)en français (ODS)
Mouvements conjoints (avec alphabet cyclique)en anglais des USA Mouvements conjoints (avec alphabet cyclique)en anglais britannique
Mouvements conjoints (avec alphabet cyclique)en espagnol Mouvements conjoints (avec alphabet cyclique)en catalan
Mouvements conjoints (avec alphabet cyclique)en italien Mouvements conjoints (avec alphabet cyclique)en portugais
Mouvements conjoints (avec alphabet cyclique)en allemand Mouvements conjoints (avec alphabet cyclique)en néerlandais
Mouvements conjoints (avec alphabet cyclique)en danois Mouvements conjoints (avec alphabet cyclique)en norvégien
Mouvements conjoints (avec alphabet cyclique)en suédois Mouvements conjoints (avec alphabet cyclique)en indonésien
Mouvements conjoints (avec alphabet cyclique)en créole haïtien

• Mouvements disjoints (l'écart alphabétique entre deux lettres successives n'est jamais inférieur au nombre D' indiqué en abscisse)

Toujours pour la même raison que pour la distanciation ci-dessus, les mouvements disjoints sont un peu plus doux en espagnol & portugais pour D' = 1.

Mouvements disjoints en français Mouvements disjoints en français (ODS)
Mouvements disjoints en anglais des USA Mouvements disjoints en anglais britannique
Mouvements disjoints en espagnol Mouvements disjoints en catalan
Mouvements disjoints en italien Mouvements disjoints en portugais
Mouvements disjoints en allemand Mouvements disjoints en néerlandais
Mouvements disjoints en danois Mouvements disjoints en norvégien
Mouvements disjoints en suédois Mouvements disjoints en indonésien
Mouvements disjoints en créole haïtien

Les résultats ne changent quasiment pas lorsqu'on considère un alphabet cyclique, où le A suit le Z.

Mouvements disjoints (avec alphabet cyclique) en français Mouvements disjoints (avec alphabet cyclique) en français (ODS)
Mouvements disjoints (avec alphabet cyclique) en anglais des USA Mouvements disjoints (avec alphabet cyclique) en anglais britannique
Mouvements disjoints (avec alphabet cyclique) en espagnol Mouvements disjoints (avec alphabet cyclique) en catalan
Mouvements disjoints (avec alphabet cyclique) en italien Mouvements disjoints (avec alphabet cyclique) en portugais
Mouvements disjoints (avec alphabet cyclique) en allemand Mouvements disjoints (avec alphabet cyclique) en néerlandais
Mouvements disjoints (avec alphabet cyclique) en danois Mouvements disjoints (avec alphabet cyclique) en norvégien
Mouvements disjoints (avec alphabet cyclique) en suédois Mouvements disjoints (avec alphabet cyclique) en indonésien
Mouvements disjoints (avec alphabet cyclique) en créole haïtien

• Clavier conjoint (deux caractères successifs sont séparés d'au plus N touches sur un clavier d'ordinateur)

Comme cette contrainte dépend du clavier utilisé, elle n'est illustrée ci-dessous que pour le français, avec ce clavier français Macintosh :

Clavier français Macinstosh

Le premier histogramme autorise les sauts de touche en touche dans toutes les directions (« q » et « w » sont par exemple immédiatement voisines). Notez que les accents sont pris en compte dans cette contrainte, donc « a » et « e » ne sont pas immédiatement voisines, alors qu'« a » et « é » le sont. La barre d'espace permet d'aller plus vite d'un côté à l'autre du clavier, par exemple de « c » au point-virgule en seulement deux sauts.

Les deux autres histogrammes correspondent à des surcontraintes choisies par Jérémie Piscicelli : les mouvements horizontaux sont interdits (par exemple de « a » à « z »), et les passages via la barre d'espace sont également interdits dans le dernier histogramme. Il est bien sûr nécessaire de choisir un nombre de sauts N plus grand pour rendre ces variantes abordables.

Clavier conjoint Clavier conjoint sans mouvements horizontaux Clavier conjoint sans mouvements horizontaux

• Hétéropolygrammes (aucune suite de N lettres n'est employée plus d'une fois, même entre mots)

Les histogrammes ci-dessous n'ont pas grand rapport avec la difficulté de cette contrainte. En effet, presque tous les mots sont autorisés pour N ≥ 2 ou 3, mais la difficulté est de respecter cette contrainte durant toute une phrase, ou un distique, voire une strophe ou un poème complet. Par ailleurs, obtenir des rimes sans réemployer les mêmes N-grammes complique encore l'écriture.

Hétéropolygrammes en français Hétéropolygrammes en français (ODS)
Hétéropolygrammes en anglais des USA Hétéropolygrammes en anglais britannique
Hétéropolygrammes en espagnol Hétéropolygrammes en catalan
Hétéropolygrammes en italien Hétéropolygrammes en portugais
Hétéropolygrammes en allemand Hétéropolygrammes en néerlandais
Hétéropolygrammes en danois Hétéropolygrammes en norvégien
Hétéropolygrammes en suédois Hétéropolygrammes en indonésien
Hétéropolygrammes en créole haïtien

• Singletons (la lettre donnée en abscisse apparaît une et une seule fois dans les mots que l'on compte)

Singletons en français Singletons en français (ODS)
Singletons en anglais des USA Singletons en anglais britannique
Singletons en espagnol Singletons en catalan
Singletons en italien Singletons en portugais
Singletons en allemand Singletons en néerlandais
Singletons en danois Singletons en norvégien
Singletons en suédois Singletons en indonésien
Singletons en créole haïtien

• Doublets (la lettre donnée en abscisse apparaît exactement deux fois dans les mots que l'on compte)

Les histogrammes du français illustrent que les doubles G, H et B d'Élisabeth Chamontin, en avril 2001, étaient particulièrement durs.

Doublets en français Doublets en français (ODS)
Doublets en anglais des USA Doublets en anglais britannique
Doublets en espagnol Doublets en catalan
Doublets en italien Doublets en portugais
Doublets en allemand Doublets en néerlandais
Doublets en danois Doublets en norvégien
Doublets en suédois Doublets en indonésien
Doublets en créole haïtien

• Triplets (la lettre donnée en abscisse apparaît exactement trois fois dans les mots que l'on compte)

Rare exemple de contrainte plus dure en anglais qu'en français, lié au fait que l'anglais est riche en mots courts.

Triplets en français Triplets en français (ODS)
Triplets en anglais des USA Triplets en anglais britannique
Triplets en espagnol Triplets en catalan
Triplets en italien Triplets en portugais
Triplets en allemand Triplets en néerlandais
Triplets en danois Triplets en norvégien
Triplets en suédois Triplets en indonésien
Triplets en créole haïtien

• Quadruplets (la lettre donnée en abscisse apparaît exactement quatre fois dans les mots que l'on compte)

Même remarque que pour les triplets ci-dessus : il est plus difficile d'employer exactement quatre fois une même lettre dans un mot anglais qu'en français (dont les mots sont généralement plus longs).

Quadruplets en français Quadruplets en français (ODS)
Quadruplets en anglais des USA Quadruplets en anglais britannique
Quadruplets en espagnol Quadruplets en catalan
Quadruplets en italien Quadruplets en portugais
Quadruplets en allemand Quadruplets en néerlandais
Quadruplets en danois Quadruplets en norvégien
Quadruplets en suédois Quadruplets en indonésien
Quadruplets en créole haïtien

• Quintuplets (la lettre donnée en abscisse apparaît exactement cinq fois dans les mots que l'on compte)

Quintuplets en français Quintuplets en français (ODS)
Quintuplets en anglais des USA Quintuplets en anglais britannique
Quintuplets en espagnol Quintuplets en catalan
Quintuplets en italien Quintuplets en portugais
Quintuplets en allemand Quintuplets en néerlandais
Quintuplets en danois Quintuplets en norvégien
Quintuplets en suédois Quintuplets en indonésien
Quintuplets en créole haïtien

• Sextuplets (la lettre donnée en abscisse apparaît exactement six fois dans les mots que l'on compte)

Dans ces histogrammes (ainsi que les précédents), les lettres par ordre alphabétique inverse correspondent à un nombre de mots strictement nul.

Sextuplets en français Sextuplets en français (ODS)
Sextuplets en anglais des USA Sextuplets en anglais britannique
Sextuplets en espagnol Sextuplets en catalan
Sextuplets en italien Sextuplets en portugais
Sextuplets en allemand Sextuplets en néerlandais
Sextuplets en danois Sextuplets en norvégien
Sextuplets en suédois Sextuplets en indonésien
Sextuplets en créole haïtien

• Rapport consonnes/voyelles

Ce rapport est piqué sur la valeur 1 dans les langues latines (français, espagnol, catalan, italien, portugais, créole haïtien, ainsi que l'indonésien), et sur 2 en allemand, danois, norvégien & suédois. L'anglais et le néerlandais donnent à peu près la même proportion de C/V = 1 que C/V = 2 (et C/V = 3/2).

On peut aussi noter que le français est finalement plus riche en consonnes qu'en voyelles : comparez les rapports inverses les uns des autres, comme 1/2 et 2, 2/3 et 3/2, ou 4/5 et 5/4.

Rapport consonnes/voyelles en français Rapport consonnes/voyelles en français (ODS)
Rapport consonnes/voyelles en anglais des USA Rapport consonnes/voyelles en anglais britannique
Rapport consonnes/voyelles en espagnol Rapport consonnes/voyelles en catalan
Rapport consonnes/voyelles en italien Rapport consonnes/voyelles en portugais
Rapport consonnes/voyelles en allemand Rapport consonnes/voyelles en néerlandais
Rapport consonnes/voyelles en danois Rapport consonnes/voyelles en norvégien
Rapport consonnes/voyelles en suédois Rapport consonnes/voyelles en indonésien
Rapport consonnes/voyelles en créole haïtien

• Aléa furtif (les mots commencent et terminent par la lettre indiquée en abscisse)

La contrainte de l'« aléa furtif » (réinventée par Robert Rapilly, après Éric Angelini & Daniel Lehman) privilégie énormément le S en anglais et en danois (qui dépasse même 9 % de mots en « s...s »). Le cas de l'italien est une conséquence de ses mots presque toujours terminés par A, E, I ou O — comme nous l'avons vu ci-dessus pour les télotautogrammes.

Mots inversant N lettre du début à leur fin, en français Mots inversant N lettre du début à leur fin, en français (ODS)
Mots inversant N lettre du début à leur fin, en anglais des USA Mots inversant N lettre du début à leur fin, en anglais britannique
Mots inversant N lettre du début à leur fin, en espagnol Mots inversant N lettre du début à leur fin, en catalan
Mots inversant N lettre du début à leur fin, en italien Mots inversant N lettre du début à leur fin, en portugais
Mots inversant N lettre du début à leur fin, en allemand Mots inversant N lettre du début à leur fin, en néerlandais
Mots inversant N lettre du début à leur fin, en danois Mots inversant N lettre du début à leur fin, en norvégien
Mots inversant N lettre du début à leur fin, en suédois Mots inversant N lettre du début à leur fin, en indonésien
Mots inversant N lettre du début à leur fin, en créole haïtien

• Semi-palindromes (les N premières lettres réapparaissent en ordre inverse à la fin du mot)

La valeur N = 1 correspond à la totalité des mots respectant la contrainte de l'« aléa furtif » ci-dessus. Le danois sort de l'ordinaire par son grand nombre de mots en « s...s ».

Mots inversant N lettre du début à leur fin, en français Mots inversant N lettre du début à leur fin, en français (ODS)
Mots inversant N lettre du début à leur fin, en anglais des USA Mots inversant N lettre du début à leur fin, en anglais britannique
Mots inversant N lettre du début à leur fin, en espagnol Mots inversant N lettre du début à leur fin, en catalan
Mots inversant N lettre du début à leur fin, en italien Mots inversant N lettre du début à leur fin, en portugais
Mots inversant N lettre du début à leur fin, en allemand Mots inversant N lettre du début à leur fin, en néerlandais
Mots inversant N lettre du début à leur fin, en danois Mots inversant N lettre du début à leur fin, en norvégien
Mots inversant N lettre du début à leur fin, en suédois Mots inversant N lettre du début à leur fin, en indonésien
Mots inversant N lettre du début à leur fin, en créole haïtien

• Aléa furtif généralisé (l'écart alphabétique entre la première et la dernière lettre est exactement donné par la valeur en abscisse)

La valeur 0 correspond à la contrainte des semi-palindromes ci-dessus pour N = 1.

Les écarts alphabétiques sont ici orientés, c.-à-d. que pour N = 1, on autorise les mots en « a...b » mais pas ceux en « b...a ». Un alphabet cyclique est par ailleurs considéré, c'est-à-dire que les mots en « z...a » sont autorisés pour N = 1. Il faut en revanche N = 25 pour employer les mots en « b...a » et « a...z ».

Mots répétant N lettre du début à leur fin, en français Mots répétant N lettre du début à leur fin, en français (ODS)
Mots répétant N lettre du début à leur fin, en anglais des USA Mots répétant N lettre du début à leur fin, en anglais britannique
Mots répétant N lettre du début à leur fin, en espagnol Mots répétant N lettre du début à leur fin, en catalan
Mots répétant N lettre du début à leur fin, en italien Mots répétant N lettre du début à leur fin, en portugais
Mots répétant N lettre du début à leur fin, en allemand Mots répétant N lettre du début à leur fin, en néerlandais
Mots répétant N lettre du début à leur fin, en danois Mots répétant N lettre du début à leur fin, en norvégien
Mots répétant N lettre du début à leur fin, en suédois Mots répétant N lettre du début à leur fin, en indonésien
Mots répétant N lettre du début à leur fin, en créole haïtien

• Semi-bègues (les N premières lettres réapparaissent dans le même ordre à la fin du mot)

La valeur N = 1 coïncide évidemment avec les semi-palindromes pour N = 1, c'est-à-dire avec la totalité des mots respectant la contrainte de l'« aléa furtif ». Le danois continue donc à sortir de l'ordinaire par son grand nombre de mots en « s...s ».

Par rapport aux autres langues, le catalan possède davantage de mots commençant et terminant par le même couple de lettres (dans le même ordre). Ses 2 % de mots de ce type sont dominés par ceux en « es...es » (0,87 %), « en...en » (0,66 %) et « em...em » (0,29 %).

Mots répétant N lettre du début à leur fin, en français Mots répétant N lettre du début à leur fin, en français (ODS)
Mots répétant N lettre du début à leur fin, en anglais des USA Mots répétant N lettre du début à leur fin, en anglais britannique
Mots répétant N lettre du début à leur fin, en espagnol Mots répétant N lettre du début à leur fin, en catalan
Mots répétant N lettre du début à leur fin, en italien Mots répétant N lettre du début à leur fin, en portugais
Mots répétant N lettre du début à leur fin, en allemand Mots répétant N lettre du début à leur fin, en néerlandais
Mots répétant N lettre du début à leur fin, en danois Mots répétant N lettre du début à leur fin, en norvégien
Mots répétant N lettre du début à leur fin, en suédois Mots répétant N lettre du début à leur fin, en indonésien
Mots répétant N lettre du début à leur fin, en créole haïtien

• Bivocalismes (seules les deux voyelles indiquées en abscisse sont autorisées)

Les bivocalismes sont plus doux en norvégien et en suédois qu'en français.

Bivocalismes en français Bivocalismes en français (ODS)
Bivocalismes en anglais des USA Bivocalismes en anglais britannique
Bivocalismes en espagnol Bivocalismes en catalan
Bivocalismes en italien Bivocalismes en portugais
Bivocalismes en allemand Bivocalismes en néerlandais
Bivocalismes en danois Bivocalismes en norvégien
Bivocalismes en suédois Bivocalismes en indonésien
Bivocalismes en créole haïtien

• Biconsonantismes (seules les deux consonnes indiquées en abscisse sont autorisées)

Les histogrammes ci-dessous n'illustrent que les 50 biconsonantismes les moins durs, qui ne sont pas les mêmes selon les langues.

Certains biconsonantismes sont 7 fois plus doux en norvégien qu'en allemand. Le français est intermédiaire.

Biconsonantismes en français Biconsonantismes en français (ODS)
Biconsonantismes en anglais des USA Biconsonantismes en anglais britannique
Biconsonantismes en espagnol Biconsonantismes en catalan
Biconsonantismes en italien Biconsonantismes en portugais
Biconsonantismes en allemand Biconsonantismes en néerlandais
Biconsonantismes en danois Biconsonantismes en norvégien
Biconsonantismes en suédois Biconsonantismes en indonésien
Biconsonantismes en créole haïtien

• Oligogrammes (seules les lettres indiquées en abscisse sont autorisées)

Les histogrammes ci-dessous n'illustrent que les oligogrammes les moins durs, et pour seulement trois langues.

Noël Bernard a choisi de se restreindre à un alphabet de quatre lettres (troisième histogramme) dans ses « quatre-san-ku » de 2013.

Sans surprise, les oligogrammes français privilégient les lettres de la série ESARTIN... chère à Perec :

Mots digrammatiques en français Mots trigrammatiques en français
Mots tétragrammatiques en français Mots pentagrammatiques en français
Mots hexagrammatiques en français Mots heptagrammatiques en français

Oligogrammes en anglais des États-Unis :

Mots digrammatiques en anglais des USA Mots trigrammatiques en anglais des USA
Mots tétragrammatiques en anglais des USA Mots pentagrammatiques en anglais des USA
Mots hexagrammatiques en anglais des USA Mots heptagrammatiques en anglais des USA

Oligogrammes en espagnol :

Mots digrammatiques en espagnol Mots trigrammatiques en espagnol
Mots tétragrammatiques en espagnol Mots pentagrammatiques en espagnol
Mots hexagrammatiques en espagnol Mots heptagrammatiques en espagnol

• N-oligogrammes (les mots emploient N lettres différentes, possiblement en plusieurs exemplaires)

Ci-dessous, chaque barre verticale correspond à la somme d'un histogramme complet de la précédente section.

Pour les petites valeurs de N, la contrainte est un peu moins dure en anglais qu'en français, en raison de la grande quantité de mots courts de l'anglais. Elle est aussi plus douce en norvégien, suédois et indonésien (ainsi qu'en créole haïtien, dont la brève liste de mots utilisée contient une majorité de mots très courts).

N-oligogrammes en français
N-oligogrammes en français (ODS)

Les mots contenant 15 ou 16 lettres distinctes en français sont absents de l'Officiel du Scrabble parce qu'ils comptent plus de 15 lettres. Le record est par exemple « dactylographiques », en 17 lettres dont 16 distinctes.

N-oligogrammes en anglais des USA
N-oligogrammes en anglais britannique

La liste de mots américains utilisée en contient 9 employant au moins 15 lettres distinctes, mais ne figurant pas dans la liste de mots britanniques. Le record est « phenylthiocarbamides », en 20 lettres dont 16 distinctes.

N-oligogrammes en espagnol
N-oligogrammes en catalan
N-oligogrammes en italien
N-oligogrammes en portugais
N-oligogrammes en allemand

L'allemand, dont certains mots peuvent être très longs, atteint 18 lettres distinctes dans « Zylinderkopfschraube » (vis à tête cylindrique), en un total de 20 lettres.

N-oligogrammes en néerlandais

Le néerlandais atteint aussi 18 lettres distinctes dans « uitwijzingsproblematiek » (problème d'expulsion), en un total de 23 lettres, et « brandverzekeringsmaatschappij(en) » [compagnie(s) d'assurance incendie], en des totaux de 29 ou 31 lettres.

N-oligogrammes en danois
N-oligogrammes en norvégien
N-oligogrammes en suédois
N-oligogrammes en indonésien
N-oligogrammes en créole haïtien

• N-bambochades (les mots emploient au moins N lettres consécutives de l'alphabet, dans un ordre quelconque)

Cette contrainte a été proposée par Noël Bernard.

Dans les histogrammes de droite, une version « stricte » a été considérée, dans laquelle les mots emploient exactement N lettres consécutives de l'alphabet, mais pas davantage.

N-oligogrammes en français
N-oligogrammes en français (ODS)

Le record en français (absent de la première liste de mots utilisée) est le passé simple « contreplaquâmes », qui contient les 10 lettres consécutives LMNOPQRSTU. On trouve aussi « électropneumatiques », « immunoélectrophorétiques » et « primodélinquant(e)s » dans le Grand Robert, qui emploient chacun ces mêmes dix lettres consécutives.

N-oligogrammes en anglais des USA
N-oligogrammes en anglais britannique

Le record en anglais est « quadruplications », qui contient les 8 lettres consécutives NOPQRSTU.

N-oligogrammes en espagnol
N-oligogrammes en catalan
N-oligogrammes en italien
N-oligogrammes en portugais
N-oligogrammes en allemand

Le record en allemand est « Fallschirmjägerbrigade » (brigade de parachutistes), qui contient les 10 lettres consécutives ABCDEFGHIJ. Contrairement aux autres langues, l'allemand (avec le danois, cf. plus bas) contient à peu près autant de 2-bambochades strictes que de 3-bambochades strictes.

N-oligogrammes en néerlandais

Le record en néerlandais est « aftapmogelijkheden », qui contient les 13 lettres consécutives DEFGHIJKLMNOP.

N-oligogrammes en danois
N-oligogrammes en norvégien
N-oligogrammes en suédois
N-oligogrammes en indonésien

L'indonésien et le créole haïtien contiennent particulièrement peu de 3-bambochades strictes, comparativement aux autres langues.

N-oligogrammes en créole haïtien

• Illustration de quelques cas particuliers

Évolution de la contrainte dans mon sonnet progressivement lipogrammatique du 01/10/03 :

Pourcentages de mots disponibles par vers d'« El Desmigado »

Paradoxalement, les plus grands pourcentages de mots correspondaient à des contraintes dures, car il était obligatoire de se servir de toutes les lettres autorisées. Il fallait donc construire des (quasi)-pangrammes pour les premiers vers. C'était aussi le cas dans les premières & dernières phrases de ma prose progressivement lipogrammatique du 05/02/17 :

Pourcentages de mots disponibles par phrase du « Sablier »

Évolution de la contrainte dans les « diminutions vocaliques » des 09/09/19 & 24/09/19 de Gérard Le Goff :

Première diminution vocalique de Gérard Le Goff Deuxième diminution vocalique de Gérard Le Goff

Évolution de la contrainte dans mes sonnets biconsonantiques des 14/09/19 & 30/10/19 :

Premier sonnet aux vers biconsonantiques Deuxième sonnet aux vers biconsonantiques

Valid XHTML 1.0 Transitional

Voir aussi l'OuBiPo : citations bibliques respectant involontairement diverses contraintes
Pages oulipiennes de Gef : 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22,
23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, sélection
Vérificateurs de contraintes : anagrammes, belles absentes, gématrie, palindromes, pangrammes & lipogrammes, prisonniers, sympathie

Gilles Esposito-Farèse <gef@iap.fr>

Principaux histogrammes tracés du 22/09/19 au 28/11/19 • Page Web créée le 30/12/19 • Dernier ajout le 18/04/22