Générateur automatique de phrases

Un article de Wikipédia, l'encyclopédie libre.

Un générateur automatique de phrases (parfois appelé « pipotron »[réf. nécessaire]) est un programme qui génère des phrases à partir d'un corpus bien défini. Il s'agit d'une supercherie dont le but est la vraissemblance d'un texte inventé par le programme. Quelqu'un qui utilise une telle matrice sera étonné de la cohérence du propos pourtant composé de toutes pièces par assemblage au hasard de morceaux de phrases. Comment un programme peut-il créer un discours entier qui ait du sens ?

En réalité un générateur de phrases ne donne que l'illusion de créer du sens. Une analyse des isotopies du texte généré montre qu'il n'a en fait quasiment aucun sens, et que le locuteur (le générateur de phrase) disserte sur un thème donné sans jamais entrer dans le vif du sujet, par supercherie, à la manière d'un locuteur qui parle la « langue de bois ».

[modifier] Technique

Comment se passe la génération des phrases ? Il suffit de demander au programme de générer des phrases sur un thème (linguistique) précis. Le programme sélectionne le champ lexical correspondant à ce thème, puis il assemble au hasard les termes du champ lexical de façon à former des phrases.

  • Le champ lexical en question doit être assez vaste pour que les mêmes termes ne reviennent pas trop souvent, de façon à donner l'illusion d'une variété dans le propos.
  • Chaque terme du champ lexical, placé au hasard dans la phrase générée, doit pouvoir faire partie de toute phrase générée sans qu'il y ait d'incohérence grammaticale. Certains termes sont donc exclus de la base de donnée lexicale, car ils sont, dans les phrases naturelles, placés dans un endroit précis de la phrase. On peut cependant conserver ces termes dans la base lexicale en obligeant le générateur à les placer dans une phrase ou dans un texte à l'endroit où ils sont d'habitude : le terme premièrement, par exemple, sera placé quelques phrases avant le terme deuxièmement. Le texte généré gagne ainsi en complexité donc en vraisemblance.
  • La base lexicale ne doit pas comporter trop de termes, sous peine d'un plus grand risque d'incongruité.
  • Les thèmes abordés par le générateur automatiques de phrases doivent être des thèmes où l'on croise ordinairement des termes techniques et inhabituels : par exemple, la philosophie kantienne ou la théorie de la superfluidité. De cette façon, d'une part, les termes inconnus par le lecteur renforcent l'impression d'un discours réfléchi donc naturel, et d'autre part ils peuvent plus facilement faire partie d'un champ lexical plus serré donc présentant moins de risque d'incongruité.

Un générateur automatique de phrase est parfois très étonnant et peut servir de test ludique pour savoir si un professionnel d'un domaine précis (par exemple la philosophie) peut détecter ou non la supercherie. Mais surtout, il est un objet de réflexion pour l'étude de la sémantique et des langages artificiels.

[modifier] Exemples

Un exemple de phrase générée n'ayant aucun sens mais qui, pour le non-spécialiste, peut passer pour vraisemblable :

L'organisation rousseauiste de la continuité découle d'une représentation universelle de l'objectivisme. Le paradoxe de l'antipodisme rationnel illustre, par là-même, l'idée selon laquelle l'objectivisme n'est ni plus ni moins qu'une immutabilité morale. Il est alors évident que Kierkegaard interprète l'analyse synthétique de la continuité.

On remarquera l'outil par là-même, servant à relier d'une manière faussement savante deux idées sans aucun rapport l'une avec l'autre. Mais le lecteur essaie de construire un rapport, comme il en a l'habitude ; tous les mots de la philosophie ayant au moins entre eux un point commun, qui est d'appartenir au champ de la philosophie, le lecteur croit comprendre au moins une chose, c'est qu'il s'agit, dans ce texte, de philosophie, ou du moins de sciences humaines. Cela peut parfois suffire à la vraisemblance du propos, surtout si un contexte ou un cotexte bien choisi vient la renforcer, tel un discours censé être officiel.

[réf. nécessaire]

Un exemple simple de générations de phrases
Sujet Verbe Complément d'objet direct
Mon voisin mange de la choucroute
Le président annonce des réformes
L'hirondelle ne fait pas le printemps
Le président ne fait pas de la choucroute

En complexifiant, il peut en résulter des sentences creuses imitant bien la langue de bois[réf. nécessaire].