Définitions

Génération automatique de texte

La génération automatique de texte (ou GAT ou Natural Langage Generation ou NLG) est un processus logiciel qui transforme des données structurées en langage naturel.

Elle peut être utilisé pour produire du contenu de forme longue permettant aux organisations d'automatiser des rapports personnalisés, ainsi que de produire du contenu personnalisé pour une application Web ou mobile. Il peut également être utilisé pour générer de brefs textes de texte dans des conversations interactives (un chatbot), qui pourraient même être lus par un système de synthèse vocale.

La GAT automatisé peut être comparé au processus utilisé par les humains lorsqu'ils transforment des idées en écriture ou en parole. Les psycholinguistes préfèrent le terme de « production de langue » pour ce processus, qui peut également être décrit en termes mathématiques, ou dans un modèle informatique pour la recherche psychologique. Les systèmes de GAT peuvent également être comparés à des traducteurs de langages informatiques artificiels, tels que decompilers ou transpilers, qui ont également à produire un code lisible par un humain généré à partir d’une version intermédiaire. Les langages humains ont tendance à être considérablement plus complexes et à permettre une ambiguïté et une variété d'expression beaucoup plus grandes que les langages de programmation, ce qui rend le NLG plus difficile.

Le GAT / NLG peut être considéré comme le contraire de compréhension du langage naturel (natural language understanding - NLU)  : alors que dans la compréhension du langage naturel, le système doit lever l’ambiguïté de la phrase d'entrée pour produire la langue de la représentation de la machine, dans NL G le système doit prendre des décisions sur la façon de mettre un concept en mots. Les considérations pratiques dans la construction de systèmes NLU par rapport à NLG ne sont pas symétriques.

La NLU doit gérer les saisies ambiguës ou erronées des utilisateurs, tandis que les idées que le système souhaite exprimer via NLG sont généralement connues avec précision. NLG doit choisir une représentation textuelle spécifique et cohérente parmi de nombreuses représentations potentielles, alors que NLU tente généralement de produire une représentation unique et normalisée de l’idée exprimée.

Le GAT / NLG existe depuis longtemps  mais les technologies commerciales de GAT n’ont été mises au point que récemment pour devenir largement disponible. Les techniques GAT / NLG vont des systèmes simples basés sur des modèles, tels que le publipostage générant des lettres types, aux systèmes ayant une compréhension complexe de la grammaire humaine. Le GAT / NLG peut également être réalisé en formant un modèle statistique utilisant l’apprentissage automatique, généralement sur un grand corpus de textes écrits par l’homme.

Organisme de formation

CPF, Pole Emploi, Plan de formation   OF N°11755165975 - 17 rue etex, Paris

Recevez des exclus !

Search