- Le système GBGEN est un générateur automatique de phrases pour le
français, réalisé conjointement par Thomas WEHRLE et Thierry ETCHEGOYHEN, et
Juri MENGON.
Nous tenons à remercier particulièrement Sujiva Pinnagoda, ancienne
collaboratrice du LATL, qui a travaillé sur une première version du prototype,
ainsi que Scott Ferguson et Eric Wehrli pour leurs conseils avisés et leur
aide amicale.
- Le système est basé sur une grammaire chomskyenne standard, de type GB.
L'input du générateur est une structure pseudo-sémantique, regroupant les
informations nécessaire à la génération, telles que le verbe thématique, ses
arguments et modifieurs, la représentation abstraite du temps, etc. Sur la base
de ces informations, le système produit des structures syntaxiques bien
formées. Les principes de la théorie linguistique, qui garantissent la
dérivation d'une phrase bien formée, sont remplacés par des algorithmes
déterministes, afin de garantir une grande efficacité au système. [De plus
amples informations seront présentées ici-même sous peu]
- Comme tous les programmes développés au LATL, le système est écrit en
Modula-2, et tourne sur un
système Dec-Alpha
, sous
OpenVMS.
- Si vous souhaitez avoir une présentation succinte et générale du générateur
syntaxique, vous pouvez cliquer sur GBGEN
LE SYSTEME
Le système GBGen est utilisé dans plusieurs applications différentes. Pour
permettre à chacun de tester le générateur, nous avons choisi de placer sur le
web l'une des applications qui nous permet de tester le système. En deux mots,
il s'agit d'un traducteur francais-francais. Pour chaque phrase, vous
obtiendrez (dans le cas optimal bien entendu) :
- Une structure produite par l'analyseur
FIPS
- Une représentation pseudo-sémantique dérivée de la structure FIPS.
- Une structure syntaxique profonde (D-structure) produite sur la base des
informations pseudo-sémantiques.
- Une S-structure dérivée de la D-structure par application d'algorithmes de
déplacement d'éléments.
- Une structure finale, après application de mécanismes morphologiques
(accords, contractions, etc.) sur la S-structure.
Il y a plusieurs raisons au choix d'une telle application comme outil de test
pour le générateur: i) les différences entre l'input et l'output sont
immédiates, et ii) les problèmes de traduction n'interviennent pas.
Il est à noter que le système en démonstration ne montre pas toutes
les possibilités du générateur. En effet, il a été nécessaire de développer
des procédures de transfert pour créer les structures pseudo-sémantiques à
partir des structures fournies par l'analyseur FIPS, et ceci n'a pas été fait
pour toutes les constructions syntaxiques traitées par GBGen. Toutefois, le
système FIPS-GBGen permet de montrer les constructions principales traitées
par GBGen.
AVERTISSEMENTS
- Le système en démonstration sur le WEB est perpétuellement remis à jour.
Il peut donc y avoir une certaine fluctuation dans les
performances du générateur lorsque des modifications et/ou des opérations de
maintenance sont en cours. N'hésitez pas à essayer le système plusieurs fois
à quelques minutes d'intervalle...
- Le module de test à partir d'IPS présenté ici ne peut fonctionner que si
les phrases entrées sont analysables par IPS. Vérifiez l'analyse si le
générateur rencontre un problème: si l'analyse est incorrecte, la génération
pourra ne pas se faire.
- Un certain nombre de constructions ne sont pas encore traitées (cf.
ci-dessous la liste des constructions traitées). Le système ne produira donc pas
de phrases si vous entrez une phrase contenant notamment:
- Des constructions clivées
- Certains groupes nominaux partitifs (e.g. "tous les enfants")
- Eventuellement d'autres types de constructions (à vous de voir...).
TESTS
Le système traite, à l'heure actuelle, les constructions suivantes:
- Phrases simples et phrases incluant des complétives
- Constructions passives.
- Constructions inaccusatives (mettant en jeu les verbes de type
"venir, arriver, etc")
- Constructions à montée (e.g., Jean/i semble t/i dormir)
- Constructions à contrôle (e.g., Jean demande à [ses enfants]/i de
PRO/i dormir)
- Constructions interrogatives (y compris les interrogatives enchâssées)
- Cas de coordination.
- Ajouts prépositionnels et phrases circonstancielles.
- Groupes nominaux complexes (avec compléments du nom,
relatives, etc.).
- Adjectifs et adverbes.
- Pronoms (clitiques ou non).
- Si vous désirez voir une démonstration à partir de phrases-test,
reprenant les constructions ci-dessus, cliquez
ICI.
- Si vous souhaitez essayer vous propres phrases, cliquez
ICI.
dernière modification: juillet 1999, webmaster