Return to search

MICO : La notion de construction située pour un modèle d'interprétation et de traitement de la référence pour le dialogue finalisé

La question de la résolution de la référence est d'une importance majeure lorsque l'on souhaite s'intéresser à la généricité dans les systèmes de dialogue. En effet, s'il est relativement aisé de résoudre une référence à un objet du contexte lorsque ce dernier est limité à quelques types d'objets connus, le problème est beaucoup moins trivial si l'on souhaite pouvoir étendre la gestion des références à des situations moins contraintes, ce qui est le cas pour les agents assistants d'interface, qui peuvent être vus comme des systèmes de dialogue dont l'objectif est de pouvoir s'adapter facilement à plusieurs tâches distinctes. Des ambiguïtés pragmatiques peuvent apparaître, des catégories différentes moins bien « coller » avec des mots indépendants, ou bien des caractères être communs à plusieurs objets, et ne plus être discriminants. Dans les systèmes de dialogue simples, la solution consiste à définir des modules de résolution spécialisés en fonction du domaine et de la tâche de dialogue visée, ce qui brise la généricité du système.<br /><br />Sans aller jusqu'à traiter le problème de la référence dans le cadre général du dialogue non contraint, nous avons cherché à donner un cadre le plus générique possible à la résolution de la référence dans le cas des agents assistants d'interface. En effet, si on l'envisage dans son sens le plus large, la question de la référence ouvre un vaste champ d'étude, et ce dans de nombreuses disciplines comme la psychologie, la linguistique ou la philosophie. En informatique linguistique, même en mettant de côté les aspects anaphoriques, il reste encore un vaste choix de problématiques ouvertes à la réflexion. Les phénomènes tels que la métaphore et ses affiliés comme la métonymie ou la méronymie, la génération d'expressions référentielles ou la résolution de l'ancrage des expressions référentielles dans une représentation formelle (c'est-à-dire la résolution des entités codées informatiquement qui sont désignées dans un énoncé), n'ont jusqu'à présent que des solutions partielles ou ad hoc.<br /><br />Nous avons cherché à donner un cadre systématique au processus d'ancrage référentiel en situation de dialogue, en nous intéressant à l'environnement partagé par l'utilisateur et l'assistant, c'est-à-dire les connaissances et les perceptions que l'utilisateur considère comme accessible à son interlocuteur virtuel. Les travaux que nous avons menés dans cette direction nous ont conduit à adopter certains principes « philosophiques » qui, sans révolutionner radicalement en surface les modèles utilisés pour traiter la langue, influencent profondément les choix que nous pouvons faire dans la conception et la mise en oeuvre du processus d'interprétation. Partant de ces principes, nous avons souhaité établir une architecture d'interprétation à la fois simple et complète, afin d'intégrer les résultats que nous avons obtenu sur la référence avec un modèle d'interprétation global.<br /><br />Pour cela nous avons étudié les théories et approches ayant été proposées autour de cette problématique. Nous avons ainsi constaté les nombreux parallèles entre les systèmes de production de Newell [1972], qui permettent de modéliser une partie des processus cognitifs, et les constructions de Fillmore et Kay [1995], qui permettent de décrire les relations entre formes syntaxiques et représentations sémantiques. Ceci nous a guidé vers la réalisation d'un modèle regroupant leurs caractéristiques principales.<br /><br />Il manquait cependant à ces théories la capacité de traiter des structures ayant des caractéristiques topologiques non triviales, comme les représentations servant à un raisonnement temporel, qui sont pourtant nécessaires dans de nombreux modèles de raisonnement, ainsi que pour la résolution de la référence. Le modèle d'interprétation constructionnelle (MIC) que nous avons conçu pour répondre à ce besoin est un modèle d'interprétation pour le dialogue finalisé, où les différentes entrées du système de dialogue, qu'elles soient textuelles, visuelles ou autre sont traitées de manière homogène au moyen d'une opération unique : les constructions situées, une forme évoluée des constructions issues des travaux de Fillmore.<br /><br />Nous avons introduit la notion de construction située (aussi appelée s-construction) afin de pouvoir prendre en compte le fait que l'information traitée par le système de dialogue, décrite et structurée par des schémas de la sémantique des frames, peut être organisée à un niveau supérieur, y compris dans des structures dotées d'une topologie. La topologie qui organise les informations que contiennent ces structures peut être modélisée par des logiques particulières, qui permettent de décrire un système de contraintes. Par exemple, la logique de Allen [1983] pour la modélisation temporelle des événements peut être utilisée pour structurer les schémas représentant les événements. Les relations ainsi décrites peuvent être utilisées ensuite pour résoudre certaines références temporelles : l'expression « avant cela » désignant le segment temporel précédant l'événement désigné par « cela ». Ainsi, dans les s-constructions, les contraintes sur l'organisation de l'information (i.e. sur les conteneurs) peuvent être décrites tout autant que les contraintes sur le contenu de l'information. Dans notre modèle, l'interface permettant de décrire la logique qui supporte les caractéristiques topologiques d'un certain conteneur est nommée contexte, le modèle logique proprement dit n'est pas décrit dans le modèle, mais laissé à la charge d'un système externe.<br /><br />La mise en oeuvre du modèle d'interprétation constructionnelle, MICO, est inspirée par les travaux de Bryant sur l'implémentation d'une grammaire de construction grâce à une méthode d'analyse par tronçon (chunk parsing) et des travaux de Engel [2002] sur l'analyse linguistique par systèmes de production utilisée dans le projet SmartKom. Pour cette implémentation, nous introduisons la notion d'observateur, qui est l'équivalent opérationnel des S-Constructions. Un observateur est capable de reconnaître certaines formes dans les instances de contextes et peut produire une nouvelle information dans une instance de contexte si cette forme est reconnue.<br /><br />La faisabilité d'une interprétation basée sur ce modèle n'est pas évidente, car la grammaire décrite par les s-constructions est une grammaire contextuelle, et donc indécidable. Afin de rendre l'exécution des observateurs possible, nous adjoignons deux mécanismes pour guider le parcours du graphe d'interprétation. Le premier mécanisme utilise une information de pondération sur la probabilité de déclenchement a priori permettant d'ordonnancer plus efficacement l'exécution des observateurs. Cette pondération peut être soit calculée manuellement, soit déterminée automatiquement grâce à un algorithme d'apprentissage. Le second mécanisme est une généralisation du principe de restriction de sélection, généralisation rendue possible du fait que les informations manipulées dans notre modèle sont structurées. L'idée est d'augmenter la probabilité de déclenchement des observateurs capables de produire l'information attendue par un certain observateur, qui ne dispose que d'une partie de son motif de déclenchement.<br /><br />Le fait que les informations soient structurées topologiquement et dans des contextes distincts permet de spécifier qu'une certaine information est attendue dans une certaine zone (une zone étant l'ensemble des lieux qui respectent certaines contraintes, relativement à un contexte donné), et donc de décider assez rapidement si un observateur particulier a des chances de produire l'information attendue à l'endroit prévu. Ce mécanisme permet aussi de décrire la coercition à la demande, en spécifiant qu'un observateur ne peut être déclenché que si sa production est attendue. Enfin, en couplant ce mécanisme avec une approche de satisfaction partielle de contraintes pour décrire les motifs de déclenchement des observateurs, on assure au système d'interprétation une certaine robustesse.<br /><br />Afin de montrer que le modèle d'interprétation constructionnelle peut être utilisé pour traiter des phénomènes complexes, nous avons conçu un modèle de résolution extensionnelle de la référence capable de traiter des prédicats vagues, et qui utilise un version continue des domaines de référence [Corblin, 1987 ; Reboul, 1997 ; Salmon-Alt, 2001]. Dans ce cadre, nous soulevons plusieurs questions sur la pertinence de l'utilisation d'une représentation propositionnelle des entités pour l'analyse linguistique. Nous montrons que la prise en compte du contexte dans l'analyse des expressions référentielles induit l'existence de plusieurs interprétations possibles pour un même prédicat référentiel appliqué à un même type d'objet. Nous proposons qu'une représentation possible d'un des rôles de prédicat puisse être basée sur des fonctions agissant dans des domaines de références. Ayant constaté l'adéquation de ce modèle aux besoins des systèmes d'interprétation des agents conversationnels, nous montrons comment l'adapter au modèle d'interprétation unifié que nous avons conçu. <br /><br />Nous exposons nos travaux en trois parties. Dans la première partie, nous présentons le Modèle d'Interprétation Constructionnelle (MIC), après avoir argumenté en faveur d'une approche unifiée et fondée sur le principe de constructions. Dans la deuxième partie, nous présentons un modèle fonctionnel pour la résolution extensionnelle de la référence dans le cadre d'une interaction avec un support visuel, et nous décrivons la mise en oeuvre de ce modèle en utilisant le MIC. Dans la dernière partie, nous spécifions les caractéristiques du modèle d'interprétation constructionnelle par observateur (MICO), une réalisation possible du MIC structurée autour de la notion d'observateur, et nous présentons aussi le système InterViews [Sansonnet, 2003], qui a été à l'origine de nos travaux.

Identiferoai:union.ndltd.org:CCSD/oai:tel.archives-ouvertes.fr:tel-00084206
Date17 September 2004
CreatorsPitel, Guillaume
PublisherUniversité Paris Sud - Paris XI
Source SetsCCSD theses-EN-ligne, France
LanguageFrench
Detected LanguageFrench
TypePhD thesis

Page generated in 0.0036 seconds