Cette thèse concerne l'étude de différentes techniques modernes de génie logiciel qui peuvent être mises en ¦uvre pour développer des systèmes de Traitement Automatique des Langues Naturelles de façon générique et extensible. La première partie fait le point sur l'état de l'art en TALN à propos des Langages Spécialisés pour la Programmation Linguistique et permet d'identifier l'intégrabilité, l'extensibilité et la généricité comme trois qualités qu'il est souhaitable de fournir aux systèmes de TALN. La définition d'un modèle à objets (LEAF) et l'affinage d'un modèle d'architecture (tableau blanc) constituent deux premiers éléments de réponse au problème de l'intégration. Une première approche de la généricité et de l'extensibilité est également présentée avec une expérience de réingéniérie du langage LT. La seconde partie approfondit les problèmes de généricité et les illustre avec la définition d'un langage original de représentation linguistique (DECOR). L'introduction de protocoles internes et externes permet de rendre ce langage particulièrement générique et dynamique. La troisième partie fait état de la réingériérie de deux langages spécialisés (ATEF et ROBRA). Cette expérience permet d'introduire une grande extensibilité dans les moteurs de ces langages par une programmation par objets et protocoles. Une question transverse à ces trois parties concerne l'identification des limites et des écueils liés à la recherche de l'intégrabilité, de l'extensibilité et de la généricité. Ces difficultés viennent principalement de la complexité croissante des protocoles adéquats, dont la maîtrise pourrait rapidement échapper au développeur si l'on n'y prend garde.
Identifer | oai:union.ndltd.org:CCSD/oai:tel.archives-ouvertes.fr:tel-00005104 |
Date | 01 December 1994 |
Creators | Lafourcade, Mathieu |
Source Sets | CCSD theses-EN-ligne, France |
Language | fra |
Detected Language | French |
Type | PhD thesis |
Page generated in 0.0015 seconds