Cette thèse vise à proposer un modèle théorique et une méthodologie permettant d’effectuer des analyses linguistiques fines des textes, permettant de rendre compte des éléments utiles des courriers à savoir : le motif/objet du courrier, l’émetteur et le destinataire du courrier. L’approche doit permettre un traitement efficace des verrous technologiques du TAL, et spécialement le problème du figement et plus particulièrement des séquences verbales figées. Il s’agit d’un phénomène extrêmement fréquent dans toutes les langues, présenté comme une des sources de difficultés majeures pour la recherche d’information et la veille dans les documents dits non structurés. La thèse comprendra une partie applicative démontrant l’efficacité de la théorie proposee, et aboutissant à un système de traitement automatique des courriers. Par ailleurs, la démarche méthodologique aboutissant aux ressources linguistiques doit permettre de définir un outil d’apprentissage automatique de ces ressources qui pourra ainsi être appliqué à de nouveaux types de documents. / The aim of this thesis is to propose a theoretic model and a methodology to make fine linguistic text analysis. That can represent elements useful in mails like: message purposes, message addressee or sender. This approach must permit an efficient processing of NLP technology issues, especially in the fixity problematic and mainly on fixed verbal sequences. This phenomenon is extremely recurrent in all languages. It is introduced as a main issue for information retrieval in unstructured documents. This thesis will include an applicative part showing the relevance of the proposed theory and to make a system to automatically process mails. Moreover, the methodology which creating linguistically resources must permit to define an automatic learning resources tool which can be applied on new kind of documents.
Identifer | oai:union.ndltd.org:theses.fr/2013PA131034 |
Date | 18 December 2013 |
Creators | Joseph, Aurélie |
Contributors | Paris 13, Mejri, Salah, Cartier, Emmanuel |
Source Sets | Dépôt national des thèses électroniques françaises |
Language | French |
Detected Language | French |
Type | Electronic Thesis or Dissertation, Text |
Page generated in 0.0082 seconds