Return to search

Etude de la fonction argumentale dans la perspective de l'acquisition automatique du vocabulaire / Study of the argument function in the perspective of the automatic acquisition of the vocabulary

L’objectif de cette thèse est d’étudier la fonction argumentale afin d’élaborer une méthode pour l’acquisition automatique des termes d’une manière pertinente et efficace. Nous avons d’abord discuté du profilage du corpus et de la constitution du corpus web pour le traitement automatique des langues. Ensuite, trois méthodes ont été développées en nous fondant sur les caractéristiques morphologiques des unités lexicales et la relation d’appropriation entre les prédicats appropriés et leurs arguments. La méthode distributionnelle a pour objet d’exploiter les structures prédicat-argument pour repérer les arguments de la classe sémantique donnée. La méthode morphosémantique est développée en se fondant sur les structures internes des unités lexicales en vue d’étendre la liste de termes. La méthode combinatoire qui associe les deux premières approches permet d’améliorer la pertinence du résultat. Finalement, nous avons développé une réflexion sur la particularité de la langue, la classe sémantique, la langue de spécialité et la récursivité de la langue dans la perspective du traitement automatique des langues. / This thesis aims to study the argumental function for finding an efficient method to automatically acquire the terms. We start with a discussion on the problematic of the corpus which is: what kind of corpus should we choose and how should we construct the web corpus. Then, three methods are developed which are based on the morphological characteristics of lexical units and the relation between the appropriate predicates and their arguments. The distributional method tries to exploit the predicate-argument structures for identifying the arguments of the given semantic class. The morph-semantic method is developed on the basis of the morphological characteristics of the lexical units in order to extend the list of terms. The mixed method which combines the two precedent approaches permit to improve the result. Finally, we try to develop a statement on the natural language character, on the semantic class, on the specialized language and on the recursive nature of language in the perspective of natural language processing.

Identiferoai:union.ndltd.org:theses.fr/2016USPCD042
Date10 June 2016
CreatorsHu, Xiaoqin
ContributorsSorbonne Paris Cité, Buvet, Pierre-André
Source SetsDépôt national des thèses électroniques françaises
LanguageFrench
Detected LanguageFrench
TypeElectronic Thesis or Dissertation, Text

Page generated in 0.0019 seconds