• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 1
  • Tagged with
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
1

Etude de la fonction argumentale dans la perspective de l'acquisition automatique du vocabulaire / Study of the argument function in the perspective of the automatic acquisition of the vocabulary

Hu, Xiaoqin 10 June 2016 (has links)
L’objectif de cette thèse est d’étudier la fonction argumentale afin d’élaborer une méthode pour l’acquisition automatique des termes d’une manière pertinente et efficace. Nous avons d’abord discuté du profilage du corpus et de la constitution du corpus web pour le traitement automatique des langues. Ensuite, trois méthodes ont été développées en nous fondant sur les caractéristiques morphologiques des unités lexicales et la relation d’appropriation entre les prédicats appropriés et leurs arguments. La méthode distributionnelle a pour objet d’exploiter les structures prédicat-argument pour repérer les arguments de la classe sémantique donnée. La méthode morphosémantique est développée en se fondant sur les structures internes des unités lexicales en vue d’étendre la liste de termes. La méthode combinatoire qui associe les deux premières approches permet d’améliorer la pertinence du résultat. Finalement, nous avons développé une réflexion sur la particularité de la langue, la classe sémantique, la langue de spécialité et la récursivité de la langue dans la perspective du traitement automatique des langues. / This thesis aims to study the argumental function for finding an efficient method to automatically acquire the terms. We start with a discussion on the problematic of the corpus which is: what kind of corpus should we choose and how should we construct the web corpus. Then, three methods are developed which are based on the morphological characteristics of lexical units and the relation between the appropriate predicates and their arguments. The distributional method tries to exploit the predicate-argument structures for identifying the arguments of the given semantic class. The morph-semantic method is developed on the basis of the morphological characteristics of the lexical units in order to extend the list of terms. The mixed method which combines the two precedent approaches permit to improve the result. Finally, we try to develop a statement on the natural language character, on the semantic class, on the specialized language and on the recursive nature of language in the perspective of natural language processing.

Page generated in 0.1495 seconds