Le travail effectué au cours de ma thèse s’inscrit dans le cadre du Web Sémantique pour rendre l’annotation sémantique. La vision du Web Sémantique a pour son objectif d’avoir les informations disponibles pour que les utilisateurs puissent les exploiter selon leurs besoins. En effet, dans les systèmes d’information actuels, dont la complexité se traduit par un volume important de données, le défi n’est plus de réunir des données, mais d’en extraire des informations pertinentes. Pour cela, les données doivent être étiquetées sémantiquement. En plus, comparé aux langues flexionnelles comme le Français, la technologie dans le traitement de langue agglutinative comme le Coréen a toujours des manques à cause de la complexité des morphologies et syntaxe. / We present an automatic semantic annotation system for Korean on the EXCOM (EXploration COntextual for Multilingual) platform. The purpose of natural language processing is enabling computers to understand human language, so that they can perform more sophisticated tasks. Accordingly, current research concentrates more and more on extracting semantic information. The realization of semantic processing requires the widespread annotation of documents. However, compared to that of inflectional languages, the technology in agglutinative language processing such as Korean still has shortcomings. EXCOM identifies semantic information in Korean text using our new method, the Contextual Exploration Method. Our system properly annotates approximately 90% of standard Korean sentences, and this annotation rate holds across text domains.
Identifer | oai:union.ndltd.org:theses.fr/2009PA040119 |
Date | 09 July 2009 |
Creators | Chai, Hyunzoo |
Contributors | Paris 4, Desclès, Jean-Pierre |
Source Sets | Dépôt national des thèses électroniques françaises |
Language | French |
Detected Language | French |
Type | Electronic Thesis or Dissertation, Text |
Page generated in 0.0016 seconds