Spelling suggestions: "subject:"terminological resource"" "subject:"therminological resource""
1 |
Construction et évolution d'une ressource termino-ontologique dédiée à la représentation de relations n-aires / Construction and evolution of an Ontological and Terminological Resource dedicated to the representation of n-ary relationsTouhami, Rim 05 September 2014 (has links)
Les ontologies sont devenues incontournables pour définir des vocabulaires standardisés ainsi qu'une représentation partagée d'un domaine d'intérêt. La notion de Ressource Termino-Ontologique (RTO) permet d'associer une partie terminologique et/ou linguistique aux ontologies afin d'établir une distinction claire entre la manifestation linguistique (le terme) et la notion qu'elle dénote (le concept). Les RTOs sont actuellement au cœur de nombreuses méthodes, outils et applications de l'Ingénierie des Connaissances (IC), discipline de l'Intelligence Artificielle permettant en particulier de développer des méthodes et des outils de capitalisation de connaissances.L'objectif de cette thèse, qui s'inscrit dans les problématiques de l'IC, est de capitaliser des données expérimentales issues de documents textuels (articles scientifiques, rapports de projet, etc.) afin de pouvoir les réutiliser dans des outils d'aide à la décision. Nous avons d'abord défini la notion de relation n-aire permettant de relier plusieurs arguments et l'avons modélisée dans une nouvelle RTO, baptisée naRyQ. Cette notion de relation n-aire nous a permis de modéliser des mesures expérimentales (e.g. diffusivité de l'oxygène dans un aliment, perméabilité à l'oxygène d'un emballage, broyage d'une biomasse, etc.) réalisées sur différents objets d'études (produit alimentaire, emballage, procédé de transformation, etc.). Afin d'implémenter la plateforme de capitalisation, nommée @Web, nous avons modélisé la RTO naRyQ en OWL/SKOS et défini l'ensemble des contraintes de cohérence qu'elle doit respecter. Enfin, une RTO étant amenée à évoluer pour répondre aux besoins de changement, nous avons proposé une méthode de gestion de l'évolution de cette RTO qui permet de maintenir sa cohérence de manière préventive. Cette méthode est implémentée dans le plug-in Protégé, nommé DynarOnto. / This PhD thesis in Artificial Intelligence deals with knowledge engineering. Ontology, which can be defined as a controlled vocabulary allowing a community to share a common representation of a given area, is one of the key elements of knowledge engineering. Our framework is the capitalization of experimental data extracted from scientific documents (scientific articles, project reports, etc.), in order to feed decision support systems. The capitalization is guided by an ontological and terminological resource (OTR). An OTR associates an ontology with a terminological and/or a linguistic part in order to establish a clear distinction between the term and the notion it denotes (the concept). Experimental data can be represented by n-ary relations linking arguments of the experimentation, i.e. experimental measurements (e.g. oxygen diffusivity in food, oxygen permeability in packaging, biomass grinding, etc.), with studied objects (food, packaging, transformation process, etc.). We have defined the n-ary relation concept and a nary Relation between Quantitative experimental data OTR, called naRyQ. Our modeling relies on OWL2-DL and SKOS, W3C languages. Moreover, we have studied the evolution of such an OTR, extending the existing works taking into account i) the specificity of our OTR which deals with interdependent concepts and ii) its language representation. For that, we have proposed a preventive ontology evolution methodology defining elementary and composed changes based on a set of consistency constraints defined for our naRyQ OTR. Our contributions are implemented in two systems : our naRyQ OTR is nowadays the core of the existing capitalization system @Web and our evolution method is implemented in a Protégé plug-in called DynarOnto.
|
2 |
Frame semantics for the field of climate change : d iscovering frames based on chinese and english termsZheng, Ying 12 1900 (has links)
La plupart des dictionnaires spécialisés de termes environnementaux en mandarin sont des dictionnaires papier, compilés et révisés il y a plus de dix ans, et contiennent principalement des termes nominaux. Les informations terminologiques se limitent aux connaissances véhiculées par le terme et son ou ses équivalents anglais. Pour les lecteurs qui souhaitent connaître les propriétés sémantiques ou syntaxiques des termes et pour les lecteurs qui veulent voir l’usage des termes dans des contextes réels de textes spécialisés, les informations fournies par les dictionnaires existants sont insuffisantes. Dans cette recherche, nous avons compilé une ressource terminologique en ligne du mandarin, décrivant les termes verbaux chinois dans le domaine du changement climatique. Cette ressource comble certaines des lacunes des dictionnaires environnementaux mandarin existants, en révélant le(s) sens du terme à travers la(les) structure(s) actantielle(s) et en montrant, à travers des contextes annotés, les propriétés sémantiques et syntaxiques du terme ainsi que ses usages pratiques dans des textes spécialisés. Cette ressource répondra mieux aux besoins du public.
La base théorique qui sous-tend cette recherche est la Sémantique des cadres (Fillmore, 1976, 1977, 1982, 1985; Fillmore & Atkins, 1992), et le FrameNet construit à partir de celle-ci. L’objectif principal de cette recherche est de découvrir et de définir des cadres sémantiques chinois dans le domaine du changement climatique, et d’établir des relations entre les cadres chinois définis. Les cadres sémantiques chinois sont découverts à l’aide de la méthodologie du dictionnaire environnemental multilingue DiCoEnviro (et de sa ressource d’accompagnement Framed DiCoEnviro) (L’Homme, 2018; L’Homme et al., 2020). Afin de rendre cette méthodologie applicable à une langue sino-tibétaine, le chinois, nous avons modifié et adapté cette méthodologie pour qu’elle convienne à la description des termes chinois et à la définition des cadres sémantiques chinois. Certaines de ces modifications et adaptations sont basées sur le Chinese FrameNet (CFN) (Liu & You, 2015).
Afin de découvrir les cadres sémantiques chinois, un corpus monolingue en chinois mandarin sur le changement climatique (MCCC) a d’abord été compilé. Ce corpus contient 224 textes
iv
authentiques chinois spécialisés dans le domaine du changement climatique, qui totalisent 1,228,333 caractères chinois, soit 547,592 mots chinois. Puis, les termes candidats ont été automatiquement extraits du MCCC à l’aide du logiciel de gestion et d’analyse de corpus – Sketch Engine. Après une analyse et une validation manuelle, nous avons déterminé quels termes candidats sont des termes réels. Par la suite, la structure actancielle de chaque terme a été écrite en analysant les contextes où le terme apparaît. Ensuite, chaque sens d’un terme polysémique a été placé dans une entrée séparée et 16-20 contextes ont été sélectionnés pour chaque entrée. Puis, chaque contexte a été annoté en fonction de trois couches – structure sémantique, fonction syntaxique et groupe syntaxique. Ensuite, les termes ont été classés en fonction des scénarios qu’ils évoquent. Les termes qui dépeignent la même scène ou situation dans le domaine du changement climatique, qui ont une structure actantielle similaire et qui partagent la majorité des circonstants sont classés dans un seul cadre sémantique (critères basés sur le projet DiCoEnviro (L’Homme, 2018; L’Homme et al., 2020)). Après avoir identifié les cadres sémantiques chinois, chaque cadre a été défini. Enfin, les cadres chinois découverts ont été reliés selon les huit types de relations entre cadres proposés par Ruppenhofer et al. (2016). Pour être affichés en ligne, les entrées de termes et les cadres sémantiques ont été encodés dans des fichiers XML.
Guidés par cette méthodologie de recherche, nous avons finalement relevé 23 cadres sémantiques chinois et nous les avons définis. Le résultat final de cette recherche est une ressource terminologique en chinois mandarin basée sur des cadres et spécialisée dans le domaine du changement climatique. Cette ressource terminologique se compose de deux parties. La première partie est la description d’un total de 39 termes verbaux chinois. Chaque sens d’un terme verbal polysémique étant placé dans une entrée séparée, il y a au total 59 entrées (chaque entrée contient la structure actantielle et les contextes annotés). Au total, 1,027 contextes ont été annotés. La deuxième partie de cette ressource présente les 23 cadres sémantiques chinois identifiés ainsi que les relations entre les cadres. / Most of the existing Mandarin Chinese specialised dictionaries of environmental terms are paper dictionaries, compiled and revised more than ten years ago, and contain mainly noun terms. Terminological information is restricted to knowledge conveyed by the term and its English equivalent(s). For readers who want to learn about semantic or syntactic properties of terms and for readers who want to see usage of terms in real contexts of specialised texts, information provided in existing dictionaries is insufficient. In this research, we compiled an online Mandarin Chinese terminological resource, describing Chinese verb terms in the field of climate change. This resource makes up for some of the deficiencies of existing Chinese environmental dictionaries, revealing meaning(s) of the term through actantial structure(s) and showing, through annotated contexts, semantic and syntactic properties of the term as well as its practical usages in specialised texts. This resource better meets the needs of the audience.
The theoretical basis underpinning this research is Frame Semantics (Fillmore, 1976, 1977, 1982, 1985; Fillmore & Atkins, 1992), and the FrameNet built from it. The main objective of this research is to discover and define Chinese semantic frames in the field of climate change, and to establish relations between the Chinese frames defined. The Chinese semantic frames are discovered with the help of the methodology of the multilingual environmental dictionary DiCoEnviro (and its accompanying resource Framed DiCoEnviro) (L’Homme, 2018; L’Homme et al., 2020). In order to make this methodology applicable to a Sino-Tibetan language, Chinese, we modified and adapted this methodology to suit the description of Chinese terms and definition of Chinese semantic frames. Some of the changes and adaptations are based on the Chinese FrameNet (CFN) (Liu & You, 2015).
In order to discover Chinese semantic frames, a monolingual Mandarin (Chinese) Climate Change Corpus (MCCC) was first compiled. This corpus contains 224 authentic Chinese specialised texts in the field of climate change, totaling 1,228,333 Chinese characters, which is 547,592 Chinese words. Following this, candidate terms were automatically extracted from MCCC using the corpus
ii
management and analysing software – Sketch Engine. After manual analysis and validation, which of the candidate terms are true terms was clarified. Subsequently, the actantial structure of each term was written by analysing the contexts where the term occurs. Next, each sense of a polysemous term was placed in a separate entry and 16-20 contexts were selected for each entry. Then, each context was annotated in terms of three layers – semantic structure, syntactic function and syntactic group. After this, the terms were classified according to the scenarios they evoke. Terms that depict the same scene or situation in the field of climate change, have similar actantial structure, and share the majority of circumstants are categorised into one semantic frame (criteria based on the project DiCoEnviro (L’Homme, 2018; L’Homme et al., 2020)). After Chinese semantic frames were identified, each frame was defined. Finally, the discovered Chinese frames were linked according to the eight types of frame relations proposed by Ruppenhofer et al. (2016). To be displayed online, term entries and semantic frames were encoded in XML files.
Guided by this research methodology, we eventually discovered and defined 23 Chinese semantic frames. The end result of this research is a frame-based Mandarin Chinese terminological resource specialised in the field of climate change. This terminological resource consists of two parts. The first part is the description of a total of 39 Chinese verb terms. With each meaning of a polysemous verb term placed in a separate entry, there are a total of 59 entries (each entry contains the actantial structure and annotated contexts). A total of 1,027 contexts were annotated. The second part of this resource presents the 23 Chinese semantic frames identified as well as the relations between frames.
|
Page generated in 0.0926 seconds