• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 2
  • Tagged with
  • 2
  • 2
  • 2
  • 2
  • 2
  • 2
  • 2
  • 2
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
1

Construction et évolution d'une ressource termino-ontologique dédiée à la représentation de relations n-aires / Construction and evolution of an Ontological and Terminological Resource dedicated to the representation of n-ary relations

Touhami, Rim 05 September 2014 (has links)
Les ontologies sont devenues incontournables pour définir des vocabulaires standardisés ainsi qu'une représentation partagée d'un domaine d'intérêt. La notion de Ressource Termino-Ontologique (RTO) permet d'associer une partie terminologique et/ou linguistique aux ontologies afin d'établir une distinction claire entre la manifestation linguistique (le terme) et la notion qu'elle dénote (le concept). Les RTOs sont actuellement au cœur de nombreuses méthodes, outils et applications de l'Ingénierie des Connaissances (IC), discipline de l'Intelligence Artificielle permettant en particulier de développer des méthodes et des outils de capitalisation de connaissances.L'objectif de cette thèse, qui s'inscrit dans les problématiques de l'IC, est de capitaliser des données expérimentales issues de documents textuels (articles scientifiques, rapports de projet, etc.) afin de pouvoir les réutiliser dans des outils d'aide à la décision. Nous avons d'abord défini la notion de relation n-aire permettant de relier plusieurs arguments et l'avons modélisée dans une nouvelle RTO, baptisée naRyQ. Cette notion de relation n-aire nous a permis de modéliser des mesures expérimentales (e.g. diffusivité de l'oxygène dans un aliment, perméabilité à l'oxygène d'un emballage, broyage d'une biomasse, etc.) réalisées sur différents objets d'études (produit alimentaire, emballage, procédé de transformation, etc.). Afin d'implémenter la plateforme de capitalisation, nommée @Web, nous avons modélisé la RTO naRyQ en OWL/SKOS et défini l'ensemble des contraintes de cohérence qu'elle doit respecter. Enfin, une RTO étant amenée à évoluer pour répondre aux besoins de changement, nous avons proposé une méthode de gestion de l'évolution de cette RTO qui permet de maintenir sa cohérence de manière préventive. Cette méthode est implémentée dans le plug-in Protégé, nommé DynarOnto. / This PhD thesis in Artificial Intelligence deals with knowledge engineering. Ontology, which can be defined as a controlled vocabulary allowing a community to share a common representation of a given area, is one of the key elements of knowledge engineering. Our framework is the capitalization of experimental data extracted from scientific documents (scientific articles, project reports, etc.), in order to feed decision support systems. The capitalization is guided by an ontological and terminological resource (OTR). An OTR associates an ontology with a terminological and/or a linguistic part in order to establish a clear distinction between the term and the notion it denotes (the concept). Experimental data can be represented by n-ary relations linking arguments of the experimentation, i.e. experimental measurements (e.g. oxygen diffusivity in food, oxygen permeability in packaging, biomass grinding, etc.), with studied objects (food, packaging, transformation process, etc.). We have defined the n-ary relation concept and a nary Relation between Quantitative experimental data OTR, called naRyQ. Our modeling relies on OWL2-DL and SKOS, W3C languages. Moreover, we have studied the evolution of such an OTR, extending the existing works taking into account i) the specificity of our OTR which deals with interdependent concepts and ii) its language representation. For that, we have proposed a preventive ontology evolution methodology defining elementary and composed changes based on a set of consistency constraints defined for our naRyQ OTR. Our contributions are implemented in two systems : our naRyQ OTR is nowadays the core of the existing capitalization system @Web and our evolution method is implemented in a Protégé plug-in called DynarOnto.
2

Extraction d'arguments de relations n-aires dans les textes guidée par une RTO de domaine / Extraction of arguments in N-ary relations in texts guided by a domain OTR

Berrahou, Soumia Lilia 29 September 2015 (has links)
Aujourd'hui, la communauté scientifique a l'opportunité de partager des connaissances et d'accéder à de nouvelles informations à travers les documents publiés et stockés dans les bases en ligne du web. Dans ce contexte, la valorisation des données disponibles reste un défi majeur pour permettre aux experts de les réutiliser et les analyser afin de produire de la connaissance du domaine. Pour être valorisées, les données pertinentes doivent être extraites des documents puis structurées. Nos travaux s'inscrivent dans la problématique de la capitalisation des données expérimentales issues des articles scientifiques, sélectionnés dans des bases en ligne, afin de les réutiliser dans des outils d'aide à la décision. Les mesures expérimentales (par exemple, la perméabilité à l'oxygène d'un emballage ou le broyage d'une biomasse) réalisées sur différents objets d'études (par exemple, emballage ou procédé de bioraffinerie) sont représentées sous forme de relations n-aires dans une Ressource Termino-Ontologique (RTO). La RTO est modélisée pour représenter les relations n-aires en associant une partie terminologique et/ou linguistique aux ontologies afin d'établir une distinction claire entre la manifestation linguistique (le terme) et la notion qu'elle dénote (le concept). La thèse a pour objectif de proposer une contribution méthodologique d'extraction automatique ou semi-automatique d'arguments de relations n-aires provenant de documents textuels afin de peupler la RTO avec de nouvelles instances. Les méthodologies proposées exploitent et adaptent conjointement des approches de Traitement automatique de la Langue (TAL) et de fouille de données, le tout s'appuyant sur le support sémantique apporté par la RTO de domaine. De manière précise, nous cherchons, dans un premier temps, à extraire des termes, dénotant les concepts d'unités de mesure, réputés difficiles à identifier du fait de leur forte variation typographique dans les textes. Après la localisation de ces derniers par des méthodes de classification automatique, les variants d'unités sont identifiés en utilisant des mesures d'édition originales. La seconde contribution méthodologique de nos travaux repose sur l'adaptation et la combinaison de méthodes de fouille de données (extraction de motifs et règles séquentiels) et d'analyse syntaxique pour identifier les instances d'arguments de la relation n-aire recherchée. / Today, a huge amount of data is made available to the research community through several web-based libraries. Enhancing data collected from scientific documents is a major challenge in order to analyze and reuse efficiently domain knowledge. To be enhanced, data need to be extracted from documents and structured in a common representation using a controlled vocabulary as in ontologies. Our research deals with knowledge engineering issues of experimental data, extracted from scientific articles, in order to reuse them in decision support systems. Experimental data can be represented by n-ary relations which link a studied object (e.g. food packaging, transformation process) with its features (e.g. oxygen permeability in packaging, biomass grinding) and capitalized in an Ontological and Terminological Ressource (OTR). An OTR associates an ontology with a terminological and/or a linguistic part in order to establish a clear distinction between the term and the notion it denotes (the concept). Our work focuses on n-ary relation extraction from scientific documents in order to populate a domain OTR with new instances. Our contributions are based on Natural Language Processing (NLP) together with data mining approaches guided by the domain OTR. More precisely, firstly, we propose to focus on unit of measure extraction which are known to be difficult to identify because of their typographic variations. We propose to rely on automatic classification of texts, using supervised learning methods, to reduce the search space of variants of units, and then, we propose a new similarity measure that identifies them, taking into account their syntactic properties. Secondly, we propose to adapt and combine data mining methods (sequential patterns and rules mining) and syntactic analysis in order to overcome the challenging process of identifying and extracting n-ary relation instances drowned in unstructured texts.

Page generated in 0.0825 seconds