1 |
Vers un système intelligent de capitalisation de connaissances pour l'agriculture durable : construction d'ontologies agricoles par transformation de sources existantes / Towards an intelligent knowledge capitalization for sustainable agriculture : agricultural building ontologies by transforming existing sourcesAmarger, Fabien 18 December 2015 (has links)
Les données disponibles sur le Web sont généralement de deux natures : (1) des données non structurées ou semi-structurées difficilement exploitables de manière automatique ou (2) des données structurées destinées à une utilisation particulière, difficilement réutilisables par d’autres applications. Le Web de données est une application du Web sémantique facilitant l’accès, le partage et l’alignement des données. Il existe actuellement de très nombreuses données disponibles sur le Web, mais qui ne sont pas publiées en suivant les principes du Web de données liées. Elles nécessiteraient d’être transformées en bases de connaissances. Nous proposons une méthodologie innovante qui permet de transformer plusieurs sources simultanément et non séquentiellement. Cette méthodologie permet la fusion de plusieurs sources de données orientée par des patrons de conception du domaine. Notre méthodologie spécifie la modélisation attendue du domaine en définissant la partie haute d’un module ontologique. Une chaîne de processus enrichit ce module par des éléments issus des sources : transformation syntaxique des sources, alignement, identification des éléments équivalents pour construire des candidats, calcul de score de confiance des candidats, filtrage des candidats. Notre travail part de l’hypothèse suivante : si un élément apparaît dans plusieurs sources, alors la possibilité qu’il appartienne au domaine d’étude est accrue. Nous avons défini différentes fonctions de calcul de la confiance consensuelle d’un candidat en mettant en évidence plusieurs caractéristiques comme le consensus entre sources ou la connectivité entre éléments d’un même candidat. Nous posons une deuxième hypothèse : un élément ne doit apparaître que dans un seul candidat pour obtenir une modélisation correcte. Cette hypothèse nous amène à définir la notion d’incompatibilité entre candidats. Nous pouvons considérer alors l’extraction des candidats qui ne partagent pas d’éléments, ce qui permet de faciliter le travail de validation. Pour évaluer nos propositions, nous avons mené trois expérimentations. La première a porté sur le domaine de la classification taxonomique des blés. Cette expérimentation nous a permis d’analyser la qualité des candidats générés avec l’aide de trois experts du domaine. La deuxième expérimentation a porté sur le même domaine et nous a permis de valider le temps gagné par un expert lors de la validation des candidats en considérant les incompatibilités. Pour la dernière expérimentation nous avons utilisé les données d’une campagne d’évaluation de systèmes d’alignements. Nous avons adaptés ces données pour évaluer la génération de candidats et la définition du score de confiance sur un grand jeu de données. Nous proposons une implémentation de cette proposition dans un outil réutilisable et paramétrable : Muskca. Celui-ci permet la fusion multi-sources pour la génération d’une base de connaissances consensuelle. L’application de nos travaux dans le domaine de l’agriculture nous a permis de constituer une base de connaissances sur la taxonomie des plantes. Cette base de connaissances permettra la représentation d’observations des attaques des agresseurs sur les cultures, ainsi que les techniques de traitement des agresseurs. Cette base de connaissances permettra de publier les données disponibles mais aussi d’annoter les nombreux documents mobilisables pour faire évoluer les pratiques agricoles. / The data available on the Web are generally of two kinds: (1) non structured data or semi structured data, which are difficult to exploit automatically; or (2) structured data, dedicated to a specific usage, which are difficult to reuse for a different application. The Linked Open Data is a Semantic Web application facilitating access, share ability and alignment of data. There are many data available on the Web, but these are not always published using the Linked Open Data theory and thus need to be transformed into knowledge bases. An innovative methodology is proposed in this work: one that transforms several sources simultaneously, not sequentially. This methodology merges several data sources oriented by domain design patterns and defines the expected domain representation using the upper part of an ontological module. A process chain enriches this module with elements from the sources: syntactic transformation of the sources, alignment, identification of equivalent elements for the construction of candidates, computation of the candidates’ trust scores and candidate filtering. This work is based on the following hypothesis: if an element appears in several sources then the possibility that it belongs to the studied domain is increased. Several functions were defined in order to compute the consensual trust score of a specific candidate by bringing out such characteristics as the consensus between the sources or the connectivity between the elements within a given candidate. A second hypothesis is put forward: to obtain a valid design, an element must be part of one candidate only. This hypothesis resulted in the definition of the notion of incompatibility between the candidates. The extraction of the candidates that do not share elements can then be considered, which made the experts’ validation task easier. To evaluate the proposals, three experiments were conducted. The first one dealt with the taxonomic classification of wheat. With the assistance of three experts, this experiment made for the analysis of the validation of the generated candidates. The second experiment, still in the same domain, lead to the evaluation of the time an expert saved using the notion of incompatibility during the validation of the candidates. As for the last experiment, the data from an evaluation campaign of alignment systems were used. These data had to be adapted to evaluate the generation of the candidates and the definition of the consensual trust score on a large data set. These three proposals were implemented in a new reusable and configurable tool: Muskca. This tool allows a multi-source fusion for the generation of a consensual knowledge base. This methodology was applied to agriculture, which allowed the creation of a knowledge base on plant taxonomy. The knowledge base will be used to represent the observations of pest attacks on crops along with pest treatment techniques. Not only will this knowledge base help the publication of the available data but it will also allow the annotation of the various documents that will be used, so as to improve agricultural practices.
|
2 |
Distributed Knowledge Modeling and Integration of Model-Based Beliefs into the Clinical Decision-Making ProcessOeser, Alexander 04 March 2022 (has links)
Das Treffen komplexer medizinischer Entscheidungen wird durch die stetig steigende Menge an zu berücksichtigenden Informationen zunehmend komplexer. Dieser Umstand ist vor allem auf die Verfügbarkeit von immer präziseren diagnostischen Methoden zur Charakterisierung der Patienten zurückzuführen (z.B. genetische oder molekulare Faktoren). Hiermit einher geht die Entwicklung neuartiger Behandlungsstrategien und Wirkstoffe sowie die damit verbundenen Evidenzen aus klinischen Studien und Leitlinien. Dieser Umstand stellt die behandelnden Ärztinnen und Ärzte vor neuartige Herausforderungen im Hinblick auf die Berücksichtigung aller relevanten Faktoren im Kontext der klinischen Entscheidungsfindung.
Moderne IT-Systeme können einen wesentlichen Beitrag leisten, um die klinischen Experten weitreichend zu unterstützen. Diese Assistenz reicht dabei von Anwendungen zur Vorverarbeitung von Daten für eine Reduktion der damit verbundenen Komplexität bis hin zur systemgestützten Evaluation aller notwendigen Patientendaten für eine therapeutischen Entscheidungsunterstützung. Möglich werden diese Funktionen durch die formale Abbildung von medizinischem Fachwissen in Form einer komplexen Wissensbasis, welche die kognitiven Prozesse im Entscheidungsprozess adaptiert. Entsprechend werden an den Prozess der IT-konformen Wissensabbildung erhöhte Anforderungen bezüglich der Validität und Signifikanz der enthaltenen Informationen gestellt.
In den ersten beiden Kapiteln dieser Arbeit wurden zunächst wichtige methodische Grundlagen im Kontext der strukturierten Abbildung von Wissen sowie dessen Nutzung für die klinische Entscheidungsunterstützung erläutert. Hierbei wurden die inhaltlichen Kernthemen weiterhin im Rahmen eines State of the Art mit bestehenden Ansätzen abgeglichen, um den neuartigen Charakter der vorgestellten Lösungen herauszustellen.
Als innovativer Kern wurde zunächst die Konzeption und Umsetzung eines neuartigen Ansatzes zur Fusion von fragmentierten Wissensbausteinen auf der formalen Grundlage von Bayes-Netzen vorgestellt. Hierfür wurde eine neuartige Datenstruktur unter Verwendung des JSON Graph Formats erarbeitet. Durch die Entwicklung von qualifizierten Methoden zum Umgang mit den formalen Kriterien eines Bayes-Netz wurden weiterhin Lösungen aufgezeigt, welche einen automatischen Fusionsprozess durch einen eigens hierfür entwickelten Algorithmus ermöglichen.
Eine prototypische und funktionale Plattform zur strukturierten und assistierten Integration von Wissen sowie zur Erzeugung valider Bayes-Netze als Resultat der Fusion wurde unter Verwendung eines Blockchain Datenspeichers implementiert und in einer Nutzerstudie gemäß ISONORM 9241/110-S evaluiert. Aufbauend auf dieser technologischen Plattform wurden im Anschluss zwei eigenständige Entscheidungsunterstützungssysteme vorgestellt, welche relevante Anwendungsfälle im Kontext der HNO-Onkologie adressieren. Dies ist zum einen ein System zur personalisierten Bewertung von klinischen Laborwerten im Kontext einer Radiochemotherapie und zum anderen ein in Form eines Dashboard implementiertes Systems zur effektiveren Informationskommunikation innerhalb des Tumor Board. Beide Konzepte wurden hierbei zunächst im Rahmen einer initialen Nutzerstudie auf Relevanz geprüft, um eine nutzerzentrische Umsetzung zu gewährleisten.
Aufgrund des zentralen Fokus dieser Arbeit auf den Bereich der klinischen Entscheidungsunterstützung, werden an zahlreichen Stellen sowohl kritische als auch optimistische Aspekte der damit verbundenen praktischen Lösungen diskutiert.:1 Introduction
1.1 Motivation and Clinical Setting
1.2 Objectives
1.3 Thesis Outline
2 State of the Art
2.1 Medical Knowledge Modeling
2.2 Knowledge Fusion
2.3 Clinical Decision Support Systems
2.4 Clinical Information Access
3 Fundamentals
3.1 Evidence-Based Medicine
3.1.1 Literature-Based Evidence
3.1.2 Practice-Based Evidence
3.1.3 Patient-Directed Evidence
3.2 Knowledge Representation Formats
3.2.1 Logic-Based Representation
3.2.2 Procedural Representation
3.2.3 Network or Graph-Based Representation
3.3 Knowledge-Based Clinical Decision Support
3.4 Conditional Probability and Bayesian Networks
3.5 Clinical Reasoning
3.5.1 Deterministic Reasoning
3.5.2 Probabilistic Reasoning
3.6 Knowledge Fusion of Bayesian Networks
4 Block-Based Collaborative Knowledge Modeling
4.1 Data Model
4.1.1 Belief Structure
4.1.2 Conditional Probabilities
4.1.3 Metadata
4.2 Constraint-Based Automatic Knowledge Fusion
4.2.1 Fusion of the Bayesian Network Structures
4.2.2 Fusion of the Conditional Probability Tables
4.3 Blockchain-Based Belief Storage and Retrieval
4.3.1 Blockchain Characteristics
4.3.2 Relevance for Belief Management
5 Selected CDS Applications for Clinical Practice
5.1 Distributed Knowledge Modeling Platform
5.1.1 Requirement Analysis
5.1.2 System Architecture
5.1.3 System Evaluation
5.1.4 Limitations of the Proposed Solution
5.2 Personalization of Laboratory Findings
5.2.1 Requirement Analysis
5.2.2 System Architecture
5.2.3 Limitations of the Proposed Solution
5.3 Dashboard for Collaborative Decision-Making in the Tumor Board
5.3.1 Requirement Analysis
5.3.2 System Architecture
5.3.3 Limitations of the Proposed Solution
6 Discussion
6.1 Goal Achievements
6.2 Contributions and Conclusion
7 Bibliography
|
3 |
Fusion d'images multimodales pour l'aide au diagnostic du cancer du sein / Multimodal image fusion for breast cancer aided diagnosisBen salem, Yosra 09 December 2017 (has links)
Le cancer du sein est le cancer le plus répandu chez les femmes de plus de 40 ans. En effet, des études ont montré qu'une détection précoce et un traitement approprié du cancer du sein augmentent de manière significative les chances de survie. La mammographie constitue le moyen d'investigation le plus utilisé dans le diagnostic des lésions mammaires. Cependant, cette technique peut être insuffisante pour montrer les structures du sein et faire apparaître les anomalies présentes et le médecin peut faire appel à d'autres modalités d'imagerie telle que l'imagerie IRM. Ces modalités sont généralement complémentaires. Par conséquent, le médecin procède à une fusion mentale des différentes informations sur les deux images dans le but d'effectuer le diagnostic adéquat. Pour assister le médecin et l'aider dans ce processus, nous proposons une solution permettant de fusionner les deux images. Bien que l'idée de la fusion paraisse simple, sa mise en oeuvre pose de nombreux problèmes liés non seulement au problème de fusion en général mais aussi à la nature des images médicales qui sont généralement des images mal contrastées et présentant des données hétérogènes, imprécises et ambigües. Notons que les images mammographiques et les images IRM présentent des représentations très différentes des informations, étant donnée qu'elles sont prises dans des conditions distinctes. Ce qui nous amène à poser la question suivante: Comment passer de la représentation hétérogène des informations dans l'espace image, à un autre espace de représentation uniforme. Afin de traiter cette problématique, nous optons pour une approche de traitement multi-niveaux : niveau pixel, niveau primitives, niveau objet et niveau scène. Nous modélisons les objets pathologiques extraits des différentes images par des ontologies locales. La fusion est ensuite effectuée sur ces ontologies locales et résulte en une ontologie globale contenant les différentes connaissances sur les objets pathologiques du cas étudié. Cette ontologie globale sert à instancier une ontologie de référence modélisant les connaissances du diagnostic médical des lésions mammaires. Un raisonnement à base de cas est exploité pour fournir les rapports diagnostic des cas les plus similaires pouvant aider le médecin à prendre la meilleure décision. Dans le but de modéliser l'imperfection des informations traitées, nous utilisons la théorie des possibilités avec les différentes ontologies. Le résultat fourni est présenté sous forme de rapports diagnostic comportant les cas les plus similaires au cas étudié avec des degrés de similarité exprimés en mesures de possibilité. Un modèle virtuel 3D complète le rapport diagnostic par un aperçu simplifié de la scène étudiée. / The breast cancer is the most prevalent cancer among women over 40 years old. Indeed, studies evinced that an early detection and an appropriate treatment of breast cancer increases significantly the chances of survival. The mammography is the most tool used in the diagnosis of breast lesions. However, this technique may be insufficient to evince the structures of the breast and reveal the anomalies present. The doctor can use additional imaging modalities such as MRI (Magnetic Reasoning Image). Therefore, the doctor proceeds to a mental fusion of the different information on the two images in order to make the adequate diagnosis. To assist the doctor in this process, we propose a solution to merge the two images. Although the idea of the fusion seems simple, its implementation poses many problems not only related to the paradigm of fusion in general but also to the nature of medical images that are generally poorly contrasted images, and presenting heterogeneous, inaccurate and ambiguous data. Mammography images and IRM images present very different information representations, since they are taken under different conditions. Which leads us to pose the following question: How to pass from the heterogeneous representation of information in the image space, to another space of uniform representation from the two modalities? In order to treat this problem, we opt a multilevel processing approach : the pixel level, the primitive level, the object level and the scene level. We model the pathological objects extracted from the different images by local ontologies. The fusion is then performed on these local ontologies and results in a global ontology containing the different knowledge on the pathological objects of the studied case. This global ontology serves to instantiate a reference ontology modeling knowledge of the medical diagnosis of breast lesions. Case-based reasoning (CBR) is used to provide the diagnostic reports of the most similar cases that can help the doctor to make the best decision. In order to model the imperfection of the treated information, we use the possibility theory with the ontologies. The final result is a diagnostic reports containing the most similar cases to the studied case with similarity degrees expressed with possibility measures. A 3D symbolic model complete the diagnostic report with a simplified overview of the studied scene.
|
Page generated in 0.0153 seconds