Spelling suggestions: "subject:"métadonnées"" "subject:"mégadonnées""
21 |
De l'usage des méthodes bas niveau pour la recherche d'image par le contenuDa Rugna, Jérôme 14 December 2004 (has links) (PDF)
La thématique de ces travaux de thèse est la recherche d'images par le contenu et plus précisément<br />l'apport des méthodes bas niveau.<br />Après avoir discuté des différentes approches existantes, nous rappelons le fossé sémantique<br />entre les attentes de l'utilisateur et ce que proposent réellement les systèmes de recherche. La<br />plupart de ceux-ci reposent sur une étape préalable de segmentation dont la validité et la robustesse<br />se doivent d'être étudiées. Nous proposons alors un protocole d'évaluation objective et un<br />exemple concret de mise en oeuvre. L'originalité consiste à ne pas comparer une segmentation à<br />une référence théorique mais à juger objectivement sa stabilité.<br />La troisième partie de ce document introduit trois contributions ponctuelles susceptibles<br />d'améliorer la chaîne de recherche. Dans un premier temps, un détecteur de flou permet d'extraire<br />une méta-information portée par l'image, les zones nettes a priori de focalisation. Ensuite<br />nous exposons un descripteur basé sur l'extraction de régions émergentes sur le seul critère couleur.<br />Cette extraction, conjuguée avec des distances adaptées, peut permettre par exemple un<br />pré-filtrage couleur en amont de la phase de recherche de similarité proprement dite. Finalement,<br />nous introduisons brièvement une algèbre d'histogrammes pour exploiter au mieux l'information<br />contenue dans ce type de descripteurs, via un langage de requêtes spécifique.
|
22 |
Conception d'un système multidimensionnel d'information sur la qualité des données géospatialesDevillers, Rodolphe 24 November 2004 (has links) (PDF)
L'information géographique est maintenant un produit de masse fréquemment manipulé par des utilisateurs non-experts en géomatique qui ont peu ou pas de connaissances de la qualité des données qu'ils utilisent. Ce contexte accroît significativement les risques de mauvaise utilisation des données et ainsi les risques de conséquence néfaste résultant de ces mauvaises utilisations. Cette thèse vise à fournir à des utilisateurs experts ou des experts en qualité une approche leur permettant d'évaluer la qualité des données et ainsi être à même de conseiller des utilisateurs non-experts dans leur utilisation des données. Cette approche se base sur une structuration des données de qualité dans une base de données multidimensionnelle et une communication dynamique et contextuelle utilisant des indicateurs de qualité affichés dans un système SOLAP (Spatial On-Line Analytical Processing) combiné à un système d'information géographique.
|
23 |
La formalisation des publications scientifiques en sciences humaines : les sciences humaines et sociales à la recherche de fondements scientifiquesDelmotte, Stéphanie 14 December 2007 (has links) (PDF)
Les sciences humaines et sociales s'interrogent sur les fondements du discours scientifique depuis les années 1950. Depuis les années 1980, l'enseignement à distance évolue, et les années 2002-2007 des supports innovants sont créés pour répondre au traitement électronique de l'information. L'information scientifique doit s'adapter aux nouvelles formes de diffusion du savoir. Le discours scientifique dans les sciences humaines reste un « objet réglé par le système rhétorique ». Il propose un raisonnement, soit selon une culture de l'évidence rationnelle et expérimentale, soit selon une culture de l'argumentation. Sa représentation donnera lieu alors soit à une structure figée, soit à un plan créatif. Ces points de vue seront illustrés par les nouveaux supports et les résultats sous des formes multimédia. Les pratiques d'écriture, de référencement, d'édition, de validation, de diffusion et de lecture du discours en sciences humaines changent et doivent être accompagnées d'une réflexion approfondie. Les publications scientifiques jouent un rôle capital dans le système de la communication scientifique. Elles doivent répondre à deux exigences symbolisées par les deux pôles : celui de l'information (l'aspect logique et rationnel) et celui de la communication (l'aspect relationnel). Le numérique ainsi que les discours qui l'accompagnent peuvent être définis comme un phénomène émergent dans la communication scientifique. L'influence du traitement numérique de l'information entraîne une évolution des formes de représentation des champs scientifiques dans les sciences humaines. Il oblige plus qu'auparavant à caractériser le discours scientifique dans les sciences humaines et à le définir. La formalisation des publications scientifiques propose une organisation et une structuration du contenu avec des langages de balisage, des normes et des standards adaptés aux besoins des communautés pour assurer l'efficacité de la production de documents numériques.
|
24 |
Mutualisation de données et de connaissances pour la<br />Gestion Intégrée des Zones Côtières.<br />Application au projet SYSCOLAG.Barde, Julien 09 December 2005 (has links) (PDF)
Cette thèse s'inscrit dans le cadre du programme régional de recherche pluridisciplinaire Syscolag<br />la gestion intégrée de la zone côtière (GIZC). Elle étudie la mise en place de méthodes génériques<br />pour optimiser la gestion de l'information et de la connaissance dans les dispositifs de GIZC. Compte<br />tenu de l'hétérogénéité des ressources informationnelles nécessaires et réparties chez des acteurs variés de l'importance de l'information géographique dans ce domaine, nous proposons, en réponse à cette problématique, une solution qui s'appuie sur l'utilisation d'un service de métadonnées pour décrire et localiser l'information existante et d'un référentiel sémantique pour intégrer et partager la connaissance experte. Ces outils sont accessibles sur un portail Web. Le premier implémente la norme ISO 19115 relative à la gestion de métadonnées pour l'information géographique), le second s'appuie sur un modèle d'ontologie a priori qui structure l'inventaire des concepts du domaine et exprime la connaissance qui leur est associée. Les concepts spatiaux possèdent des propriétés géométriques qui permettent leurs représentations cartographiques géoréférencées et des relations spatiales normalisées d'après les travaux de l'Open Gis Consortium. Le référentiel sémantique sert pour le contrôle de la valuation d'éléments clés du service de métadonnées, en particulier les éléments de descriptions thématique et spatiale (avec une interface cartographique). Le gain en qualité d'indexation améliore la localisation d'information. Le détail du référentiel est consultable sous la forme d'une base terminologique, d'un réseau sémantique et d'un atlas cartographique (basé la norme relative aux Web Mapping Service de l'OGC) dans le cas des concepts spatiaux. De tels systèmes distribués sont capables d'interopérer et partager les métadonnées, l'information géographique, ou les concepts qu'ils hébergent.<br />Mots-clés : métadonnées, partage de l'information, partage de la connaissance, ontologie a priori,<br />information géographique, gestion intégrée de la zone côtière, SIG.
|
25 |
LORESA : un système de recommandation d'objets d'apprentissage basé sur les annotations sémantiquesBenlizidia, Sihem January 2007 (has links)
Mémoire numérisé par la Division de la gestion de documents et des archives de l'Université de Montréal
|
26 |
Sydonie : modèle de document et ingénierie du WebLecarpentier, Jean-Marc 05 December 2011 (has links) (PDF)
Cette thèse de doctorat est articulée autour des ré flexions sur les évolutions du web et de l'approche des documents numériques. Elle se concrétise dans la mise au point d'un framework reprenant nos propositions de modèle de document, d'interactions et d'ingénierie du web. Nous appelons ce framework Sydonie pour SYstème de gestion de DOcuments Numériques pour l'Internet et l'édition. Il est distribué en logiciel libre. Nous proposons un modèle de document inspiré des spécifications fonctionnelles des notices bibliographiques, consignées dans le rapport sur les FRBR (Functional Requirements for Bibliographic Records). Notre modèle propose de regrouper, sous la forme d'un arbre, les différentes versions linguistiques et divers formats de fichier d'un même document. Ce modèle règle élégamment la sélection de la vue du document la plus appropriée à un utilisateur grâce à la négociation de contenu. Pour un document composite, il permet, de plus, d'inclure les composants sous la forme la plus appropriée. Notre réflexion sur les processus mis en oeuvre pour le développement d'applications web, complétée par les études réalisées dans le domaine de l'ingénierie du web, nous permettent de proposer, au sein du framework Sydonie, une architecture logicielle qui apporte des solutions souples et extensibles pour le développement d'applications web. Enfin, nous avons étudié les mécanismes à proposer pour rendre la gestion des métadonnées plus accessible aux développeurs web. Nous utilisons le modèle de document sous forme d'arbre pour proposer un modèle de gestion des métadonnées au sein des applications web.
|
27 |
Plateforme visuelle pour l'intégration de données faiblement structurées et incertaines / A visual platform to integrate poorly structured and unknown dataDa Silva Carvalho, Paulo 19 December 2017 (has links)
Nous entendons beaucoup parler de Big Data, Open Data, Social Data, Scientific Data, etc. L’importance qui est apportée aux données en général est très élevée. L’analyse de ces données est importante si l’objectif est de réussir à en extraire de la valeur pour pouvoir les utiliser. Les travaux présentés dans cette thèse concernent la compréhension, l’évaluation, la correction/modification, la gestion et finalement l’intégration de données, pour permettre leur exploitation. Notre recherche étudie exclusivement les données ouvertes (DOs - Open Data) et plus précisément celles structurées sous format tabulaire (CSV). Le terme Open Data est apparu pour la première fois en 1995. Il a été utilisé par le groupe GCDIS (Global Change Data and Information System) (États-Unis) pour encourager les entités, possédant les mêmes intérêts et préoccupations, à partager leurs données [Data et System, 1995]. Le mouvement des données ouvertes étant récent, il s’agit d’un champ qui est actuellement en grande croissance. Son importance est actuellement très forte. L’encouragement donné par les gouvernements et institutions publiques à ce que leurs données soient publiées a sans doute un rôle important à ce niveau. / We hear a lot about Big Data, Open Data, Social Data, Scientific Data, etc. The importance currently given to data is, in general, very high. We are living in the era of massive data. The analysis of these data is important if the objective is to successfully extract value from it so that they can be used. The work presented in this thesis project is related with the understanding, assessment, correction/modification, management and finally the integration of the data, in order to allow their respective exploitation and reuse. Our research is exclusively focused on Open Data and, more precisely, Open Data organized in tabular form (CSV - being one of the most widely used formats in the Open Data domain). The first time that the term Open Data appeared was in 1995 when the group GCDIS (Global Change Data and Information System) (from United States) used this expression to encourage entities, having the same interests and concerns, to share their data [Data et System, 1995]. However, the Open Data movement has only recently undergone a sharp increase. It has become a popular phenomenon all over the world. Being the Open Data movement recent, it is a field that is currently growing and its importance is very strong. The encouragement given by governments and public institutions to have their data published openly has an important role at this level.
|
28 |
Metadata quality in the cultural heritage sector: stakes, problems and solutionsVan Hooland, Seth 10 March 2009 (has links)
Contrairement à l'opinion dominante, les nouvelles technologies n'ont pas toujours un impact positif sur la qualité des métadonnées dans le secteur culturel. Après dix ans d'expérience avec les projets de numérisation dans nos musées, bibliothèques et archives, une réflexion critique se montre plus que jamais nécessaire pour évaluer à quelles conditions ce genre de projets d'informatisation peuvent offrir une valeur ajoutée pour la documentation de notre patrimoine culturel. Cette réflexion se base, entre autres, sur un ensemble de case studies représentatifs dans un contexte international. A cette fin, nous présenterons et définirons un cadre méthodologique et conceptuel original concernant l'impact des technologies sur la qualité des métadonnées. Sur cette base, nous proposons et expérimentons trois approches opérationnelles novatrices en vue d'améliorer la qualité des systèmes d'information déployés dans le secteur culturel. / Doctorat en Information et communication / info:eu-repo/semantics/nonPublished
|
29 |
Automated adaptation of Electronic Heath Record for secondary use in oncology / Adaptation automatique des données de prises en charge hospitalières pour une utilisation secondaire en cancérologieJouhet, Vianney 16 December 2016 (has links)
Avec la montée en charge de l’informatisation des systèmes d’information hospitaliers, une quantité croissante de données est produite tout au long de la prise en charge des patients. L’utilisation secondaire de ces données constitue un enjeu essentiel pour la recherche ou l’évaluation en santé. Dans le cadre de cette thèse, nous discutons les verrous liés à la représentation et à la sémantique des données, qui limitent leur utilisation secondaire en cancérologie. Nous proposons des méthodes basées sur des ontologies pour l’intégration sémantique des données de diagnostics. En effet, ces données sont représentées par des terminologies hétérogènes. Nous étendons les modèles obtenus pour la représentation de la maladie tumorale, et les liens qui existent avec les diagnostics. Enfin, nous proposons une architecture combinant entrepôts de données, registres de métadonnées et web sémantique. L’architecture proposée permet l’intégration syntaxique et sémantique d’un grand nombre d’observations. Par ailleurs, l’intégration de données et de connaissances (sous la forme d’ontologies) a été utilisée pour construire un algorithme d’identification de la maladie tumorale en fonction des diagnostics présents dans les données de prise en charge. Cet algorithme basé sur les classes de l’ontologie est indépendant des données effectivement enregistrées. Ainsi, il fait abstraction du caractère hétérogène des données diagnostiques initialement disponibles. L’approche basée sur une ontologie pour l’identification de la maladie tumorale, permet une adaptation rapide des règles d’agrégation en fonction des besoins spécifiques d’identification. Ainsi, plusieurs versions du modèle d’identification peuvent être utilisées avec des granularités différentes. / With the increasing adoption of Electronic Health Records (EHR), the amount of data produced at the patient bedside is rapidly increasing. Secondary use is there by an important field to investigate in order facilitate research and evaluation. In these work we discussed issues related to data representation and semantics within EHR that need to be address in order to facilitate secondary of structured data in oncology. We propose and evaluate ontology based methods for heterogeneous diagnosis terminologies integration in oncology. We then extend obtained model to enable tumoral disease representation and links with diagnosis as recorded in EHR. We then propose and implement a complete architecture combining a clinical data warehouse, a metadata registry and web semantic technologies and standards. This architecture enables syntactic and semantic integration of a broad range of hospital information System observation. Our approach links data with external knowledge (ontology), in order to provide a knowledge resource for an algorithm for tumoral disease identification based on diagnosis recorded within EHRs. As it based on the ontology classes, the identification algorithm is uses an integrated view of diagnosis (avoiding semantic heterogeneity). The proposed architecture leading to algorithm on the top of an ontology offers a flexible solution. Adapting the ontology, modifying for instance the granularity provide a way for adapting aggregation depending on specific needs
|
30 |
Contributions à une nouvelle approche de Recherche d'Information basée sur la métaphore de l'impédance et illustrée sur le domaine de la santé / Contributions to a new information retrieving approach based on the impedance metaphor and illustrated on the health domainGuemeida, Abdelbasset 16 October 2009 (has links)
Les récentes évolutions dans les technologies de l’information et de la communication, avec le développement de l’Internet, conduisent à l’explosion des volumes des sources de données. Des nouveaux besoins en recherche d’information émergent pour traiter l’information en relation aux contextes d’utilisation, augmenter la pertinence des réponses et l’usabilité des résultats produits, ainsi que les possibles corrélations entre sources de données, en rendant transparentes leurs hétérogénéités. Les travaux de recherche présentés dans ce mémoire apportent des contributions à la conception d’une Nouvelle Approche de Recherche d’Information (NARI) pour la prise de décision. NARI vise à opérer sur des grandes masses de données cataloguées, hétérogènes, qui peuvent être géo référencées. Elle est basée sur des exigences préliminaires de qualité (standardisation, réglementations), exprimées par les utilisateurs, représentées et gérées à l’aide des métadonnées. Ces exigences conduisent à pallier le manque de données ou leur insuffisante qualité, pour produire une information de qualité suffisante par rapport aux besoins décisionnels. En utilisant la perspective des utilisateurs, on identifie et/ou on prépare des sources de données, avant de procéder à l’étape d’intégration des contenus. L’originalité de NARI réside dans la métaphore de l’écart d’impédance (phénomène classique lorsque on cherche à connecter deux systèmes physiques hétérogènes). Cette métaphore, dont R. Jeansoulin est à l’origine, ainsi que l’attention portée au cadre réglementaire, en guident la conception. NARI est structurée par la dimension géographique (prise en compte de divers niveaux de territoires, corrélations entre plusieurs thématiques) : des techniques d’analyse spatiale supportent des tâches de la recherche d’information, réalisées souvent implicitement par les décideurs. Elle s’appuie sur des techniques d’intégration de données (médiation, entrepôts de données), des langages de représentation des connaissances et des technologies et outils relevant du Web sémantique, pour supporter la montée en charge, la généralisation et la robustesse théorique de l’approche. NARI est illustrée sur des exemples relevant de la santé / The recent developments in information and communication technologies along with the growth of the Internet have lead to the explosion of data source volumes. This has created many growing needs such as in information retrieval to: treat the information according to its usage context, to increase the relevance of answers and the usability of results, and to increase the potential correlations between results, which can be done by making the heterogeneities and source distribution transparent. Our contributions consist in designing a NARI (New Approach to Information Retrieval) for decision-making. NARI is designed to operate on large amounts of catalogued and heterogeneous data that can be geo-referenced. It is based on quality preliminary requirements expressed by users, which are represented and managed using metadata. These requirements lead to the lack of data or their insufficient quality in relation to decision-making needs. Using the users’ perspective, we identify and/or prepare the data sources, before integration step processing. NARI’s originality relies on the metaphor of the impedance mismatch (classical phenomenon when we try to connect two physical heterogeneous systems), due to R. Jeansoulin. This metaphor, as well as the attention paid to regulatory framework (standardization), guides the design of NARI. The geographical dimension structures NARI, taking into account various territorial levels, correlations between several themes. Thus, it takes advantage of spatial analysis techniques, by automating information retrieval tasks, often implicitly made by policy makers. NARI is based on data integration techniques (mediation, data warehouses), knowledge representation languages and a set of Semantic Web technologies and tools, adapted to support the scalability, robustness and generalization theory of the approach. NARI is illustrated on examples relevant to the health domain
|
Page generated in 0.0259 seconds