• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 44
  • 9
  • 4
  • 3
  • 1
  • Tagged with
  • 61
  • 27
  • 23
  • 19
  • 13
  • 8
  • 6
  • 6
  • 6
  • 6
  • 6
  • 5
  • 5
  • 5
  • 5
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
31

Expression et contrôle de l'intégrité sémantique dans les bases de données relationnelles : projet MICROBE

Ferrat, Lounas 19 May 1983 (has links) (PDF)
Cette thèse présente le sous-système ISIS, une méthode d'expression et de contrôle de l'intégrité sémantique, dans les bases de données relationnelles. Celle-ci est réglée par un ensemble de lois appelées contraintes d'intégrité sémantique (CIS). Une réalisation est effectuée dans le cadre du projet MICROBE
32

Clustering-based Approximate Answering of Query Result in Large and Distributed Databases

Bechchi, Mounir 15 September 2009 (has links) (PDF)
Les utilisateurs des bases de données doivent faire face au problème de surcharge d'information lors de l'interrogation de leurs données, qui se traduit par un nombre de réponses trop élevé à des requêtes exploratoires. Pour remédier à ce problème, nous proposons un algorithme efficace et rapide, ap- pelé ESRA (Explore-Select-Rearrange Algorithm), qui utilise les résumés SAINTETIQ pré-calculés sur l'ensemble des données pour regrouper les réponses à une requête utilisateur en un ensemble de classes (ou résumés) organisées hiérarchiquement. Chaque classe décrit un sous-ensemble de résul- tats dont les propriétés sont voisines. L'utilisateur pourra ainsi explorer la hiérarchie pour localiser les données qui l'intéressent et en écarter les autres. Les résultats expérimentaux montrent que l'al- gorithme ESRA est efficace et fournit des classes bien formées (i.e., leur nombre reste faible et elles sont bien séparées). Cependant, le modèle SAINTETIQ, utilisé par l'algorithme ESRA, exige que les données soient disponibles sur le serveur des résumés. Cette hypothèse rend inapplicable l'algo- rithme ESRA dans des environnements distribués où il est souvent impossible ou peu souhaitable de rassembler toutes les données sur un même site. Pour remédier à ce problème, nous proposons une collection d'algorithmes qui combinent deux résumés générés localement et de manière autonome sur deux sites distincts pour en produire un seul résumant l'ensemble des données distribuées, sans accéder aux données d'origine. Les résultats expérimentaux montrent que ces algorithmes sont aussi performants que l'approche centralisée (i.e., SAINTETIQ appliqué aux données après regroupement sur un même site) et produisent des hiérarchies très semblables en structure et en qualité à celles produites par l'approche centralisée.
33

Représentations relationnelles et apprentissage interactif pour l'apprentissage efficace du comportement coopératif / Relational representations and interactive learning for efficient cooperative behavior learning

Munzer, Thibaut 21 April 2017 (has links)
Cette thèse présente de nouvelles approches permettant l’apprentissage efficace et intuitif de plans de haut niveau pour les robots collaboratifs. Plus précisément, nous étudions l’application d’algorithmes d’apprentissage par démonstration dans des domaines relationnels. L’utilisation de domaines relationnels pour représenter le monde permet de simplifier la représentation de comportements concurrents et collaboratifs. Nous avons commencé par développer et étudier le premier algorithme d’apprentissage par renforcement inverse pour domaines relationnels. Nous avons ensuite présenté comment utiliser le formalisme RAP pour représenter des tâches collaboratives comprenant un robot et un opérateur humain. RAP est une extension des MDP relationnels qui permet de modéliser des activités concurrentes. Utiliser RAP nous a permis de représenter à la fois l’humain et le robot dans le même processus, mais également de modéliser des activités concurrentes du robot. Sous ce formalisme, nous avons montré qu’il était possible d’apprendre le comportement d’une équipe, à la fois comme une politique et une récompense. Si des connaissances a priori sur la tâche à réaliser sont disponibles, il est possible d’utiliser le même algorithme pour apprendre uniquement les préférences de l’opérateur. Cela permet de s’adapter à l’utilisateur. Nous avons montré que l’utilisation des représentations relationnelles permet d’apprendre des comportements collaboratifs à partir de peu de démonstrations.Ces comportements sont à la fois robustes au bruit, généralisables à de nouveaux états, et transférables à de nouveaux domaines (par exemple en ajoutant des objets). Nous avons également introduit une architecture d’apprentissage interactive qui permet au système de faire moins d’erreurs tout en demandant moins d’efforts à l’opérateur humain. Le robot, en estimant sa confiance dans ses décisions, est capable de demander des instructions quand il est incertain de l’activité à réaliser. Enfin, nous avons implémenté ces approches sur un robot et montré leurs impacts potentiels dans un scenario réaliste. / This thesis presents new approaches toward efficient and intuitive high-level plan learning for cooperative robots. More specifically this work study Learning from Demonstration algorithm for relational domains. Using relational representation to model the world, simplify representing concurrentand cooperative behavior.We have first developed and studied the first algorithm for Inverse ReinforcementLearning in relational domains. We have then presented how one can use the RAP formalism to represent Cooperative Tasks involving a robot and a human operator. RAP is an extension of the Relational MDP framework that allows modeling concurrent activities. Using RAP allow us to represent both the human and the robot in the same process but also to model concurrent robot activities. Under this formalism, we have demonstrated that it is possible to learn behavior, as policy and as reward, of a cooperative team. Prior knowledge about the task can also be used to only learn preferences of the operator.We have shown that, using relational representation, it is possible to learn cooperative behaviors from a small number of demonstration. That these behaviors are robust to noise, can generalize to new states and can transfer to different domain (for example adding objects). We have also introduced an interactive training architecture that allows the system to make fewer mistakes while requiring less effort from the human operator. By estimating its confidence the robot is able to ask for instructions when the correct activity to dois unsure. Lastly, we have implemented these approaches on a real robot and showed their potential impact on an ecological scenario.
34

Contributions à la mise en place d'une infrastructure de Cloud Computing à large échelle / Contributions to massively distributed Cloud Computing infrastructures

Pastor, Jonathan 18 October 2016 (has links)
La croissance continue des besoins en puissance de calcul a conduit au triomphe du modèle de Cloud Computing. Des clients demandeurs en puissance de calcul vont s’approvisionner auprès de fournisseurs d’infrastructures de Cloud Computing, mises à disposition via Internet. Pour réaliser des économies d’échelles, ces infrastructures sont toujours plus grandes et concentrées en quelques endroits, conduisant à des problèmes tels que l’approvisionnement en énergie, la tolérance aux pannes et l’éloignement des utilisateurs. Cette thèse s’est intéressée à la mise en place d’un système d’IaaS massivement distribué et décentralisé exploitant un réseau de micros centres de données déployés sur la dorsale Internet, utilisant une version d’OpenStack revisitée pendant cette thèse autour du support non intrusif de bases de données non relationnelles. Des expériences sur Grid’5000 ont montré des résultats intéressants sur le plan des performances, toutefois limités par le fait qu’OpenStack ne tirait pas avantage nativement d’un fonctionnement géographiquement réparti. Nous avons étudié la prise en compte de la localité réseau pour améliorer les performances des services distribués en favorisant les collaborations proches. Un prototype de l’algorithme de placement de machines virtuelles DVMS, fonctionnant sur une topologie non structurée basée sur l’algorithme Vivaldi, a été validé sur Grid’5000. Ce prototype a fait l’objet d’un prix scientifique lors de l’école de printemps Grid’50002014. Enfin, ces travaux nous ont amenés à participer au développement du simulateur VMPlaceS. / The continuous increase of computing power needs has favored the triumph of the Cloud Computing model. Customers asking for computing power will receive supplies via Internet resources hosted by providers of Cloud Computing infrastructures. To make economies of scale, Cloud Computing that are increasingly large and concentrated in few attractive places, leading to problems such energy supply, fault tolerance and the fact that these infrastructures are far from most of their end users. During this thesis we studied the implementation of an fully distributed and decentralized IaaS system operating a network of micros data-centers deployed in the Internet backbone, using a modified version of OpenStack that leverages non relational databases. A prototype has been experimentally validated onGrid’5000, showing interesting results, however limited by the fact that OpenStack doesn’t take advantage of a geographically distributed functioning. Thus, we focused on adding the support of network locality to improve performance of Cloud Computing services by favoring collaborations between close nodes. A prototype of the DVMS algorithm, working with an unstructured topology based on the Vivaldi algorithm, has been validated on Grid’5000. This prototype got the first prize at the large scale challenge of the Grid’5000 spring school in 2014. Finally, the work made with DVMS enabled us to participate at the development of the VMPlaceS simulator.
35

Contribution à l'extraction et à la représentation des connaissances de l'environnement maritime : proposition d'une architecture dédiée aux applications de navigation / No

Tsatcha, Dieudonné 11 December 2014 (has links)
De nos jours, les applications informatiques autonomes sont au centre de grandes préoccupations de la recherche scientifique. Ces dernières sont destinées initialement à des systèmes d'aide à la décision dans des environnements contraints et dynamiques, communément appelés environnements complexes. Elles peuvent dès à présent, à l'aide des avancées de la recherche, permettre de construire et déduire leurs connaissances propres afin d'interagir en temps réel avec leur environnement. Cependant, elles sont confrontées à la difficulté d'avoir une modélisation fidèle du monde réel et des entités qui le composent. L'un des principaux objectifs de nos recherches est de capturer et modéliser la sémantique associée aux entités spatio-temporelles afin d'enrichir leur expressivité dans les SIG ou les systèmes d'aide à la décision. Un service de routage maritime dynamique a été déployé en exploitant cette modélisation. Cet algorithme a été démontré comme optimal en termes d'espace mémoire et de temps de calcul. La sémantique capturée se compose de l'affordance et de la saillance visuelle de l'entité spatiale. Les connaissances associées à cette sémantique sont par la suite représentées par une ontologie computationnelle qui intègre des approches spatio-temporelles. Ces connaissances sont soit déduites du savoir de l'expert du domaine, soit extraites de gros volumes de données textuelles en utilisant des techniques de traitement automatique du langage. L'ontologie computationnelle proposée nous a permis de définir un algorithme de routage maritime dynamique (fonction des évènements ou objets présents dans l'environnement) fondé sur une heuristique itérative monocritère de plus courte distance et bidirectionnelle. L'algorithme BIDA* proposé s'applique sur un graphe itératif qui est une conceptualisation d'une grille hexagonale itérative recouvrant la zone de navigation. Cet algorithme permet aussi la gestion de différents niveaux de résolution. Toujours dans l'initiative de produire un modèle aussi proche que possible du monde réel, l'algorithme BIDA* a été enrichi des stratégies multicritères afin de prendre en compte les différentes contraintes de la navigation maritime. Les contraintes globales et locales auxquelles nous nous sommes intéressés sont la profondeur des eaux, la distance de navigation et la direction de navigation. Le modèle proposé permet ainsi d'enrichir les capacités cognitives des utilisateurs évoluant dans les environnements maritimes et peut aussi être utilisé pour construire des systèmes complètement autonomes explorant ces environnements. Un prototype expérimental de navigation intelligente mettant en oeuvre cette modélisation et proposant un service de routage maritime a été développé dans le cadre de cette thèse. / No
36

Valeurs du travail et capacités relationnelles, Réflexion éthique et managériale de la pensée de Martha C.Nussbaum / Work values and relational skills, Ethical and managerial study based on Martha C. Nussbaum's work

Ezvan, Cécile 18 October 2018 (has links)
La présente thèse propose une réflexion sur les valeurs du travail à partir de l’œuvre de Martha C. Nussbaum, de sa conception des capacités, de la vie bonne et de la justice. Nous y définissions la valeur du travail en fonction de ses effets sur les capacités du travailleur et des autres partie-prenantes. Penser les valeurs du travail à partir des capacités relationnelles permet de rendre compte de dimensions essentielles que le travail permet de développer et que chaque être humain valorise : le respect de soi, la qualité des relations inter-personnelles ou les interactions positives avec le milieu naturel et culturel, de façon à préserver le bien vivre aujourd’hui et demain. Nous éclairons ainsi les enjeux et des finalités du bien vivre au travail, en s’appuyant sur une anthropologie et une éthique relationnelles inspirées d’Aristote et de Kant. Suivant cette approche, le travail s’inscrit aussi dans un cadre institutionnel qui vise à garantir à tous l’accès aux capacités, et en particulier à ceux qui en sont exclus.En contrepoint des approches purement instrumentales de la valeur du travail, d’inspiration utilitariste et néoclassique, cette conception des valeurs du travail est centrée ses finalités, en termes de fonctionnements humains et de vie bonne, à une échelle individuelle et collective.La portée pratique de cette recherche consiste à mettre en évidence les tensions dont le travail contemporain est l’objet et à proposer une démarche pour évaluer, de façon plus juste, les capacités des êtres humains qui y sont engagées. Elle ouvre ainsi la voie à une réflexion pour des acteurs économiques – équipes, entrepreneurs, investisseurs - qui souhaiteraient s’inspirer du cadre proposé pour faire évoluer leurs pratiques et leurs modèles économiques, en promouvant une économie qui serait davantage attentive à la qualité relationnelle entre les parties prenantes. / This thesis proposes a reflection on the values of work based on the work of Martha C. Nussbaum, her conception of capabilities, good life and justice. We defined the value of work in terms of its effects on the abilities of the worker and other stakeholders. Defining work values based on relational capacities makes it possible to account for essential dimensions that work allows to develop and that each human being values: self-respect, the quality of interpersonal relations or positive interactions with the natural and cultural environment, so as to preserve the good life today and tomorrow. In this way, we shed light on the challenges and aims of good working life, based on an anthropology and relational ethics inspired by Aristotle and Kant. Following this approach, the work is also part of an institutional framework that aims to guarantee access to capacities for all, and in particular for those excluded from them.As a counterpoint to purely instrumental approaches to the value of work, utilitarian and neoclassical in inspiration, this conception of work values is centred on its aims, in terms of human functioning and good life, on an individual and collective scale.The practical scope of this research consists in highlighting the tensions to which contemporary work is subjected and in proposing an approach to evaluate, in a more accurate way, the capacities of the human beings who are committed to it. It thus opens the way to reflection for economic players - teams, entrepreneurs, investors - who would like to draw inspiration from the proposed framework to change their business practices and models, by promoting an economy that would be more attentive to the quality of relationships between stakeholders.
37

"Da geração" e "da simpatia" : relacionalidade em prática em três danças da Ilha de Luanda (Angola) / «Par la génération» ou «par la sympathie». : la relationnalité en acte dans trois danses de l’Île de Luanda (Angola) / "Through generation" or "through sympathy" : relationality in Action in Three Dances of the Island of Luanda (Angola)

Toldo, Federica 30 November 2017 (has links)
Ma thèse porte sur les logiques relationnelles qui émergent de l’analyse de trois danses pratiquées sur l’Île de Luanda, un cordon littoral situé face à la ville du même nom, autrefois habité uniquement par des pêcheurs, aujourd’hui largement urbanisé. Dans le contexte local, le mot « danse » (« dança » en portugais ou « kizomba » en kimbundu) ne désigne pas une pratique propre au corps singulier, mais plutôt une configuration sociale. « Danse » signifie « groupe ». Cet usage local m’a conduite à appréhender la danse sur deux plans : celui de la représentation et celui de la participation. Deux des trois danses analysées sont des danses récréatives : la danse carnavalesque et la danse en cercle – rebita – à partir duquel des couples se forment. La troisième est une danse rituelle pratiquée lors des offrandes à la sirène, laquelle exprime son mécontentement par de violentes marées qui, au fil du temps, ont drastiquement réduit la surface émergée de l’île. L’analyse de ces trois danses révèle la prééminence axiologique du domaine de l’affinité, de la conjugalité et du couple. Ce domaine relationnel associé à la territorialité s’oppose à la généalogie – champ dont la transmission de maladies spirituelles vient traduire son caractère problématique.Le fait que ces trois groupes se chevauchent (les gens, et notamment les femmes, circulent entre l’un et l’autre) m’a amenée à aborder la contribution des pratiques dansées à la saturation relationnelle de l’île. Cette densité relationnelle implémentée, entre autres, par les pratiques dansées apporte alors une nouvelle perspective à la vexata quaestio de l’identité de la population de l’île et de sa spécificité dans le contexte luandais. / My thesis focuses on the relational fabric that emerges from three dances practiced on the Island of Luanda –a now urbanised coastal strip off the city shore, formerly inhabited by fishermen. In the local Portuguese dialect, the term “dance” (“dança”) not only refers to an action undertaken by individuals, but also designates a social grouping. The term “dance” means first and foremost “group”. This linguistic particularity led me to view dance from two perspectives: representation and participation. Two of the three dances analysed are recreational: the carnival dance, and the circle dance (rebita) –typically during which couples are formed. The third dance is a ritual dance practiced during the offering to the mermaid (kyanda), who manifests her dissatisfaction through sea storms. The analysis of these three dances shows the axiological pre-eminence of the relational domain of affinity, conjugality and partnership. This contrasts with the genealogic domain, which is troubled by the transmission of spiritual afflictions (ilundu spirits).It is common for these three groups to overlap; individuals –especially women– tend to flow from group to group. This led me to consider the role of dance practices in the densification of the Island’s relational fabric. Implemented by dances, this relational density brings a new perspective to the difficult task of understanding the cultural specificity of the Island’s population within Luanda’s broader context. / Esta tese foca as logicas relacionais que emergem da analise de três danças praticadas na Ilha de Luanda, uma restinga que, da margem norte do rio Kwanza, vai até em frente ao porto da cidade de Luanda. A Ilha, um tempo maioritariamente habitada por uma população de pescadores, se encontra hoje englobada pela cidade. No contexto local, o termo dança não se refere à prática de um corpo singular, mas antes a um grupo. Este uso linguístico local leva a considerar a dança segundo uma dupla perspetiva: a da representação e a da participação. Duas das três danças tem uma finalidade recreativa: a dança carnavalesca e a dança em roda de combinação de casais chamada rebita. A terceira é uma dança ritual praticada em ocasião das oferendas para a sereia, cuja insatisfação se traduz em marés violentas chamadas kalembas que ao longo do tempo reduziram a superfície da Ilha. Da analise das três danças emerge la preeminência axiológica do campo da afinidade, da conjugalidade e do casal. Este campo relacional associado à territorialidade se contrapõe ao campo genealógico, dominado pela transmissão de doenças espirituais.A sobreposição sociológica dos três grupos de dança (isto é, o fato que um pequeno grupo de mulheres circulam pertencem simultaneamente aos três) levou a considerar o papel das praticas dançadas na densificação do campo relacional da Ilha. Essa densidade implementada, entre outras coisas, pela dança traz uma nova perspetiva para abordar a vexata quaestio da identidade da população da Ilha e da sua especificidade no contexto luandense
38

La génération des connaissances et la conception des artefacts visuels : le cas de l'aménagement des espaces de travail dans les entreprises / Knowledge generation and visuel's artifact conception : case of workspace planning within the enterprises

Chouki, Mourad 26 November 2012 (has links)
Actuellement, le développement du travail en mode projet, ainsi que le travail en réseaux, entraînent de profondes modifications dans la manière de concevoir les espaces de travail et les bureaux. Les entreprises qui conçoivent ces espaces associent souvent des architectes et des designers.La thèse a pour objet de répondre à la question suivante : comment les connaissances nouvelles sont elles générées dans les activités de conception relatives au domaine de l'aménagement des espaces de travail ?Le premier chapitre s'articulera autour des différents travaux relatifs aux activités deconception (travaux de Lebahar, Hatchuel et Visser, etc.). Le second s'intéressera aux différentes théories relatives à la génération des connaissances (travaux de Nonaka, Tsoukas et Engeström, etc).Afin de répondre à notre question de recherche, nous avons mis en place un dispositif d'observation de longue durée au sein des entreprises étudiées (approche de nature ethnométhdologique). Il s'agit de deux entreprises parisiennes spécialisées dans l'aménagement des espaces de travail: Génie des Lieux et Workspace CBRE.Nous avons montré que des difficultés d'intercompréhension apparaissent dans les activités de conception. Ces obstacles sont dûs à l'existence des connaissances tacites relationnelles au sens d'Harry Collins. Ces dernières peuvent être rendues explicites par la conception d'objets intermédiaires. Nous avons vu également comment la conception des artefacts en deux dimensions et en trois dimensions permet la génération des connaissances nouvelles et utiles dans un projet d'aménagement d'espaces de travail. / The development of this work is currently carried out in a project mode, since working in the network requires deep modifications in a way of conceiving the workspaces as well as the offices. The enterprises that conceive these spaces often associate both the designers and the architects.The purpose of this present thesis is to answer the flowing question: how are the recent knowledges generated in the conception activities which appear in the field of work space planning?The first chapter focuses on the works related to the conception activities (works of Lebahar, Hatchuel and Visser...etc...). The second deals with the different theories relating to the generation of knowledge (works of Nonaka, Tsoukas and Engeström... etc...).To answer our research question, we have installed a device which requires a long_term intervention inside the enterprises meant for study (ethnomethodological approach). There are two Parisian enterprises that specialize in work space planning: (GENIE DES LIEUX and workspace CBRE).During the work, we have shown some difficulty intercomprehension that emerged in the conception activities. We have concluded, as a result, that these obstacles were due to relational tacit knowledges (RTK) according to Harry Collins theory. However these difficulties can be made explicit by the conception of intermediate objects.We have also noticed that ho when conceiving the artifacts into two and three dimensions, this allows the generation of new and useful knowledges in a project of work space planning.
39

Modèles d'embeddings à valeurs complexes pour les graphes de connaissances / Complex-Valued Embedding Models for Knowledge Graphs

Trouillon, Théo 29 September 2017 (has links)
L'explosion de données relationnelles largement disponiblessous la forme de graphes de connaissances a permisle développement de multiples applications, dont les agents personnels automatiques,les systèmes de recommandation et l'amélioration desrésultats de recherche en ligne.La grande taille et l'incomplétude de ces bases de donnéesnécessite le développement de méthodes de complétionautomatiques pour rendre ces applications viables.La complétion de graphes de connaissances, aussi appeléeprédiction de liens, se doit de comprendre automatiquementla structure des larges graphes de connaissances (graphes dirigéslabellisés) pour prédire les entrées manquantes (les arêtes labellisées).Une approche gagnant en popularité consiste à représenter ungraphe de connaissances comme un tenseur d'ordre 3, etd'utiliser des méthodes de décomposition de tenseur pourprédire leurs entrées manquantes.Les modèles de factorisation existants proposent différentscompromis entre leur expressivité, et leur complexité en temps et en espace.Nous proposons un nouveau modèle appelé ComplEx, pour"Complex Embeddings", pour réconcilier expressivité etcomplexité par l'utilisation d'une factorisation en nombre complexes,dont nous explorons le lien avec la diagonalisation unitaire.Nous corroborons notre approche théoriquement en montrantque tous les graphes de connaissances possiblespeuvent être exactement décomposés par le modèle proposé.Notre approche, basées sur des embeddings complexesreste simple, car n'impliquant qu'un produit trilinéaire complexe,là où d'autres méthodes recourent à des fonctions de compositionde plus en plus compliquées pour accroître leur expressivité.Le modèle proposé ayant une complexité linéaire en tempset en espace est passable à l'échelle, tout endépassant les approches existantes sur les jeux de données de référencepour la prédiction de liens.Nous démontrons aussi la capacité de ComplEx àapprendre des représentations vectorielles utiles pour d'autres tâches,en enrichissant des embeddings de mots, qui améliorentles prédictions sur le problème de traitement automatiquedu langage d'implication entre paires de phrases.Dans la dernière partie de cette thèse, nous explorons lescapacités de modèles de factorisation à apprendre lesstructures relationnelles à partir d'observations.De part leur nature vectorielle,il est non seulement difficile d'interpréter pourquoicette classe de modèles fonctionne aussi bien,mais aussi où ils échouent et comment ils peuventêtre améliorés. Nous conduisons une étude expérimentalesur les modèles de l'état de l'art, non pas simplementpour les comparer, mais pour comprendre leur capacitésd'induction. Pour évaluer les forces et faiblessesde chaque modèle, nous créons d'abord des tâches simplesreprésentant des propriétés atomiques despropriétés des relations des graphes de connaissances ;puis des tâches représentant des inférences multi-relationnellescommunes au travers de généalogies synthétisées.À partir de ces résultatsexpérimentaux, nous proposons de nouvelles directionsde recherches pour améliorer les modèles existants,y compris ComplEx. / The explosion of widely available relational datain the form of knowledge graphsenabled many applications, including automated personalagents, recommender systems and enhanced web search results.The very large size and notorious incompleteness of these data basescalls for automatic knowledge graph completion methods to make these applicationsviable. Knowledge graph completion, also known as link-prediction,deals with automatically understandingthe structure of large knowledge graphs---labeled directed graphs---topredict missing entries---labeled edges. An increasinglypopular approach consists in representing knowledge graphs as third-order tensors,and using tensor factorization methods to predict their missing entries.State-of-the-art factorization models propose different trade-offs between modelingexpressiveness, and time and space complexity. We introduce a newmodel, ComplEx---for Complex Embeddings---to reconcile both expressivenessand complexity through the use of complex-valued factorization, and exploreits link with unitary diagonalization.We corroborate our approach theoretically and show that all possibleknowledge graphs can be exactly decomposed by the proposed model.Our approach based on complex embeddings is arguably simple,as it only involves a complex-valued trilinear product,whereas other methods resort to more and more complicated compositionfunctions to increase their expressiveness. The proposed ComplEx model isscalable to large data sets as it remains linear in both space and time, whileconsistently outperforming alternative approaches on standardlink-prediction benchmarks. We also demonstrateits ability to learn useful vectorial representations for other tasks,by enhancing word embeddings that improve performanceson the natural language problem of entailment recognitionbetween pair of sentences.In the last part of this thesis, we explore factorization models abilityto learn relational patterns from observed data.By their vectorial nature, it is not only hard to interpretwhy this class of models works so well,but also to understand where they fail andhow they might be improved. We conduct an experimentalsurvey of state-of-the-art models, not towardsa purely comparative end, but as a means to get insightabout their inductive abilities.To assess the strengths and weaknesses of each model, we create simple tasksthat exhibit first, atomic properties of knowledge graph relations,and then, common inter-relational inference through synthetic genealogies.Based on these experimental results, we propose new researchdirections to improve on existing models, including ComplEx.
40

Supporting multiple data stores based applications in cloud environments / Soutenir les applications utilisant des bases de données multiples dans un environnement Cloud Computing

Sellami, Rami 05 February 2016 (has links)
Avec l’avènement du cloud computing et des big data, de nouveaux systèmes de gestion de bases de données sont apparus, connus en général sous le vocable systèmes NoSQL. Par rapport aux systèmes relationnels, ces systèmes se distinguent par leur absence de schéma, une spécialisation pour des types de données particuliers (documents, graphes, clé/valeur et colonne) et l’absence de langages de requêtes déclaratifs. L’offre est assez pléthorique et il n’y a pas de standard aujourd’hui comme peut l’être SQL pour les systèmes relationnels. De nombreuses applications peuvent avoir besoin de manipuler en même temps des données stockées dans des systèmes relationnels et dans des systèmes NoSQL. Le programmeur doit alors gérer deux (au moins) modèles de données différents et deux (au moins) langages de requêtes différents pour pouvoir écrire son application. De plus, il doit gérer explicitement tout son cycle de vie. En effet, il a à (1) coder son application, (2) découvrir les services de base de données déployés dans chaque environnement Cloud et choisir son environnement de déploiement, (3) déployer son application, (4) exécuter des requêtes multi-sources en les programmant explicitement dans son application, et enfin le cas échéant (5) migrer son application d’un environnement Cloud à un autre. Toutes ces tâches sont lourdes et fastidieuses et le programmeur risque d’être perdu dans ce haut niveau d’hétérogénéité. Afin de pallier ces problèmes et aider le programmeur tout au long du cycle de vie des applications utilisant des bases de données multiples, nous proposons un ensemble cohérent de modèles, d’algorithmes et d’outils. En effet, notre travail dans ce manuscrit de thèse se présente sous forme de quatre contributions. Tout d’abord, nous proposons un modèle de données unifié pour couvrir l’hétérogénéité entre les modèles de données relationnelles et NoSQL. Ce modèle de données est enrichi avec un ensemble de règles de raffinement. En se basant sur ce modèle, nous avons défini notre algèbre de requêtes. Ensuite, nous proposons une interface de programmation appelée ODBAPI basée sur notre modèle de données unifié, qui nous permet de manipuler de manière uniforme n’importe quelle source de données qu’elle soit relationnelle ou NoSQL. ODBAPI permet de programmer des applications indépendamment des bases de données utilisées et d’exprimer des requêtes simples et complexes multi-sources. Puis, nous définissons la notion de bases de données virtuelles qui interviennent comme des médiateurs et interagissent avec les bases de données intégrées via ODBAPI. Ce dernier joue alors le rôle d’adaptateur. Les bases de données virtuelles assurent l’exécution des requêtes d’une façon optimale grâce à un modèle de coût et un algorithme de génération de plan d’exécution optimal que nous définis. Enfin, nous proposons une approche automatique de découverte de bases de données dans des environnements Cloud. En effet, les programmeurs peuvent décrire leurs exigences en termes de bases de données dans des manifestes, et grâce à notre algorithme d’appariement, nous sélectionnons l’environnement le plus adéquat à notre application pour la déployer. Ainsi, nous déployons l’application en utilisant une API générique de déploiement appelée COAPS. Nous avons étendue cette dernière pour pouvoir déployer les applications utilisant plusieurs sources de données. Un prototype de la solution proposée a été développé et mis en œuvre dans des cas d'utilisation du projet OpenPaaS. Nous avons également effectué diverses expériences pour tester l'efficacité et la précision de nos contributions / The production of huge amount of data and the emergence of Cloud computing have introduced new requirements for data management. Many applications need to interact with several heterogeneous data stores depending on the type of data they have to manage: traditional data types, documents, graph data from social networks, simple key-value data, etc. Interacting with heterogeneous data models via different APIs, and multiple data stores based applications imposes challenging tasks to their developers. Indeed, programmers have to be familiar with different APIs. In addition, the execution of complex queries over heterogeneous data models cannot, currently, be achieved in a declarative way as it is used to be with mono-data store application, and therefore requires extra implementation efforts. Moreover, developers need to master and deal with the complex processes of Cloud discovery, and application deployment and execution. In this manuscript, we propose an integrated set of models, algorithms and tools aiming at alleviating developers task for developing, deploying and migrating multiple data stores applications in cloud environments. Our approach focuses mainly on three points. First, we provide a unified data model used by applications developers to interact with heterogeneous relational and NoSQL data stores. This model is enriched by a set of refinement rules. Based on that, we define our query algebra. Developers express queries using OPEN-PaaS-DataBase API (ODBAPI), a unique REST API allowing programmers to write their applications code independently of the target data stores. Second, we propose virtual data stores, which act as a mediator and interact with integrated data stores wrapped by ODBAPI. This run-time component supports the execution of single and complex queries over heterogeneous data stores. It implements a cost model to optimally execute queries and a dynamic programming based algorithm to generate an optimal query execution plan. Finally, we present a declarative approach that enables to lighten the burden of the tedious and non-standard tasks of (1) discovering relevant Cloud environments and (2) deploying applications on them while letting developers to simply focus on specifying their storage and computing requirements. A prototype of the proposed solution has been developed and implemented use cases from the OpenPaaS project. We also performed different experiments to test the efficiency and accuracy of our proposals

Page generated in 0.1244 seconds