Global ETD Search

Return to search

Le déploiement, une phase à part entière dans le cycle de vie des entrepôts de données : application aux plateformes parallèles / Deployment, full phase in the data warehouse life cycle : application to parallel platforms

La conception d’un entrepôt de données parallèle consiste à choisir l’architecture matérielle,à fragmenter le schéma d’entrepôt de données, à allouer les fragments générés, à répliquer les fragments pour assurer une haute performance du système et à définir la stratégie de traitement et d’équilibrage de charges. L’inconvénient majeur de ce cycle de conception est son ignorance de l’interdépendance entre les sous-problèmes liés à la conception d’un EDP et l’utilisation des métriques hétérogènes pour atteindre le même objectif. Notre première proposition définie un modèle de coût analytique pour le traitement parallèle des requêtes OLAP dans un environnement cluster. Notre deuxième proposition prend en considération l’interdépendance existante entre la fragmentation et l’allocation. Dans ce contexte, nous avons proposé une nouvelle approche de conception d’un EDP sur un cluster de machine. Durant le processus de fragmentation, notre approche décide si le schéma de fragmentation généré est pertinent pour le processus d’allocation. Les résultats obtenus sont très encourageant et une validation est faite sur Teradata. Notre troisième proposition consiste à présenter une méthode de conception qui est une extension de notre travail. Dans cette phase, une méthode de réplication originale, basée sur la logique floue, est intégrée. / Designing a parallel data warehouse consists of choosing the hardware architecture, fragmenting the data warehouse schema, allocating the generated fragments, replicating fragments to ensure high system performance and defining the treatment strategy and load balancing.The major drawback of this design cycle is its ignorance of the interdependence between subproblems related to the design of PDW and the use of heterogeneous metrics to achieve thesame goal. Our first proposal defines an analytical cost model for parallel processing of OLAP queries in a cluster environment. Our second takes into account the interdependence existing between fragmentation and allocation. In this context, we proposed a new approach to designa PDW on a cluster machine. During the fragmentation process, our approach determines whether the fragmentation pattern generated is relevant to the allocation process or not. The results are very encouraging and validation is done on Teradata. For our third proposition, we presented a design method which is an extension of our work. In this phase, an original method of replication, based on fuzzy logic is integrated.

http://www.theses.fr/2014ESMA0027/document

Fragmentation

Allocation

Réplication

Equilibrage de charge

Modèle de coût analytique

Analytical cost model

Identifer	oai:union.ndltd.org:theses.fr/2014ESMA0027
Date	24 June 2014
Creators	Benkrid, Soumia
Contributors	Chasseneuil-du-Poitou, Ecole nationale supérieure de mécanique et d'aérotechnique, Ecole Nationale Supérieure d'Informatique (ESI) - Alger, Bellatreche, Ladjel, Hidouci, Khaled-Walid
Source Sets	Dépôt national des thèses électroniques françaises
Language	French
Detected Language	French
Type	Electronic Thesis or Dissertation, Text

Page generated in 0.002 seconds

Le déploiement, une phase à part entière dans le cycle de vie des entrepôts de données : application aux plateformes parallèles / Deployment, full phase in the data warehouse life cycle : application to parallel platforms

Description

Links & Downloads

Tags

Additional Fields