171 |
Contribution des données accélérométriques de KiKNet à la prédiction du mouvement sismique par l'approche neuronale avec la prise en compte des effets de siteDerras, Boumédiène 18 September 2011 (has links) (PDF)
Ce travail a pour objet d'analyser la capacité des réseaux de neurones artificiels (RNA) à prédire les mouvements sismiques avec des performances statistiques similaires aux techniques de régression par moindres carrés conduisant aux "équations de prédiction du mouvement du sol" (EPMS), utilisées classiquement depuis plusieurs décennies. Les principaux avantages de cette nouvelle approche RNA vis-à-vis des EPMS sont d'une part l'absence d'a priori sur les formes fonctionnelles régissant la dépendance aux différents paramètres, celle-ci devant "automatiquement" émerger des données, ainsi qu'une quantification simple de l'importance relative des variables indépendantes qui affectent le mouvement sismique du sol. Le présent travail s'appuie sur un sous-ensemble de la base de données sismique KiKNet, où les événements retenus ont une profondeur inferieure à 25 km, une magnitude comprise entre 3.5 et 7.3 et une distance épicentrale allant de 1 à 343 km. L'effet de site est pris en considération dans cette étude avec l'utilisation conjointe de la vitesse des ondes de cisaillement moyenne sur trente mètres de profondeur et la fréquence de résonance du site. L'analyse des données KiK-Net enregistrées en surface et en profondeur permet de calculer, par un RNA, les rapports d'amplification spectrale surface/profondeur afin d'estimer l'effet de site. La même approche est utilisée pour la prédiction des indicateurs de nocivité les plus communément utilisés en ingénierie parasismique, ainsi que pour la génération des pseudo-accélérations spectrales largement utilisées dans l'analyse dynamique des structures. Les résultats obtenus montrent que les modèles neuronaux élaborés sont relativement robustes et ne dépendent que faiblement de la base de données initiale. Ce résultat est intéressant pour les régions où les données sismiques sont rares. Les écarts-types obtenus pour ces modèles sont légèrement inferieurs à ceux des équations classiques de prédiction du mouvement sismique. Les modèles neuronaux établis ne nécessitent aucun a priori sur la nature de la forme fonctionnelle de la relation d'atténuation. L'atténuation du mouvement sismique avec la distance, l'effet d'échelle de la magnitude et l'effet de site non linéaire sont ainsi pris en considération "naturellement" par les RNA à partir du moment où ils existent dans le jeu de données initial. Les résultats obtenus indiquent également une influence significative de la profondeur focale et de la fréquence de résonance sur le mouvement sismique à la surface libre. La possibilité de mettre ces modèles en oeuvre à l'aide d'un tableur Excel ou autre est démontrée, ouvrant ainsi un très vaste champ d'utilisation.
|
172 |
Création d'un environnement de gestion de base de données "en grille" : application à l'échange de données médicalesDe Vlieger, Paul 12 July 2011 (has links) (PDF)
La problématique du transport de la donnée médicale, de surcroît nominative, comporte de nombreuses contraintes, qu'elles soient d'ordre technique, légale ou encore relationnelle. Les nouvelles technologies, issues particulièrement des grilles informatiques, permettent d'offrir une nouvelle approche au partage de l'information. En effet, le développement des intergiciels de grilles, notamment ceux issus du projet européen EGEE, ont permis d'ouvrir de nouvelles perspectives pour l'accès distribué aux données. Les principales contraintes d'un système de partage de données médicales, outre les besoins en termes de sécurité, proviennent de la façon de recueillir et d'accéder à l'information. En effet, la collecte, le déplacement, la concentration et la gestion de la donnée, se fait habituellement sur le modèle client-serveur traditionnel et se heurte à de nombreuses problématiques de propriété, de contrôle, de mise à jour, de disponibilité ou encore de dimensionnement des systèmes. La méthodologie proposée dans cette thèse utilise une autre philosophie dans la façon d'accéder à l'information. En utilisant toute la couche de contrôle d'accès et de sécurité des grilles informatiques, couplée aux méthodes d'authentification robuste des utilisateurs, un accès décentralisé aux données médicales est proposé. Ainsi, le principal avantage est de permettre aux fournisseurs de données de garder le contrôle sur leurs informations et ainsi de s'affranchir de la gestion des données médicales, le système étant capable d'aller directement chercher la donnée à la source.L'utilisation de cette approche n'est cependant pas complètement transparente et tous les mécanismes d'identification des patients et de rapprochement d'identités (data linkage) doivent être complètement repensés et réécris afin d'être compatibles avec un système distribué de gestion de bases de données. Le projet RSCA (Réseau Sentinelle Cancer Auvergne - www.e-sentinelle.org) constitue le cadre d'application de ce travail. Il a pour objectif de mutualiser les sources de données auvergnates sur le dépistage organisé des cancers du sein et du côlon. Les objectifs sont multiples : permettre, tout en respectant les lois en vigueur, d'échanger des données cancer entre acteurs médicaux et, dans un second temps, offrir un support à l'analyse statistique et épidémiologique.
|
173 |
Découverte de motifs n-aires utilisant la programmation par contraintesKhiari, Medhi 19 June 2012 (has links) (PDF)
La fouille de données et la Programmation Par Contraintes (PPC) sont deux domaines de l'informatique qui ont eu, jusqu'à très récemment, des destins séparés. Cette thèse est l'une des toutes premières à s'intéresser aux liens entre la fouille de données et la PPC, et notamment aux apports de cette dernière à l'extraction de motifs sous contraintes. Différentes méthodes génériques pour la découverte de motifs locaux ont été proposées. Mais, ces méthodes ne prennent pas en considération le fait que l'intérêt d'un motif dépend souvent d'autres motifs. Un tel motif est appelé motif n-aire. Très peu de travaux concernant l'extraction de motifs n-aires ont été menés et les méthodes développées sont toutes ad hoc. Cette thèse propose un cadre unifié pour modéliser et résoudre les contraintes n-aires en fouille de données. Tout d'abord, l'extraction de motifs n-aires est modélisée sous forme de problème de satisfaction de contraintes (CSP). Puis, un langage de requêtes à base de contraintes de haut niveau est proposé. Ce langage permet d'exprimer une large panoplie de contraintes n-aires. Plusieurs méthodes de résolution sont développées et comparées. Les apports principaux de ce cadre sont sa déclarativité et sa généricité. Il s'agit du premier cadre générique et flexible permettant la modélisation et la résolution de contraintes n-aires en fouille de données.
|
174 |
Étude d'un modèle simplifié pour l'analyse de cycle de vie des bâtimentsLasvaux, Sébastien 14 December 2010 (has links) (PDF)
Les préoccupations énergétiques et environnementales sont de plus en plus au cœur du processus de conception des bâtiments. L'approche couramment retenue pour évaluer la performance environnementale d'un bâtiment est la méthode d'Analyse de Cycle de Vie (ACV). Cette méthode utilise, à ce jour, un nombre de données très important pouvant parfois être une limite pour son application. Par exemple, il est difficile pour certains fabricants de fournir des inventaires sous la forme de plusieurs centaines de flux. De même, l'interprétation des résultats à l'aide d'une dizaine d'indicateurs environnementaux peut paraître complexe pour les professionnels du bâtiment. Dans ce contexte, l'objectif de cette recherche est d'étudier un modèle simplifié pour l'ACV des bâtiments. Pour cela, une base de données simplifiée de flux d'inventaire de cycle de vie sur les matériaux, produits de construction et procédés est dans un premier temps développée. Elle est composée de données des bases Ecoinvent et INIES à l'aide d'une nomenclature homogénéisée. L'utilisation de méthodes statistiques permet ensuite de mettre en évidence les limites et potentialités de la simplification du modèle ACV. Des modèles simplifiés d'évaluation des impacts reliant les flux et les indicateurs de l'ACV sont notamment mis au point. Ils permettent préalablement aux applications utilisant la base de données, d'identifier les flux qui sont les plus déterminants dans l'impact environnemental d'un bâtiment. La compréhension des conséquences de la simplification du modèle et les méthodes statistiques utilisées dans ce travail permettent alors de mieux cerner la fiabilité des ACV simplifiées appliquées aux produits de construction et aux bâtiments.
|
175 |
Extraction de Séquences Fréquentes : Des Bases de Données Statiques aux Flots de DonnéesRaïssi, Chedy 15 July 2008 (has links) (PDF)
Extraction de séquences fréquentes : des bases de données statiques aux flots de données Il est reconnu aujourd'hui que l'être humain est généralement noyé sous une profusion d'informations et que sa capacité d'analyse n'est plus capable de faire face au volume sans cesse croissant de données. C'est dans ce contexte qu'est né le processus d'Extraction de Connaissance dans les bases de Données. Un des buts de ce processus est de passer d'un grand volume d'informations à un petit ensemble de connaissances à fortes valeurs ajoutées pour l'analyste ou le décideur. De plus, le processus d'ECD n'est pas un processus monolithique et univoque au cours duquel il s'agirait d'appliquer un principe général à tous les types de données stockées ou récupérées. Ainsi, une des étapes de ce processus qu'est la fouille de données peut se dériver sous plusieurs formes tels que : le clustering, la classification, l'extraction d'itemset et de règles d'associations, l'extraction de structures plus complexes tels que les épisodes, les graphes ou comme dans le cadre de cette thèse l'extraction de motifs séquentiels. Malheureusement, dans un monde sans cesse en évolution, le contexte dans lequel les travaux d'ECD ont été définis ces dernières années considérait que les données, sur lesquelles la fouille était réalisée, étaient disponibles dans des bases de données statiques. Aujourd'hui, suite au développement de nouvelles technologies et applications associées, nous devons faire face à de nouveaux modèles dans lesquels les données sont disponibles sous la forme de flots. Une question se pose alors : quid des approches d'extraction de connaissances traditionnelles ? Dans ce mémoire, nous présentons un ensemble de résultat sur les motifs séquentiels dans les bases de données d'un point de vue des représentations condensées et des méthodes d'échantillonnage puis nous étendons nos différentes approches afin de prendre en compte le nouveau modèle des flots de données. Nous présentons des algorithmes permettant ainsi l'extraction de motifs séquentiels (classiques et multidimensionnels) sur les flots. Des expérimentations menées sur des données synthétiques et sur des données réelles sont rapportées et montrent l'intérêt de nos propositions.
|
176 |
Induction automatique : aspects théoriques, le système ARBRE, applications en médecineCrémilleux, Bruno 12 February 1991 (has links) (PDF)
L'objectif de ce travail est d'étudier l'induction en tant qu'outil exploratoire de bases d'exemples. L'induction automatique fournit une description tenant compte de l'ensemble des individus de la base d'exemples et en extrait la connaissance nécessaire à la résolution d'un problème. Il existe de nombreux algorithmes d'induction employant différents critères pragmatiques pour sélectionner une variable. Une formalisation mathématique du problème de la sélection d'une variable est proposée. Elle permet d'une part de définir une famille de "bons" critères reposant sur le choix d'une fonction strictement concave. D'autre part, les systèmes d'induction incertaine décrits dans la littérature emploient des techniques d'élagage dont le but est la construction d'arbres de classement. Une méthode d'élagage liée à un indice de qualité et adaptée à notre usage de l'induction incertaine est proposée. Elle montre en quoi la construction et l'élagage d'un arbre relèvent des mêmes concepts théoriques (l'indice de qualité fait intervenir les résultats des calculs entrepris lors de la construction de l'arbre). Un système d'induction (ARBRE) mettant enoeuvre ces résultats théoriques a été développé. il met en évidence les spécifications qui, à notre avis, sont indispensables pour un système en domaine incertain. Il permet une exploration immédiate de base d'exemples sans connaissance préalable du domaine, et représente la connaissance acquise sous la forme d'arbres d'induction. Trois problèmes médicaux réels montrent l'intérêt de l'usage d'un tel système, adapté à tout domaine où la connaissance est incertaine.
|
177 |
Recommandation Pair-à-Pair pour Communautés en Ligne à Grande EchelleDraidi, Fady 09 March 2012 (has links) (PDF)
Les systèmes de recommandation (RS) et le pair-à-pair (P2) sont complémen-taires pour faciliter le partage de données à grande échelle: RS pour filtrer et person-naliser les requêtes des utilisateurs, et P2P pour construire des systèmes de partage de données décentralisés à grande échelle. Cependant, il reste beaucoup de difficultés pour construire des RS efficaces dans une infrastructure P2P. Dans cette thèse, nous considérons des communautés en ligne à grande échelle, où les utilisateurs notent les contenus qu'ils explorent et gardent dans leur espace de travail local les contenus de qualité pour leurs sujets d'intérêt. Notre objectif est de construire un P2P-RS efficace pour ce contexte. Nous exploitons les sujets d'intérêt des utilisateurs (extraits automatiquement des contenus et de leurs notes) et les don-nées sociales (amitié et confiance) afin de construire et maintenir un overlay P2P so-cial. La thèse traite de plusieurs problèmes. D'abord, nous nous concentrons sur la conception d'un P2P-RS qui passe à l'échelle, appelé P2Prec, en combinant les ap-proches de recommandation par filtrage collaboratif et par filtrage basé sur le contenu. Nous proposons alors de construire et maintenir un overlay P2P dynamique grâce à des protocoles de gossip. Nos résultats d'expérimentation montrent que P2Prec per-met d'obtenir un bon rappel avec une charge de requêtes et un trafic réseau accep-tables. Ensuite, nous considérons une infrastructure plus complexe afin de construire et maintenir un overlay P2P social, appelé F2Frec, qui exploite les relations sociales entre utilisateurs. Dans cette infrastructure, nous combinons les aspects filtrage par contenu et filtrage basé social, pour obtenir un P2P-RS qui fournit des résultats de qualité et fiables. A l'aide d'une évaluation de performances extensive, nous mon-trons que F2Frec améliore bien le rappel, ainsi que la confiance dans les résultats avec une surcharge acceptable. Enfin, nous décrivons notre prototype de P2P-RS que nous avons implémenté pour valider notre proposition basée sur P2Prec et F2Frec.
|
178 |
PHYSIOPATHOLOGIE DE LA MALADIE DE CHARCOT-MARIE- TOOTH DE TYPE 4A/2K ASSOCIEE AUX MUTATIONS DU GENE GDAP1Cassereau, Julien 28 September 2011 (has links) (PDF)
La maladie de Charcot-Marie-Tooth (CMT) représente un large groupe hétérogène de neuropathies périphériques héréditaires. Les mutations du gène GDAP1 (ganglioside-induced differentiation-associated protein 1), codant pour une protéine de la membrane externe mitochondriale, sont associées à des formes récessives (CMT4A) et à des formes dominantes de CMT (CMT2K). GDAP1 participerait au processus de fission des mitochondries sans que son rôle soit bien défini. L'objectif de ce travail a été d'étudier le métabolisme énergétique mitochondrial de cellules de peau issues de patients porteurs de mutations du gène GDAP1. Nous avons mis en évidence un déficit énergétique mitochondrial associé au complexe I sans altération majeure du réseau mitochondrial. Ce déficit fonctionnel du complexe I est associé à une production accrue de radicaux libres et un défaut de régulation de la protéine sirtuine 1, une désacétylase NAD-dépendante impliquée dans la biogenèse mitochondriale. Nos travaux ont ainsi montré que GDAP1 a un rôle important dans le métabolisme énergétique mitochondrial. Dans le but d'établir des corrélations génotype-phénotype, nous avons créé une base de données internationale permettant de répertorier les données cliniques et les variations de séquence de GDAP1.
|
179 |
Analyse multidimensionnelle interactive de résultats de simulation. Aide à la décision dans le domaine de l'agroécologieBouadi, Tassadit 28 November 2013 (has links) (PDF)
Dans cette thèse, nous nous sommes intéressés à l'analyse des données de simulation issues du modèle agro-hydrologique TNT. Les objectifs consistaient à élaborer des méthodes d'analyse des résultats de simulation qui replacent l'utilisateur au coeur du processus décisionnel, et qui permettent d'analyser et d'interpréter de gros volumes de données de manière efficace. La démarche développée consiste à utiliser des méthodes d'analyse multidimensionnelle interactive. Tout d'abord, nous avons proposé une méthode d'archivage des résultats de simulation dans une base de données décisionnelle (i.e. entrepôt de données), adaptée au caractère spatio-temporel des données de simulation produites. Ensuite, nous avons suggéré d'analyser ces données de simulations avec des méthodes d'analyse en ligne (OLAP) afin de fournir aux acteurs des informations stratégiques pour améliorer le processus d'aide à la prise de décision. Enfin, nous avons proposé deux méthodes d'extraction de skyline dans le contexte des entrepôts de données afin de permettre aux acteurs de formuler de nouvelles questions en combinant des critères environnementaux contradictoires, et de trouver les solutions compromis associées à leurs attentes, puis d'exploiter les préférences des acteurs pour détecter et faire ressortir les données susceptibles de les intéresser. La première méthode EC2Sky, permet un calcul incrémental et efficace des skyline en présence de préférences utilisateurs dynamiques, et ce malgré de gros volumes de données. La deuxième méthode HSky, étend la recherche des points skyline aux dimensions hiérarchiques. Elle permet aux utilisateurs de naviguer le long des axes des dimensions hiérarchiques (i.e. spécialisation / généralisation) tout en assurant un calcul en ligne des points skyline correspondants. Ces contributions ont été motivées et expérimentées par l'application de gestion des pratiques agricoles pour l'amélioration de la qualité des eaux des bassins versants agricoles, et nous avons proposé un couplage entre le modèle d'entrepôt de données agro-hydrologiques construit et les méthodes d'extraction de skyline proposées.
|
180 |
Outil d'aide au diagnostic du réseau d'eau potable pour la ville de Chisinau par analyse spatiale et temporelle des dysfonctionnements hydrauliquesBlindu, Igor 12 May 2004 (has links) (PDF)
Le travail effectué dans le cadre de cette thèse intitulée " Outil d'aide au diagnostic du réseau d'eau potable pour la ville de Chisinau par analyse spatiale et temporelle des dysfonctionnements hydrauliques " porte sur le développement d'une maquette du futur outil d'aide à la gestion des infrastructures et notamment du réseau d'eau potable de la ville de Chisinau Moldavie (1200 Km de canalisations - 800 000 habitants). La méthode proposée est basée sur l'analyse de l'état de fonctionnement du réseau d'eau potable. Cet état de fonctionnement du réseau d'AEP peut être connu à partir : - d'informations directes fournies par un système de télésurveillance (mesure de pression, de vitesse, de débit, de qualité....), - d'informations indirectes (analyse des incidents survenus sur le réseau, des interventions, de l'environnement du réseau....) obtenues. Dans notre cas, l'absence de mesures directes ne permet pas de quantifier l'état de fonctionnement du réseau sur l'ensemble du réseau sauf en quelques points critiques connus (station de pompage, station de relèvement..), c'est pourquoi, cet état est défini en se basant sur la liste des incidents, et des interventions survenues sur le réseau entre 1996 et 2001, ainsi que sur des informations portant sur l'environnement du réseau (nature des sols, aménagement du territoire ...) Ce travail de recherche comprend deux volets : Ü Aspect " Diagnostic " : Analyser qualitativement et quantitativement tous les aléas pouvant exister sur le réseau et se manifester par des observations. Il s'agit dans tous les cas d'établir le cheminement possible entre les observations, les causes possibles, et d'évaluer les conséquences induites. Il s'agit par une analyse successive et récursive (à l'aide de requêtes temporelles), de détecter la simultanéité de 2 ou plusieurs observations (manifestations de dysfonctionnement) se produisant dans un même laps de temps et la mise en évidence de relations topologiques et hydrauliques pouvant exister entre les sites où sont observés les dysfonctionnements. L'utilisation également de la théorie des graphes, plus particulièrement du réseau de Petri, permet de passer d'une analyse espace-temps entre 2 ou m événements à une analyse intégrant la causalité entre 2 événements. Ü Aspect " Aide à la décision " : Associer un " niveau d'urgence " à chaque tronçon du réseau afin d'assurer le suivi de la réhabilitation des infrastructures, l'assistance à la réhabilitation avec la détermination de zones prioritaires, la gestion/maintenance du réseau pour la pérennité du réseau. Ce niveau d'urgence est quantifié à l'aide d'une Méthode Hiérarchique Multicritères développée par SAATY (en considérant des critères techniques, économiques, sociaux, environnementaux ainsi que la politique des gestionnaires). La méthodologie développée utilise différents outils et méthodes issues : des bases de données temporelles, d'analyse spatiale et de SIG, de raisonnement cognitif et de modélisation hydraulique des écoulements, théorie de graphes et réseau de Petri. L'outil est testé sur un secteur pilote de la ville, qui représente environ 7% du réseau d'eau potable sur la ville, l'ensemble du réseau sera pris en compte ultérieurement lorsque la validation de cette portion de réseau sera faite par les services techniques de la ville de Chisinau (Moldavie). Mots clés : Vieillissement, réseau d'eau potable, Système d'Information Géographique, base de données géographique, renouvellement, méthode hiérarchique multicritère, dysfonctionnements, analyse spatio-temporelle, théorie des graphes, réseau de Petri, diagramme cause à effets.
|
Page generated in 0.0353 seconds