Spelling suggestions: "subject:"3analyse een composantes principales"" "subject:"3analyse een omposantes principales""
61 |
Analyse factorielle de données structurées en groupes d'individus : application en biologie / Multivariate data analysis of multi-group datasets : application to biologyEslami, Aida 21 October 2013 (has links)
Ce travail concerne les analyses visant à étudier les données où les individus sont structurés en différents groupes (données multi-groupes). La thèse aborde la question des données multi-groupes ayant une structure en un seul tableau, plusieurs tableaux, trois voies et deux blocs (régression). Cette thèse présente plusieurs méthodes d'analyse de données multi-groupes dans le cadre de l'analyse factorielle. Notre travail comporte trois parties. La première partie traite de l'analyse de données multi-groupes (un bloc de variables divisé en sous-groupes d'individus). Le but est soit descriptif (analyse intra-groupes) ou prédictif (analyse discriminante ou analyse inter-groupe). Nous commençons par une description exhaustive des méthodes multi-groupes. En outre, nous proposons deux méthodes : l'Analyse Procrustéenne duale et l'Analyse en Composantes Communes et Poids Spécifiques duale. Nous exposons également de nouvelles propriétés et algorithmes pour l'Analyse en Composantes Principales multi-groupes. La deuxième partie concerne l'analyse multi-blocs et multi-groupes et l'analyse trois voies et multi-groupes. Nous présentons les méthodes existantes. Par ailleurs, nous proposons deux méthodes, l'ACP multi-blocs et multi-groupes et l'ACP multi-blocs et multi-groupes pondérée, vues comme des extensions d'Analyse en Composantes Principales multi-groupes. L'analyse en deux blocs et multi-groupes est prise en compte dans la troisième partie. Tout d'abord, nous présentons des méthodes appropriées pour trouver la relation entre un ensemble de données explicatives et un ensemble de données à expliquer, les deux tableaux présentant une structure de groupe entre les individus. Par la suite, nous proposons quatre méthodes pouvant être vues comme des extensions de la régression PLS au cas multi-groupes, et parmi eux, nous en sélectionnons une et la développons dans une stratégie de régression. Les méthodes proposées sont illustrées sur la base de plusieurs jeux de données réels dans le domaine de la biologie. Toutes les stratégies d'analyse sont programmées sur le logiciel libre R. / This work deals with multi-group analysis, to study multi-group data where individuals are a priori structured into different groups. The thesis tackles the issue of multi-group data in a multivariate, multi-block, three-way and two-block (regression) setting. It presents several methods of multi-group data analysis in the framework of factorial analysis. It includes three sections. The first section concerns the case of multivariate multi-group data. The aim is either descriptive (within-group analysis) or predictive (discriminant analysis, between-group analysis). We start with a comprehensive review of multi-group methods. Furthermore, we propose two methods namely Dual Generalized Procrustes Analysis and Dual Common Component and Specific Weights Analysis. We also exhibit new properties and algorithms for multi-group Principal Component Analysis. The second section deals with multiblock multi-group and three-way multi-group data analysis. We give a general review of multiblock multi-group methods. In addition, we propose two methods, namely multiblock and multi-group PCA and Weighted-multiblock and multi-group PCA, as extensions of multi-group Principal Component Analysis. The two-block multi-group analysis is taken into account in the third section. Firstly, we give a presentation of appropriate methods to investigate the relationship between an explanatory dataset and a dependent dataset where there is a group structure among individuals. Thereafter, we propose four methods, namely multi-group PLS, in the PLS approach, and among them we select one and develop it into a regression strategy. The proposed methods are illustrated on the basis of several real datasets in the field of biology. All the strategies of analysis are implemented within the framework of R.
|
62 |
Évaluation de l'équilibre postural par capteurs embarqués : application au yoga / Wearable device for postural balance assessment : application to yoga exerciseRouis, Amina 07 July 2015 (has links)
La thématique générale des travaux de la thèse porte sur l’utilisation des Technologies de l’information et de la communication afin de promouvoir l’activité physique et limiter les troubles dus à la sédentarité. Ils s’inscrivent dans le cadre d’un projet qui vise à développer une solution d’évaluation de la motricité des sujets humains à faible coût, en utilisant des capteurs inertiels embarqués. L’objectif du présent travail de thèse est d’évaluer les capacités posturales au travers deux exercices de Yoga. En premier lieu, nous avons validé l’utilisation des dispositifs BodyTrack, par rapport à un système de référence (Plateforme de force), dans le cadre de l’évaluation des oscillations posturales. Ensuite, une méthodologie est proposée afin d’évaluer la performance motrice selon 3 facteurs. Le premier considère le maintien de l’équilibre postural lors des phases statique des deux exercices. Le deuxième facteur évalue la durée de ces phases statiques et le troisième permet de vérifier la bonne exécution de la posture. L’ensemble des facteurs mesurés permet de construire une vue d’ensemble de l’exercice effectué et rend compte de la performance motrice. / Balance is a key element for daily activities, that’s making balance training, is important for ev eryone. In the aim of promoting physical activity and changing exercise behaviour, BodyScoring’s balance application, using an inexpensive mobile device provided with accelerometers, gyroscope and magnetometer, proposes tow Yoga exercises (‘Tadasana and Vrksasana’), for balance improvement, an d calculates a score to determine the level skills and share it with friends. First, this thesis examines th e validity, reliability and the sensitivity of accelerometer data by comparing them to force platform data. Second, a postural scoring system is developed. Based on three key factors, it allows evaluating the postural performance, the duration and the appropriate execution of the exercise. The graphical re presentation of the score has allowed a straightforward and simple interpretation of results.
|
63 |
Nouvelles approches pour la formation des cellules de production dans le cadre d'une démarche de conceptionHachicha, Wafik 13 March 2009 (has links) (PDF)
Dans ce travail de thèse, nous avons proposé des nouvelles approches pour la conception des aménagements cellulaires (AC) et plus particulièrement pour la formation des cellules (FC) de production. La première approche consiste à appliquer la méthode d'analyse en composantes principale sur la matrice d'incidence (produits/machines). La matrice de corrélation statistique est exploitée comme une matrice de similarité. L'analyse du plan principal permet de grouper simultanément les machines en groupes et les produits en machines. Des algorithmes pour l'affection des éléments exceptionnels sont également proposés. Le problème de FC devient plus complexe en présence de gammes alternatives. Dans ce contexte, nous avons proposé une deuxième nouvelle approche qui se base sur l'application de la méthode des plans d'expériences (factoriel, méthode de Taguchi). L'objectif étant de choisir, pour chaque produit, la gamme préférentielle permettant l'optimisation des indicateurs de performance de FC. En plus, ce traitement permet d'introduire un aspect d'analyse de la sensibilité de la solution finale ignorée par les techniques antérieures de la FC. La troisième approche porte sur le développement d'une démarche de conception basée sur la combinaison de la conception axiomatique avec la technique des plans d'expériences. Elle permet de lister et d'ordonner les différentes tâches nécessaires pour concevoir un AC. Les autres approches que nous avons développées sont validées à travers cette démarche. Partant de l'une des solutions initiales de répartition des machines en cellules en présence d'éléments exceptionnels, la quatrième approche proposée consiste à appliquer la méthode de simulation à événements discrets pour évaluer puis améliorer la performance des cellules de production. Plusieurs stratégies pourront être étudiées : admettre des éléments exceptionnels dans les différentes cellules, dupliquer les machines exceptionnelles, etc. Les résultats des études comparatives basées sur plusieurs indicateurs de performance, indiquent que les approches proposées sont efficaces, efficientes et pratiques surtout dans leurs accessibilités à travers la disponibilité de plusieurs logiciels dans le marché.
|
64 |
Etude de la synergie des observations satellites pour la caractérisation du manteau neigeuxCordisco, Emmanuel 04 November 2005 (has links) (PDF)
La neige étant une composante importante du climat terrestre, il convient de l'étudier à l'échelle du globe pour en comprendre son rôle.<br /><br />Ces travaux visent ainsi à étudier le contenu en information sur le manteau neigeux à l'échelle globale des observations satellites réalisées à partir de différents instruments couvrant différents domaines du spectre électromagnétique (visible, infrarouge et micro-ondes). Des paramètres autres que la neige interférant dans la problématique, il est nécessaire de les déterminer afin d'encadrer leurs influences. Ensuite, on cherchera comment limiter la pollution qu'engendre ces paramètres sur l'information accessible du manteau neigeux, on aura alors recours à ce que l'on appelera des statistiques locales.<br />Hélas ces statistiques locales ne sont pas disponibles sur l'ensemble du globe. Il est donc inévitable d'utiliser la modélisation pour permettre l'interpolation. Toutefois, une méthode originale d'ajustement de modèle par analyse en composantes principales sera présentée. Au final, la synergie entre les observations satellites, la modélisation et les mesures in situ devra être utilisée pour extraire de façon optimale l'information contenu dans les données et permettre l'inversion de l'épaisseur de neige à grande échelle.<br />D'autre part, il sera intéressant de caractériser les différents types de neiges existants selon une classification non-supervisée des observations satellites afin d'extraire les similitudes et les spécificités de chacun de ces types.
|
65 |
Traitement et analyse de signaux sonores physiologiques. Application à la phonoentérographieRanta, Radu 09 December 2003 (has links) (PDF)
L'objectif de ce travail de recherche est le développement d'un système d'étude de sons, plus particulièrement dédié à la phonoentérographie, qui devrait aboutir à plus long terme à un outil d'aide au diagnostic. La première étape présente une chaîne d'instrumentation multi-voies spécifique. Elle est suivie par le pré-traitement: la détection, la segmentation et le débruitage par ondelettes sont réalisés avec un algorithme original optimisé par une méthode de point-fixe. Une deuxième phase introduit des connaissances a priori sur les sons abdominaux et étudie leur localisation spatiale. Les caractéristiques physiques (fréquence, intensité, durée) décrivent les sons individuellement. L'étude globale des phonoentérogrammes est réalisée à partir d'indices d'activité (nombre d'événements, énergie moyenne, etc.). Les caractéristiques physiques et les indices sont utilisés dans l'analyse statistique des signaux, par analyse en composantes principales et classification non supervisée.
|
66 |
Utilisation de biomarqueurs cellulaires chez plusieurs espèces d'invertébrés pour l'évaluation de la contamination des milieux dulçaquicoles.Guerlet, Edwige 12 October 2007 (has links) (PDF)
Pour valider une suite de biomarqueurs cellulaires en milieu dulçaquicole, nous avons étudié la structure des systèmes lysosomal et peroxysomal et les variations de contenus en lipofuscines et lipides neutres insaturés dans les tissus digestifs de plusieurs invertébrés, à travers une approche couplant histochimie et analyse d'images. Les expérimentations in situ et bioessais à plus ou moins long terme ont montré la pertinence des réponses cellulaires étudiées pour la mise en évidence de gradients de contamination. Les profils de réponse les plus communs chez les mollusques incluent un gonflement lysosomal, des déplétions de lipides neutres insaturés, une accumulation de lipofuscines et/ou un système peroxysomal plus volumineux. Ces réponses cellulaires précoces peuvent être associées, au niveau individuel, à une désynchronisation de la reproduction entre individus ou à une diminution de l'indice de condition. L'étude mensuelle à long terme a souligné l'absence de niveaux de base saisonniers de ces biomarqueurs et l'influence importante de la disponibilité trophique sur les contenus tissulaires en lipides neutres. Une mise en dépuration de 15 jours du bivalve, Dreissena polymorpha, sur son site d'origine, n'a pas montré de réversibilité du profil des réponses cellulaires à un gradient de contamination in situ, mais elle a tout de même de limité la déplétion des lipides neutres. Les réponses cellulaires les plus précoces et discriminatives sont le gonflement lysosomal et la déplétion en lipides neutres. Une comparaison d'outils d'analyse intégrative a montré le pouvoir discriminatif accru de la suite de biomarqueur entière, par rapport aux réponses individuelles.
|
67 |
Contributions aux Modèles de Markov Cachés : métaheuristiques d'apprentissage, nouveaux modèles et visualisation de dissimilaritéAupetit, Sébastien 30 November 2005 (has links) (PDF)
Dans ce travail de thèse, nous présentons plusieurs contributions visant à améliorer l'utilisation des modèles de Markov cachés (MMC) dans les systèmes d'intelligence artificielle. Nous nous sommes concentrés sur trois objectifs : l'amélioration de l'apprentissage de MMC, l'expérimentation d'un nouveau type de MMC et la visualisation de dissimilarité pour mieux comprendre les interactions entre MMC. Dans la première partie, nous proposons, évaluons et comparons plusieurs nouvelles applications<br />de métaheuristiques biomimétiques classiques (les algorithmes génétiques, l'algorithme de fourmis artificielles API et l'optimisation par essaim particulaire) au problème de l'apprentissage de MMC. Dans la<br />deuxième partie, nous proposons un nouveau type de modèle de Markov caché, appelé modèle Markov caché à substitutions de symboles (MMCSS). Un MMCSS permet d'incorporer des connaissances a priori dans le processus d'apprentissage et de reconnaissance. Les premières expérimentations de ces modèles sur des images démontrent leur intérêt. Dans la troisième partie, nous proposons une nouvelle méthode de représentation de dissimilarité appelée matrice de scatterplots pseudo-euclidienne (MSPE), permettant de mieux comprendre les interactions entre des MMC. Cette MSPE est construite à partir<br />d'une technique que nous nommons analyse en composantes principales à noyau indéfini (ACPNI). Nous terminons par la présentation de la bibliothèque HMMTK, développée au cours de ce travail. Cette dernière intègre des mécanismes de parallélisation et les algorithmes développés au cours de la thèse.
|
68 |
Détection de métaux lourds dans les sols par spectroscopie d'émission sur plasma induit par laser (LIBS)Sirven, Jean-Baptiste 18 September 2006 (has links) (PDF)
Dans les domaines de l'analyse, du contrôle et de la mesure physique, le laser constitue un outil métrologique particulièrement puissant et polyvalent, capable d'apporter des réponses concrètes à des problématiques variées, y compris d'ordre sociétal. Parmi ces dernières, la contamination des sites et des sols par les métaux lourds est un enjeu de santé publique important qui requiert de disposer de moyens de mesure adaptés aux réglementations existantes et suffisamment souples d'utilisation. Technique rapide et ne nécessitant pas de préparation de l'échantillon, la spectroscopie sur plasma induit par laser (LIBS) présente des avantages très intéressants pour réaliser des mesures sur site de la teneur en métaux lourds à l'échelle de la dizaine de ppm; la conception d'un appareil portable à moyen terme est envisageable.<br />Dans cette thèse nous montrons d'abord que le régime femtoseconde ne présente pas d'avantages par rapport au régime nanoseconde standard pour notre problématique. Ensuite nous mettons en œuvre un traitement avancé des spectres LIBS par des méthodes chimiométriques dont les performances améliorent sensiblement les résultats des analyses qualitatives et quantitatives d'échantillons de sols.
|
69 |
Développement de méthodes d'analyse de données en ligneBar, Romain 29 November 2013 (has links) (PDF)
On suppose que des vecteurs de données de grande dimension arrivant en ligne sont des observations indépendantes d'un vecteur aléatoire. Dans le second chapitre, ce dernier, noté Z, est partitionné en deux vecteurs R et S et les observations sont supposées identiquement distribuées. On définit alors une méthode récursive d'estimation séquentielle des r premiers facteurs de l'ACP projetée de R par rapport à S. On étudie ensuite le cas particulier de l'analyse canonique, puis de l'analyse factorielle discriminante et enfin de l'analyse factorielle des correspondances. Dans chacun de ces cas, on définit plusieurs processus spécifiques à l'analyse envisagée. Dans le troisième chapitre, on suppose que l'espérance θn du vecteur aléatoire Zn dont sont issues les observations varie dans le temps. On note Zn_tilde = Zn − θn et on suppose que les vecteurs Zn_tilde forment un échantillon indépendant et identiquement distribué d'un vecteur aléatoire Z_tilde. On définit plusieurs processus d'approximation stochastique pour estimer des vecteurs directeurs des axes principaux d'une analyse en composantes principales (ACP) partielle de Z_tilde. On applique ensuite ce résultat au cas particulier de l'analyse canonique généralisée (ACG) partielle après avoir défini un processus d'approximation stochastique de type Robbins-Monro de l'inverse d'une matrice de covariance. Dans le quatrième chapitre, on considère le cas où à la fois l'espérance et la matrice de covariance de Zn varient dans le temps. On donne finalement des résultats de simulation dans le chapitre 5.
|
70 |
Analyse par ToF-SIMS de matériaux fragiles pour les micro/nanotechnologies : évaluation et amplification de l'information chimique / ToF-SIMS characterisation of fragile materials used in microelectronic and microsystem devices : validation and enhancement of the chemical informationScarazzini, Riccardo 04 July 2016 (has links)
Aujourd’hui, une grande variété de matériaux dit « fragiles » sont intégrés dans des dispositifs micro ou nanotechnologiques. Ces matériaux sont définissables comme « fragiles » en raison de leur forme, de leur dimension ou encore de leur densité. Dans ce travail, trois catégories de matériaux, de différents niveaux de maturités industrielle et technologique, ont été étudiés par spectrométrie de masse des ions secondaires à temps du vol (ToF-SIMS). Ces matériaux sont: du silicium méso-poreux, des polyméthacrylates déposés en couches très minces par voie chimique en phase vapeur initiée (iCVD) et des matériaux organosilicates (SiOCH) à basse constante diélectrique (low-k). L’objectif de ce travail est de vérifier et de valider la méthode ToF-SIMS comme une technique fiable pour répondre aux besoins de caractérisation chimique rencontrés pas ces matériaux Il s’agit également d’établir la cohérence de l’information chimique produite par l’interprétation de l’interaction ion/matière se déroulant lors de l’analyse. Pour le silicium méso-poreux, les échantillons ont été pulvérisés par différentes sources primaires d’ions (Césium, Xénon, Oxygène) et l’information secondaire générée comme, par exemple, les différences d’ionisation entre la couche poreuse et le matériau dense ont été analysées, notamment vis de l’énergie du faisceau de pulvérisation mais aussi du taux de porosité du matériau cible. Des modifications morphologiques significativement différentes selon la source d’ions ont également été observées et ont été corrélées à différents types de régime de pulvérisation, principalement induits par le taux de porosité de la cible.Concernant la caractérisation de polymères en couches minces, des conditions d’abrasion très peu agressives, notamment l’usage d’ions d’argon en cluster polyatomiques, ont été appliquées avec l’intention d’obtenir une information chimique secondaire riche en hautes masses moléculaires. La discrimination de films de polyméthacrylate avec une structure chimique quasi-identique a pu être obtenue et un protocole de quantification de copolymères proposé. De plus, par l’utilisation de la méthode d’analyse de données en composantes principales (PCA) appliquée aux spectres,une corrélation claire a été établie entre les composantes principales et la masse moléculaire des films de polymères.Enfin l’impact de traitements d’intégration tels que de la gravure ou du nettoyage chimique, nécessaires à la mise en œuvre industrielle des matériaux low-k, mais défavorables à leurs propriétés diélectriques, a été étudié. Pour obtenir une information chimique résolue en profondeur, l’abrasion par césium à basse énergie a été identifiée comme la stratégie la plus sensible et la plus adaptée. De même, la PCA a permis d’amplifier significativement les différences chimiques entre échantillons, permettant de rapprocher les variations de constante diélectrique aux compositions chimiques / Nowadays, the micro and nanotechnology field integrates a wide range of materials that can be defined as “fragile” because of their shape, dimension or density. In this work, three materials of this kind, at different level of technological and industrial maturity are studied by time of flight secondary ion mass spectrometry (ToF-SIMS). These materials are: mesoporous silicon, thin polymethacrylate films deposited by initiated Chemical Vapour Deposition (i-CVD)and hybrid organosilicate (SiOCH) dielectric materials (low-k). The objective is to verify and validate the ToF-SIMS as a reliable characterisation technique for describing the chemical properties of these materials. Indeed, because of this intrinsic ‘fragility’ the consistency of the chemical information is connected to an appropriate interpretation of the specific ion/matter interactions taking place.For mesoporous silicon, a systematic analysis is carried out considering various sputtering ion sources (Caesium, Xenon and Oxygen); both sputtering and ionisation behaviours are examined relatively to the nonporous silicon, taking into account energy of the sputtering beam and porosity rate of the target material.Concerning nanometric thick polymer films, low damaging analysis conditions are applied by the use of argon cluster primary ion sources in order to obtain a significant molecular secondary ion information. In these conditions, a discrimination of quasi-identical nanometre thick structures is made possible and a quantification method for copolymers is then proposed. In addition, with the supplement of data principal component analysis (PCA) an innovative and significant correlation is obtained between main Principal Component and sample molecular weights.Finally, the effect of several industrial integration processes (such as etching or wet cleaning) applied on low-k materials are studied in order to understand their detrimental impact on low-k insulating properties. To achieve a depth-resolved chemical information, low energy caesium sputterings are shown to be the most adapted and sensitive strategy. In addition, PCA is shown to be almost essential to amplify differences between samples significantly. This approach allowed combining the variation of physical properties (dielectric constant) with the chemical ones.
|
Page generated in 0.0917 seconds