Spelling suggestions: "subject:"multivariée"" "subject:"multivariable""
41 |
Processus stochastiques matriciels, systèmes de racines et probabilités non commutativesDemni, Nizar 15 November 2007 (has links) (PDF)
On étudie quelques aspects de certaines diffusions matricielles pour lesquelles on utilise des outils d'analyse harmonique pour répondre à des questions de nature probabiliste : on commence par le processus de Laguerre, puis on s'intéresse au processus de Dunkl radial qui généralise le processus des valeurs propres de ces diffusions. On regarde ensuite le processus de Jacobi dans le cas où la taille de la matrice tend vers l'infini, ceci nous plonge dans le monde des probabilités libres. Le dernier chapitre est consacré à la résolution d'un problème de grandes déviations pour des statistiques de processus de Jacobi univariés.
|
42 |
Plasticité du programme spatio-temporel de réplication au cours du développement et de la différenciation cellulaireJulienne, Hanna 11 December 2013 (has links) (PDF)
Le séquençage du génome humain, il y a maintenant 12 ans, a mis en lumière la complexité des mécanismes des processus nucléaires tels que la transcription, la réplication ou l'organisation de la chromatine. Depuis, afin de mieux comprendre ces processus, un ensemble sans cesse croissant de données sur le noyau cellulaire a été produit et mis en ligne par un nombre important de laboratoires de par le monde. Ces données sont à la fois d'une richesse extraordinaire et d'une complexité embarrassante. Dans cette thèse, nous mettons à profit l'ensemble de ces données afin de mieux comprendre les déterminants nucléaires du programme spatio-temporel de réplication. Pour cela nous utilisons pas moins d'une centaine de profils épigénétiques ChiP-seq le long des chromosomes humains et dans diverses lignées cellulaires pour caractériser la structure primaire de la chromatine. Nous démontrons, à l'aide d'outils issus des statistiques multivariées, que l'immense complexité potentielle de ces jeux de données peut être réduite à quatre états chromatiniens principaux et ce dans toutes les lignées cellulaires somatiques étudiées. Cette classification simple, robuste et néanmoins complète est un excellent point d'appui pour l'étude de la réplication. Les quatre états principaux de chromatine sont répliqués à des moments distinct de la phase S (leur " timing " de réplication est différent) et ont un contenu en gènes drastiquement différents. Leur répartition spatiale le long du génome est structurée et est particulièrement visible dans les domaines où le " timing " de réplication dessine un U comme signature de l'existence d'un gradient de polarité des fourches de réplication. Ces U-domaines de la taille du Mpb recouvrent 50% du génome humain et les quatre états chromatiniens principaux se succèdent du bord au centre de ces U-domaines. Les mêmes techniques statistiques appliquées au cas d'une lignée embryonnaire révèlent aussi l'existence de quatre états principaux de chromatine mais de nature différente. La classification en quatre états s'avèrent alors très utile pour comparer l'épigénétique d'une lignée somatique à celle d'une lignée embryonnaire. Aussi, les spécificités du programme de réplication embryonnaire sont mises en rapport avec les spécificités de l'organisation de la chromatine dans cette lignée cellulaire. En particulier, notre étude révèle le rôle majeur de l'histone variant H2AZ dans la pluripotence.
|
43 |
Les tests de causalité en variance entre deux séries chronologiques multivariéesNkwimi-Tchahou, Herbert 12 1900 (has links)
Les modèles de séries chronologiques avec variances conditionnellement hétéroscédastiques sont devenus quasi incontournables afin de modéliser les séries chronologiques dans le contexte des données financières. Dans beaucoup d'applications, vérifier l'existence d'une relation entre deux séries chronologiques représente un enjeu important. Dans ce mémoire, nous généralisons dans plusieurs directions et dans un cadre multivarié, la procédure dévéloppée par Cheung et Ng (1996) conçue pour examiner la causalité en variance dans le cas de deux séries univariées. Reposant sur le travail de El Himdi et Roy (1997) et Duchesne (2004), nous proposons un test basé sur les matrices de corrélation croisée des résidus standardisés carrés et des produits croisés de ces résidus. Sous l'hypothèse nulle de l'absence de causalité en variance, nous établissons que les statistiques de test convergent en distribution vers des variables aléatoires khi-carrées. Dans une deuxième approche, nous définissons comme dans Ling et Li (1997) une transformation des résidus pour chaque série résiduelle vectorielle. Les statistiques de test sont construites à partir des corrélations croisées de ces résidus transformés. Dans les deux approches, des statistiques de test pour les délais individuels sont proposées ainsi que des tests de type portemanteau. Cette méthodologie est également utilisée pour déterminer la direction de la causalité en variance. Les résultats de simulation montrent que les tests proposés offrent des propriétés empiriques satisfaisantes. Une application avec des données réelles est également présentée afin d'illustrer les méthodes / Time series models with conditionnaly heteroskedastic variances have become almost inevitable to model financial time series. In many applications, to confirm the existence of a relationship between two time series is very important. In this Master thesis, we generalize in several directions and in a multivariate framework, the method developed by Cheung and Ng (1996) designed to examine causality in variance in the case of two univariate series. Based on the work of El Himdi and Roy (1997) and Duchesne (2004), we propose a test based on residual cross-correlation matrices of squared residuals and cross-products of these residuals. Under the null hypothesis of no causality in variance, we establish that the test statistics converge in distribution to chi-square random variables. In a second approach, we define as in Ling and Li (1997) a transformation of the residuals for each residual time series. The test statistics are built from the cross-correlations of these transformed residuals. In both approaches, test statistics at individual lags are presented and also portmanteau-type test statistics. That methodology is also used to determine the direction of causality in variance. The simulation results show that the proposed tests provide satisfactory empirical properties. An application with real data is also presented to illustrate the methods
|
44 |
Sur la validation des modèles de séries chronologiques spatio-temporelles multivariéesSaint-Frard, Robinson 06 1900 (has links)
Le présent mémoire porte sur les séries chronologiques qui en plus d’être observées
dans le temps, présentent également une composante spatiale. Plus particulièrement,
nous étudions une certaine classe de modèles, les modèles autorégressifs
spatio-temporels généralisés, ou GSTAR. Dans un premier temps, des liens sont
effectués avec les modèles vectoriels autorégressifs (VAR). Nous obtenons explicitement la distribution asymptotique des autocovariances résiduelles pour les
modèles GSTAR en supposant que le terme d’erreur est un bruit blanc gaussien,
ce qui représente une première contribution originale. De ce résultat, des tests de type portemanteau sont proposés, dont les distributions asymptotiques sont étudiées. Afin d’illustrer la performance des statistiques de test, une étude de
simulations est entreprise où des modèles GSTAR sont simulés et correctement ajustés. La méthodologie est illustrée avec des données réelles. Il est question de la production mensuelle de thé en Java occidental pour 24 villes, pour la période
janvier 1992 à décembre 1999. / In this master thesis, time series models are studied, which have also a spatial
component, in addition to the usual time index. More particularly, we study
a certain class of models, the Generalized Space-Time AutoRegressive (GSTAR)
time series models. First, links are considered between Vector AutoRegressive models(VAR) and GSTAR models. We obtain explicitly the asymptotic distribution of the residual autocovariances for the GSTAR models, assuming that the error term is a Gaussian white noise, which is a first original contribution. From that
result, test statistics of the portmanteau type are proposed, and their asymptotic
distributions are studied. In order to illustrate the behaviour of the test statistics, a simulation study is conducted where GSTAR models are simulated and correctly fitted. The methodology is illustrated with monthly real data concerning the production of tea in west Java for 24 cities from the period January 1992 to December 1999. / Dans ce mémoire, nous avons utilisé le logiciel R pour la programmation.
|
45 |
Diversité et processus de colonisation microbienne sur des substrats minérauxRagon, Marie 30 September 2011 (has links) (PDF)
Mes travaux de recherche ont eu pour but d'analyser la diversité des microorganismes des trois domaines du vivant présents dans des biofilms phototrophes exposés à l'air, se développant sur des substrats minéraux divers, afin d'essayer, d'une part, de répondre à des questions de diversité et de biogéographie et, d'autre part, d'étudier le processus de colonisation par le biais d'expériences d'exposition contrôlées.J'ai ainsi caractérisé, essentiellement par des approches moléculaires basées sur l'analyse des banques des gènes d'ARNr de la petite sous-unité (SSU rDNAs) et sur des analyses d'empreintes communautaires, la diversité microbienne (procaryote et eucaryote) formant des biofilms matures (exposés depuis plusieurs années) dans plusieurs sites géographiques en Irlande du Nord, en France et en Ukraine, dans la région de Chernobyl. Dans ces biofilms soumis à forte pression sélective, nous avons mis en évidence beaucoup de microorganismes hétérotrophes et phototrophes, mais avec une diversité relativement restreinte en comparaison à d'autres milieux comme les sols ou les systèmes aquatiques. Les archées étaient absentes. Les conditions environnementales auxquelles ce type de biofilm est constamment exposé comme l'irradiation, la dessiccation et la limitation des nutriments sélectionnent des microorganismes qui développent des stratégies pour s'adapter comme, entre autres, la production de pigments. Ce sont des microorganismes fréquemment retrouvés dans des milieux désertiques extrêmes et résistants aussi aux radiations ionisantes qui ont ainsi été identifiés, notamment des Deinococcales et des Actinobacteria, ou encore des champignons ascomycètes (Ascomycota). Parmi les organismes phototrophes, nous avons dénombré des Cyanobacteria, des algues vertes (Chlorophyta) et des Streptophyta. Nous avons mis en évidence que les facteurs environnementaux influencent la composition des biofilms. Toutefois, tandis que la composition de la communauté bactérienne est fortement dépendante de la nature du substrat ou elle se développe, la composition des communautés microbiennes eucaryotes dépend de la distance géographique. Nous avons également mené des expériences de colonisation en exposant un même substrat minéral dans trois sites géographiques en Irlande du Nord et en France. L'analyse de la diversité microbienne lors du processus de colonisation a révélé des changements importants dans la composition des communautés, que ce soit pour les procaryotes ou pour les eucaryotes avec, cependant, des comportements différents de ces deux groupes de microorganismes. Dans le cas des bactéries, on observe une transition des Gammaproteobacteria, qui dominent les temps 0-6 mois et qui correspondent vraisemblablement aux cellules inactives en dispersion, vers des Betaproteobacteria, Bacteroidetes, Alphaproteobacteria et Actinobacteria dans des phases successives de formation du biofilm. Par contre, dès leur détection sur le substrat minéral, les eucaryotes sont massivement dominés par des champignons ascomycètes et basidiomycètes, des algues vertes ainsi que d'autres composantes minoritaires comme des ciliés, étant détectées dans des stades plus tardifs. Nos résultats montrent que les organismes hétérotrophes sont pionniers dans la formation de ces biofilms, ce qui permet d'émettre l'hypothèse qu'ils facilitent l'installation des cyanobactéries et surtout des algues vertes. Ils montrent aussi que le processus d'assemblage des communautés bactériennes dépend du temps de colonisation, alors que le site géographique détermine celui des microorganismes eucaryotes. Ces différences majeures de comportement pourraient être expliquées par des modes de vie différents entre les organismes de ces deux grands groupes.
|
46 |
Search for WH associated production in the lνbb final state using the DØ detector at the TevatronBrown, Jonathan 15 September 2011 (has links) (PDF)
Le Modèle Standard est le cadre qui permet de décrire les interactions entre les particules et leur dynamique. Le mécanisme de Higgs est une solution pour introduire naturellement un terme de masse dans la description théorique de ce modèle. Après la rupture spontanée de la symétrie électrofaible, une nouvelle particule scalaire massive est introduite, le boson de Higgs. Comme celui-ci n'a pas encore été découvert, la recherche du boson de Higgs est effectué au Tevatron, qui est un collisionneur pp ̄ à une énergie au centre de masse de 1.96 TeV. Pour MH = 135 GeV, le mode de désintégration dominant est H → bb ̄. L'analyse présentée dans ce document est axée sur le domaine en masse 100 < MH < 150 GeV, dans le canal où le boson de Higgs est produit en association avec un boson W se désintègrant en un lepton chargé (électron ou muon) et un neutrino. L'étude de cet état final repose sur les informations recueillies auprès de toutes les parties du détecteur DØ. Un résultat basé sur 5.3 fb−1 de collisions récoltées durant le RunII du Tevatron est présenté ici. Afin d'augmenter la sensibilité au signal, l'analyse est séparée en sous-canaux en fonction de la saveur du lepton considéré, le nombre de jets dans l'état final, le nombre de jets identifiés comme provenant de quarks b et par périodes de prise de données. Après sélection des événements, une technique d'analyse multivariée est utilisée pour séparer les événements de type signal du bruit de fond physique et instrumental attendu. Comme un bon accord entre les données et simulation est observé, une limite supérieure observée (attendue) de 4.5 (4.8) est placée (pour MH = 115 GeV) sur le rapport entre la section efficace pp ̄ → W H multipliée par le rapport d'embranchement H → bb ̄ et la prédiction du Modèle Standard, à 95% de niveau de confiance. Alors que les dernières données du Tevatron sont en cours d'analyse, les perspectives de recherche au Tevatron sont exposées ici. Les améliorations futures pour la publication finale sur la recherche dans le canal WH → lνbb ̄ sont présentées. La masse invariante dijet étant la variable la plus discriminante, l'amélioration de la résolution du pic de masse est un enjeu important, ainsi que l'optimisation de l'utilisation des outils d'identification de jets de quarks b et du discriminant final. Une amélioration significative est obtenue au niveau de la limite.
|
47 |
Les modèles vectoriels et multiplicatifs avec erreurs non-négatives de séries chronologiquesMoutran, Emilie 05 1900 (has links)
No description available.
|
48 |
Multifractal analysis for multivariate data with application to remote sensing / Analyse multifractale de données multivariées avec application à la télédétectionCombrexelle, Sébastien 12 October 2016 (has links)
La caractérisation de texture est centrale dans de nombreuses applications liées au traitement d’images. L’analyse de textures peut être envisagée dans le cadre mathématique de l’analyse multifractale qui permet d’étudier les fluctuations de la régularité ponctuelle de l’amplitude d’une image et fournit les outils pratiques pour leur évaluation grâce aux coefficients d’ondelettes ou aux coefficients dominants. Bien que mise à profit dans de nombreuses applications, l’analyse multifractale souffre à présent de deux limitations majeures. Premièrement, l’estimation des paramètres multifractaux reste délicate, notamment pour les images de petites tailles. Deuxièmement, l’analyse multifractale a été jusqu’à présent uniquement considérée pour l’analyse univariée d’images, alors que les données à étudier sont de plus en plus multivariées. L’objectif principal de cette thèse est la mise au point de contributions pratiques permettant de pallier ces limitations. La première limitation est abordée en introduisant un modèle statistique générique pour le logarithme des coefficients dominants, paramétrisé par les paramètres multifractaux d’intérêt. Ce modèle statistique permet de contrebalancer la variabilité résultant de l’analyse d’images de petite taille et de formuler l’estimation dans un cadre bayésien. Cette approche aboutit à des procédures d’estimation robustes et efficaces, que ce soit pour des images de petites ou grandes tailles. Ensuite, l’analyse multifractale d’images multivariées est traitée en généralisant ce cadre bayésien à des modèles hiérarchiques capables de prendre en compte l’hypothèse d’une évolution lente des propriétés multifractales d’images multi-temporelles ou multi-bandes. Ceci est réalisé en définissant des lois a priori reliant les propriétés dynamiques des paramètres multifractaux des différents éléments composant le jeu de données. Différents types de lois a priori sont étudiés dans cette thèse au travers de simulations numériques conduites sur des images multifractales multivariées synthétiques. Ce travail est complété par une étude du potentiel apport de l’analyse multifractale et de la méthodologie bayésienne proposée pour la télédétection à travers l’exemple de l’imagerie hyperspectrale. / Texture characterization is a central element in many image processing applications. Texture analysis can be embedded in the mathematical framework of multifractal analysis, enabling the study of the fluctuations in regularity of image intensity and providing practical tools for their assessment, the coefficients or wavelet leaders. Although successfully applied in various contexts, multi fractal analysis suffers at present from two major limitations. First, the accurate estimation of multifractal parameters for image texture remains a challenge, notably for small sample sizes. Second, multifractal analysis has so far been limited to the analysis of a single image, while the data available in applications are increasingly multivariate. The main goal of this thesis is to develop practical contributions to overcome these limitations. The first limitation is tackled by introducing a generic statistical model for the logarithm of wavelet leaders, parametrized by multifractal parameters of interest. This statistical model enables us to counterbalance the variability induced by small sample sizes and to embed the estimation in a Bayesian framework. This yields robust and accurate estimation procedures, effective both for small and large images. The multifractal analysis of multivariate images is then addressed by generalizing this Bayesian framework to hierarchical models able to account for the assumption that multifractal properties evolve smoothly in the dataset. This is achieved via the design of suitable priors relating the dynamical properties of the multifractal parameters of the different components composing the dataset. Different priors are investigated and compared in this thesis by means of numerical simulations conducted on synthetic multivariate multifractal images. This work is further completed by the investigation of the potential benefit of multifractal analysis and the proposed Bayesian methodology for remote sensing via the example of hyperspectral imaging.
|
49 |
Use of factorial biostatistical methods to investigate the relation between nutrition and cancer in the European Prospective Investigation into Cancer and Nutrition (EPIC) study / Exploitation de méthodes biostatistiques factorielles pour l'investigation de la relation nutrition-cancer dans la cohorte Européenne sur le Cancer et la Nutrition (EPIC)Assi, Nada 19 October 2016 (has links)
La nutrition est un facteur de risque modifiable pour le cancer puisqu'environ un tiers des cas pourraient être évités en adoptant une meilleure alimentation. La relation entre nutrition et cancer est complexe, et son étude est enrichie par de nouveaux défis apportés par les récentes avancées technologiques dans le domaine des « -omiques ». Cette thèse a pour but de développer de nouvelles approches biostatistiques afin d'étudier la relation entre nutrition et cancer au sein de la cohorte EPIC. Pour ce faire, l'applicabilité de nouvelles méthodologies multivariées dans le domaine de l'épidémiologie nutritionnelle a été étudiée.Une nouvelle méthode multivariée pour la réduction de la dimensionnalité, le Treelet Transform (TT), a été examinée afin d'extraire des patterns de nutriments issus de questionnaires. Les patterns ainsi obtenus par le TT étaient plus facilement interprétables que par les méthodes classiques. Ensuite, un cadre analytique pour implémenter le concept du « meeting-in-the-middle » (MITM) a été développé et appliqué dans 2 études cas-témoin nichées sur le cancer hépatocellulaire avec des données métabolomiques. Le MITM cherche à identifier des biomarqueurs qui soient à la fois des marqueurs de certaines expositions passées et des prédicteurs de maladies. L'implémentation s'est focalisée sur l'application de la PLS et de l'analyse de médiation.Enfin, nous avons examinés la relation entre les niveaux plasmatiques de 60 acides gras issus de biomarqueurs et le risque de cancer du sein dans une étude cas-témoin nichée dans EPIC.Cette thèse servira de base pour des applications épidémiologiques futures examinant la relation nutrition-cancer / Diet is a modifiable risk factor for many cancers. It has been estimated that about a third of cancer cases can be prevented by complying with a healthy diet and adhering to the recommendations in terms of nutrition. The nutrition-cancer relationship is a complex one, and its study is currently at a turning point with the opportunity and challenges brought by the recent technological advances in the fields of « -omics ».This thesis aims to develop new biostatistical approaches to investigate the nutrition-cancer relation within the European Prospective Investigation into Cancer and nutrition (EPIC) study. To do so, the applicability of new methodologies in the field of nutritional epidemiology has been examined.First, a new multivariate dimension reduction method, the Treelet Transform (TT) was applied to extract nutrient patterns relying on questionnaire data. The extracted patterns were more easily interpretable than those obtained with more classical methods.Then, an analytical framework was conceived for the « meeting-in-the-middle » (MITM) principle and applied to two nested case-control studies on hepatocellular carcinoma, with targeted and untargeted metabolomics data. The MITM aims to identify overlap biomarkers of certain exposures that are at the same time predictive of disease outcomes. The implementation focused on the application of partial least squares and mediation analyses. Last, the association between 60 plasma fatty acids levels assessed from biomarkers and breast cancer risk was examined in a nested case-control study in EPIC. This thesis will serve as a basis for future epidemiological applications looking into the nutrition-cancer relation
|
50 |
Temps, espaces, dynamiques de peuplement : la fin du Néolithique provençal / Time, spaces, settlements dynamics : the end of Provençal NeolithicCaraglio, Agnès 27 November 2015 (has links)
L’espace provençal du 3ème millénaire av. n. è. laisse entrevoir un certain nombre d’éléments qui mettent en scène la complexité archéologique de la transition Néolithique final / Âge du Bronze ancien. En Provence, si le travail de J. Cauliez a ouvert la voie à un cadre chrono-culturel plus robuste et tissé une trame plus diversifiée des composantes céramiques de la fin du Néolithique, il n’en demeure pas moins que l’imbrication de l’évènement Campaniforme avec les différentes traditions locales se pose toujours comme un problème majeur, notamment en termes stratigraphiques, dans la compréhension des gisements domestiques de cette période. L’analyse des différents types de vestiges archéologiques liés à ces contextes requiert à notre sens une étude complémentaire fondée sur les logiques d’implantation des sites d’habitat dans le paysage afin de mieux saisir l’ensemble des mécanismes socio-culturels émergeants à l’aube de l’Âge du Bronze. Grâce à la mise en place d’une base de données relationnelle couplée à un Système d’Information Géographique, il a été possible de générer de nouvelles informations spatiales sur les sites géo-référencés de notre corpus. Ainsi, après des analyses statistiques multivariées exploratoires sur les données archéologiques issues de la littérature et les nouvelles données spatiales, il a été possible de caractériser finement les implantations de chacun des gisements étudiés à l’échelle de la Provence (426 sites) puis à l’échelle du Luberon (analyse territoriale basée sur 70 sites) et de dégager des tendances principales dans les choix d’installation de ces populations au cours du 3ème millénaire av. n. è. / The archaeological complexity of the transition between Late Neolithic and Early Bronze Age can be characterized by a certain amount of elements found in the Provence area in the 3rd millennium BCE. Despite the fact that the work done by J. Cauliez in Provence provided a more structured chrono-cultural framework and a more diversified background concerning ceramic components in the Late Neolithic, the Bell Beaker event overlapping the various local traditions still appears as a crucial issue. It specifically relates to the understanding of domestic deposits in this period in terms of stratigraphic studies. Following the analysis of these different types of archaeological remains in these dwellings, we believed that an in-depth study on settlement patterns in the landscape must be carried out to better comprehend the emerging social and cultural mechanisms at the dawn of Bronze Age. Due to the set up of a relational database integrated with a Geographic Information System (GIS), new spatial items were generated on the georeferenced sites listed in our corpus. Finally, after the use of statistical multivariate and exploratory analysis based on archaeological data from bibliographic references and on new spatial data, a precise implantation’s characterization of each investigated deposits has been possible, first in Provence (426 establishments), then in Luberon (territorial analysis involving 70 sites) as well as an identification of significant trends regarding dwelling choices by the populations living in the 3rd millennium BCE.
|
Page generated in 0.0614 seconds