Global ETD Search

1	Contribution à l'étude de la régression non paramétrique et à l'estimation de la moyenne d'un processus à temps continu Degras, David 07 December 2007 (has links) (PDF) Cette thèse porte sur l'étude de la régression non paramétrique en présence de mesures répétées. D'abord, nous étendons aux estimateurs splines de lissage les vitesses de convergence présentées dans la littérature pour d'autres estimateurs usuels sous différentes hypothèses classiques de dépendance des données. Ensuite, dans le cadre de l'estimation de la moyenne d'un processus aléatoire à temps continu, nous généralisons les résultats existants sur la convergence en moyenne quadratique et nous établissons de nouveaux résultats de normalité asymptotique pour les distributions finies-dimensionnelles. Enfin, dans le cadre d'un échantillon fini et corrélé, nous comparons les performances d'estimateurs construits par moindres carrés ordinaires ou généralisés, nous proposons une méthode efficace de sélection du paramètre de lissage tenant compte de la structure de covariance des données, et à travers des simulations, nous mettons en évidence l'apport du lissage local par rapport au lissage global. [MATH] Mathematics Régression non paramétrique mesures répétées données corrélées splines de lissage vitesses de convergence normalité asymptotique estimation adaptative
2	Apports bioinformatiques et statistiques à l'identification d'inhibiteurs du récepteur MET / Bioinformatics and statistical contributions to the identification of inhibitors for the MET receptor Apostol, Costin 21 December 2010 (has links) L’effet des polysaccharides sur l’interaction HGF-MET est étudié à l’aide d’un plan d’expérience comportant plusieurs puces à protéines sous différentes conditions d’expérimentation. Le but de l’analyse est la sélection des meilleurs polysaccharides inhibiteurs de l’interaction HGF-MET. D’un point de vue statistique c’est un problème de classification. Le traitement informatique et statistique des biopuces obtenues nécessite la mise en place de la plateforme PASE avec des plug-ins d’analyse statistique pour ce type de données. La principale caractéristique statistique de ces données est le caractère de répétition : l’expérience est répétée sur 5 puces et les polysaccharides, au sein d’une même puce, sont répliqués 3 fois. On n’est donc plus dans le cas classique des données indépendantes globalement, mais de celui d’une indépendance seulement au niveau intersujets et intrasujet. Nous proposons les modèles mixtes pour la normalisation des données et la représentation des sujets par la fonction de répartition empirique. L’utilisation de la statistique de Kolmogorov-Smirnov apparaît naturelle dans ce contexte et nous étudions son comportement dans les algorithmes de classification de type nuées dynamique et hiérarchique. Le choix du nombre de classes ainsi que du nombre de répétitions nécessaires pour une classification robuste sont traités en détail. L’efficacité de cette méthodologie est mesurée sur des simulations et appliquée aux données HGF-MET. Les résultats obtenus ont aidé au choix des meilleurs polysaccharides dans les essais effectués par les biologistes et les chimistes de l’Institut de Biologie de Lille. Certains de ces résultats ont aussi conforté l’intuition des ces chercheurs. Les scripts R implémentant cette méthodologie sont intégrés à la plateforme PASE. L’utilisation de l’analyse des données fonctionnelles sur ce type de données fait partie des perspectives immédiates de ce travail. / The effect of polysaccharides on HGF-MET interaction was studied using an experimental design with several microarrays under different experimental conditions. The purpose of the analysis is the selection of the best polysaccharides, inhibitors of HGF-MET interaction. From a statistical point of view this is a classification problem. Statistical and computer processing of the obtained microarrays requires the implementation of the PASE platform with statistical analysis plug-ins for this type of data. The main feature of these statistical data is the repeated measurements: the experiment was repeated on 5 microarrays and all studied polysaccharides are replicated 3 times on each microarray. We are no longer in the classical case of globally independent data, we only have independence at inter-subjects and intra-subject levels. We propose mixed models for data normalization and representation of subjects by the empirical cumulative distribution function. The use of the Kolmogorov-Smirnov statistic appears natural in this context and we study its behavior in the classification algorithms like hierarchical classification and k-means. The choice of the number of clusters and the number of repetitions needed for a robust classification are discussed in detail. The robustness of this methodology is measured by simulations and applied to HGF-MET data. The results helped the biologists and chemists from the Institute of Biology of Lille to choose the best polysaccharides in tests conducted by them. Some of these results also confirmed the intuition of the researchers. The R scripts implementing this methodology are integrated into the platform PASE. The use of functional data analysis on such data is part of the immediate future work. Classification des données répétées Mesures répétées Fonction de répartition Classification hiérarchique Clustering Cumulative distribution fonction K-means
3	Statistical genetic analysis of infectious disease (malaria) phenotypes from a longitudinal study in a population with significant familial relationships / Méthodes statistiques génétiques pour l’étude des phénotypes de maladies infectieuses (paludisme) à partir de données de suivi longitudinal obtenues dans des cohortes familiales Loucoubar, Cheikh 21 March 2012 (has links) Les études longitudinales sur une longue période permettent d’échantillonner plusieurs fois le phénomène étudié et ainsi, avec des mesures répétées, dégager une tendance confirmée. Mais, dès lors, elles produisent de très larges bases de données épidémiologiques accompagnées de plus de sources de bruit par rapport aux études à observation unique ; et souvent, contiennent de la corrélation dans les mesures. Ici, nous avons présenté à travers cette thèse une étude de long terme des facteurs épidémiologiques et génétiques du paludisme menée dans deux cohortes familiales du Sénégal, l’une dans le village de Dielmo suivi pendant 19 années consécutives (1990 – 2008) et l’autre dans le village de Ndiop suivi pendant 16 années consécutives (1993 – 2008). L’objectif de ce travail de thèse a été de développer des méthodes d’analyse statistique pour identifier des gênes de susceptibilité / résistance au paludisme prenant en compte les relations familiales, les mesures répétées et des potentielles interactions génotypes – environnement dans l’évaluation des phénotypes. Par la suite, de tels phénotypes corrigés des facteurs identifiés comme potentielles sources de confusion et/ou de bruit ont été alors utilisés pour les tests de liaison et d’association génétique. Le phénotype principal étudié chez chaque volontaire a été la survenue ou non d’accès palustre, attribué à une infection au parasite Plasmodium falciparum, durant chaque trimestre de présence (PFA). Les études ont été menées de manière indépendante dans chacun des deux villages, de même que les analyses descriptives, l’estimation de la contribution génétique humaine et des effets individuels. Les tests de liaison et d’association génétique ont été réalisés par des méthodes familiales basées sur l’analyse de la transmission d’allèles des parents aux enfants (Transmission Disequilibrium Test). Ces méthodes sont connues pour être robustes par rapport au problème de la stratification de population et donc nous permettent d’augmenter la taille de notre échantillon dans les études de liaison et d’association génétique en analysant les deux villages en même temps. / Long term longitudinal surveys have the advantage to enable several sampling of the studied phenomena and then, with the repeated measures obtained, find a confirmed tendency. However, these long term surveys generate large epidemiological datasets including more sources of noise than normal datasets (e.g. one single measure per observation unit) and potential correlation in the measured values. Here, we studied data from a long-term epidemiological and genetic survey of malaria disease in two family-based cohorts in Senegal, followed for 19 years (1990–2008) in Dielmo and for 16 years (1993–2008) in Ndiop. The main objectives of this work were to take into account familial relationships, repeated measures as well as effect of covariates to measure both environmental and host genetic (heritability) impacts on the outcome of infection with the malaria parasite Plasmodium falciparum, and then use findings from such analyses for linkage and association studies. The outcome of interest was the occurrence of a P. falciparum malaria attack during each trimester (PFA). The two villages were studied independently; epidemiological analyses, estimation of heritability and individual effects were then performed in each village separately. Linkage and association analyses used family-based methods (based on the original Transmission Disequilibrium Test) known to be immune from population stratification problems. Then to increase sample size for linkage and association analyses, data from the two villages were used together. Paludisme Mesures répétées Génétique Héritabilité Liens Association Malaria Repeated measures Family based Genetics Heritability Multi-locus Linkage Association
4	Contribution des modèles à classes latentes à l’étude de la répartition spatio-temporelle des vecteurs de Paludisme et à l’étude temporelle de l’observance aux antirétroviraux chez les patients VIH / Contribution of latent class models to the study of the spatio-temporal distribution of malaria vectors and to the temporal study of adherence to antiretroviral treatment by HIV patients Boussari, Olayidé 16 June 2014 (has links) Ce travail est construit autour de deux problématiques de santé relatives aux deux plus grandes pandémies qui sévissent en Afrique sub-saharienne : i) l'hétérogénéité rencontrée dans la répartition spatiale et temporelle des vecteurs de paludisme ; ii) la variabilité dans l'observance au traitement antirétroviral par des personnes vivant avec le virus de l'immunodéficience humaine. Sur le plan méthodologique, ces deux problèmes se rapportent à la prise en compte de l'hétérogénéité dans la modélisation de données issues de mesures répétées ; ils nécessitent en outre le développement d'outils statistiques permettant de distinguer à partir des données, des sous-groupes (de localités, d'individus. . .) homogènes indispensables pour rendre plus efficientes les mesures de santé souvent déployer par les praticiens dans le cadre de la lutte contre le paludisme ou le VIH/SIDA. Les modèles de mélanges finis, grâce à leur flexibilité, sont des outils capables de fournir non seulement de bonnes estimations en présence d'une grande hétérogénéité dans les observations mais aussi une bonne partition des unités statistiques. Nous les distinguons, parmi d'autres méthodes, comme étant adaptés aux problématiques du présent travail. Deux applications de ces modèles aux données issues de capture de moustiques ont permis de modéliser la répartition spatiale et temporelle de vecteurs de paludisme et de dégager une méthode simple d'évaluation d'impact de mesures de lutte anti vectorielle. Nous introduisons la notion de _trajectoires de variances_ dans une troisième application portant sur des données d'observance aux traitements antirétroviraux par des personnes vivant avec le virus de l'immunodéficience humaine / This work focuses on two health issues relating to two major pandemics in sub- Saharan Africa : i) the heterogeneity encountered in the spatial and temporal distribution of malaria vectors ; ii) the variability in adherence to antiretroviral treatment by people living with the human immunodeficiency virus. Methodologically, these two problems are related to the consideration of the heterogeneity in the modeling of data from repeated measurements. They also require the development of statistical tools to distinguish from the data, homogeneous clusters of localities, individuals. . . that are needed to make more efficient health measures often deployed by practitioners in the fight against malaria and HIV/AIDS. The finite mixture models, due to their flexibility, are statistical tools that not only provide good estimates in the presence of heterogeneity in the observations but also a good classification of statistical units. We show that they are able to deal with the problematics of our study. The spatial and temporal distributions of malaria vectors are modeled through two different applications of finite mixture models and a simple tool to evaluate the impact of vector control methods is generated. We introduce a ”variance trajectories” method in a third application of finite mixture models to data on adherence to antiretroviral therapy by people living with human immunodeficiency virus Hétérogénéité Mesures répétées Modèles de mélange Classification non supervisée Vecteurs de paludisme Antirétroviraux VIH/SIDA Heterogeneity Repeated measurements Mixture models Unsupervised classification Malaria vectors Antiretroviral HIV/AIDS 570.15

Search results

Contribution à l'étude de la régression non paramétrique et à l'estimation de la moyenne d'un processus à temps continu

Apports bioinformatiques et statistiques à l'identification d'inhibiteurs du récepteur MET / Bioinformatics and statistical contributions to the identification of inhibitors for the MET receptor