Spelling suggestions: "subject:"connées manquent"" "subject:"connées manque""
11 |
Modélisation longitudinales de marqueur du VIHThiebaut, Rodolphe 17 December 2002 (has links) (PDF)
L'étude de l'évolution et de la valeur pronostique des marqueurs est très fréquente en<br />épidémiologie. Le taux de lymphocytes T CD4+ et la charge virale plasmatique sont des<br />marqueurs très important de l'infection par le virus de l'immunodéficience humaine (VIH).<br />La modélisation de l'évolution de ces marqueurs présente plusieurs difficultés<br />méthodologiques. D'une part, il s'agit de données répétées incomplètes c'est à dire pouvant<br />être manquantes du fait de la sortie d'étude de certains sujets et de la censure de la charge<br />virale liée à une limite de détection inférieure des techniques de mesure. D'autre part, ces<br />deux marqueurs étant corrélés, il est important de prendre en compte cette information dans le<br />modèle. Nous avons proposé des méthodes basées sur le maximum de vraisemblance pour<br />estimer les paramètres de modèles linéaires mixtes prenant en compte l'ensemble de ces<br />difficultés. Nous avons montré l'impact significatif de ces méthodes biostatistiques sur les<br />estimations et donc nous avons souligné l'importance de leur utilisation dans le cadre des<br />marqueurs du VIH. Pour promouvoir leur diffusion, nous avons présenté des possibilités<br />d'implémentation de certaines des méthodes proposées dans des logiciels statistiques<br />communs.
|
12 |
Parametric LCA approaches for efficient design / Approches d'ACV paramétriques pour une conception performanteKozderka, Michal 13 December 2016 (has links)
Ces travaux de recherche portent sur la problématique de la mise en pratique de l'analyse de cycle de vie (ACV). La question principale est : comment faire une ACV plus rapide et plus facilement accessible pour la conception des produits ? Nous nous concentrons sur deux problématiques qui prolongent l'inventaire de Cycle de Vie (ICV) : • recherche des données manquantes : Comment ranger les données manquantes selon leur importance? Comment traiter l'intersection des aspects qualitatifs et les aspects quantitatifs des données manquantes? • Modélisation du cycle de vie : Comment réutiliser le cycle de vie existant pour un nouveau produit? Comment développer un modèle de référence? Pour la recherche des solutions nous avons utilisé l'approche "Case study" selon Robert Yin. Nos contributions font résultat de trois études de cas, dont la plus importante est l'ACV du High Impact Polypropylene (HIPP) recyclé. Nous avons publié les résultats de celle-ci dans la revue scientifique Journal of Cleaner Production. Suite aux études de cas nous proposons deux approches d'amélioration d'efficacité en ICV : nous proposons l'analyse de sensibilité préalable pour classifier les données manquantes selon leur impact sur les résultats d'ACV. L'approche combine les aspects quantitatifs avec les aspects quantitatifs en protégeant le respect des objectives d'étude. Nous appelons cette protection "LCA Poka-Yoké". La modélisation du cycle de vie peut être assistée grace à la méthode basée sur l'algorithme de King. Pour la continuation de la recherche nous proposons huit perspectives, dont six font l'objet d'intégration des nouvelles approches d'amélioration dans les concepts d'ACV basés sur la norme ISO 14025 ou dans le projet de la Commission Européenne PEF. / This work addresses the different issues that put a brake to using Lifecycle assessment (LCA) in product design by answering the main question of the research: How to make Lifecycle assessment faster and easier accessible for manufactured product design? In the LCA methodology we have identified two issues to deal with and their consecutive scientific locks : • Research of missing data : How to organize missing data? How to respect quantitative and qualitative dimensions? • Modeling of the lifecycle scenario : How to translate methodological choices into the lifecycle scenario model? How to transform the reference scenario into a new one? We have dealt with these issues using the scientific approach Case study according toRobert Yin. Our contributions are based on three case studies, between which the most important is study of High Impact Polypropylene recycling in the automotive industry. We have published it in the Journal of Cleaner Production. As result of our research we present two methods to improve efficiency of the LifecycleInventory Analysis (LCI) : To organize the missing data: Preliminary sensitivity analysis with LCA Poka-Yoke ; To help with scenario modeling: Method of workflows factorization, based on Reverse engineering. For further research we propose eight perspectives, mostly based on integration of our methods into Product Category Rules (PCR)-based platforms like EPD International or the European PEF.
|
13 |
Apport de la reconstruction virtuelle du bassin Regourdou 1 (Dordogne, France) à la connaissance des mécaniques obstétricales néandertaliennes. / Contribution of the virtual reconstruction of the pelvis Regourdou 1 (Dordogne, France) in the knowledge of the Neandertal obstetrical mechanics.Meyer, Valentine 04 October 2013 (has links)
La découverte d’un nouveau bassin, Regourdou 1, offre l’occasion de discuter de l’implication fonctionnelle de la morphologie pelvienne néandertalienne. Dans un premier temps, ce spécimen est décrit, ce qui permet de vérifier son appartenance aux Néandertaliens et mettre en évidence certains traits spécifiques à cette population. Bien qu’aucun ne soit autapomorphique, la combinaison de ces caractères caractérise la ceinture pelvienne néandertalienne. Le bassin Regourdou 1 est ensuite reconstruit à l’aide d’une estimation desdonnées manquantes, par thin-plate spline à partir de Kebara 2. Les dimensions du canal pelvien de Regourdou 1sont comparées à celles de deux autres spécimens néandertaliens (Tabun C1 et Kebara 2) et d’une populationmoderne (n=151). L’analyse de la morphologie des détroits obstétricaux néandertaliens (par morphométrie géométrique), et de la relation céphalo-pelvienne, met en évidence la présence de caractéristiques associées chez l’Homme anatomiquement moderne à la naissance rotationnelle. Notre travail confirme l’existence de mécaniques obstétricales néandertaliennes de type moderne. Cette interprétation permet d’enrichir notre connaissance biologique et culturelle de cette population. / The discovery of a new Neandertal pelvis, Regourdou 1, allows discussing the functional implications of Neandertal pelvic morphology. First, the specimen is described, which offers to proveits affiliation to the Neandertal population and to highlight specific Neandertal features. Even if none of these are autapomorphic, the combinaison of these traits characterize the Neandertal pelvic belt. The pelvis Regourdou 1 is reconstructed, by an estimation of missing-data, thanks to the thin-plate splines method, applied on Kebara 2. The dimensions of Regourdou 1 birth canal are compared with those of two others Neandertal individuals (Tabun C1 and Kebara 2) as well as a modern population (n=151).The analysis of the obstetrical planes morphology (by geometric morphometrics) and the cephalo-pelvic relation highlights the presence of traits associated with rotational birth in modern Human. Our work attests the existence of modern type obstetrical mechanics, in Neandertal. This interpretation allows enriching our biological and cultural knowledge of this population.
|
14 |
Traitement des données manquantes en épidémiologie : application de l’imputation multiple à des données de surveillance et d’enquêtes / Missing data management in epidemiology : Application of multiple imputation to data from surveillance systems and surveysHéraud Bousquet, Vanina 06 April 2012 (has links)
Le traitement des données manquantes est un sujet en pleine expansion en épidémiologie. La méthode la plus souvent utilisée restreint les analyses aux sujets ayant des données complètes pour les variables d’intérêt, ce qui peut réduire lapuissance et la précision et induire des biais dans les estimations. L’objectif de ce travail a été d’investiguer et d’appliquer une méthode d’imputation multiple à des données transversales d’enquêtes épidémiologiques et de systèmes de surveillance de maladies infectieuses. Nous avons présenté l’application d’une méthode d’imputation multiple à des études de schémas différents : une analyse de risque de transmission du VIH par transfusion, une étude cas-témoins sur les facteurs de risque de l’infection à Campylobacter et une étude capture-recapture estimant le nombre de nouveaux diagnostics VIH chez les enfants. A partir d’une base de données de surveillance de l’hépatite C chronique (VHC), nous avons réalisé une imputation des données manquantes afind’identifier les facteurs de risque de complications hépatiques graves chez des usagers de drogue. A partir des mêmes données, nous avons proposé des critères d’application d’une analyse de sensibilité aux hypothèses sous-jacentes àl’imputation multiple. Enfin, nous avons décrit l’élaboration d’un processus d’imputation pérenne appliqué aux données du système de surveillance du VIH et son évolution au cours du temps, ainsi que les procédures d’évaluation et devalidation.Les applications pratiques présentées nous ont permis d’élaborer une stratégie de traitement des données manquantes, incluant l’examen approfondi de la base de données incomplète, la construction du modèle d’imputation multiple, ainsi queles étapes de validation des modèles et de vérification des hypothèses. / The management of missing values is a common and widespread problem in epidemiology. The most common technique used restricts the data analysis to subjects with complete information on variables of interest, which can reducesubstantially statistical power and precision and may also result in biased estimates.This thesis investigates the application of multiple imputation methods to manage missing values in epidemiological studies and surveillance systems for infectious diseases. Study designs to which multiple imputation was applied were diverse: a risk analysis of HIV transmission through blood transfusion, a case-control study on risk factors for ampylobacter infection, and a capture-recapture study to estimate the number of new HIV diagnoses among children. We then performed multiple imputation analysis on data of a surveillance system for chronic hepatitis C (HCV) to assess risk factors of severe liver disease among HCV infected patients who reported drug use. Within this study on HCV, we proposedguidelines to apply a sensitivity analysis in order to test the multiple imputation underlying hypotheses. Finally, we describe how we elaborated and applied an ongoing multiple imputation process of the French national HIV surveillance database, evaluated and attempted to validate multiple imputation procedures.Based on these practical applications, we worked out a strategy to handle missing data in surveillance data base, including the thorough examination of the incomplete database, the building of the imputation model, and the procedure to validate imputation models and examine underlying multiple imputation hypotheses.
|
15 |
Devenir à long terme de couples traités par fécondation in vitro dans la cohorte DAIFI / Long-term outcome of couples treated by in vitro fertilization in the DAIFI cohortTroude, Pénélope 21 June 2013 (has links)
Les études sur les couples traités par fécondation in vitro (FIV) ont jusqu’à présent porté essentiellement sur l’évaluation du succès en FIV. Très peu de données sont disponibles sur le devenir à long terme de couples traités par FIV. L’objectif de ce travail était d’estimer la fréquence de réalisation du projet parental à long terme, et d’étudier les facteurs associés aux interruptions précoces des traitements et aux naissances naturelles.L’enquête DAIFI-2009 a inclus 6 507 couples ayant débuté un programme de FIV en 2000-2002 dans l’un des 8 centres de FIV participant à l’étude. Les données médicales des couples et leur parcours dans le centre ont été obtenus à partir des dossiers médicaux des centres de FIV pour tous les couples. L’information sur le devenir des couples après le départ du centre a été obtenue par questionnaire postal auprès des couples en 2008-2009 (38% de participation 7 à 9 ans après l’initiation des FIV). L’étude des facteurs associés à la participation à l’enquête postale suggérait que la fréquence de réalisation du projet parental estimée sur les répondants seulement pourrait être biaisée. Les différentes méthodes mises en œuvre pour corriger la non réponse (pondération, imputation multiple) n’ont pas modifié l’estimation de la fréquence de réalisation du projet parental. Au total, 7 à 9 ans après l’initiation des FIV, 60% des couples ont réalisé leur projet parental de façon biologique, suite à un traitement ou suite à une conception naturelle. Lorsque les adoptions sont aussi prises en compte, 71% des couples ont réalisé leur projet parental. Après l’échec d’une première tentative de FIV, un couple sur 4 (26%) a interrompu les FIV dans le centre d’inclusion. Globalement, les couples avec de mauvais facteurs pronostiques ont un plus grand risque d’interrompre les FIV. Cependant, la proportion plus importante d’interruption parmi les couples avec une origine inexpliquée de l’infécondité pourrait s’expliquer par la survenue plus fréquente de naissance naturelle dans ce sous-groupe de couples. Parmi les couples n’ayant pas eu d’enfant suite aux traitements, 24% ont ensuite conçu naturellement en médiane 28 mois après l’initiation des FIV. Parmi les couples ayant eu un enfant suite aux traitements, 17% ont ensuite conçu naturellement en médiane 33 mois après la naissance de l’enfant conçu par AMP. Les facteurs associés aux naissances naturelles sont des indicateurs d’un meilleur pronostic de fertilité, particulièrement chez les couples sans enfant AMP.L’enquête DAIFI-2009 a permis d’apporter des informations sur le parcours à long terme des couples traités par FIV qui n’avait jusqu’à présent été que peu étudié, souvent sur de faibles effectifs et avec un suivi plus court. Ces résultats doivent apporter de l’espoir aux couples inféconds, puisque la majorité d’entre eux ont finalement réalisé leur projet parental, même si cela peut prendre de nombreuses années. / Until now, most studies of couples treated by in vitro fertilization (IVF) have been centered on IVF success. Very few data are available on the long-term outcome of these couples, including spontaneous conception and adoptions. This work aimed to estimate the long-term cumulative parenthood rate, and to study factors associated with early IVF discontinuation and with spontaneous live births.The DAIFI study is a retrospective cohort including 6,507 couples who began IVF in 2000-2002 in one of the eight participating French IVF centres. Medical data on all couples were obtained from centre databases. Information on long-term outcome after leaving the IVF center was collected by postal questionnaire sent to couples in 2008-2010 (7 to 9 years after IVF initiation, participation rate 38%). Study of factors associated with participation in the postal survey suggested that the cumulative parenthood rate estimated only in participants might be biased. The different methods used to correct for non-response bias (inverse probability weighting, multiple imputation) did not modify the estimation of the cumulative parenthood rate obtained with the complete case approach. Finally, 7 to 9 years after IVF initiation, the cumulative parenthood rate was estimated at 60%, including live births following IVF, other treatment or spontaneous conception. When adoptions were also considered, the cumulative parenthood rate reached 71%. After a first failed IVF cycle, just over one couple out of four (26%) discontinued IVF treatment. Globally, couples with poor prognostic factors had a higher risk of early discontinuation of IVF treatment. However, the higher proportion of early discontinuation observed among couples with unexplained infertility could be linked to a higher chance of spontaneous pregnancy in this subpopulation. Among couples who remained childless after treatment, 24% later had a spontaneous live birth (SLB), at a median of 28 months after the first IVF attempt. Among couples who had had a child during medical treatment, 17% later had an SLB, at a median of 33 months after the birth following medical treatment. Regarding factors associated with SLB, they can be viewed as indicators of a better fertility prognosis, especially among unsuccessfully treated couples.The DAIFI study has provided information on the long-term outcome of couples treated by IVF, which has until now been little studied, often on small samples and with a shorter duration of follow-up. These results should give hope to infertile couples as nearly three couples out of four finally became parents, even if it may take many years.
|
16 |
Méthodes informées de factorisaton matricielle pour l'étalonnage de réseaux de capteurs mobiles et la cartographie de champs de pollution / Informed method of matrix factorization for calibration of mobile sensor networks and pollution fields mappingDorffer, Clément 13 December 2017 (has links)
Le mobile crowdsensing consiste à acquérir des données géolocalisées et datées d'une foule de capteurs mobiles (issus de ou connectés à des smartphones). Dans cette thèse, nous nous intéressons au traitement des données issues du mobile crowdsensing environnemental. En particulier, nous proposons de revisiter le problème d'étalonnage aveugle de capteurs comme un problème informé de factorisation matricielle à données manquantes, où les facteurs contiennent respectivement le modèle d'étalonnage fonction du phénomène physique observé (nous proposons des approches pour des modèles affines et non linéaires) et les paramètres d'étalonnage de chaque capteur. Par ailleurs, dans l'application de surveillance de la qualité de l'air que nous considérons, nous supposons avoir à notre disposition des mesures très précises mais distribuées de manière très parcimonieuse dans le temps et l'espace, que nous couplons aux multiples mesures issues de capteurs mobiles. Nos approches sont dites informées car (i) les facteurs matriciels sont structurés par la nature du problème, (ii) le phénomène observé peut être décomposé sous forme parcimonieuse dans un dictionnaire connu ou approché par un modèle physique/géostatistique, et (iii) nous connaissons la fonction d'étalonnage moyenne des capteurs à étalonner. Les approches proposées sont plus performantes que des méthodes basées sur la complétion de la matrice de données observées ou les techniques multi-sauts de la littérature, basées sur des régressions robustes. Enfin, le formalisme informé de factorisation matricielle nous permet aussi de reconstruire une carte fine du phénomène physique observé. / Mobile crowdsensing aims to acquire geolocated and timestamped data from a crowd of sensors (from or connected to smartphones). In this thesis, we focus on processing data from environmental mobile crowdsensing. In particular, we propose to revisit blind sensor calibration as an informed matrix factorization problem with missing entries, where factor matrices respectively contain the calibration model which is a function of the observed physical phenomenon (we focus on approaches for affine or nonlinear sensor responses) and the calibration parameters of each sensor. Moreover, in the considered air quality monitoring application, we assume to pocee- some precise measurements- which are sparsely distributed in space and time - that we melt with the multiple measurements from the mobile sensors. Our approaches are "informed" because (i) factor matrices are structured by the problem nature, (ii) the physical phenomenon can be decomposed using sparse decomposition with a known dictionary or can be approximated by a physical or a geostatistical model, and (iii) we know the mean calibration function of the sensors to be calibrated. The proposed approaches demonstrate better performances than the one based on the completion of the observed data matrix or the multi-hop calibration method from the literature, based on robust regression. Finally, the informed matrix factorization formalism also provides an accurate reconstruction of the observed physical field.
|
17 |
Estimation et sélection en classification semi-superviséeVandewalle, Vincent 09 December 2009 (has links) (PDF)
Le sujet de cette thèse est la classification semi-supervisée qui est considérée d'un point de vue décisionnel. Nous nous intéressons à la question de choix de modèles dans ce contexte où les modèles sont estimés en utilisant conjointement des données étiquetées et des données non étiquetées plus nombreuses. Nous concentrons notre recherche sur les modèles génératifs où la classification semi-supervisée s'envisage sans difficulté, contrairement au cadre prédictif qui nécessite des hypothèses supplémentaires peu naturelles. Après avoir dressé un état de l'art de la classification semi-supervisée, nous décrivons l'estimation des paramètres d'un modèle de classification à l'aide de données étiquetées et non étiquetées par l'algorithme EM. Nos contributions sur la sélection de modèles font l'objet des deux chapitres suivants. Au chapitre 3, nous présentons un test statistique où les données non étiquetées sont utilisées pour mettre à l'épreuve le modèle utilisé. Au chapitre 4 nous présentons un critère de sélection de modèles AIC_cond, dérivé du critère AIC d'un point de vue prédictif. Nous prouvons la convergence asymptotique de ce critère particulièrement bien adapté au contexte semi-supervisé et ses bonnes performances pratiques comparé à la validation croisée et à d'autres critères de vraisemblance pénalisée. Une deuxième partie de la thèse, sans rapport direct avec le contexte semi-supervisé, présente des modèles multinomiaux pour la classification sur variables qualitatives. Nous avons conçu ces modèles pour répondre à des limitations des modèles multinomiaux parcimonieux proposés dans le logiciel MIXMOD. À cette occasion, nous proposons un critère type BIC qui prend en compte de manière spécifique la complexité de ces modèles multinomiaux contraints.
|
18 |
Estimation par maximum de vraisemblance dans des problèmes inverses non linéairesKUHN, Estelle 12 December 2003 (has links) (PDF)
Cette thèse est consacrée à l'estimation par maximum de vraisemblance dans des problèmes inverses. Nous considérons des modèles statistiques à données manquantes, dans un cadre paramétrique au cours des trois premiers chapitres. Le Chapitre 1 présente une variante de l'algorithme EM (Expectation Maximization) qui combine une approximation stochastique à une méthode de Monte Carlo par chaînes de Markov : les données manquantes sont simulées selon une probabilité de transition bien choisie. Nous prouvons la convergence presque sûre de la suite générée par l'algorithme vers un maximum local de la vraisemblance des observations. Nous présentons des applications en déconvolution et en détection de ruptures. Dans le Chapitre 2, nous appliquons cet algorithme aux modèles non linéaires à effets mixtes et effectuons outre l'estimation des paramètres du modèle, des estimations de la vraisemblance du modèle et de l'information de Fisher. Les performances de l'algorithme sont illustrées via des comparaisons avec d'autres méthodes sur des exemples de pharmacocinétique et de pharmacodynamique. Le Chapitre 3 présente une application de l'algorithme en géophysique. Nous effectuons une inversion jointe, entre les temps de parcours des ondes sismiques et leurs vitesses et entre des mesures gravimétriques de surface et les densités du sous-sol, en estimant les paramètres du modèle, qui étaient en général fixés arbitrairement. De plus, nous prenons en compte une relation linéaire entre les densités et les vitesses des ondes. Le Chapitre 4 est consacré à l'estimation non paramétrique de la densité des données manquantes. Nous exhibons un estimateur logspline de cette densité qui maximise la vraisemblance des observations dans un modèle logspline et appliquons notre algorithme à ce modèle paramétrique. Nous étudions la convergence de cet estimateur vers la vraie densité lorsque la dimension du modèle logspline et le nombre d'observations tendent vers l'infini. Nous présentons quelques applications.
|
19 |
Approches probabilistes appliquées à la restauration numérique d'archives téléviséesBornard, Raphaël 27 November 2002 (has links) (PDF)
Dans le contexte de la restauration d'archives, nous abordons dans cette thèse la suppression des défauts impulsifs (taches, "dropouts" vidéo). Les méthodes de détection et correction existantes sont limitées par les défaillances de l'estimation de mouvement dues à la présence de phénomènes naturels complexes. Nous cherchons à prendre en compte ces phénomènes que nous qualifions de mouvement pathologique. Pour les deux étapes de détection et de correction, une approche probabiliste est privilégiée et nos algorithmes sont exprimés à l'aide de champs de Markov paramétriques ou non-paramétriques. La méthode de détection que nous proposons s'inscrit dans le cadre de la théorie bayesienne de l'estimation. Nous considérons une fenêtre temporelle plus large que les trois images utilisées habituellement afin de mieux distinguer les défauts des mouvements pathologiques et éviter ainsi les fausses alarmes. Nous proposons également une méthode de correction dans les zones d'information manquante inspirée de travaux sur la synthèse de texture. Après généralisation aux images naturelles, nous intégrons ces approches dans un contexte spatio-temporel qui permet un repli implicite sur une correction spatiale lorsque le mouvement est trop complexe. Les méthodes proposées sont validées séparément puis intégrées dans un prototype complet de suppression des défauts impulsifs.
|
20 |
Contributions à la reconnaissance automatique de la parole avec données manquantesDemange, Sébastien 08 November 2007 (has links) (PDF)
Ce mémoire propose, dans un premier temps, une introduction détaillée de la reconnaissance automatique de la parole avec données manquantes appuyée par de nombreuses références bibliographiques. Il est montré que l'estimation de masques constitue une étape cruciale. En effet, la qualité des masques estimés conditionne les performances du système de reconnaissance. L'amélioration de la fiabilité des masques constitue donc un enjeu important. Dans un second temps, les travaux menés dans le cadre de l'estimation bayésienne des masques de données manquantes sont présentés. D'une part je propose de nouveaux modèles de masques permettant de modéliser les dépendances entre les masques de différents coefficients d'un signal. Ces modèles sont évalués comparativement à un modèle de référence. Les résultats sont présentés en termes d'erreur de masques ainsi qu'en taux de reconnaissance. Les résultats montrent que ces dépendances contribuent à améliorer les taux de reconnaissance et soulignent l'importance du contexte temporel d'un masque. Je présente, dans un second temps, une nouvelle définition de masque: les masques de contribution. Ces nouveaux masques sont évalués comparativement aux masques usuellement utilisés, fondés sur le seuillage du SNR. Je montre que cette nouvelle définition permet d'améliorer l'algorithme de décodage en affinant les intervalles de marginalisation. L'évaluation, dans le cadre de la marginalisation de données et en présence d'un bruit stationnaire, montrent que les intervalles sont considérablement réduits entraînant une nette amélioration des taux de reconnaissance.
|
Page generated in 0.0482 seconds