• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 39
  • 16
  • 5
  • Tagged with
  • 62
  • 62
  • 25
  • 25
  • 23
  • 16
  • 14
  • 14
  • 14
  • 13
  • 12
  • 11
  • 10
  • 10
  • 10
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
11

Estimation dans les modèles linéaires généralisés à effets aléatoires

Trottier, Catherine 02 July 1998 (has links) (PDF)
Ce travail est consacré à l'étude et à la mise en place de méthodes d'estimation de paramètres dans les modèles linéaires généralisés à effets aléatoires (GL2M). Dans ces modèles, sous une hypothèse gaussienne de distribution des effets aléatoires $\xi$, la vraisemblance basée sur la distribution marginale du vecteur à expliquer $Y$ n'est pas en général explicitement calculable. Diverses approximations peuvent être appliquées. Nous distinguons pour cela deux approches : l'une conditionnelle et l'autre marginale. En suivant la première, nous proposons une méthode qui consiste en une maximisation de la distribution jointe de ($Y,\xi$) avant de procéder à l'estimation des paramètres. Ceci équivaut à une linéarisation conditionnelle du modèle. Dans la seconde approche, nous étudions une démarche marginale qui repose sur l'approximation des deux premiers moments marginaux de $Y$ puis sur l'utilisation de la quasi-vraisemblance. Nous étendons à d'autres lois et fonctions de lien la méthode développée par Gilmour et al. dans le cas d'un modèle binomial-lien probit. Nous comparons les différentes méthodes selon une échelle de déconditionnement. Dans un deuxième temps, nous introduisons une notion d'hétérogénéité dans les GL2M. Cette hétérogénéité traduit des comportements des effets aléatoires distincts selon les environnements. Elle est modélisée en attribuant à chaque environnement un paramètre de variance différent pour ces effets. Nous proposons alors une méthode d'estimation combinant à la fois la technique de linéarisation de la démarche conditionnelle précédente et l'utilisation de l'algorithme EM, bien adapté à cette situation d'hétérogénéité dans le cas linéaire.
12

Aide à l'optimisation de maintenance à partir de réseaux bayésiens et fiabilité dans un contexte doublement censuré

Corset, Franck 22 January 2003 (has links) (PDF)
La première partie traite de l'application des réseaux bayésiens en maintenance et propose une méthodologie de construction à partir d'avis d'experts. Pour évaluer les probabilités, le réseau est décrit par un modèle log-linéaire saturé. Des indices permettant l'analyse du réseau et l'identification des variables critiques sont donnés. Les actions de maintenance sont intégrées comme nouveaux noeuds du graphe. Une intégration du retour d'expérience est proposée par une inférence bayésienne, en quantifiant la confiance attribuée aux avis d'experts. La deuxième partie traite de la fiabilité dans un contexte doublement censuré. Nous étudions les propriétés asymptotiques des estimateurs du maximum de vraisemblance pour la loi de Weibull. Une inférence bayésienne est proposée avec des lois a priori informatives et non informatives. De plus, nous modélisons par des variables cachées un facteur humain, représentant des manques d'information lors d'opérations de maintenance et résolvons ce problème par maximum de vraisemblance et par une inférence bayésienne.
13

Modélisation conjointe de données longitudinales et de durées de vie

Dupuy, Jean-François 19 November 2002 (has links) (PDF)
Le modèle de régression semiparamétrique de Cox est l'un des plus utilisés pour l'analyse statistique des durées de vie issues du domaine médical ou de la fiabilité. Ses paramètres sont un paramètre de régression et une fonction de risque de base positive et inconnue. L'inférence statistique pour ce modèle, basée sur la vraisemblance partielle de Cox, est souvent compliquée par la présence de données manquantes des covariables. Dans cette thèse, nous proposons une méthode d'estimation des paramètres du modèle de Cox adaptée à cette situation, et nous étudions les propriétés asymptotiques des estimateurs obtenus. La méthode proposée consiste à modéliser conjointement les durées censurées et le processus de covariable afin d'en déduire, par intégration sur les valeurs manquantes de cette covariable, une vraisemblance conjointe permettant d'estimer les paramètres du modèle de Cox au vu des données incomplètes. Dans un premier temps, nous proposons et formalisons un modèle conjoint pour les durées de vie et la covariable longitudinale. Ce modèle est construit à partir du modèle de Cox et d'un modèle de covariable choisi comme étant une fonction en escalier. Nous établissons ensuite l'identifiabilité de ce modèle sous des conditions de régularité peu contraignantes. Puis, nous adaptons au modèle conjoint la méthode du maximum de vraisemblance semiparamétrique. Nous montrons l'existence d'estimateurs semiparamétriques de ses paramètres, et en particulier de ses paramètres d'intérêt, qui sont les paramètres du modèle de Cox. L'expression compliquée de la vraisemblance conjointe ne permet pas d'obtenir analytiquement ces estimateurs. Nous mettons alors en oeuvre l'estimation à l'aide d'un algorithme EM. Nous montrons ensuite la consistance et la normalité asymptotique de nos estimateurs. Puis, nous proposons un estimateur consistant de leur variance asymptotique. Dans une dernière partie, nous appliquons la méthode proposée sur un jeu de données réelles, et nous comparons nos résultats avec deux autres méthodes d'estimation du modèle de Cox avec covariable manquante proposées dans la littérature.
14

Reconnaissance de caractères par méthodes markoviennes et réseaux bayésiens

Hallouli, Khalid 05 1900 (has links) (PDF)
Cette thése porte sur la reconnaissance de caractères imprimés et manuscrits par méthodes markoviennes et réseaux bayésiens. La première partie consiste à effectuer une modélisation stochastique markovienne en utilisant les HMMs classiques dans deux cas: semi-continu et discret. Un premier modèle HMM est obtenu à partir d'observations de type colonnes de pixels (HMM-vertical), le second à partir d'observations de type lignes (HMM-horizontal). Ensuite nous proposons deux types de modèles de fusion : modèle de fusion de scores qui consiste à combiner les deux vraisemblances résultantes des deux HMMs, et modèle de fusion de données qui regroupe simultanément les deux observations lignes et colonnes. Les résultats montrent l'importance du cas semi-continu et la performance des modèles de fusion. Dans la deuxième partie nous développons les réseaux bayésiens statiques et dynamiques, l'algorithme de Jensen Lauritzen Olesen (JLO) servant comme moteur d'inférence exacte, ainsi que l'apprentissage des paramètres avec des données complètes et incomplètes. Nous proposons une approche pour la reconnaissance de caractères (imprimés et manuscrits) en employant le formalisme des réseaux bayésiens dynamiques. Nous construisons certains types de modèles: HMM sous forme de réseau bayésien dynamique, modèle de trajectoire et modèles de couplages. Les résultats obtenus mettent en évidence la bonne performance des modèles couplés. En général nos applications nous permettent de conclure que l'utilisation des réseaux bayésiens est efficace et très prometteuse par le fait de modéliser les dépendances entre différentes observations dans les images de caractères.
15

Distributed Source Coding: Tools and application to video compression

Toto-Zarasoa, Velotiaray 29 November 2010 (has links) (PDF)
Le codage de sources distribuées est une technique permettant de compresser plusieurs sources corrélées sans aucune coopération entre les encodeurs, et sans perte de débit si leur décodage s'effectue conjointement. Fort de ce principe, le codage de vidéo distribué exploite la corrélation entre les images successives d'une vidéo, en simplifiant au maximum l'encodeur et en laissant le décodeur exploiter la corrélation. Parmi les contributions de cette thèse, nous nous intéressons dans une première partie au codage asymétrique de sources binaires dont la distribution n'est pas uniforme, puis au codage des sources à états de Markov cachés. Nous montrons d'abord que, pour ces deux types de sources, exploiter la distribution au décodeur permet d'augmenter le taux de compression. En ce qui concerne le canal binaire symétrique modélisant la corrélation entre les sources, nous proposons un outil, basé sur l'algorithme EM, pour en estimer le paramètre. Nous montrons que cet outil permet d'obtenir une estimation rapide du paramètre, tout en assurant une précision proche de la borne de Cramer-Rao. Dans une deuxième partie, nous développons des outils permettant de décoder avec succès les sources précédemment étudiées. Pour cela, nous utilisons des codes Turbo et LDPC basés syndrome, ainsi que l'algorithme EM. Cette partie a été l'occasion de développer des nouveaux outils pour atteindre les bornes des codages asymétrique et non-asymétrique. Nous montrons aussi que, pour les sources non-uniformes, le rôle des sources corrélées n'est pas symétrique. Enfin, nous montrons que les modèles de sources proposés modélisent bien les distributions des plans de bits des vidéos; nous montrons des résultats prouvant l'efficacité des outils développés. Ces derniers permettent d'améliorer de façon notable la performance débit-distorsion d'un codeur vidéo distribué, mais sous certaines conditions d'additivité du canal de corrélation.
16

Modèles à structure cachée : inférence, estimation, sélection de modèles et applications

Durand, Jean-Baptiste 31 January 2003 (has links) (PDF)
L'objet de cette thèse est l'étude d'algorithmes d'inférence et de méthodes de sélection pour les modèles de Markov cachés. L'analyse de propriétés du graphe d'indépendance conditionnelle aboutit à la définition d'une famille de modèles aisément paramétrables et interprétables. Pour ces modèles, nous proposons des algorithmes d'inférence basés sur des récursions de type arrière-avant efficaces, numériquement stables et permettant des calculs analytiques. Puis nous étudions différentes méthodes de sélection du nombre d'états cachés, dont le demi-échantillonnage, les critères BIC, AIC, ICL, et la pénalisation de la vraisemblance marginale. L'implémentation de la validation croisée, problématique dans le cas de dépendances entre variables, fait l'objet de développements particuliers. Ces méthodes sont comparées par des expérimentations sur des données simulées puis réelles (fiabilité de logiciels). Nous illustrons l'intérêt des arbres et chaînes de Markov cachés en traitement du signal.
17

Segmentation/classification de processus. Application a l'analyse de donnees de microarrays CGH.

Picard, Franck 16 November 2005 (has links) (PDF)
Dans cette thèse nous proposons un nouveau modèle statistique pour l'analyse des problèmes de segmentation/classification dont l'objectif <br /> est de partitionner des données en zones homogènes, et de regrouper ces zones en un nombre fini de classes. Les problèmes de segmentation/classification sont traditionnellement étudiés à l'aide <br /> des modèles de chaînes de Markov cachées. Nous proposons un modèle alternatif qui combine un modèle de segmentation et un modèle de mélange.<br /> <br /> Nous construisons notre modèle dans le cas gaussien et nous proposons une généralisation à des variables discrètes dépendantes. Les paramètres de ce modèle sont estimés par maximum de vraisemblance à l'aide d'un algorithme hybride fondé sur la programmation dynamique et sur l'algorithme EM. Nous abordons un nouveau problème de sélection de modèle qui est la sélection simultanée du nombre de groupes et du nombre de segments et proposons une heuristique pour ce choix. <br /> <br /> Notre modèle est appliqué à l'analyse de données issues d'une nouvelle technologie, les microarrays CGH (Comparative Genomic Hybridization). Cette technique permet de compter le nombre de milliers de gènes le long du génome en une seule expérience. L'application de notre méthode à ces données permet de localiser des zones délétées ou amplifiées le long des chromosomes. Nous proposons également une application à l'analyse des séquences d'ADN pour l'identification de régions homogènes en terme de composition en nucléotides.
18

Un habitat capable de reconna??tre les activit??s planifi??es dans un calendrier ??lectronique

Nivollet, Pierre-Yves January 2013 (has links)
Le vieillissement de la population est un probl??me qui touche de plus en plus le monde occidental et a pour cons??quence de rendre difficile le maintien ?? domicile des personnes ??g??es, ??tant donn?? les co??ts engendr??s et le manque de personnel soignant. D'un autre c??t??, la pr??sence des technologies dans les domiciles devient r??pandue et ce, ?? des prix abordables. On est d??sormais capable de r??cup??rer facilement des informations sur ce qui se passe ?? l'int??rieur de la maison et ainsi agir en cons??quence. Le maintien ?? domicile devient alors possible en offrant une assistance aux personnes ??g??es qui soit port??e par la technologie, afin de les aider ?? r??aliser leurs activit??s de la vie quotidienne. ?? l'aide d'un calendrier ??lectronique dans lequel seront not??es toutes les activit??s ?? r??aliser dans la journ??e, on est en mesure d'utiliser les donn??es fournies par l'appartement pour v??rifier qu'elles ont bien ??t?? r??alis??es, et ainsi offrir des rappels efficaces pour ces activit??s. C'est vers cette probl??matique que se tourne ce m??moire en offrant un outil pouvant utiliser et interpr??ter les informations provenant de l'int??rieur d'un habitat, combin??es ?? celles venant d'un calendrier ??lectronique, dans le but d'aider ?? la r??alisation des t??ches de la vie quotidienne. Cet outil est compos?? de deux programmes principaux: le calendrier ??lectronique et le programme de reconnaissance d'activit??, les deux fonctionnant en collaboration. Ce m??moire pr??sente en premier lieu l'informatique ubiquitaire, les moyens de rappel existants ainsi que les diff??rentes m??thodes pour faire de la reconnaissance d'activit?? dans un appartement intelligent. Suit une description du calendrier ??lectronique permettant aux personnes ??g??es d'entrer correctement leurs activit??s ?? rappeler. Ensuite est d??crit le programme de reconnaissance d'activit??, qui interpr??te les ??v??nements des capteurs pour reconna??tre les activit??s r??alis??es. Le chapitre suivant traite de la collaboration entre le calendrier et le programme de reconnaissance d'activit?? afin qu'ils soient utilisables dans l'appartement. Une exp??rimentation r??alis??e dans l'appartement intelligent du DOMUS cherche ?? fournir une preuve de concept du rappel d'activit?? en fonction de ce qui se passe dans l'appartement.
19

Modèles stochastiques des processus de rayonnement solaire

Tran, Van Ly 12 December 2013 (has links) (PDF)
Les caractéristiques des rayonnements solaires dépendent fortement de certains événements météorologiques non observés comme fréquence, taille et type des nuages et leurs propriétés optiques (aérosols atmosphériques, al- bédo du sol, vapeur d'eau, poussière et turbidité atmosphérique) tandis qu'une séquence du rayonnement solaire peut être observée et mesurée à une station donnée. Ceci nous a suggéré de modéliser les processus de rayonnement solaire (ou d'indice de clarté) en utilisant un modèle Markovien caché (HMM), paire corrélée de processus stochastiques. Notre modèle principal est un HMM à temps continu (Xt, yt)t_0 est tel que (yt), le processus observé de rayonnement, soit une solution de l'équation différentielle stochastique (EDS) : dyt = [g(Xt)It − yt]dt + _(Xt)ytdWt, où It est le rayonnement extraterrestre à l'instant t, (Wt) est un mouvement Brownien standard et g(Xt), _(Xt) sont des fonctions de la chaîne de Markov non observée (Xt) modélisant la dynamique des régimes environnementaux. Pour ajuster nos modèles aux données réelles observées, les procédures d'estimation utilisent l'algorithme EM et la méthode du changement de mesures par le théorème de Girsanov. Des équations de filtrage sont établies et les équations à temps continu sont approchées par des versions robustes. Les modèles ajustés sont appliqués à des fins de comparaison et classification de distributions et de prédiction.
20

Models and estimation algorithms for nonparametric finite mixtures with conditionally independent multivariate component densities / Modèles et algorithmes d'estimation pour des mélanges finis de densités de composantes multivariées non paramétriques et conditionnellement indépendantes

Hoang, Vy-Thuy-Lynh 20 April 2017 (has links)
Plusieurs auteurs ont proposé récemment des modèles et des algorithmes pour l'estimation nonparamétrique de mélanges multivariés finis dont l'identifiabilité n'est pas toujours assurée. Entre les modèles considérés, l'hypothèse des coordonnées indépendantes conditionnelles à la sous-population de provenance des individus fait l'objet d'une attention croissante, en raison des développements théoriques et pratiques envisageables, particulièrement avec la multiplicité des variables qui entrent en jeu dans le framework statistique moderne. Dans ce travail, nous considérons d'abord un modèle plus général supposant l'indépendance, conditionnellement à la composante, de blocs multivariés de coordonnées au lieu de coordonnées univariées, permettant toute structure de dépendance à l'intérieur de ces blocs. Par conséquent, les fonctions de densité des blocs sont complètement multivariées et non paramétriques. Nous présentons des arguments d'identifiabilité et introduisons pour l'estimation dans ce modèle deux algorithmes méthodologiques dont les procédures de calcul ressemblent à un véritable algorithme EM mais incluent une étape additionnelle d'estimation de densité: un algorithme rapide montrant l'efficacité empirique sans justification théorique, et un algorithme lissé possédant une propriété de monotonie comme certain algorithme EM, mais plus exigeant en terme de calcul. Nous discutons également les méthodes efficaces en temps de calcul pour l'estimation et proposons quelques stratégies. Ensuite, nous considérons une extension multivariée des modèles de mélange utilisés dans le cadre de tests d'hypothèses multiples, permettant une nouvelle version multivariée de contrôle du False Discovery Rate. Nous proposons une version contrainte de notre algorithme précédent, adaptée spécialement à ce modèle. Le comportement des algorithmes de type EM que nous proposons est étudié numériquement dans plusieurs expérimentations de Monte Carlo et sur des données réelles de grande dimension et comparé avec les méthodes existantes dans la littérature. En n, les codes de nos nouveaux algorithmes sont progressivement ajoutés sous forme de nouvelles fonctions dans le package en libre accès mixtools pour le logiciel de statistique R. / Recently several authors have proposed models and estimation algorithms for finite nonparametric multivariate mixtures, whose identifiability is typically not obvious. Among the considered models, the assumption of independent coordinates conditional on the subpopulation from which each observation is drawn is subject of an increasing attention, in view of the theoretical and practical developments it allows, particularly with multiplicity of variables coming into play in the modern statistical framework. In this work we first consider a more general model assuming independence, conditional on the component, of multivariate blocks of coordinates instead of univariate coordinates, allowing for any dependence structure within these blocks. Consequently, the density functions of these blocks are completely multivariate and nonparametric. We present identifiability arguments and introduce for estimation in this model two methodological algorithms whose computational procedures resemble a true EM algorithm but include an additional density estimation step: a fast algorithm showing empirical efficiency without theoretical justification, and a smoothed algorithm possessing a monotony property as any EM algorithm does, but more computationally demanding. We also discuss computationally efficient methods for estimation and derive some strategies. Next, we consider a multivariate extension of the mixture models used in the framework of multiple hypothesis testings, allowing for a new multivariate version of the False Discovery Rate control. We propose a constrained version of our previous algorithm, specifically designed for this model. The behavior of the EM-type algorithms we propose is studied numerically through several Monte Carlo experiments and high dimensional real data, and compared with existing methods in the literature. Finally, the codes of our new algorithms are progressively implemented as new functions in the publicly-available package mixtools for the R statistical software.

Page generated in 0.0404 seconds