Global ETD Search

1	Analysis of the Dirichlet process mixture model with application to dialogue act classification Bakhtiari, Alireza 17 April 2018 (has links) La reconnaissance des intentions de l’utilisateur est l’un des problèmes les plus difficiles dans la conception des systèmes de dialogues. Ces intentions sont généralement codés en termes d’actes de dialogue, où un rôle fonctionnel est attribué à chaque énoncé d’une conversation. L’annotation manuelle des actes de dialogue est généralement coûteuse et prends du temps, il y a donc un grand intérêt à plutôt annoter automatiquement des corpus de dialogue. Dans ce mémoire, nous proposons une approche non paramétrique bayésienne pour la classification automatique des actes de dialogue. Nous utilisons les mélanges par processus de Dirichlet (DPMM), dans lesquels chacune des composantes est déterminée par une distribution de Dirichlet-multinomial. Deux nouvelles approches pour l’estimation des hyperparamètres dans ces distributions sont introduites. Les résultats de l’application de ce modèle au corpus DIHANA montre que la DPMM peut récupérer le nombre réel d’étiquettes en haute précision. / Recognition of user intentions is one of the most challenging problems in the design of dialogue systems. These intentions are usually coded in terms of Dialogue Acts (Following Austin’s work on speech act theory), where a functional role is assigned to each utterance of a conversation. Manual annotation of dialogue acts is both time consuming and expensive, therefore there is a huge interest in systems which are able to automatically annotate dialogue corpora. In this thesis, we propose a nonparametric Bayesian approach for the automatic classification of dialogue acts. We make use of the Dirichlet Process Mixture Model (DPMM), within which each of the components is governed by a Dirichlet-Multinomial distribution. Two novel approaches for hyperparameter estimation in these distributions are also introduced. Results of the application of this model to the DIHANA corpus shows that the DPMM can successfully recover the true number of DA labels with high precision QA 76.05 UL 2011 Théorème de Bayes Analyse du discours -- Informatique Traitement automatique de la parole Processus de Dirichlet
2	Modélisation et utilisation des erreurs de pseudodistances GNSS en environnement transport pour l'amélioration des performances de localisation Viandier, Nicolas 07 June 2011 (has links) (PDF) Les GNSS sont désormais largement présents dans le domaine des transports. Actuellement, la communauté scientifique désire développer des applications nécessitant une grande précision, disponibilité et intégrité.Ces systèmes offrent un service de position continu. Les performances sont définies par les paramètres du système mais également par l'environnement de propagation dans lequel se propagent les signaux. Les caractéristiques de propagation dans l'atmosphère sont connues. En revanche, il est plus difficile de prévoir l'impact de l'environnement proche de l'antenne, composé d'obstacles urbains. L'axe poursuivit par le LEOST et le LAGIS consiste à appréhender l'environnement et à utiliser cette information en complément de l'information GNSS. Cette approche vise à réduire le nombre de capteurs et ainsi la complexité du système et son coût. Les travaux de recherche menés dans le cadre de cette thèse permettent principalement de proposer des modélisations d'erreur de pseudodistances et des modélisations de l'état de réception encore plus réalistes. Après une étape de caractérisation de l'erreur, plusieurs modèles d'erreur de pseudodistance sont proposés. Ces modèles sont le mélange fini de gaussiennes et le mélange de processus de Dirichlet. Les paramètres du modèle sont estimés conjointement au vecteur d'état contenant la position grâce à une solution de filtrage adaptée comme le filtre particulaire Rao-Blackwellisé. L'évolution du modèle de bruit permet de s'adapter à l'environnement et donc de fournir une localisation plus précise. Les différentes étapes des travaux réalisés dans cette thèse ont été testées et validées sur données de simulation et réelles. [SPI:OTHER] Engineering Sciences/Other GNSS Filtrage statistique Erreur de pseudodistance Multitrajet Mélange de gaussiennes Mélange de processus de Dirichlet Filtrage particulaire Estimation de densité
3	Classification bayésienne non supervisée de données fonctionnelles en présence de covariables / Unsupervised Bayesian clustering of functional data in the presence of covariates Juery, Damien 18 December 2014 (has links) Un des objectifs les plus importants en classification non supervisée est d'extraire des groupes de similarité depuis un jeu de données. Avec le développement actuel du phénotypage où les données sont recueillies en temps continu, de plus en plus d'utilisateurs ont besoin d'outils capables de classer des courbes.Le travail présenté dans cette thèse se fonde sur la statistique bayésienne. Plus précisément, nous nous intéressons à la classification bayésienne non supervisée de données fonctionnelles. Les lois a priori bayésiennes non paramétriques permettent la construction de modèles flexibles et robustes.Nous généralisons un modèle de classification (DPM), basé sur le processus de Dirichlet, au cadre fonctionnel. Contrairement aux méthodes actuelles qui utilisent la dimension finie en projetant les courbes dans des bases de fonctions, ou en considérant les courbes aux temps d'observation, la méthode proposée considère les courbes complètes, en dimension infinie. La théorie des espaces de Hilbert à noyau reproduisant (RKHS) nous permet de calculer, en dimension infinie, les densités de probabilité des courbes par rapport à une mesure gaussienne. De la même façon, nous explicitons un calcul de loi a posteriori, sachant les courbes complètes et non seulement les valeurs discrétisées. Nous proposons un algorithme qui généralise l'algorithme "Gibbs sampling with auxiliary parameters" de Neal (2000). L'implémentation numérique requiert le calcul de produits scalaires, qui sont approchés à partir de méthodes numériques. Quelques applications sur données réelles et simulées sont également présentées, puis discutées.En dernier lieu, l'ajout d'une hiérarchie supplémentaire à notre modèle nous permet de pouvoir prendre en compte des covariables fonctionnelles. Nous verrons à cet effet qu'il est possible de définir plusieurs modèles. La méthode algorithmique proposée précédemment est ainsi étendue à chacun de ces nouveaux modèles. Quelques applications sur données simulées sont présentées. / One of the major objectives of unsupervised clustering is to find similarity groups in a dataset. With the current development of phenotyping, in which continuous-time data are collected, more and more users require new efficient tools capable of clustering curves.The work presented in this thesis is based on Bayesian statistics. Specifically, we are interested in unsupervised Bayesian clustering of functional data. Nonparametric Bayesian priors allow the construction of flexible and robust models.We generalize a clustering model (DPM), founded on the Dirichlet process, to the functional framework. Unlike current methods which make use of the finite dimension, either by representing curves as linear combinations of basis functions, or by regarding curves as data points, calculations are hereby carried out on complete curves, in the infinite dimension. The reproducing kernel Hilbert space (RKHS) theory allows us to derive, in the infinite dimension, probability density functions of curves with respect to a gaussian measure. In the same way, we make explicit a posterior distribution, given complete curves and not only data points. We suggest generalizing the algorithm "Gibbs sampling with auxiliary parameters" by Neal (2000). The numerical implementation requires the calculation of inner products, which are approximated from numerical methods. Some case studies on real and simulated data are also presented, then discussed.Finally, the addition of an extra hierarchy in our model allows us to take functional covariates into account. For that purpose, we will show that it is possible to define several models. The previous algorithmic method is therefore extended to each of these models. Some case studies on simulated data are presented. Classification Données fonctionnelles Statistique bayésienne Processus de Dirichlet Mcmc Courbes Clustering Functional data Bayesian statistics Dirichlet process Mcmc Curves
4	Calcul stochastique via régularisation en dimension infinie avec perspectives financières Di Girolami, Cristina 05 July 2010 (has links) (PDF) Ce document de thèse développe certains aspects du calcul stochastique via régularisation pour des processus X à valeurs dans un espace de Banach général B. Il introduit un concept original de Chi-variation quadratique, où Chi est un sous-espace du dual d'un produit tensioriel B⊗B, muni de la topologie projective. Une attention particulière est dévouée au cas où B est l'espace des fonctions continues sur [-τ,0], τ>0. Une classe de résultats de stabilité de classe C^1 pour des processus ayant une Chi-variation quadratique est établie ainsi que des formules d'Itô pour de tels processus. Un rôle significatif est joué par les processus réels à variation quadratique finie X (par exemple un processus de Dirichlet, faible Dirichlet). Le processus naturel à valeurs dans C[-τ,0] est le dénommé processus fenêtre X_t(•) où X_t(y) = X_{t+y}, y ∈ [-τ,0]. Soit T>0. Si X est un processus dont la variation quadratique vaut [X]_t = t et h = H(X_T(•)) où H:C([-T,0])→ R est une fonction de classe C^3 Fréchet par rapport à L^2([-T,0] ou H dépend d'un numéro fini d' intégrales de Wiener, il est possible de représenter h comme un nombre réel H_0 plus une intégrale progressive du type \int_0^T \xi d^-X où \xi est un processus donné explicitement. Ce résultat de répresentation de la variable aléatoire h sera lié strictement à une fonction u:[0,T] x C([-T,0])→R qui en général est une solution d'une equation au derivées partielles en dimension infinie ayant la proprieté H_0=u(0, X_0(•)), \xi_t=Du(t, X_t(•))({0}). A certains égards, ceci généralise la formule de Clark-Ocone valable lorsque X est un mouvement brownien standard W. Une des motivations vient de la théorie de la couverture d'options lorsque le prix de l'actif soujacent n'est pas une semimartingale. [MATH] Mathematics Calcul stochastique via régularisation analyse infini-dimensionnelle mouvement brownien fractionnaire analyse tensorielle formule de Clark-Ocone processus de Dirichlet formule d'Itô variation quadratique
5	Traitement du signal pour la reconnaissance de la parole robuste dans des environnements bruités et réverbérants Ota, Kenko 19 January 2008 (has links) (PDF) Les technologies de la reconnaissance de la parole ont des performances acceptables si l'on utilise un micro dans des environnements calmes. Si des micros se situent à une position distante d'un locuteur, il faut développer des techniques de la soustraction de bruits et de réverbération. Une technique pour réduire des sons émis par les appareils environnants est proposée. Bien que l'annulation adaptative du bruit (ANC) soit une solution possible, l'excès de soustraction peut causer la distorsion de la parole estimée. Le système proposé utilise la structure harmonique des segments vocaliques que les ANCs conventionnels n'a pas prise en compte directement. La méthode de déréverbération conventionnelle provoque l'excès de soustraction car on suppose que la caractéristique de fréquence, est plate. Il faut donc estimer le temps réel de réverbération pour résoudre ce problème. On propose une méthode de déréverbération aveugle utilisant un micro avec des fonctions d'autocorrélation sur la séquence de composants à chaque fréquence. Une technique pour échapper au problème de permutation qui se provoque lorsqu'on utilise l'analyse en composantes indépendantes (ICA) dans le domaine de fréquence, est également proposée : le Multi-bin ICA. Enfin, ce travail propose une technique pour estimer les spectres de bruit et de parole sans développer de modèle de gaussienne à mélange (GMM). Le spectre de la parole est modélisé à l'aide mélange de processus de Dirichlet (Dirichlet Process Mixture : ‘DPM') au lieu du GMM. Traitement du signal Reconnaissance de la parole Annulation adaptative de bruit Déréverbération Analyse en composantes indépendantes Mélange de gaussiennes Mélange de processus de Dirichlet Inférence Bayésiennes
6	Économie informelle en Haïti, marché du travail et pauvreté : analyses quantitatives / Informal economy in Haiti, labour market and poverty : a quantitative analysis Aspilaire, Roseman 03 November 2017 (has links) La prédominance de l’informel dans l’économie d’Haïti, où plus de 80% de la population vit en dessous du seuil de la pauvreté et plus de 35% au chômage, laisse entrevoir des liens étroits entre l’économie informelle, la pauvreté et le marché du travail. Faire ressortir ces interrelations, exige une évaluation de cette économie informelle qui fait l’objet des quatre chapitres de notre thèse traitant successivement l’évolution de la situation macroéconomique, le capital humain, les gains des travailleurs informels, et la segmentation du marché du travail.Le premier chapitre fait un diagnostic du phénomène selon l’état des lieux des théories élaborées et l’évolution du cadre macro-économique d’Haïti de 1980 à 2010 et propose une évaluation macroéconomique de l’informel à partir d’un modèle PLS (Partial Least Squares) en pourcentage du PIB.Le chapitre deux établit les relations entre l’évolution de l’économie informelle, dérégulation et politiques néolibérales grâce à un modèle LISREL (Linear Structural Relations). Nous examinons les incidences des politiques fiscales, budgétaires et monétaires des 30 dernières années sur l’économie informelle. Nous réévaluons aussi les causes de l’évolution de l’informel généralement évoquées par les études empiriques (taxes, sécurité sociale).Au chapitre trois, nous analysons la dimension micro-réelle de l’informel grâce à un modèle des gains à la Mincer estimé par les équations logit à partir des données d’une enquête nationale sur l’emploi et l’économie informelle (EEEI) de 2007. Nous analysons les déterminants des gains informels au regard de la position des travailleurs sur le marché (salariés, entrepreneurs et indépendants) ; et les revenus (formels et informels) et les caractéristiques socioéconomiques des travailleurs pauvres et non-pauvres par rapport au seuil de pauvreté.Au chapitre quatre, nous testons d’abord la compétitivité et la segmentation du marché de l’emploi en faisant usage de modèle de Roy et du modèle de Roy élargi à travers une estimation d’un modèle Tobit. Nous utilisons un modèle de Processus de Dirichlet : d’abord analyser la segmentation et la compétitivité éventuelle du marché du travail informel ainsi que ses déterminants, selon les données de l’EEEI-2007 ; ensuite, pour distinguer les caractéristiques fondamentales des informels involontaires (exclus du marché du travail formel) de celles des informels volontaires qui en retirent des avantages comparatifs. / The predominance of the informal sector in the economy of Haiti, where more than 80% of the population lives below the threshold of poverty and more than 35% unemployed, suggests links between the informal economy, poverty and the labour market. Highlight these interrelationships, requires an assessment of the informal economy, which is the subject of the four chapters of this thesis, dealing successively with the evolution of the macroeconomic situation, human capital, the informal earnings of workers, and the segmentation of the labour market.The first chapter made a diagnosis of the phenomenon according to the State of affairs of the developed theories and the evolution of the macroeconomic framework of Haiti from 1980 to 2010. And then offers a macroeconomic assessment of the informal sector as a percentage of GDP from a PLS (Partial Least Squares).Chapter two sets out the relationship between the evolution of the informal economy, deregulation and neo-liberal policies through a LISREL (Linear Structural Relations) model. We look at the impact of the budgetary, fiscal and monetary policies of the past 30 years on the informal economy. We also reassess the causes of the evolution of the informal economy generally evoked by the empirical studies (taxes, social security).In the chapter three, we analyse the micro-real dimension of the informal economy through a model of the Mincer earnings estimated by the equations logit from data in a national survey on employment and the informal economy (EEEI) in 2007. We analyse the determinants of informal gains in terms of the position of the market workers (employees, entrepreneurs and self-employed); and revenues (formal and informal) and the socio-economic characteristics of the working poor and non-poor compared to the poverty line.In chapter four, we first test the competitiveness and the segmentation of the labour market by making use of model of Roy and the expanded Roy model through an estimate a model Tobit. We use a model of Dirichlet process: first analyse the segmentation and possible informal work and market competitiveness as its determinants, according to data from the EEEI 2007; then, to distinguish the fundamental characteristics of the involuntary informal (excluded from the formal labour market) than the voluntary informal who gain comparative advantages. Economie informelle en Haiti Marché du Travail Pauvreté Modele PLS Lisrel Processus de Dirichlet Informal Economy in Haiti Labour Market Poverty PLS modelling Lisrel Dirichlet Process
7	Estimation Bayésienne non Paramétrique de Systèmes Dynamiques en Présence de Bruits Alpha-Stables Jaoua, Nouha 06 June 2013 (has links) (PDF) Dans un nombre croissant d'applications, les perturbations rencontrées s'éloignent fortement des modèles classiques qui les modélisent par une gaussienne ou un mélange de gaussiennes. C'est en particulier le cas des bruits impulsifs que nous rencontrons dans plusieurs domaines, notamment celui des télécommunications. Dans ce cas, une modélisation mieux adaptée peut reposer sur les distributions alpha-stables. C'est dans ce cadre que s'inscrit le travail de cette thèse dont l'objectif est de concevoir de nouvelles méthodes robustes pour l'estimation conjointe état-bruit dans des environnements impulsifs. L'inférence est réalisée dans un cadre bayésien en utilisant les méthodes de Monte Carlo séquentielles. Dans un premier temps, cette problématique a été abordée dans le contexte des systèmes de transmission OFDM en supposant que les distorsions du canal sont modélisées par des distributions alpha-stables symétriques. Un algorithme de Monte Carlo séquentiel a été proposé pour l'estimation conjointe des symboles OFDM émis et des paramètres du bruit $\alpha$-stable. Ensuite, cette problématique a été abordée dans un cadre applicatif plus large, celui des systèmes non linéaires. Une approche bayésienne non paramétrique fondée sur la modélisation du bruit alpha-stable par des mélanges de processus de Dirichlet a été proposée. Des filtres particulaires basés sur des densités d'importance efficaces sont développés pour l'estimation conjointe du signal et des densités de probabilité des bruits [SPI:OTHER] Engineering Sciences/Other Bruit impulsif Distributions alpha-stables Inférence Bayésienne Méthodes de Monte Carlo Filtrage particulaire Systèmes OFDM Estimation non paramétrique de densité Mélange de processus de Dirichlet
8	Inférence bayésienne pour la détermination et la<br />sélection de modèles stochastiques Caron, Francois 10 November 2006 (has links) (PDF) On s'intéresse à l'ajout d'incertitudes supplémentaires dans les modèles de Markov cachés. L'inférence est réalisée dans un cadre bayésien à l'aide des méthodes de Monte Carlo. Dans un cadre multicapteur, on suppose que chaque capteur peut commuter entre plusieurs états de fonctionnement. Un modèle à saut original est développé et des algorithmes de Monte Carlo efficaces sont présentés pour différents types de situations, prenant en compte des données synchrones/asynchrones et le cas binaire capteur valide/défaillant. Le modèle/algorithme développé est appliqué à la localisation d'un véhicule terrestre équipé de trois capteurs, dont un récepteur GPS, potentiellement défaillant à cause de phénomènes de trajets multiples. <br />On s'intéresse ensuite à l'estimation de la densité de probabilité des bruits d'évolution et de mesure dans les modèles de Markov cachés, à l'aide des mélanges de processus de Dirichlet. Le cas de modèles linéaires est tout d'abord étudié, et des algorithmes MCMC et de filtrage particulaire sont développés. Ces algorithmes sont testés sur trois applications différentes. Puis le cas de l'estimation des densités de probabilité des bruits dans les modèles non linéaires est étudié. On définit pour cela des processus de Dirichlet variant temporellement, permettant l'estimation en ligne d'une densité de probabilité non stationnaire. Inférence bayésienne modèles de Markov cachés méthodes de Monte Carlo Markov Chain Monte Carlo filtrage particulaire Processus de Dirichlet Estimation<br />de densité fusion de données localisation de véhicule GPS
9	Calcul stochastique via régularisation et applications financières Coviello, Rosanna 11 November 2006 (has links) (PDF) Dans la première partie de cette thèse nous appliquons le calcul via régularisation à l'étude d'un marché où le processus des prix d'un actif risqué n'est pas une semimartingale mais simplement à variation quadratique finie. Cette condition est réalisée lorsque le prix de l'actif est admis dans la classe A de toutes les stratégies admissibles, et devient réaliste si la condition de non-arbitrage sur l'ensemble de toutes les stratégies simples prévisibles n'est pas plausible. Cette situation est vérifiée, par exemple, lorsque l'agent est un initié ou si A est restreinte.<br />Nous fournissons des exemples de portefeuilles autofinancés et introduisons une notion de A-martingale. Un calcul relatif à celle-ci est développé. La condition de non-arbitrage parmi toutes les stratégies dans A est récupérée si le processus des prix de l'actif risqué est une A-martingale.<br />Nous abordons le problème de la viabilité du marché, de la couverture et de la maximisation de l'utilité de la richesse terminale.<br />La deuxième partie de la thèse est consacrée à l'étude d'une équation différentielle stochastique unidimensionnelle dirigée par une semimartingale mélangée à un processus à variation cubique finie.<br />Nous proposons une méthode qui repose sur une transformation réduisant le coefficient de diffusion à 1.<br />Le développement de la méthode utilisée nous conduit à des résultats significatifs dans l'analyse du calcul via régularisation.<br />En particulier, une formule de type Ito-Wentzell relative aux processus à variation cubique finie est<br />établie et la structure des processus weak-Dirichlet par rapport à la filtration brownienne est clarifiée.<br />Nous démontrons, par une approche similaire, l'existence et l'unicité d'une équation dirigée par un processus hölder-continu dans l'espace. En utilisant une formule d'Ito pour les semimartingales réversibles nous prouvons l'existence d'une solution lorsque le processus dirigeant l'équation est le mouvement brownien et le coefficient de diffusion est juste continu [MATH] Mathematics calcul via régularisation intégrale forward (symetrique) variation quadratique (cubique) finie processus weak Dirichlet mouvement brownien fractionnaire arbitrage valorisation couverture maximisation d'utilité
10	Modèles hiérarchiques et processus ponctuels spatio-temporels - Applications en épidémiologie et en sismologie Valmy, Larissa 05 November 2012 (has links) (PDF) Les processus ponctuels sont souvent utilisés comme modèles de répartitions spatiales ou spatio-temporelles d'occurrences. Dans cette thèse, nous nous intéressons tout d'abord à des processus de Cox dirigés par un processus caché associé à un processus de Dirichlet. Ce modèle correspond à des occurrences cachées influençant l'intensité stochastique des occurrences observées. Nous généralisons la notion de " Shot noise Cox process " introduite par Moller et développons le traitement bayésien par un échantillonneur de Gibbs combiné à un algorithme de Metropolis-Hastings. Nous montrons que cette méthode MCMC est à sauts réversibles. Le modèle prend en compte, en effet, un nombre aléatoire de contributions cachées influençant l'intensité du processus ponctuel observé donc a un espace paramétrique de dimension variable. Nous focalisons l'inférence statistique sur l'estimation de la valeur espérée de chaque contribution cachée, le nombre espéré de contributions cachées, le degré d'influence spatiale de ces contributions et leur degré de corrélation. Le test d'égalité des contributions et celui de leur indépendance sont ainsi développés. L'utilité en épidémiologie et en écologie est alors démontrée à partir de données de Rubus fruticosa, Ibicella lutea et de mortalité dans les cantons de Georgia, USA. En termes de données observées, deux situations sont considérées: premièrement, les positions spatiales des occurrences sont observées entre plusieurs paires de dates consécutives; deuxièmement, des comptages sont effectués, au cours d'une période fixée, dans des unités d'échantillonnage spatiales. D'autre part, nous nous intéressons aux processus ponctuels à mémoire introduits par Kagan, Ogata et Vere-Jones, précurseurs de la statistique sismologique. En effet, les processus ponctuels spatio-temporels ont une place importante dans l'étude des catalogues sismiques puisque ces derniers sont généralement constitués d'événements sismiques datés et géo-référencés. Nous avons étudié un modèle ETAS (Epidemic Type Aftershock Sequence) avec une intensité d'arrière-plan indépendante du temps et plusieurs fonctions déclenchantes permettant d'intégrer les événements antérieurs récents. Cette approche est utilisée pour étudier la sismicité de l'arc des Petites Antilles. Une étude comparative des modèles Gamma, Weibull, Log-Normal et loi d'Omori modifiée pour les fonctions déclenchantes est menée. Nous montrons que la loi d'Omori modifiée ne s'ajuste pas aux données sismiques des Petites Antilles et la fonction déclenchante la plus adaptée est le modèle de Weibull. Cela implique que le temps d'attente entre répliques dans la zone des Petites Antilles est plus faible que celui des régions à sismicité décrite par la loi d'Omori modifiée. Autrement dit, l'agrégation des répliques après un événement majeur est plus prononcée dans la zone des Petites Antilles. La possibilité d'inclure une intensité d'arrière-plan suivant un processus de Dirichlet centré sur un processus spatial log-gaussien est discutée. [STAT:AP] Statistics/Applications [STAT:AP] Statistiques/Applications [STAT:ME] Statistics/Methodology [STAT:ME] Statistiques/Méthodologie [STAT:TH] Statistics/Statistics Theory [STAT:TH] Statistiques/Théorie Processus ponctuels processus de Hawkes processus de Cox processus de Dirichlet processus de vraisemblance échantillonnage modèles bayésiens méthodes MCMC

Search results