Global ETD Search

1	Análisis bayesiano de modelos de clases latentes para variables politómicas: Confianza hacia instituciones públicas Cruz Sarmiento, Marylía Paola 11 February 2019 (has links) El modelo de análisis de clases latentes tiene como finalidad describir una variable no observable a través del agrupamiento de los individuos en base a sus patrones de respuestas. La estimación en este modelo se puede realizar mediante el algoritmo de Esperanza-Maximización (EM) y su desarrollo para el caso politómico se encuentra implementado en el paquete poLCA de R. Desde el punto de vista bayesiano, esta estimación ha sido hasta el momento implementada sólo para el caso de variables dicotómicas. En este trabajo, se busca extender este ultimo aporte para el caso politómico, haciendo uso del muestrador de Gibbs. La aplicación del modelo de análisis de clases latentes, bajo el enfoque bayesiano aquí desarrollado, se realizó sobre un conjunto de datos reales relacionados con la con fianza hacia 21 instituciones públicas en una encuesta para Lima Metropolitana. En general, se identificaron tres grupos de encuestados seg un sus niveles de confianza institucional, los cuales se analizaron luego en relación a otras variables. / Tesis Estadística bayesiana Variables latentes
2	Modelo lineal mixto conjunto de clases latentes aplicado a un conjunto de datos longitudinales del sector salud Neciosup Vera, Carmen Stéfany 13 November 2018 (has links) Los modelos lineales mixtos conjuntos de clases latentes, propuestos por Proust-Lima et al. (2015), permiten modelar de manera conjunta un proceso longitudinal y un proceso de supervivencia, calculando también la probabilidad de pertenencia a determinadas clases latentes que puedan existir en la población en estudio. En el presente trabajo se describen los componentes que conforman este modelo, y mediante un estudio de simulación se evalúa y analiza la implementación de su estimación. El modelo se aplica finalmente a un conjunto de datos longitudinales de pacientes diagnosticados con Cáncer de Próstata, permitiéndonos la identificación de clases latentes que se asocian luego con el estadío clínico de los pacientes. / The joint latent class mixed model, proposed by Proust-Lima et al. (2015), allows to jointly model a longitudinal process and a survival process, also calculating the probability of belonging to certain latent classes in the study population. In our study, we describe the components that make up this model (Proust-Lima et al. (2017)) and through a simulation study we assesed the implementation of its estimation. The model is finally applied to a set of longitudinal data of Prostate Cancer diagnosed patients allowing us to identify latent classes that are then associated with the clinical stage of the patients. / Tesis Variables latentes Simulación Análisis de supervivencia
3	Modelo de regresión de clases latentes: factores asociados a la valoración de una universidad privada Wiener Ramos, Lucia 20 June 2016 (has links) En diversos campos de análisis, especialmente en las ciencias sociales y humanas, se identifican constructos teóricos a los cuales queremos aproximarnos pero que no son directamente observables ni medibles, como por ejemplo, la calidad o satisfacción con un servicio, el nivel de estrés, el nivel de conocimiento en matemáticas, entre otras. Este tipo de constructos son llamados variables latentes y su valor solo puede ser aproximado a través de variables observadas o manifiestas que si pueden ser medidas (Bartholomew et al., 2011). En el Capítulo 2 se presenta consideraciones generales acerca del modelo lineal general de variables latentes y el modelo de clases latentes. En el Capítulo 3 se estudian los modelos de regresión de clases latentes, la estimación de sus parámetros y su implementación computacional. En el Capítulo 4 se presenta los resultados de la aplicación del modelo a un conjunto de datos reales orientados a conocer la valoración de una universidad privada. En el Capítulo 5 se presenta algunas conclusiones, recomendaciones y futuras extensiones que se podrían derivar de este trabajo. / Tesis Análisis de regresión Análisis de estructura latente Educación superior. Variables latentes
4	Sur la méthode des moments pour l'estimation des modèles à variables latentes / On the method of moments for estimation in latent linear models Podosinnikova, Anastasia 01 December 2016 (has links) Les modèles linéaires latents sont des modèles statistique puissants pour extraire la structure latente utile à partir de données non structurées par ailleurs. Ces modèles sont utiles dans de nombreuses applications telles que le traitement automatique du langage naturel et la vision artificielle. Pourtant, l'estimation et l'inférence sont souvent impossibles en temps polynomial pour de nombreux modèles linéaires latents et on doit utiliser des méthodes approximatives pour lesquelles il est difficile de récupérer les paramètres. Plusieurs approches, introduites récemment, utilisent la méthode des moments. Elles permettent de retrouver les paramètres dans le cadre idéalisé d'un échantillon de données infini tiré selon certains modèles, mais ils viennent souvent avec des garanties théoriques dans les cas où ce n'est pas exactement satisfait. Dans cette thèse, nous nous concentrons sur les méthodes d'estimation fondées sur l'appariement de moment pour différents modèles linéaires latents. L'utilisation d'un lien étroit avec l'analyse en composantes indépendantes, qui est un outil bien étudié par la communauté du traitement du signal, nous présentons plusieurs modèles semiparamétriques pour la modélisation thématique et dans un contexte multi-vues. Nous présentons des méthodes à base de moment ainsi que des algorithmes pour l'estimation dans ces modèles, et nous prouvons pour ces méthodes des résultats de complexité améliorée par rapport aux méthodes existantes. Nous donnons également des garanties d'identifiabilité, contrairement à d'autres modèles actuels. C'est une propriété importante pour assurer leur interprétabilité. / Latent linear models are powerful probabilistic tools for extracting useful latent structure from otherwise unstructured data and have proved useful in numerous applications such as natural language processing and computer vision. However, the estimation and inference are often intractable for many latent linear models and one has to make use of approximate methods often with no recovery guarantees. An alternative approach, which has been popular lately, are methods based on the method of moments. These methods often have guarantees of exact recovery in the idealized setting of an infinite data sample and well specified models, but they also often come with theoretical guarantees in cases where this is not exactly satisfied. In this thesis, we focus on moment matchingbased estimation methods for different latent linear models. Using a close connection with independent component analysis, which is a well studied tool from the signal processing literature, we introduce several semiparametric models in the topic modeling context and for multi-view models and develop moment matching-based methods for the estimation in these models. These methods come with improved sample complexity results compared to the previously proposed methods. The models are supplemented with the identifiability guarantees, which is a necessary property to ensure their interpretability. This is opposed to some other widely used models, which are unidentifiable. Modèles thématiques Modèles à variables latentes Méthode des moments Topic models Latent variable models Method of moments 004
5	Apprentissage de réseaux causaux avec variables latentes et applications à des contextes génomiques et cliniques / Learning causal networks with latent variable and applications to genomic and clinical contexts Verny, Louis 04 December 2017 (has links) L’algorithme développé durant ma thèse utilise la théorie de l’information pour l’apprentissage d’une grande variété de classes de modèles graphiques à partir de données issues uniquement de l’observation d’un système. Il permet également de prendre en compte les effets de variables dites « latentes » c’est-à-dire non observées durant l’expérimentation, un problème majeur de ce domaine de recherche. Notre méthode, baptisée Miic (Multivariate Information-based Inductive Causation), part d’un réseau entièrement connecté, et supprime de façon itérative les liens non essentiels à l’explication des données. La seconde partie de mon travail de thèse a été d’analyser les réseaux reconstruits sur deux types de données biologiques. Des données génomiques d’une part : Miic a été utilisé pour reconstituer les réseaux d’interactions transcriptomiques entre les facteurs de transcriptions responsables de la différentiation des premières cellules hématopoïétiques de l’embryon. Des données cliniques d’autre part : Miic a également été utilisé sur deux jeux de données issus de deux cohortes distinctes, obtenues grâce à des collaborations avec la Pitié-Salpétrière (données de neurologie) et avec l’Institut Curie (données sur le cancer du sein). Nous démontrons l’apport de la reconstruction de modèles graphiques sur l’analyse et la compréhension de ces données. Les tests réalisés durant le développement ainsi que les résultats obtenus via l’analyse des résultats des différentes applications présentées dans ce manuscrit démontrent l’efficacité de Miic non seulement pour la détection de relations précédemment inconnues, mais également pour le contrôle de la qualité de données de ce type. / During my PhD, I worked on the development of an information theory based algorithm allowing the reconstruction of a wide variety of graphical model classes from observationnal datas. This method also allows to tackle the effect of latent (unobserved) latent variables ; which is essential given the difficultyto observe a biological/clinical system as a whole. Our method, called Miic (for Multivariate Information-based Inductive Causation), starts from a complete network (all nodes are connected to each other), and iteratively removes non essential edges from it. The second part of my thesis was to analyze and interpret the networks reconstructed from two kinds of biological datasets : Genomic dataset on one hand : Miic was used to learn networks of transcriptomic interactions driving the differentiation of the first hematopoietic cells of the embryo. Clinical datasets on the other hand : Miic was also used on two datasets extracted from two distinct cohort, obtained thanks to two collaborations, with la Pitié-Salpétrière (neurology dataset) and with Institut Curie Hospital (breast cancer dataset). The testing during Miic development, along with the results obtained when we analyzed the different applications presented in this manuscript show Miic’s efficiency at both confirming already known interactions, and getting previously unknown associations. Réseaux Causalité Information Variables latentes Hématopoïèse Clinique Données cliniques Networks Biology Information theory 004
6	Modelo lineal mixto conjunto de clases latentes aplicado a un conjunto de datos longitudinales del sector salud Neciosup Vera, Carmen Stéfany 13 November 2018 (has links) Los modelos lineales mixtos conjuntos de clases latentes, propuestos por Proust-Lima et al. (2015), permiten modelar de manera conjunta un proceso longitudinal y un proceso de supervivencia, calculando también la probabilidad de pertenencia a determinadas clases latentes que puedan existir en la población en estudio. En el presente trabajo se describen los componentes que conforman este modelo, y mediante un estudio de simulación se evalúa y analiza la implementación de su estimación. El modelo se aplica finalmente a un conjunto de datos longitudinales de pacientes diagnosticados con Cáncer de Próstata, permitiéndonos la identificación de clases latentes que se asocian luego con el estadío clínico de los pacientes. / The joint latent class mixed model, proposed by Proust-Lima et al. (2015), allows to jointly model a longitudinal process and a survival process, also calculating the probability of belonging to certain latent classes in the study population. In our study, we describe the components that make up this model (Proust-Lima et al. (2017)) and through a simulation study we assesed the implementation of its estimation. The model is finally applied to a set of longitudinal data of Prostate Cancer diagnosed patients allowing us to identify latent classes that are then associated with the clinical stage of the patients. Variables latentes Simulación Análisis de supervivencia
7	Métodos de selección de variables bajo el enfoque bayesiano para el modelo lineal normal Blas Oyola, Sthip Frank 18 January 2021 (has links) En muchos casos prácticos, al realizar un análisis de regresión, se cuenta con un gran número de potenciales variables explicativas de las cuáles sólo algunas serán importantes para explicar la variable respuesta. Por lo tanto, un problema importante para la construcción de un modelo de regresión es encontrar un adecuado conjunto de variables explicativas. A los métodos que lidian con este problema se les denomina métodos de selección de variables. En el presente proyecto de tesis, se estudiarán tres métodos de selección de variables bajo inferencia bayesiana para el modelo de regresión lineal normal los cuales fueron propuestos por George y McCulloch (1993), Kuo y Mallick (1998) y Dellaportas et al. (2002). Estos métodos, a diferencia de los métodos tradicionales, consideran la selección de variables dentro del mismo modelo, por ejemplo, introduciendo variables latentes que indiquen la presencia o ausencia de una variable explicativa. Se realizaron comparaciones de estos métodos bayesianos con los métodos Lasso y Stepwise por ser los más tradicionales. A través de un estudio con datos simulados, en diversos escenarios se observa que los métodos bayesianos permiten una adecuada selección de las variables explicativas. Adicionalmente se presentan los resultados de una aplicación con datos reales. Análisis de regresión Variables latentes Estadística bayesiana
8	Identificación de conglomerados espaciales de acuerdo a niveles de morosidad de empresas en el Perú Tristán Gómez, Alex Edward 07 November 2021 (has links) El cumplimiento de las obligaciones financieras que tienen las empresas es respaldado por una correcta gestión de riesgo de crédito, esto evita problemas de liquidez y solvencia. Por ello es importante detectar los niveles de riesgo de morosidad en las empresas. La presente tesis tiene como objetivo identifi car conglomerados de provincias del Perú, en funciona de la tasa de incumplimiento de pagos, conocida también como la tasa de morosidad. Para ello se propone un modelamiento en dos niveles. En el primer nivel se usan modelos aglomerativos jerárquicos para seleccionar n conglomerados candidatos a priori, donde el número fi nal de conglomerados se escoge mediante criterios de selección de modelos. Posteriormente, en un segundo nivel, modelaremos el nivel de riesgo haciendo uso del modelo de Poisson y prioris condicionales autoregresivas en base a los conglomerados de nidos en el primer nivel e incluyendo covariables. Los modelos pueden ser reescritos como modelos Gaussianos latentes, y se puede usar inferencia bayesiana para estimar sus parámetros, específicamente a través de la aproximación de Laplace anidada integrada. Finalmente, como resultado de la aproximación se obtienen conglomerados de provincias de acuerdo a sus niveles de morosidad, permitiendo clasi ficar las provincias en conglomerado de alto, medio y bajo nivel de riesgo de morosidad. / Compliance with the nancial obligations of companies is ensured by proper credit risk management, this avoids liquidity and solvency problems. For this reason, it is important to identify the risk level of default in peruvian companies. The goal of this thesis is to identify clusters of provinces of Per u with regard to the default rate of payments, also known as probability of default. Thus it is proposed a model in two stages. In the rst stage hierarchical agglomerative models select prior candidate clusters, and the nal number of clusters is selected through selection criteria of models. In the second stage it is proposed the Poisson model considering autoregressive conditional prioris, the clusters de ned in the rst stage, and also including covariates. This model ll in the class of Gaussian latent models, therfore its paremeters were estimated using bayesian inference, speci cally through integrated nested Laplace approximation. Finally, as a result, we found clusters in accordance with the default level, allowing to classify provinces into clusters of high, medium and low risk level. Estadística bayesiana Variables latentes
9	Modelo de regresión de clases latentes: factores asociados a la valoración de una universidad privada Wiener Ramos, Lucia 20 June 2016 (has links) En diversos campos de análisis, especialmente en las ciencias sociales y humanas, se identifican constructos teóricos a los cuales queremos aproximarnos pero que no son directamente observables ni medibles, como por ejemplo, la calidad o satisfacción con un servicio, el nivel de estrés, el nivel de conocimiento en matemáticas, entre otras. Este tipo de constructos son llamados variables latentes y su valor solo puede ser aproximado a través de variables observadas o manifiestas que si pueden ser medidas (Bartholomew et al., 2011). En el Capítulo 2 se presenta consideraciones generales acerca del modelo lineal general de variables latentes y el modelo de clases latentes. En el Capítulo 3 se estudian los modelos de regresión de clases latentes, la estimación de sus parámetros y su implementación computacional. En el Capítulo 4 se presenta los resultados de la aplicación del modelo a un conjunto de datos reales orientados a conocer la valoración de una universidad privada. En el Capítulo 5 se presenta algunas conclusiones, recomendaciones y futuras extensiones que se podrían derivar de este trabajo. Análisis de regresión Análisis de estructura latente Educación superior. Variables latentes
10	Approximate bayesian inference for directed acyclic graph autoregressive models Buendía Narváez, Julio César 01 May 2022 (has links) La prevalencia de enfermedades epidemiológicas recolectadas en áreas geográficamente limitadas, como distritos o provincias, son cruciales para la toma de decisiones en salud pública. Usualmente esta variable respuesta presenta dependencia espacial, es decir, es similar en áreas vecinas, debido a la naturaleza de la enfermedad, clima, nivel económico y cultural, entre otras razones. En este sentido, se proponen modelos espaciales de datos áreas para identificar tendencias y factores asociados a enfermedades epidemiológicas, tomando en cuenta la dependencia espacial entre áreas geográficas. Por lo general, estos modelos ajustan a la dependencia espacial a través de efectos aleatorios derivados a través de grafos. En particular, el modelo autorregresivo de gráfico acíclico dirigido (DAGAR) se basa en un grafo acíclico dirigido y algunos efectos aleatorios \del pasado". Como consecuencia, la matriz de precisión (inversa de la covarianza) del modelo es dispersa. Este modelo tiene una interpretación intuitiva de los parámetros asociados con la dependencia espacial y se puede representar como un modelo gaussiano latente. En este contexto, en esta tesis se propone implementar el modelo DAGAR a través del método de inferencia bayesiano aproximado INLA que es determinista, bastante preciso y eficiente. Dentro de este enfoque, la estimación de datos grandes se puede realizar en segundos o minutos, y permite ajustar los datos con distribución gaussiana o no gaussiana. Finalmente, para mostrar el aporte de esta propuesta, el modelo DAGAR se ajusta a datos reales. / The prevalence of epidemiological diseases collected in geographically limited areas, such as districts or provinces, are crucial for making public health decisions. It is common that this response variable presents spatial dependence, that is, it is similar in neighboring areas, due to the nature of the disease, weather, economy and cultural level, among other reasons. In this sense, spatial models for areal data are proposed to identify trends and factors associated with epidemiological diseases, taking into account the spatial dependence between geographic areas. Usually, these models t the spatial dependence through spatial random e ects built from graphs and conditional distributions. In particular, the directed acyclic graph autoregressive (DAGAR) model is based on a directed acyclic graph and some \past" random e ects. As a consequence, the precision matrix (inverse of the covariance) of the model is sparse. This model has an intuitive interpretation of the parameters associated with spatial dependence and can be represented as a latent Gaussian model. In this context, we propose in this project to implement the DAGAR model throughout the approximate Bayesian inference method INLA which is deterministic, quite accurate and e cient. Within this approach, estimation of large data can be carried out in seconds or minutes, and it allows to t data following a Gaussian distribution or non-Gaussian distributions. Finally, in order to show the contribution of this proposal, the DAGAR model will be tted to real data. Estadística bayesiana Variables latentes

Search results