441 |
Regresión espacial cuantílica para variables acotadas entre (0,1)García Céspedes, Carlos Jeffer 26 October 2020 (has links)
El Perú es un país emergente donde el desarrollo se centra en algunas ciudades y distritos específicos. Esto conlleva a mucha desigualdad económica por ello resulta importante dar seguimiento a la incidencia de pobreza en el país. De acuerdo al nivel de precariedad, la pobreza puede considerarse extrema o no extrema. En este contexto, estudiamos la incidencia de pobreza no extrema a través de un modelo de regresión cuantílica espacial a nivel distrital en la provincia de Lima utilizando la distribución de Kumaraswamy combinada con un efecto espacial intrínseco condicional autorregresivo (ICAR). Para tratar y evaluar la posible confusión espacial entre los efectos espaciales y las covariables de efectos fijos, se considera, también, el enfoque SPOCK (Spatial Orthogonal Centroid \K"orrection). Nuestros modelos pertenecen a la clase de modelos jerárquicos, para los cuales la inferencia se puede realizar utilizando el método de Monte Carlo Hamiltoniano. Por lo tanto, el modelo es computacionalmente factible para grandes conjuntos de datos, puede describir puntos extremos de la distribución de la incidencia de pobreza no extrema e identificar qué factores son importantes en las colas de la distribución de los datos.
|
442 |
Métodos de selección de variables bajo el enfoque bayesiano para el modelo lineal normalBlas Oyola, Sthip Frank 18 January 2021 (has links)
En muchos casos prácticos, al realizar un análisis de regresión, se cuenta con un gran
número de potenciales variables explicativas de las cuáles sólo algunas serán importantes para explicar la variable respuesta. Por lo tanto, un problema importante para la construcción de un modelo de regresión es encontrar un adecuado conjunto de variables explicativas. A los métodos que lidian con este problema se les denomina métodos de selección de variables. En el presente proyecto de tesis, se estudiarán tres métodos de selección de variables bajo inferencia bayesiana para el modelo de regresión lineal normal los cuales fueron propuestos por George y McCulloch (1993), Kuo y Mallick (1998) y Dellaportas et al. (2002). Estos métodos, a diferencia de los métodos tradicionales, consideran la selección de variables dentro del mismo modelo, por ejemplo, introduciendo variables latentes que indiquen la presencia o ausencia de una variable explicativa. Se realizaron comparaciones de estos métodos bayesianos con los métodos Lasso y Stepwise por ser los más tradicionales. A través de un estudio con datos simulados, en diversos escenarios se observa que los métodos bayesianos permiten una adecuada selección de las variables explicativas. Adicionalmente se presentan los resultados de una aplicación con datos reales.
|
443 |
Extensión al modelo DINA reparametrizado con covariableSáenz Egúsquiza, Miguel Angel 20 October 2020 (has links)
En el campo educacional, cuando los estudiantes resuelven problemas su habilidad en un tema particular puede influir en el desempeño de los mismos en un área de estudio similar pero diferente. Por ejemplo, la habilidad en ciencias podría tener un efecto en su dominio sobre las matemáticas, lo que a su vez afectará la forma en que los evaluados responden a las preguntas o ítems sobre matemáticas de una prueba. Por tanto, resulta natural examinar la relación entre el rendimiento en un área particular de estudio y el dominio de los atributos en un tema relacionado. Los modelos de diagnóstico cognitivo (CDM) proporcionan un marco ideal para realizar un análisis de este tipo, ya que clasifican a los examinados en perfiles de atributos que indican su dominio en las habilidades delimitadas permitiendo obtener información más específica con respecto a sus fortalezas y debilidades. Los CDM resuelven varias limitaciones de los métodos clásicos y los modelos de teoría de respuesta a ítems unidimensionales (TRI).
Para este estudio se amplía el marco de DINA al incorporar una covariable en un modelo de DINA reparametrizado. La covariable se puede especificar en dos niveles: en el nivel inferior, afectando la forma en que los evaluados resuelven los ítems (es decir, la probabilidad de respuesta), y en el nivel superior, influenciando en el dominio de los atributos (es decir, la clasificación latente). En esta tesis, se desarrolla teóricamente el modelo indicado desde el enfoque clásico. Para la estimación desarrollaremos el método de máxima verosimilitud y el método de la moda a posteriori vía el algoritmo de Esperanza-Maximización (EM) y de Newton-Raphson. Para tal fin, se realiza 4 estudios de simulación con la finalidad de observar en primer lugar el efecto de la covariable cuando afecta simultáneamente a los ítems y a los atributos, luego cuando la covariable afecta por separado a ambos, y también cuando la covariable no los afecta. Finalmente, se muestra su aplicación en la evaluación de la prueba de admisión a una Universidad.
|
444 |
Modelo de regresión Dirichlet bayesiano: aplicación para estimar la prevalencia del nivel de anemia infantil en centros poblados del PerúAndrade Chávez, Francisco Mauricio 29 March 2021 (has links)
La anemia es una afección causada por un bajo nivel de hemoglobina en la sangre causada
principalmente por un déficit en el consumo de hierro. En el Perú, es un problema de
salud pública y nutrición principalmente en niñas y niños menores de cinco años, por ello el
Instituto Nacional de Estadística (INEI) realiza una prueba para determinar anemia en niñas
y niños a través de la Encuesta Demográfica y de Salud Familiar (ENDES). En esta encuesta
se clasifica los niveles de anemia como severa si es menor a 7,0 g/dl, moderada si está entre
7,0 y 9,9 g/dl o leve si varía entre 10,0 y 11,9 g/dl. En este contexto, en esta tesis se propone
aplicar el modelo de regresión de Dirichlet para estimar la prevalencia de los niveles de
anemia infantil a nivel de centros poblados en el año 2017. Se propone estimar los parámetros
usando inferencia bayesiana, a través del método Halmitoniano de Monte Carlo (HMC) usando
Rstan. El modelo propuesto también permite identificar posibles factores determinantes
de la prevalencia de la anemia infantil y tiene el propósito de mejorar las políticas públicas
dirigidas a la reducción de la anemia en el país.
|
445 |
El Modelo de Respuesta Nominal: Aplicación a datos educacionalesRivera Espejo, José Manuel 17 July 2019 (has links)
This thesis focuses its e orts on presenting and studying the Nominal Response Model
or NRM (Bock, 1972, 1997), in the context of the Item Response Theory (IRT). Simulation
studies are carried out to determine the quality of the recovery of the parameters of the
model, under the Classic (MML) and Bayesian (MCMC) aproach and nally, the studied
model was applied to an random, representative and anonymous sample of 1641 teachers
from the Basic Regular Education modality of the english specialty, who were exposed to the
Reading-Comprehension sub-test of the \Concurso de Nombramiento 2015".
Related to the simulation, we found the bayesian method is a good substitute for the
classic counterpart, because it recovers in a similarly satisfactory fashion the parameters of
the items; however, the main disadvantage was that the process was between 620 to 14; 100
times slower than the classical approach, despite the special emphasis on making the MCMC
processes parrallel.
Related to the results of the implementation of the model on real data, the NRM: (i) it
facilitates the recovery of a greater proportion of information available in the items, compared
to dichotomous response models (Bock, 1972; Thissen, 1976; Levine y Drasgow, 1983;
Thissen y Steinberg, 1984), (ii) it allows to nd the implicit order in initially not ordered
categorical data (Samejima, 1988; Bock, 1997) and (iii) it provided relevant information for
the examination of the quality of an item (Thissen et al., 1989), specially in two fronts: (a) it
allowed the identi cation of useless or forced alternatives and (b) it allowed the identi cation
of alternatives that could be collapsed, given that these alternatives registered a similar topics. / La presente tesis centra sus esfuerzos en presentar y estudiar el Modelo de Respuesta
Nominal o NRM por sus siglas en inglés (Bock, 1972, 1997), en el contexto de la Teoría de Respuesta al ítem (IRT, por sus siglas en inglés). Se realizaron estudios de simulación para determinar la calidad de la recuperación de los parámetros del modelo, bajo la metodología clásica (MML) y bayesiana (MCMC) y finalmente, se aplicó el modelo estudiado en una muestra anónima, aleatoria y representativa de 1641 docentes de la modalidad de Educación Básica Regular de la especialidad de inglés, que fueron expuestos a la sub-prueba de Compresión Lectora del Concurso de Nombramiento 2015.
En relación a la simulación, encontramos que el método bayesiano es un buen sustituto de su contraparte clásica, debido a que el mismo recupera de manera similarmente satisfactoria los parámetros de los ítems; sin embargo, la principal desventaja es que fue entre 620 a 14100 veces más lento que los métodos clásicos, pese a que se puso especial énfasis en hacer paralelos los procesos MCMC.
En relación a los resultados de la aplicación se tiene que el NRM: (i) facilita la recuperación de una mayor proporción información disponible en los ítems, frente a los modelos de respuestas dicotómicas (Bock, 1972; Thissen, 1976; Levine y Drasgow, 1983; Thissen y Steinberg, 1984), (ii) permite hallar el ordenamiento implícito en datos categóricos inicialmente no ordenados (Samejima, 1988; Bock, 1997) y (iii) brinda información relevante para la valoración de la calidad de un ítem (Thissen et al., 1989), especialmente en dos puntos: (a) les permitía identificar alternativas inservibles o forzadas y (b) les permita identificar alternativas que se podían colapsar, dado que estas alternativas registraban similar temática.
|
446 |
Modelo de regresión lineal con censura basado en una distribución senh-normal/independiente: una perspectiva frecuentistaAlonzo Huaman, Max Walter 31 July 2022 (has links)
En esta tesis se estudia el modelo de regresión lineal para datos censurados considerando
una distribución senh-normal/independiente para los errores desde un enfoque frecuentista.
Este trabajo considera la revisión de la teoría existente, la construcción del nuevo modelo,
estimación de parámetros, estudios de simulación para recuperar los parámetros del modelo
y la aplicación a un conjunto de datos reales. / In this thesis, the linear regression model for censored data is studied considering a sinhnormal
/ independent distribution for errors from a frequentist approach. This paper considers
the revision of the existing theory, the construction of the new model, estimation of parameters,
simulation studies to retrieve the parameters of the model and the application to a set
of real data.
|
447 |
Evolución de Schramm-LoewnerMaura Llauri, Christian Jaime 21 April 2021 (has links)
The Schramm-Loewner Evolution, or SLE, is a chain of random compact sets that allows us to generate any random curve that satis es conformal invariance as well as the domain Markov property. Its construction goes through the solution of a random version of Loewner's deterministic equation: @tgt(z) = 2 gt(z) f(t) g0(z) = z where the continuous function f is replaced by a stochastic process p kB, where k is a positive constant and B a Brownian motion. This construction enables the inclusion of stochastic calculus tools in the study of the curves generated by the SLE. The main objective of this thesis is to provide an accessible and introductory description of SLE. To do this, Loewner's theorems, which allows us to establish bijections between families of hulls and families of biholomorphisms properly normalized in 1, as well as between real continuous functions of real variable and families of hulls, are enunciated and demonstrated. On these bijections, the good de nition of the SLE is justi ed as a random family of hulls with law induced by a Brownian motion through the Loewner random equation. Then some elementary properties that the SLE inherits from the Brownian movement are presented and the existence of the curve that generates the SLE is demonstrated. Finally, as a way of discussing the non-trivial character of the constant k that appears in front of the Brownian motion that gives rise to the SLE, a demonstration of a phase transition exhibited by the SLE curves is presented, which pass from curves simple to non-simple once you go from k 2 (0:4] to k > 4. / La Evolución Schramm-Loewner, o SLE por sus siglas en inglés, es una
cadena de conjuntos compactos aleatorios que permite generar cualquier curva
aleatoria que posea las propiedades de dominio de Markov y de invarianza bajo
transformaciones conformes. Su construcción pasa por la solución de una versión
aleatoria de la ecuación determinística de Loewner:
∂tgt(z) = 2/gt(z) − f(t)
g0(z) = z
donde la función continua f es reemplazada por un proceso estocástico raíz de kB,
donde k es una constante positiva y B un movimiento Browniano. Dicha
construcción facilita la inclusión de herramientas del cálculo estocástico en el
estudio de las curvas que genera la SLE. La presente tesis tiene como objetivo
principal brindar una descripción accesible e introductoria de la SLE. Para ello
se enuncian y demuestran los teoremas de Loewner que nos permiten establecer
biyecciones entre familias de hulls y familias de biholomorfismos adecuadamente
normalizados en infinito, así como entre funciones continuas reales de variable real
y familias de hulls. Sobre dichas biyecciones se justifica la buena definición
de la SLE en tanto familia aleatoria de hulls con ley inducida a través de un
movimiento Browniano por intermedio de la ecuación aleatoria de Loewner.
Luego se presentan algunas propiedades elementales que la SLE hereda del
movimiento Browniano y se demuestra la existencia de la curva que genera la SLE.
Finalmente, como una manera de discutir el carácter no trivial de la constante k
que aparece delante del movimiento Browniano que da lugar a la SLE, se presenta
una demostración de una transición de fase que exhiben las curvas SLE, las cuales
pasan de curvas simples a no simples una vez que se pasa de k E (0; 4] a k>4.
Palabras clave:
ecuación de Loewner
hull compacto
ujo de Loewner
cadena de Loewner
movimiento browniano
curva aleatoria
|
448 |
Análisis bayesiano de modelos de clases latentes para variables politómicas: Confianza hacia instituciones públicasCruz Sarmiento, Marylía Paola 11 February 2019 (has links)
El modelo de análisis de clases latentes tiene como finalidad describir una variable no observable a través del agrupamiento de los individuos en base a sus patrones de respuestas.
La estimación en este modelo se puede realizar mediante el algoritmo de Esperanza-Maximización (EM) y su desarrollo para el caso politómico se encuentra implementado en el paquete poLCA de R. Desde el punto de vista bayesiano, esta estimación ha sido hasta el momento implementada sólo para el caso de variables dicotómicas. En este trabajo, se busca
extender este ultimo aporte para el caso politómico, haciendo uso del muestrador de Gibbs.
La aplicación del modelo de análisis de clases latentes, bajo el enfoque bayesiano aquí desarrollado, se realizó sobre un conjunto de datos reales relacionados con la con fianza hacia 21 instituciones públicas en una encuesta para Lima Metropolitana. En general, se identificaron tres grupos de encuestados seg un sus niveles de confianza institucional, los cuales se analizaron luego en relación a otras variables.
|
449 |
Modelo bayesiano geoestadístico beta-inflacionado utilizando NNGP con aplicación a datos de cobertura forestalBarriga Pozada, Alfonso Carlos Cesar 29 September 2020 (has links)
En esta tesis proponemos un nuevo modelo geoestadístico beta inflacionado en ceros y unos utilizando NNGP (del inglés Nearest Neighbor Gaussian Process). La ventaja principal de modelar los efectos espaciales utilizando NNGP es la reducción del elevado tiempo computacional que con lleva modelar un proceso gaussiano, ya que no necesita trabajar con todos los vecinos sino solo con un grupo reducido. La estimación de los parámetros se llevó a cabo desde una perspectiva bayesiana. Además, se llevó a cabo un estudio de simulación en el cual se hicieron pruebas con diferentes cantidades de vecinos para evaluar en términos de RMSE y tiempo computacional la ganancia en la estimación del modelo al agregar más vecinos. Finalmente, se modeló la proporción de cobertura forestal en Hiroshima utilizando el modelo geoestadístico desarrollado, obteniendo buenos resultados. / In this thesis, we propose a new geostatistical beta inflated zero-one model using
NNGP (Nearest Neighbor Gaussian Process). The main advantage of using NNGP in
the modeling of spatial effects is the reduction of the large computing time it takes to
model a Gaussian process since it does not need to work with all the neighbors, but
only with a small group. The estimation of the parameters is done from a bayesian
perspective since the posterior distribution does not have a known shape. In addition,
a simulation studywas carried out inwhich testswere donewith different amounts of
neighborstoevaluateintermsofRMSEandcomputational timethegaininthemodels
whenaddingmore neighbors.Finally, the proportionof forest cover inHiroshimawas
modeled using the developed geostatistical model, obtaining good results.
|
450 |
Modelo lineal mixto de clases latentes con respuesta ordinal y su aplicación en la medición de la religiosidadRenteria Sacha, Ivonne Mireille 16 January 2020 (has links)
Los modelos lineales mixtos de clases latentes desarrollados por Proust-Lima, Philipps y Liquet (2017) son útiles para analizar el aspecto dinámico y la naturaleza multidimensional de un fenómeno de interés en poblaciones no necesariamente homogéneas. Estos permiten identificar las posibles clases latentes en la población bajo estudio y cómo un conjunto de covariables afecta en cada clase a la variable respuesta de interés. En esta tesis se desarrolla el modelo lineal mixto de clases latentes con variable respuesta latente y variable mani-fiesta ordinal, a través de sus dos componentes: el sub-modelo estructural y el sub-modelo de medición, que son complementados con un modelo logístico multinomial para analizar la probabilidad de pertenencia a una clase latente. El modelo se aplicó a un conjunto de datos pertenecientes al Estudio Nacional de Juventud y Religión (NSYR por las siglas en inglés “National Study of Youth and Religion”), con el fin de encontrar clases latentes en el constructo religiosidad y describir su evolución. Como resultado, se identificaron tres clases latentes con trayectorias distintas para cada caso. / Latent class linear mixed models developed by Proust-Lima, Philipps y Liquet (2017) are useful to analyze the dynamic aspect and the multidimensional nature of a phenomenon of interest in populations not necessarily homogeneous. These allow to identify the possible latent classes in the population under study and how a set of covariates affects the response variable of interest in each class. In this thesis, the latent class linear mixed model with latent response variable and ordinal manifest variable is developed, through its two components: the structural sub-model and the measure sub-model, which are complemented with a mul-tinominal logistic model to analyze the probability of belonging to a latent class. The model was applied to a dataset from the National Study of Youth and Religion (NSYR), in order to find latent classes in the religiosity construct and to describe their evolution. As a result, three latent classes were identified with different trajectories for each case.
|
Page generated in 0.0907 seconds