Spelling suggestions: "subject:"estadística bayesian ""
31 |
Modelos testlet logísticos y logísticos de exponente positivo para pruebas de compresión de textosFlores Ari, Sandra Elizabeth 16 August 2012 (has links)
Los modelos de Teoría de Respuesta al Item (TRI) para datos binarios multivariados,
permiten estimar una medida latente (de habilidad) a partir de información observada, que puede ser respuestas dicotómicas (de éxito y fracaso) a un conjunto de ítems de una determinada prueba. Uno de los supuestos críticos en los modelos TRI es la independencia condicional de los ítems, que permite el cálculo directo de la verosimilitud del modelo. En muchas situaciones de evaluación este supuesto no se cumple, como es el caso de pruebas de comprensión de textos, en la que se presenta un texto y luego varias preguntas relacionadas con ese texto. Este tipo de estructuras son denominadas como testlets. Bradlow et al. (1999) desarrollaron una parametrización adicional para recoger el efecto de esta dependencia. A partir de este trabajo se presenta el modelo Testlet logístico y se propone el modelo Testlet logístico de exponente positivo (2LPET), que es una extensión del modelo LPE propuesto por Samejima (1999) y Bazan y Bolfarine (2010) y considera enlaces asimétricos.
Se desarrollaron varios estudios de simulación en los que se muestra que cuando se tiene testlets, los modelos Testlet recuperan mejor los parámetros respecto a los modelos TRI.
Finalmente se realizó una aplicación con datos del Ministerio de Educación, específicamente con los resultados de la prueba de comprensión de textos de la Evaluación Censal de Estudiantes (ECE) dirigido a estudiantes de segundo grado de primaria, en un conjunto de escuelas de Lima metropolitana. De los resultados obtenidos se concluye que los modelos TRI sobreestiman la medida de habilidad respecto a los modelos Testlets y además la información de la prueba es mejor distribuida por el modelo propuesto.
|
32 |
Métodos de selección de variables bajo el enfoque bayesiano para el modelo lineal normalBlas Oyola, Sthip Frank 18 January 2021 (has links)
En muchos casos prácticos, al realizar un análisis de regresión, se cuenta con un gran
número de potenciales variables explicativas de las cuáles sólo algunas serán importantes para explicar la variable respuesta. Por lo tanto, un problema importante para la construcción de un modelo de regresión es encontrar un adecuado conjunto de variables explicativas. A los métodos que lidian con este problema se les denomina métodos de selección de variables. En el presente proyecto de tesis, se estudiarán tres métodos de selección de variables bajo inferencia bayesiana para el modelo de regresión lineal normal los cuales fueron propuestos por George y McCulloch (1993), Kuo y Mallick (1998) y Dellaportas et al. (2002). Estos métodos, a diferencia de los métodos tradicionales, consideran la selección de variables dentro del mismo modelo, por ejemplo, introduciendo variables latentes que indiquen la presencia o ausencia de una variable explicativa. Se realizaron comparaciones de estos métodos bayesianos con los métodos Lasso y Stepwise por ser los más tradicionales. A través de un estudio con datos simulados, en diversos escenarios se observa que los métodos bayesianos permiten una adecuada selección de las variables explicativas. Adicionalmente se presentan los resultados de una aplicación con datos reales.
|
33 |
Modelos de regresión binaria Skew probit para el calculo de probabilidad de default en el ámbito del sistema financieroPantoja Marin, Luis 05 February 2013 (has links)
La presente investigación se fundamenta en el uso o aplicación de Modelos Skew Probit con enlace asimétrico desde un enfoque Bayesiano. Los modelos a usar incorporan la posibilidad de usar enlaces asimétricos para estimar la probabilidad de y i =1 en muestras no balanceadas (alta proporción de ceros y por ende pequeña proporción de unos). La formulación general de esto modelos es debida a Bazán, Bolfarine y Branco (2010).
Aunque en estos modelos inicialmente su computación es complicada se usaron Cadenas de Markov por Monte Carlo (MCMC) o muestreo Gibbs (para la aplicación de estos procedimientos ver Carlin y Polson, 1992) que hacen simple la formulación del modelo y por tanto simple su implementación usando el software WinBugs (los códigos de los diferentes modelos utilizados fueron obtenidos en el programa BRMUW propuesto por Bazán y Bayes, 2010).
De acuerdo al análisis y estudio de aplicación realizado sobre una muestra de clientes de préstamos pertenecientes a una entidad micro financiera, aquellos modelos Skew Probit BBB y Estándar presentan los mejores indicadores de eficiencia.
El análisis sobre datos reales señala que el modelo tradicional Probit presenta un 56.6% (371/664) de mala clasificación versus los modelos Estándar y BBB que en promedio muestran dicho indicador alrededor de 43% (290/664).
El análisis mediante curvas COR (Receiver Operating Characteristic) ratifica lo mencionado; el área debajo de las curvas superan el 0.74 de 1 para el modelo BBB, mientras que dicho dato es de 0.70 para el caso del modelo simétrico tradicional probit. Por tanto la sensibilidad y especificidad (eficiencia) es mayor para aquellos modelos Skew Probit (mejor modelo BBB).
Dentro de los modelos con Enlaces Asimétricos los modelos (SP) BBB y Estándar son los que presentan mejores indicadores de ajuste e información as__ como mejoran la sensibilidad y especificidad de un determinado modelo. Finalmente, se pretende la sistematización de la propuesta a nivel de la entidad micro financiera y su aplicación en la estimación de la probabilidad de default de créditos pero aplicado en todos los tipos de créditos.
|
34 |
Extensión al modelo DINA reparametrizado con covariableSáenz Egúsquiza, Miguel Angel 20 October 2020 (has links)
En el campo educacional, cuando los estudiantes resuelven problemas su habilidad en un tema particular puede influir en el desempeño de los mismos en un área de estudio similar pero diferente. Por ejemplo, la habilidad en ciencias podría tener un efecto en su dominio sobre las matemáticas, lo que a su vez afectará la forma en que los evaluados responden a las preguntas o ítems sobre matemáticas de una prueba. Por tanto, resulta natural examinar la relación entre el rendimiento en un área particular de estudio y el dominio de los atributos en un tema relacionado. Los modelos de diagnóstico cognitivo (CDM) proporcionan un marco ideal para realizar un análisis de este tipo, ya que clasifican a los examinados en perfiles de atributos que indican su dominio en las habilidades delimitadas permitiendo obtener información más específica con respecto a sus fortalezas y debilidades. Los CDM resuelven varias limitaciones de los métodos clásicos y los modelos de teoría de respuesta a ítems unidimensionales (TRI).
Para este estudio se amplía el marco de DINA al incorporar una covariable en un modelo de DINA reparametrizado. La covariable se puede especificar en dos niveles: en el nivel inferior, afectando la forma en que los evaluados resuelven los ítems (es decir, la probabilidad de respuesta), y en el nivel superior, influenciando en el dominio de los atributos (es decir, la clasificación latente). En esta tesis, se desarrolla teóricamente el modelo indicado desde el enfoque clásico. Para la estimación desarrollaremos el método de máxima verosimilitud y el método de la moda a posteriori vía el algoritmo de Esperanza-Maximización (EM) y de Newton-Raphson. Para tal fin, se realiza 4 estudios de simulación con la finalidad de observar en primer lugar el efecto de la covariable cuando afecta simultáneamente a los ítems y a los atributos, luego cuando la covariable afecta por separado a ambos, y también cuando la covariable no los afecta. Finalmente, se muestra su aplicación en la evaluación de la prueba de admisión a una Universidad.
|
35 |
Jointly modelling of cluster dependent pro les of fractional and binary variables from a Bayesian point of viewCortés Tejada, Fernando Javier 27 October 2020 (has links)
En la presente tesis se proponen modelos de clasificación basados en regresiones beta inflacionadas cero-uno con efectos mixtos para modelar perfiles longitudinales de variables fraccionarias mixtas y variables binarias de forma conjunta con formación de clústeres. Las distintas parametrizaciones de los modelos propuestos permiten modelar distintos efectos, como modelar directamente la media marginal a través de covariables e interpretar fácilmente su efecto sobre ella o modelar la media condicional y las probabilidades de inflación de forma separada. Además, se forman clústeres de grupos de individuos con perfiles longitudinales similares a través de una variable latente, asumiendo que las variables respuesta siguen un modelo de mixtura finita. Debido a la complejidad de los modelos, los parámetros se estiman desde un punto de vista bayesiano, a partir de simulaciones MCMC utilizando el software JAGS en R. Se prueban los modelos propuestos sobre diferentes bases de datos simulados
para medir el desempeño de los mismos y se comparan con otros modelos a fin de verificar cual ajusta mejor los perfiles longitudinales de variables fraccionarias mixtas y variables binarias. Por último, se aplican los modelos propuestos a datos reales de un banco peruano, con información del ratio de uso de tarjetas de crédito en el periodo de un año, estado de default del cliente y otras covariables correspondientes al cliente poseedor de la tarjeta, con el objetivo de obtener clústeres de individuos con similar ratio de uso de tarjeta de crédito y relacionarlos con la probabilidad de caer en default que presenta cada grupo. / The following thesis proposes classi cation models that consist of jointly tting longitudinal
pro les of mixed fractional and binary variables modelled by zero-one beta in
ated mixed
regressions with cluster formation. The distinct proposed parametrizations allow di erent effects
to be modelled, such as modelling the marginal mean directly through independent
variables and easily interpret its e ect on it or modelling the conditional mean and the in-
ation probabilities separately. In addition, individuals with similar fractional longitudinal
pro les are grouped into a cluster through a latent variable, assuming that the response variables
follow a nite mixture model. Due to the complexity of the models, the parameters are
estimated from a Bayesian point of view by simulating a MCMC using JAGS software in R.
The proposed models are tted in various simulated datasets and are compared against other
models to measure performance in tting fractional longitudinal pro les and binary variables.
Finally, an application on real data is conducted, consisting on longitudinal information of
credit card utilization ratio and default status as dependants variables and covariates corresponding
to client information, aiming to obtain clusters of clients with similar behaviour in
evolution of credit card utilization and relate them to their probability of default.
|
36 |
Inferencia bayesiana en el modelo de regresión spline penalizado con una aplicación a los tiempos en cola de una agencia bancariaHuaraz Zuloaga, Diego Eduardo 08 April 2013 (has links)
En diversos campos de aplicación se requiere utilizar modelos de regresión para analizar la relación entre dos variables. Cuando esta relación es compleja, es difícil modelar los datos usando técnicas paramétricas tradicionales, por lo que estos casos requieren de la flexibilidad de los modelos no paramétricos para ajustar los datos. Entre los diferentes modelos no paramétricos está la regresión spline penalizada, que puede ser formulada dentro de un marco de modelos lineales mixtos. De este modo, los programas computacionales desarrollados originalmente para la inferencia clásica y Bayesiana de modelos mixtos pueden ser utilizados para estimarlo.
La presente tesis se centra en el estudio de la inferencia Bayesiana en el modelo de regresión spline penalizado. Para lograr esto, este trabajo proporciona un marco teórico breve de este modelo semiparamétrico y su relación con el modelo lineal mixto, la inferencia Bayesiana de este modelo, y un estudio de simulación donde se comparan la inferencia clásica y Bayesiana en diferentes escenarios considerando diversos valores del n umero de nodos, tamaños de muestra y niveles de dispersión en la data simulada. Finalmente, en base a los resultados del estudio de simulación, el modelo se aplica para estimar el tiempo de espera en cola de los clientes en agencias bancarias con el fin de calcular la capacidad de personal óptima bajo determinadas metas de nivel de servicio.
|
37 |
El Modelo de Respuesta Nominal: Aplicación a datos educacionalesRivera Espejo, José Manuel 17 July 2019 (has links)
This thesis focuses its e orts on presenting and studying the Nominal Response Model
or NRM (Bock, 1972, 1997), in the context of the Item Response Theory (IRT). Simulation
studies are carried out to determine the quality of the recovery of the parameters of the
model, under the Classic (MML) and Bayesian (MCMC) aproach and nally, the studied
model was applied to an random, representative and anonymous sample of 1641 teachers
from the Basic Regular Education modality of the english specialty, who were exposed to the
Reading-Comprehension sub-test of the \Concurso de Nombramiento 2015".
Related to the simulation, we found the bayesian method is a good substitute for the
classic counterpart, because it recovers in a similarly satisfactory fashion the parameters of
the items; however, the main disadvantage was that the process was between 620 to 14; 100
times slower than the classical approach, despite the special emphasis on making the MCMC
processes parrallel.
Related to the results of the implementation of the model on real data, the NRM: (i) it
facilitates the recovery of a greater proportion of information available in the items, compared
to dichotomous response models (Bock, 1972; Thissen, 1976; Levine y Drasgow, 1983;
Thissen y Steinberg, 1984), (ii) it allows to nd the implicit order in initially not ordered
categorical data (Samejima, 1988; Bock, 1997) and (iii) it provided relevant information for
the examination of the quality of an item (Thissen et al., 1989), specially in two fronts: (a) it
allowed the identi cation of useless or forced alternatives and (b) it allowed the identi cation
of alternatives that could be collapsed, given that these alternatives registered a similar topics. / La presente tesis centra sus esfuerzos en presentar y estudiar el Modelo de Respuesta
Nominal o NRM por sus siglas en inglés (Bock, 1972, 1997), en el contexto de la Teoría de Respuesta al ítem (IRT, por sus siglas en inglés). Se realizaron estudios de simulación para determinar la calidad de la recuperación de los parámetros del modelo, bajo la metodología clásica (MML) y bayesiana (MCMC) y finalmente, se aplicó el modelo estudiado en una muestra anónima, aleatoria y representativa de 1641 docentes de la modalidad de Educación Básica Regular de la especialidad de inglés, que fueron expuestos a la sub-prueba de Compresión Lectora del Concurso de Nombramiento 2015.
En relación a la simulación, encontramos que el método bayesiano es un buen sustituto de su contraparte clásica, debido a que el mismo recupera de manera similarmente satisfactoria los parámetros de los ítems; sin embargo, la principal desventaja es que fue entre 620 a 14100 veces más lento que los métodos clásicos, pese a que se puso especial énfasis en hacer paralelos los procesos MCMC.
En relación a los resultados de la aplicación se tiene que el NRM: (i) facilita la recuperación de una mayor proporción información disponible en los ítems, frente a los modelos de respuestas dicotómicas (Bock, 1972; Thissen, 1976; Levine y Drasgow, 1983; Thissen y Steinberg, 1984), (ii) permite hallar el ordenamiento implícito en datos categóricos inicialmente no ordenados (Samejima, 1988; Bock, 1997) y (iii) brinda información relevante para la valoración de la calidad de un ítem (Thissen et al., 1989), especialmente en dos puntos: (a) les permitía identificar alternativas inservibles o forzadas y (b) les permita identificar alternativas que se podían colapsar, dado que estas alternativas registraban similar temática.
|
38 |
Identificación de conglomerados espaciales de acuerdo a niveles de morosidad de empresas en el PerúTristán Gómez, Alex Edward 07 November 2021 (has links)
El cumplimiento de las obligaciones financieras que tienen las empresas es respaldado por
una correcta gestión de riesgo de crédito, esto evita problemas de liquidez y solvencia. Por
ello es importante detectar los niveles de riesgo de morosidad en las empresas. La presente
tesis tiene como objetivo identifi car conglomerados de provincias del Perú, en funciona de la
tasa de incumplimiento de pagos, conocida también como la tasa de morosidad. Para ello se
propone un modelamiento en dos niveles. En el primer nivel se usan modelos aglomerativos
jerárquicos para seleccionar n conglomerados candidatos a priori, donde el número fi nal de
conglomerados se escoge mediante criterios de selección de modelos. Posteriormente, en un
segundo nivel, modelaremos el nivel de riesgo haciendo uso del modelo de Poisson y prioris
condicionales autoregresivas en base a los conglomerados de nidos en el primer nivel e incluyendo
covariables. Los modelos pueden ser reescritos como modelos Gaussianos latentes, y se
puede usar inferencia bayesiana para estimar sus parámetros, específicamente a través de la
aproximación de Laplace anidada integrada. Finalmente, como resultado de la aproximación
se obtienen conglomerados de provincias de acuerdo a sus niveles de morosidad, permitiendo
clasi ficar las provincias en conglomerado de alto, medio y bajo nivel de riesgo de morosidad. / Compliance with the nancial obligations of companies is ensured by proper credit risk
management, this avoids liquidity and solvency problems. For this reason, it is important to
identify the risk level of default in peruvian companies. The goal of this thesis is to identify
clusters of provinces of Per u with regard to the default rate of payments, also known as
probability of default. Thus it is proposed a model in two stages. In the rst stage hierarchical
agglomerative models select prior candidate clusters, and the nal number of clusters is
selected through selection criteria of models. In the second stage it is proposed the Poisson
model considering autoregressive conditional prioris, the clusters de ned in the rst stage,
and also including covariates. This model ll in the class of Gaussian latent models, therfore
its paremeters were estimated using bayesian inference, speci cally through integrated nested
Laplace approximation. Finally, as a result, we found clusters in accordance with the default
level, allowing to classify provinces into clusters of high, medium and low risk level.
|
39 |
Modelo de regresión no lineal basado en una mixtura de la distribución senh-normal/independiente en el errorOcampo Corrales, Carlos Iván 22 September 2021 (has links)
La distribución normal, si bien útil para explicar la distribución de muchos conjuntos
de datos, a veces es inadecuada para ello. En este sentido, en muchos casos es conveniente
trabajar con transformaciones de la distribución normal por ejemplo log-normal, Birnbaum-
Saunders (BS) y Senh-Normal (SN). En esta tesis se presenta un modelo de regresión no lineal
basado en una mixtura finita de distribuciones Senh-Normal/Independiente (SNI) en el error
considerando dos casos específicos de esta distribución, SN y Senh-t-Student (SSt), respectivamente.
En el contexto de regresión se plantea una metodología de estimación mediante la
aplicación del algoritmo EM y también para el cálculo de los errores estándar.
Se realizaron estudios de simulación para evaluar las propiedades de las estimaciones. Los
resultados muestran que el modelo estima de manera satisfactoria los parámetros, más aún,
evaluando el sesgo y el RSME de las estimaciones se observa que el modelo cumple con las
propiedades asintóticas de los estimadores de máxima verosimilitud. Asimismo, se realizaron
estudios de aplicación tanto para el modelo SN como SSt.
|
40 |
Mixtura finita de una distribución Birnbaum-Saunders basado en la familia de mixtura en parámetros de escala de distribuciones normal asimétricaGavidia Pucllas, Daniel Elías 28 February 2022 (has links)
La presente tesis muestra la distribución mixtura de distribuciones Birnbaum-Saunders basados en mixturas de escala normal asimétrica (MF-BS-MENA). Este modelo es una extensión a la propuesta de Maehara (2018a) para datos unimodales basados en distribuciones con mixtura de escala normal asimétrica utilizada para modelar datos con percentiles extremos y altamente concentrados a la izquierda de la distribución. El modelo propuesto permite modelar datos con dos o más componentes de mixtura de distribuciones asimétricas como la t de Student asimétrica (TA), la Slash asimétrica (SLA), y la normal contaminada asimétrica (NCA). Para estimar los parámetros del modelo propuesto se presenta un método de estimación basado en el algoritmo de maximización condicional de la esperanza (una extensión del algoritmo EM). Además, se desarrollan simulaciones que muestran la precisión de las estimaciones y los errores estándar. Por último, se realizan aplicaciones con un conjunto de datos reales. / The following thesis presents the nite mixtures of Birbaums-Saunders distributions based
on the scale mixture of skew-normal distributions, which are called FM-BS-SMSN. This
model is an extension of Maehara (2018a) study of unimodal data based on scale mixture
of skew-normal distributions which are used to model extreme percentiles in the left-tail of
the distribution. The proposed model can t two or more mixture of components of skewed
distributions like Skew-t, Skew-slash, and skew-contaminated normal. The proposed method
to accomplish the estimation of model parameters is the expectation of conditional maximization
(an extension of EM algorithm). Moreover, simulations and applications are presented
to illustrate the robustness of the proposed estimation method and standar errors. Finally,
the last chapter presents an aplication for real data sets.
|
Page generated in 0.0743 seconds