111 |
Modelo de regresión lineal usando una mixtura de distribuciones senh-normalPalomino Ore, Roussel Simpson 27 September 2023 (has links)
La distribución Senohiperbólico-Normal, denominada también como una variación de la distribución Birnbaum-Saunders, surgió inicialmente para estimar el deterioro en la calidad de los materiales sujetos a estrés. Asimismo, los modelos de mixtura han suscitado considerable interés en el campo de estadística debido a que permiten lidiar con situaciones en las que el comportamiento de los errores de un modelo con ajuste lineal se aleja significativamente de la normalidad. Esta tesis aborda los dos temas mencionados mediante la presentación de un modelo de ajuste lineal usando una mixtura de distribuciones Senohiperbólico Normal o Log-Birnbaum-Saunders. Esta propuesta es una familia versátil de distribuciones de probabilidad que posibilita representar datos que presentan multimodalidad además de provenir de poblaciones heterogéneas. Para conseguir los estimadores de máxima verosimilitud se emplea el algoritmo EM con maximización condicional. Asimismo, se llevan a cabo estudios de simulación y análisis de conjuntos de datos reales para demostrar la utilidad del método propuesto. Por último, se implementa la propuesta del algoritmo y los métodos en el software R. / The Senohyperbolic-Normal distribution, also known as a variation of the Birnbaum-Saunders distribution, was initially developed to estimate the deterioration in the quality of materials subjected to stress. Likewise, mixture models have attracted considerable interest in the field of statistics because they allow dealing with situations where the error behavior of a linearly fitted model deviates significantly from normality. This thesis addresses the two aforementioned issues by presenting a linear fitting model using a mixture of Senohyperbolic Normal or Log-Birnbaum-Saunders distributions. This proposal is a versatile family of probability distributions that makes it possible to represent data that present multimodality as well as coming from heterogeneous populations. The EM algorithm with conditional maximization is used to obtain the maximum likelihood estimators. Simulation studies and analysis of real data sets are also carried out to demonstrate the usefulness of the proposed method. Finally, the proposed algorithm and methods are implemented in R software.
|
112 |
Selección de métodos numéricos aplicados a la predicción estadística usando la regresión logísticaBigio Luks, David Miles 09 March 2017 (has links)
El presente proyecto de fin de carrera buscará encontrar el mejor método
computacional para la predicción estadística usando la regresión logística. Esta
búsqueda se realizará dentro de un espacio limitado de métodos que se estudiaran.
Una vez que se realice la investigación se escogerá el algoritmo más óptimo para la
predicción y se obtendrá como resultado un aplicativo genérico para modelar
comportamientos futuros en cualquier ámbito.
Al leer la presente investigación uno podrá lograr discriminar sobre las mejores
herramientas – de las planteadas – para la predicción de escenarios futuros en
cualquier campo de estudio, de tal forma que se mejoren las decisiones tomadas y que
los usuarios (estadísticos, matemáticos e ingenieros) sepan un poco más sobre los
métodos que los llevan a sus respuestas predictivas.
|
113 |
Modelo para estimar impactos ambientales en el movimiento de tierras en obras de edificacionesGutierrez Silva, Dario Santiago, Pomar Castromonte, Rafu Estanislao 26 April 2016 (has links)
Esta tesis presenta los efectos producidos en la calidad del aire por el desarrollo de la
actividad de movimiento de tierras en obras de edificaciones. Para ello, se postula dos
modelos matemáticos que permiten calcular los factores de emisión producidos a
través de dos parámetros, PM10 y PM2.s. Se escogió tres casos reales, en donde se
obtuvo los parámetros ambientales que permitan postular el modelo, así como también
validarlo con datos reales en obras con ejecución de movimiento de tierras.
La importancia de este tema de investigación radica en que se hace necesario estudiar
y desarrollar este modelo matemático que permita estimar las emisiones de material
particulado, lo cual contribuye un aporte para un mejor estudio o evaluación de
impacto ambiental (EIA), porque por cada nuevo proyecto de construcción que se
genere, es necesario analizar y evaluar su sostenibilidad ambiental, tal es el caso de la
calidad del aire. Además, se elaboraron índices de calidad del aire para la estimación
de material particulado PM10 y PM2.s, que nos puedan mostrar el daño que se produce
o existe en el ambiente.
Mediante análisis estadísticos, como el análisis de regresión, se determinó las
causalidades que se dan entre las emisiones de material particulado durante la
actividad de movimiento de tierras y los parámetros ambientales: Porcentaje de finos
del suelo, humedad del suelo, humedad relativa, precipitación y velocidad del viento;
siendo el primer parámetro el que incide en mayor cantidad y en directa proporción y el
contenido de humedad el que menos influye.
El resultado obtenido es que la contaminación del aire existe en las obras de
edificaciones de esta ciudad. Para los proyectos seleccionados, la cantidad de material
particulado emitido obtiene la categoría de moderado según los estándares nacionales
de calidad de aire planteadas por el SENAMHI.
Palabras clave: Material particulado, factor de em1s1on, parámetros ambientales,
Estudio de Impacto Ambiental, análisis de regresión, función de transformación,
porcentaje de finos, humedad del suelo, precipitación, velocidad del viento, humedad
relativa.
|
114 |
Inferencia bayesiana en un modelo de regresión cuantílica autorregresivoQuintos Choy, Manuel Alejandro 14 June 2021 (has links)
El modelo de regresión cuantílica autorregresivo permite modelar el cuantil condicional
de una serie de tiempo a partir de los rezagos de la serie. En el presente trabajo se presenta
la estimación de este modelo desde la perspectiva bayesiana asumiendo que los errores se
distribuyen según la distribución asimétrica de Laplace (ALD). Luego, el proceso de generación de muestras de la distribución a posteriori es simplificado utilizando una representación estocástica de la ALD propuesta por Kotz et al. (2001) y el algoritmo de datos aumentados de Tanner y Wong (1987), siguiendo la propuesta de Kozumi y Kobayashi (2011), así como las adaptaciones para el modelamiento de series de tiempo de Cai et al. (2012) y Liu y Luger (2017). Los estudios de simulación demuestran que el supuesto sobre la distribución del término error no es limitante para estimar el cuantil condicional de series de tiempo con otras distribuciones. El modelo es aplicado en la predicción del Valor en Riesgo (VaR) en la serie de tiempo de los retornos diarios de la tasa de cambio de PEN a USD, y sus resultados son comparados con las predicciones obtenidas por las metodologías RiskMetrics, GARCH(1,1) y CAVIaR. Al respecto, la evidencia numérica permite concluir que el modelo QAR es una alternativa válida para estimar el VaR.
|
115 |
Modelamiento del tiempo a la ocurrencia de un evento con tiempos discretosHuertas Quispe, Anthony Enrique 18 January 2021 (has links)
En este trabajo de tesis, se plantea estudiar el tiempo a la ocurrencia de un evento en un proceso discreto. Para ello, se considera un modelo mixtura de fracción de cura sobre una población segmentada en dos tipos de individuos: sujetos curados, o también denominados sobrevivientes a largo plazo, haciendo referencia a aquellos sujetos que no alcanzarán el evento de interés en estudio; y sujetos no curados, o también denominados sujetos susceptibles, quienes en un tiempo específico, experimentarán dicho evento de interés. Los objetivos principales de esta tesis, son el de estimar la fracción de cura, la cual está definida como la proporción de individuos curados al final del estudio, y estimar el tiempo de falla para los individuos susceptibles, entendiéndose como el tiempo a la ocurrencia del evento. Este análisis se llevará a cabo con la presencia de covariables y datos censurados, siendo la simulación e inferencia de los datos efectuados vía el software estadístico R, en donde los procesos de simulación abordarán distintos escenarios para evaluar la performance del modelo propuesto.
|
116 |
Métodos de selección de variables bajo el enfoque bayesiano para el modelo lineal normalBlas Oyola, Sthip Frank 18 January 2021 (has links)
En muchos casos prácticos, al realizar un análisis de regresión, se cuenta con un gran
número de potenciales variables explicativas de las cuáles sólo algunas serán importantes para explicar la variable respuesta. Por lo tanto, un problema importante para la construcción de un modelo de regresión es encontrar un adecuado conjunto de variables explicativas. A los métodos que lidian con este problema se les denomina métodos de selección de variables. En el presente proyecto de tesis, se estudiarán tres métodos de selección de variables bajo inferencia bayesiana para el modelo de regresión lineal normal los cuales fueron propuestos por George y McCulloch (1993), Kuo y Mallick (1998) y Dellaportas et al. (2002). Estos métodos, a diferencia de los métodos tradicionales, consideran la selección de variables dentro del mismo modelo, por ejemplo, introduciendo variables latentes que indiquen la presencia o ausencia de una variable explicativa. Se realizaron comparaciones de estos métodos bayesianos con los métodos Lasso y Stepwise por ser los más tradicionales. A través de un estudio con datos simulados, en diversos escenarios se observa que los métodos bayesianos permiten una adecuada selección de las variables explicativas. Adicionalmente se presentan los resultados de una aplicación con datos reales.
|
117 |
Modelos de regresión binaria Skew probit para el calculo de probabilidad de default en el ámbito del sistema financieroPantoja Marin, Luis 05 February 2013 (has links)
La presente investigación se fundamenta en el uso o aplicación de Modelos Skew Probit con enlace asimétrico desde un enfoque Bayesiano. Los modelos a usar incorporan la posibilidad de usar enlaces asimétricos para estimar la probabilidad de y i =1 en muestras no balanceadas (alta proporción de ceros y por ende pequeña proporción de unos). La formulación general de esto modelos es debida a Bazán, Bolfarine y Branco (2010).
Aunque en estos modelos inicialmente su computación es complicada se usaron Cadenas de Markov por Monte Carlo (MCMC) o muestreo Gibbs (para la aplicación de estos procedimientos ver Carlin y Polson, 1992) que hacen simple la formulación del modelo y por tanto simple su implementación usando el software WinBugs (los códigos de los diferentes modelos utilizados fueron obtenidos en el programa BRMUW propuesto por Bazán y Bayes, 2010).
De acuerdo al análisis y estudio de aplicación realizado sobre una muestra de clientes de préstamos pertenecientes a una entidad micro financiera, aquellos modelos Skew Probit BBB y Estándar presentan los mejores indicadores de eficiencia.
El análisis sobre datos reales señala que el modelo tradicional Probit presenta un 56.6% (371/664) de mala clasificación versus los modelos Estándar y BBB que en promedio muestran dicho indicador alrededor de 43% (290/664).
El análisis mediante curvas COR (Receiver Operating Characteristic) ratifica lo mencionado; el área debajo de las curvas superan el 0.74 de 1 para el modelo BBB, mientras que dicho dato es de 0.70 para el caso del modelo simétrico tradicional probit. Por tanto la sensibilidad y especificidad (eficiencia) es mayor para aquellos modelos Skew Probit (mejor modelo BBB).
Dentro de los modelos con Enlaces Asimétricos los modelos (SP) BBB y Estándar son los que presentan mejores indicadores de ajuste e información as__ como mejoran la sensibilidad y especificidad de un determinado modelo. Finalmente, se pretende la sistematización de la propuesta a nivel de la entidad micro financiera y su aplicación en la estimación de la probabilidad de default de créditos pero aplicado en todos los tipos de créditos.
|
118 |
Jointly modelling of cluster dependent pro les of fractional and binary variables from a Bayesian point of viewCortés Tejada, Fernando Javier 27 October 2020 (has links)
En la presente tesis se proponen modelos de clasificación basados en regresiones beta inflacionadas cero-uno con efectos mixtos para modelar perfiles longitudinales de variables fraccionarias mixtas y variables binarias de forma conjunta con formación de clústeres. Las distintas parametrizaciones de los modelos propuestos permiten modelar distintos efectos, como modelar directamente la media marginal a través de covariables e interpretar fácilmente su efecto sobre ella o modelar la media condicional y las probabilidades de inflación de forma separada. Además, se forman clústeres de grupos de individuos con perfiles longitudinales similares a través de una variable latente, asumiendo que las variables respuesta siguen un modelo de mixtura finita. Debido a la complejidad de los modelos, los parámetros se estiman desde un punto de vista bayesiano, a partir de simulaciones MCMC utilizando el software JAGS en R. Se prueban los modelos propuestos sobre diferentes bases de datos simulados
para medir el desempeño de los mismos y se comparan con otros modelos a fin de verificar cual ajusta mejor los perfiles longitudinales de variables fraccionarias mixtas y variables binarias. Por último, se aplican los modelos propuestos a datos reales de un banco peruano, con información del ratio de uso de tarjetas de crédito en el periodo de un año, estado de default del cliente y otras covariables correspondientes al cliente poseedor de la tarjeta, con el objetivo de obtener clústeres de individuos con similar ratio de uso de tarjeta de crédito y relacionarlos con la probabilidad de caer en default que presenta cada grupo. / The following thesis proposes classi cation models that consist of jointly tting longitudinal
pro les of mixed fractional and binary variables modelled by zero-one beta in
ated mixed
regressions with cluster formation. The distinct proposed parametrizations allow di erent effects
to be modelled, such as modelling the marginal mean directly through independent
variables and easily interpret its e ect on it or modelling the conditional mean and the in-
ation probabilities separately. In addition, individuals with similar fractional longitudinal
pro les are grouped into a cluster through a latent variable, assuming that the response variables
follow a nite mixture model. Due to the complexity of the models, the parameters are
estimated from a Bayesian point of view by simulating a MCMC using JAGS software in R.
The proposed models are tted in various simulated datasets and are compared against other
models to measure performance in tting fractional longitudinal pro les and binary variables.
Finally, an application on real data is conducted, consisting on longitudinal information of
credit card utilization ratio and default status as dependants variables and covariates corresponding
to client information, aiming to obtain clusters of clients with similar behaviour in
evolution of credit card utilization and relate them to their probability of default.
|
119 |
Inferencia bayesiana en el modelo de regresión spline penalizado con una aplicación a los tiempos en cola de una agencia bancariaHuaraz Zuloaga, Diego Eduardo 08 April 2013 (has links)
En diversos campos de aplicación se requiere utilizar modelos de regresión para analizar la relación entre dos variables. Cuando esta relación es compleja, es difícil modelar los datos usando técnicas paramétricas tradicionales, por lo que estos casos requieren de la flexibilidad de los modelos no paramétricos para ajustar los datos. Entre los diferentes modelos no paramétricos está la regresión spline penalizada, que puede ser formulada dentro de un marco de modelos lineales mixtos. De este modo, los programas computacionales desarrollados originalmente para la inferencia clásica y Bayesiana de modelos mixtos pueden ser utilizados para estimarlo.
La presente tesis se centra en el estudio de la inferencia Bayesiana en el modelo de regresión spline penalizado. Para lograr esto, este trabajo proporciona un marco teórico breve de este modelo semiparamétrico y su relación con el modelo lineal mixto, la inferencia Bayesiana de este modelo, y un estudio de simulación donde se comparan la inferencia clásica y Bayesiana en diferentes escenarios considerando diversos valores del n umero de nodos, tamaños de muestra y niveles de dispersión en la data simulada. Finalmente, en base a los resultados del estudio de simulación, el modelo se aplica para estimar el tiempo de espera en cola de los clientes en agencias bancarias con el fin de calcular la capacidad de personal óptima bajo determinadas metas de nivel de servicio.
|
120 |
Modelo de regresión cuantílica para respuestas positivas con censura intervalarManrique Urbina, Justo Andrés 21 March 2022 (has links)
La presente tesis propone un modelo de regresi on cuant lica en d onde la variable es no
negativa y posee censura intervalar, es decir que esta no es directamente observable, y la unica
informaci on que se conoce sobre ella es que se encuentra en cierto intervalo. Para evaluar si
la metodolog a de estimaci on captura adecuadamente los par ametros poblacionales desde el
punto de vista de la inferencia cl asica, se desarrolla un estudio de simulaci on. Finalmente, se
aplica el modelo a los datos de la Encuesta Nacional de Satisfacci on de Salud ejecutada el
a~no 2015. La estructura del modelo permite evaluar los factores relacionados al sueldo de los
profesionales en salud (el cual hab a sido censurado desde el proceso de recolecci on de datos).
El presente modelo es una extensi on al modelo de regresi on de censura intervalar expuesto
en Sal y Rosas et al. (2019), pues eval ua los factores subyacentes a una variable respuesta a
lo largo de sus cuantiles.
|
Page generated in 0.0381 seconds