121 |
Análisis de votos electorales usando modelos de regresión para datos de conteoContreras Vilca, Norma 08 April 2013 (has links)
Se presentan dos modelos de regresión para datos de conteo: el modelo de regresión
Poisson y modelo de regresión Binomial Negativa dentro del marco de los Modelos Lineales Generalizados. Los modelos son aplicados inicialmente a un conjunto de datos conocido como ((The Aircraft Damage)) presentado en Montgomery (2006) referido al número de daños en las aeronaves
durante la guerra de Vietnam.
La principal aplicación de este trabajo sería el análisis de los votos obtenidos por el candidato
Ollanta Humala Tasso en los resultados de las ((Elecciones Generales y Parlamento Andino
2011)), analizamos los datos de la primera vuelta a nivel de regiones considerando diversos
predictores. Ambos conjunto de datos, presentan sobredispersión, esto es una varianza mayor que la media, bajo estas condiciones el modelo de Regresión Binomial Negativa resulta m as adecuado que
el modelo de Regresión Poisson.
Adicionalmente, se realizaron estudios de diagnósticos que confirman la elección del modelo
Binomial Negativa como el más apropiado para estos datos.
|
122 |
Endpoint-inflated beta-binomial regression for correlated count dataFazio Luna, Boris Manuel 29 March 2021 (has links)
El modelo de regresión binomial con in acción en los extremos permite modelar datos de
conteo acotados en los que una alta proporción de las observaciones se encuentra en los extremos.
Extendemos el modelo considerando una función de enlace de logit ordenado, la cual
aprovecha la información de orden implícita en las probabilidades de in
acción y exploramos
el uso de efectos aleatorios y marginalización para manejar la presencia de observaciones
repetidas. Empleamos un conjunto de datos previamente analizado en la literatura mediante
un modelo de regresión binomial con in
acción en los extremos que emplea el enlace softmax
para mostrar el mejor ajuste logrado por nuestro modelo. / The endpoint-inflated binomial regression model provides a way of modeling bounded
count data with a high proportion of observations at the endpoints. We extended the model
by considering an ordered logit link which exploits the natural ordering in the inflation
probabilities and explore the utility of random effects and marginalization for dealing with
repeated measures. We use a dataset previously analyzed in the literature with an endpointinflated binomial regression using a softmax link to show our model achieves an improved fit.
|
123 |
Modelo de regresión no lineal basado en una mixtura de la distribución senh-normal/independiente en el errorOcampo Corrales, Carlos Iván 22 September 2021 (has links)
La distribución normal, si bien útil para explicar la distribución de muchos conjuntos
de datos, a veces es inadecuada para ello. En este sentido, en muchos casos es conveniente
trabajar con transformaciones de la distribución normal por ejemplo log-normal, Birnbaum-
Saunders (BS) y Senh-Normal (SN). En esta tesis se presenta un modelo de regresión no lineal
basado en una mixtura finita de distribuciones Senh-Normal/Independiente (SNI) en el error
considerando dos casos específicos de esta distribución, SN y Senh-t-Student (SSt), respectivamente.
En el contexto de regresión se plantea una metodología de estimación mediante la
aplicación del algoritmo EM y también para el cálculo de los errores estándar.
Se realizaron estudios de simulación para evaluar las propiedades de las estimaciones. Los
resultados muestran que el modelo estima de manera satisfactoria los parámetros, más aún,
evaluando el sesgo y el RSME de las estimaciones se observa que el modelo cumple con las
propiedades asintóticas de los estimadores de máxima verosimilitud. Asimismo, se realizaron
estudios de aplicación tanto para el modelo SN como SSt.
|
124 |
Fusión de efectos para modelos de regresión con respuesta positiva bajo un enfoque bayesianoDongo Román, Andie Bryan 10 January 2022 (has links)
El presente trabajo tiene como objetivo adaptar el modelo bayesiano para fusión de efectos presentado por Pauger y Wagner (2019), de tal manera que sea adecuado para modelos de regresión con respuesta positiva bajo una distribución gamma. El modelo plantea como distribución a priori de los coeficientes de cada covariable cualitativa a una normal multivariada, deducida a partir de una distribución a priori spike y slab para la diferencia de cada par de efectos, cuya matriz de precisión permite conocer qué niveles pueden fusionarse.
La estructura de la matriz de precisión depende de un hiperparámetro que permite estimar las probabilidades de fusión a posteriori entre cada par de niveles, con las cuales se pueden agrupar aquellos niveles con efectos similares mediante la función de pérdida de Binder. La estimación a posteriori del modelo es realizada con métodos MCMC utilizando el programa JAGS en R.
Se aplicó la metodología a un conjunto de datos reales extraído de la Encuesta Nacional de Hogares (ENAHO) del año 2019, donde se pudo verificar la existencia de una brecha salarial por etnicidad en los entrevistados de la macro región sur del Perú. Así mismo, se incluyó en el caso aplicativo a la interacción entre los efectos de la etnicidad y el sexo, revelándose que la brecha por género existente es mayor en la población aymara y en la no indígena, en comparación con la población quechua.
|
125 |
Aplicación de técnicas de Data Analytics: Clustering y Regresión Lineal Múltiple, para la segmentación de la oferta y proyección de ciclos inmobiliarios en el mercado de oficinas primeJhon Rios, Luis Priamo 13 February 2023 (has links)
El presente trabajo de investigación desarrolla la aplicación de las técnicas clustering
(clúster) y regresión lineal múltiple, para la segmentación de la oferta y proyección de ciclos
inmobiliarios en el mercado de oficinas prime. Estas herramientas corresponden al ámbito de data
analytics (análisis de datos), el cual consiste en el procesamiento y ejecución de análisis
estadísticos en conjuntos de datos de entrada, los cuales para el caso de esta investigación,
corresponden a información de indicadores del mercado inmobiliario de oficinas en los últimos 10
años.
En primer lugar, la aplicación de la técnica descriptiva de clúster, permitirá segmentar el
mercado inmobiliario de oficinas, agrupando las diferentes edificaciones según sus características
afines, generando una segmentación que permita profundizar un mejor entendimiento de la oferta
existente y de esta manera optimizar las estrategias de comercialización utilizadas por los agentes
del mercado.
En segundo lugar, utilizando la información histórica de los principales indicadores
inmobiliarios, se plantea la construcción de un modelo predictivo de regresión múltiple que
permitirá proyectar el comportamiento de la oferta y demanda del mercado, estimando de esta
manera la fase del ciclo inmobiliario que atraviesa el mercado: expansión, sobreoferta, re1cesión
o recuperación.
Para desarrollar el presente trabajo, se realizó la revisión bibliográfica de las principales
investigaciones que aplican modelos de clúster y regresión lineal múltiple, considerando también
que el contenido puede resultar útil para la toma de decisiones de inversionistas, empresas
desarrolladoras y analistas comerciales del sector inmobiliario, puesto que les permitirá
deslumbrar tendencias en el mercado y les servirá como ayuda para determinar cuáles son los
momentos adecuados para invertir en un nuevo proyecto inmobiliario y/o comercializar un
contrato de arrendamiento de oficinas.
|
126 |
Modelo de regresión lineal con censura basado en una distribución senh-normal/independiente: una perspectiva frecuentistaAlonzo Huaman, Max Walter 31 July 2022 (has links)
En esta tesis se estudia el modelo de regresión lineal para datos censurados considerando
una distribución senh-normal/independiente para los errores desde un enfoque frecuentista.
Este trabajo considera la revisión de la teoría existente, la construcción del nuevo modelo,
estimación de parámetros, estudios de simulación para recuperar los parámetros del modelo
y la aplicación a un conjunto de datos reales. / In this thesis, the linear regression model for censored data is studied considering a sinhnormal
/ independent distribution for errors from a frequentist approach. This paper considers
the revision of the existing theory, the construction of the new model, estimation of parameters,
simulation studies to retrieve the parameters of the model and the application to a set
of real data.
|
127 |
A beta inflated mean regression model with mixed effects for fractional response variablesFernández Villegas, Renzo 20 June 2017 (has links)
In this article we propose a new mixed effects regression model for fractional bounded response variables. Our model allows us to incorporate covariates directly to the expected
value, so we can quantify exactly the influence of these covariates in the mean of the variable of interest rather than to the conditional mean. Estimation is carried out from a Bayesian perspective and due to the complexity of the augmented posterior distribution we use a Hamiltonian Monte Carlo algorithm, the No-U-Turn sampler, implemented using Stan software. A simulation study for comparison, in terms of bias and RMSE, was performed showing that our model has a better performance than other traditional longitudinal models for bounded variables. Finally, we applied our Beta Inflated mixed-effects regression model to real data which consists of utilization of credit lines in the peruvian financial system. / En este artículo proponemos un nuevo modelo de regresión con efectos mixtos para variables acotadas fraccionarias. Este modelo nos permite incorporar covariables directamente al valor esperado, de manera que podemos cuantificar exactamente la influencia de estas covariables en la media de la variable de interés en vez de en la media condicional. La estimación se llevó a cabo desde una perspectiva bayesiana y debido a la complejidad de la distribución aumentada a posteriori usamos un algoritmo de Monte Carlo Hamiltoniano, el muestreador No-U-Turn, que se encuentra implementado en el software Stan. Se realizó un estudio de simulación que compara, en términos de sesgo y RMSE, el modelo propuesto con otros modelos tradicionales longitudinales para variables acotadas, resultando que el primero tiene un mejor desempeño. Finalmente, aplicamos nuestro modelo de regresión Beta Inflacionada con efectos mixtos a datos reales los cuales consistían en información de la utilización de las líneas de crédito en el sistema financiero peruano.
|
128 |
Modelo de regresión semiparamétrico robustoEsquivel Segura, Henry John 11 May 2021 (has links)
El presente trabajo de tesis presenta un modelo de regresión semiparamétrico con errores
t-Student, que permite estudiar el comportamiento de una variable dependiente dado un
conjunto de variables explicativas cuando los supuestos de linealidad y normalidad no se
cumplen. La estimación de los parámetros se realiza bajo el enfoque bayesiano a través del
algoritmo de Gibbs. En el estudio de simulación se observa que el modelo propuesto es más
robusto ante la presencia de valores atípicos que el usual modelo regresión semiparamétrico
normal. Asimismo se presenta una aplicación con datos reales para ilustrar esta característica.
|
129 |
Modelo de regresión de clases latentes: factores asociados a la valoración de una universidad privadaWiener Ramos, Lucia 20 June 2016 (has links)
En diversos campos de análisis, especialmente en las ciencias sociales y humanas, se identifican constructos teóricos a los cuales queremos aproximarnos pero que no son directamente observables ni medibles, como por ejemplo, la calidad o satisfacción con un servicio, el nivel de estrés, el nivel de conocimiento en matemáticas, entre otras. Este tipo de constructos son llamados variables latentes y su valor solo puede ser aproximado a través de variables observadas o manifiestas que si pueden ser medidas (Bartholomew et al., 2011).
En el Capítulo 2 se presenta consideraciones generales acerca del modelo lineal general de variables latentes y el modelo de clases latentes. En el Capítulo 3 se estudian los modelos de regresión de clases latentes, la estimación de sus parámetros y su implementación computacional. En el Capítulo 4 se presenta los resultados de la aplicación del modelo a un conjunto de datos reales orientados a conocer la valoración de una universidad privada. En el Capítulo 5 se presenta algunas conclusiones, recomendaciones y futuras extensiones que se podrían derivar de este trabajo.
|
130 |
Modelo de regresión lineal con censura basado en una mixtura finita de una distribución normal asimétricaYábar Geldres, Ingrid Alicia 29 May 2023 (has links)
El presente trabajo de tesis propone estudiar el modelo de regresión lineal con censura basado en una mixtura finita de una distribución normal asimétrica (NA), con adaptación a diferente número de componentes. Este enfoque permite modelar datos continuos con gran flexibilidad, acomodando simultáneamente multimodalidad, colas pesadas y asimetría, dependiendo de la estructura de los componentes de la mixtura. Se implementa un algoritmo de tipo EM analíticamente manejable y eficiente para calcular iterativamente las estimaciones de máxima verosimilitud de los parámetros, mediante aproximaciones estocásticas (SAEM). El algoritmo propuesto tiene algunas expresiones cerradas en el paso-E, por lo que la obtención de los errores estándar se da por el método Bootstrap.
Asimismo, se realiza un estudio de simulación con el fin de evaluar si el método propuesto permite recuperar los parámetros del modelo mediante el uso del algoritmo SAEM.
Por otro lado, se realiza la aplicación del modelo propuesto para el estudio de la participación en la fuerza laboral de las mujeres casadas usando la base de datos de la Universidad de Michigan (Mroz, 1987). Como segunda aplicación se utiliza un conjunto de datos de clientes que entraron en campaña en una entidad financiera local con el fin de estimar sus ingresos.
|
Page generated in 0.1356 seconds