Spelling suggestions: "subject:"modelos lineal generalizado"" "subject:"modelos lineal generalizada""
1 |
Principios de metodología de superficie de respuesta para modelos logísticosTarsicio De Zan, Arturo 03 February 2006 (has links)
En esta tesis doctoral abordamos algunos principios para estudiar la Metodología de Superficie de Respuesta (que abreviaremos en adelante como MSR) para datos que siguen distribuciones binarias (Bernoulli y binomial), y que se ajustan mediante Modelos Lineales Generalizados (que abreviaremos como MLG). El punto de partida elegido ha sido el enfoque clásico de la MSR, es decir, en el contexto de modelos lineales y normales y, en particular, a partir del trabajo seminal de Box y Wilson (1951).Nuestra pregunta de investigación alrededor de la cual hemos elaborado este trabajo gira alrededor del siguiente planteamiento: "¿cómo podría proceder el experimentador cuando la naturaleza de su proceso no sigue los supuestos clásicos de normalidad y linealidad?". Enlazando esta cuestión con el estado actual del arte en materia de la MSR, una segunda pregunta fue: "¿Cómo podría ser un proceso secuencial de aprendizaje del funcionamiento de un sistema en los que intervengan respuestas de naturaleza binaria en el que se persiga un objetivo determinado?". Para poder investigar con mayor profundidad esta pregunta, y mediante un sustento metodológico lo suficientemente sólido, nos apoyamos en los MLG. Estos modelos -a partir de su primera presentación y formulación en el trabajo de Nelder y Wedderburn (1972)- son la herramienta que elegimos para encontrar una metodología de aplicación sistemática, que nos permita buscar modelos adecuados que puedan ajustar respuestas de naturaleza binaria. Consideramos como estrategia particular aquella en la que se encontraría el experimentador cuando dispone de un número fijo de observaciones a realizar de las variables de un sistema, que traducimos con el nombre de "estrategia de presupuesto fijo". Así, el objetivo será poder cuantificar de alguna forma la ganancia de información que alcanzamos a conocer del proceso luego de haber utilizado todo el presupuesto disponible. En todos los casos nuestro plan es el de utilizar familias de estrategias de diseños factoriales a dos niveles, secuencialmente encadenados. Nuestro estudio comienza definiendo una familia de estrategias de exploración de un proceso representado por una superficie de respuesta teórica binaria, en la que hemos identificado tres variables: un valor llamado w, acotado entre 0 y 1, el cual es utilizado para definir el primer centro de experimentación. Luego, se considera una segunda variable, que será el valor que tenga el rango de variación de los factores, L, y finalmente, cuando se ensayen nuevas alternativas de puntos de diseño, habrá un valor S, que llamaremos "salto", que representará la longitud que separa un centro de diseño del siguiente. De esta manera, diremos que una estrategia de diseño queda caracterizada por los valores L, S y w. Partiendo así de una superficie de respuesta que sea la que mejor se considera que se aproxima a un proceso real, el objetivo será el de encontrar a través de simulaciones los niveles de w, L y S que alcancen los mejores valores posibles bajo dos criterios de selección de diseños: (a) una basada en el determinante de la Matriz de Información de Fisher (que hemos llamado "criterio de la cantidad de información"), y (b) el otro, basado en el valor de la superficie teórica evaluado en las mejores condiciones que se obtengan del modelo ajustado (que hemos llamado "criterio de proximidad al máximo"). A tal efecto, hemos utilizado programas escritos en el lenguaje R (www.r-project.orq), un entorno de programación potente y flexible,La completa revisión bibliográfica de ambos temas (MSR y MLG), junto con el diseño de herramientas informáticas "ad-hoc", ofrecen un enfoque novedoso y origina! que puede servir como punto de partida para continuar buscando el enlace entre estas dos metodologías y su aplicación en problemas prácticos sobre la base de criterios objetivos que puedan soportar la toma de decisiones. / In this PhD thesis we approached some principles that relate to the study the Response Surface Methodology (abbreviated as RSM) for binary responses (Bernoulli and binomial distributions), modellable through the scope of Generalized Linear Models (abbreviated as GLM}. Our starting point is the classic approach of the RSM, in the context of linear normal models and, particularly, from the seminal work on the subject, by the article of Box and Wilson (1951). Our first research question from which we started ellaborating this work was around of the following statement: "How could experimenters deal with this problem when the nature of the process does not follow the classical assumptions of normality and linearity?". Connecting this question with the present state-of-the-art in RSM, the second question that we address is: "How could one design a sequential strategy to learn about the operation of a system with binary response, when certain objectives are persecuted?". In order to explore these questions deeper by means of a methodological support, we leaned towards the GLM approach. These models -presented and formulated primarily in the work of Nelder and Wedderburn (1972)- are the tool that we have chosen in order to find a systematic applied methodology, that aims for suitable models that can be fitted to binary response.We consider as a particular strategy, the one in which the experimenter has a fixed number of observations to be made, in what we labeled as "strategy of fixed budget". Thus, the objective will be to quantify the information gain once we have used all the budget available. In both cases, our plan is to carry out 2-level factorial and sequential designs. Our approach starts with a definition of a family of design strategies for exploration of a process that is being represented by a certain response surface. These strategies are characterized though three variables: w, bounded between 0 and 1, used to define the first experimentation center point. Once that is determined, a second variable is considered: L, or the range of variation of the factors. Finally, when several experimental conditions were considered, the variable S, identifies the jump length that connects one center point of experimentation with the following one, Having defined the scope this way, we can say that a design strategy may be characterized by means of a three-variable picture: L, S and w. Once the experimenter defined what kind of response surface is the best one to approach the real process, the goal will be to find the levels of L, S and w that maximizes the value of two alternative criteria: the first one is based on the determinant of the Fisher's Information Matrix, and it captures (he amount of information gathered by the design, and the second one is the value taken by the theoretical surface on the maximum of the fitted surface. In order to this scope, we have written some programs in R language (www.r-proiect.org), a powerful and flexible environment of programming and doing statistics.A complete bibliographical review of both topics (RSM and GLM), as well as the design of "ad-hoc" specific software, try to offer a new and an original point of view to study this problem, which maybe useful as a starting point for continuing the research in these areas and the link between these two methodologies. It is of special interest the exploration of new practical applications to real problems based on some objective criteria that can support the process of decision making.
|
2 |
Aspectes metodològics i aplicacions de la modelització del temps de supervivència multivariant mitjançant models mixtesRenart i Vicens, Gemma 15 June 2009 (has links)
Els estudis de supervivència s'interessen pel temps que passa des de l'inici de l'estudi (diagnòstic de la malaltia, inici del tractament,...) fins que es produeix l'esdeveniment d'interès (mort, curació, millora,...). No obstant això, moltes vegades aquest esdeveniment s'observa més d'una vegada en un mateix individu durant el període de seguiment (dades de supervivència multivariant). En aquest cas, és necessari utilitzar una metodologia diferent a la utilitzada en l'anàlisi de supervivència estàndard. El principal problema que l'estudi d'aquest tipus de dades comporta és que les observacions poden no ser independents. Fins ara, aquest problema s'ha solucionat de dues maneres diferents en funció de la variable dependent. Si aquesta variable segueix una distribució de la família exponencial s'utilitzen els models lineals generalitzats mixtes (GLMM); i si aquesta variable és el temps, variable amb una distribució de probabilitat no pertanyent a aquesta família, s'utilitza l'anàlisi de supervivència multivariant. El que es pretén en aquesta tesis és unificar aquests dos enfocs, és a dir, utilitzar una variable dependent que sigui el temps amb agrupacions d'individus o d'observacions, a partir d'un GLMM, amb la finalitat d'introduir nous mètodes pel tractament d'aquest tipus de dades. / Survival research is interested in the time that passes from the beginning of the study until the event of interest occurs. However, it is very common to find individuals who experience this event more than once during the period of study. In this case, a different methodology needs to be used to that of the standard univariate survival analysis.In this case, the duration between recurrences could be correlated due to the presence of unobserved individual factors. This type of event is normally dealt with by introducing individual random effects in the model, resulting in a multivariate model. The random effects represent the individual "frailty" and the variance of these effects measures the unobserved heterogeneity between individuals. Until recently, the most common way of dealing with this type of situation in survival analysis was by using marginal models such as the robust covariance matrix estimation in the Andersen-Gill approximation; the Wei, Lin and Weissfeld method or the Prentice, Williams and Peterson method; or using the conditional models such as the frailty models (EM algorhthym). The aim of this study is to model multivariate survival data, based on generalised linear mixed models (GLMM).
|
3 |
Análisis de la incidencia de factores causales en la evolución de la siniestralidad laboral en EspañaGallego Blasco, Vicente Salvador 05 July 2021 (has links)
[ES] La Ley de Prevención de Riesgos Laborales de 8 de noviembre de 1995 (LPRL), en vigor desde el 10 de febrero de 1996, establece en su artículo 5: "tendrá por objeto la promoción de la mejora de las condiciones de trabajo dirigida a elevar el nivel de protección de la seguridad y la salud de los trabajadores en el trabajo."
En esta Tesis se ha investigado la evolución de los índices de siniestralidad laboral y su relación con la evolución de diferentes variables explicativas relacionadas con el desarrollo normativo, el mercado de trabajo, la estructura productiva, las condiciones de empleo y las condiciones individuales, entre otras, para el caso de España y en el periodo 1995-2017, que abarca desde la promulgación de la LPRL hasta fechas recientes donde se disponía de los datos históricos necesarios. La investigación se ha centrado en los índices de salud más relevantes según su significado en términos de riesgo y/o sus componentes.
El objetivo de la investigación ha sido el encontrar evidencias sobre relaciones causa-efecto entre índices y variables, a partir de las cuales extraer lecciones que facilitarán una mejor planificación de la acción preventiva. Para ello, se han propuesto varios modelos explicativos utilizando diferentes herramientas estadísticas, que han permitido formular de manera explícita y analizar la relación entre la evolución de los indicadores de salud ocupacional y la evolución de las principales variables explicativas.
En términos generales puede concluirse que la implantación de dicha ley y normativa que la acompaña ha tenido un impacto positivo en las condiciones de trabajo y en consecuencia sobre el nivel de seguridad y salud de los trabajadores desde entonces y hasta la fecha. Sin embargo, se observan diferentes comportamientos cíclicos en la evolución de los indicadores, tales como los índices de incidencia, frecuencia y gravedad, que pone de manifiesto su dependencia de la naturaleza y comportamiento cíclico de algunas de las variables explicativas más importantes relacionadas con ciclos económicos, mercado de trabajo, estructura productiva, etc. Además, se observa como aspectos tales como la pertenencia a grupos de edad jóvenes o expertos, el nivel de estudios, determinadas categorías profesionales, y algunos sectores particulares tienen efectos significativos sobre los valores alcanzados por los índices de siniestralidad. En cambio, otros, como el trabajo a tiempo parcial o la contratación temporal no manifiestan tener tanta repercusión sobre los indicadores. / [CA] Partint de les dades corresponents als accidents ocorreguts en el període 1995-2017, es La Llei de Prevenció de Riscos Laborals de 8 de novembre de 1995 (*LPRL), en vigor des del 10 de febrer de 1996, estableix en el seu article 5: "tindrà per objecte la promoció de la millora de les condicions de treball dirigida a elevar el nivell de protecció de la seguretat i la salut dels treballadors en el treball." En aquesta Tesi s'ha investigat l'evolució dels índexs de sinistralitat laboral i la seua relació amb l'evolució de diferents variables explicatives relacionades amb el desenvolupament normatiu, el mercat de treball, l'estructura productiva, les condicions d'ocupació i les condicions individuals, entre altres, per al cas d'Espanya i en el període 1995-2017, que abasta des de la promulgació de la LPRL fins a dates recents on es disposava de les dades històriques necessàries. La investigació s'ha centrat en els índexs de salut més rellevants segons el seu significat en termes de risc i/o els seus components. L'objectiu de la investigació ha sigut el trobar evidències sobre relacions causa-efecte entre índexs i variables, a partir de les quals extraure lliçons que facilitaran una millor planificació de l'acció preventiva. Per a això, s'han proposat diversos models explicatius utilitzant diferents eines estadístiques, que han permés formular de manera explícita i analitzar la relació entre l'evolució dels indicadors de salut ocupacional i l'evolució de les principals variables explicatives. En termes generals pot concloure's que la implantació d'aquesta llei i normativa que l'acompanya ha tingut un impacte positiu en les condicions de treball i en conseqüència sobre el nivell de seguretat i salut dels treballadors des de llavors i fins hui. No obstant això, s'observen diferents comportaments cíclics en l'evolució dels indicadors, com ara els índexs d'incidència, freqüència i gravetat, que posa de manifest la seua dependència de la naturalesa i comportament cíclic d'algunes de les variables explicatives més importants relacionades amb cicles econòmics, mercat de treball, estructura productiva, etc. A més, s'observa com a aspectes com ara la pertinença a grups d'edat joves o experts, el nivell d'estudis, determinades categories professionals, i alguns sectors particulars tenen efectes significatius sobre els valors aconseguits pels índexs de sinistralitat. En canvi, uns altres, com el treball a temps parcial o la contractació temporal no manifesten tindre tanta repercussió sobre els indicadors. / [EN] The Occupational Risk Prevention Act of November 8, 1995 (ORPA), in force since February 10, 1996, establishes in its article 5: "will have as its objective the promotion of the improvement of working conditions aimed at raise the level of protection of the safety and health of workers at work. "
This thesis has investigated the evolution of the occupational accident rates and their relationship with the evolution of different explanatory variables related to regulatory development, the labor market, the productive structure, employment conditions and individual conditions, among others, in the case of Spain and in the period 1995-2017, which ranges from the enactment of the LPRL to recent dates where the necessary historical data was available. Research has focused on the most relevant health indices according to their meaning in terms of risk and / or their components.
The objective of the research has been to find evidence on cause-effect relationships between indices and variables, from which to extract lessons that will facilitate better planning of preventive action. To this end, several explanatory models have been proposed using different statistical tools, which have made it possible to explicitly formulate and analyze the relationship between the evolution of occupational health indicators and the evolution of the main explanatory variables.
In general terms, it can be concluded that the implementation of said law and accompanying regulations has had a positive impact on working conditions and consequently on the level of health and safety of workers since then and to date. However, different cyclical behaviors are observed in the evolution of the indicators, such as incidence, frequency and severity indices, which highlights their dependence on the nature and cyclical behavior of some of the most important explanatory variables related to economic cycles, labor market, productive structure, etc. Furthermore, aspects such as belonging to young age groups or experts, educational level, certain professional categories, and some particular sectors are observed as having significant effects on the values reached by the accident rates. On the other hand, others, such as part-time work or temporary hiring, do not claim to have such an impact on the indicators. / Gallego Blasco, VS. (2021). Análisis de la incidencia de factores causales en la evolución de la siniestralidad laboral en España [Tesis doctoral]. Universitat Politècnica de València. https://doi.org/10.4995/Thesis/10251/168774
|
Page generated in 0.1022 seconds