• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 99
  • 42
  • 9
  • 6
  • 3
  • 3
  • 1
  • 1
  • Tagged with
  • 179
  • 179
  • 91
  • 88
  • 33
  • 32
  • 22
  • 22
  • 20
  • 19
  • 18
  • 17
  • 17
  • 16
  • 15
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
111

Regression models with an interval-censored covariate

Langohr, Klaus 16 June 2004 (has links)
El análisis de supervivencia trata de la evaluación estadística de variables que miden el tiempo transcurrido hasta un evento de interés. Una particularidad que ha de considerar el análisis de supervivencia son datos censurados. Éstos aparecen cuando el tiempo de interés no puede ser observado exactamente y la información al respecto es parcial. Se distinguen diferentes tipos de censura: un tiempo censurado por la derecha está presente si el tiempo de supervivencia es sabido mayor a un tiempo observado; censura por izquierda está dada si la supervivencia es menor que un tiempo observado. En el caso de censura en un intervalo, el tiempo está en un intervalo de tiempo observado, y el caso de doble censura aparece cuando, también, el origen del tiempo de supervivencia está censurado.La primera parte del Capítulo 1 contiene un resumen de la metodología estadística para datos censurados en un intervalo, incluyendo tanto métodos paramétricos como no-paramétricos. En la Sección 1.2 abordamos el tema de censura noinformativa que se supone cumplida para todos los métodos presentados. Dada la importancia de métodos de optimización en los demás capítulos, la Sección 1.3 trata de la teoría de optimización. Esto incluye varios algoritmos de optimización y la presentación de herramientas de optimización. Se ha utilizado el lenguaje de programación matemática AMPL para resolver los problemas de maximización que han surgido. Una de las características más importantes de AMPL es la posibilidad de enviar problemas de optimización al servidor 'NEOS: Server for Optimization' en Internet para que sean solucionados por ese servidor.En el Capítulo 2, se presentan los conjuntos de datos que han sido analizados. El primer estudio es sobre la supervivencia de pacientes de tuberculosis co-infectados por el VIH en Barcelona, mientras el siguiente, también del área de VIH/SIDA, trata de usuarios de drogas intra-venosas de Badalona y alrededores que fueron admitidos a la unidad de desintoxicación del Hospital Trias i Pujol. Un área completamente diferente son los estudios sobre la vida útil de alimentos. Se presenta la aplicación de la metodología para datos censurados en un intervalo en esta área. El Capítulo 3 trata del marco teórico de un modelo de vida acelerada con una covariante censurada en un intervalo. Puntos importantes a tratar son el desarrollo de la función de verosimilitud y el procedimiento de estimación de parámetros con métodos del área de optimización. Su uso puede ser una herramienta importante en la estadística. Estos métodos se aplican también a otros modelos con una covariante censurada en un intervalo como se demuestra en el Capítulo 4.Otros métodos que se podrían aplicar son descritos en el Capítulo 5. Se trata sobre todo de métodos basados en técnicas de imputación para datos censurados en un intervalo. Consisten en dos pasos: primero, se imputa el valor desconocido de la covariante, después, se pueden estimar los parámetros con procedimientos estadísticos estándares disponibles en cualquier paquete de software estadístico.El método de maximización simultánea ha sido implementado por el autor con el código de AMPL y ha sido aplicado al conjunto de datos de Badalona. Presentamos los resultados de diferentes modelos y sus respectivas interpretaciones en el Capítulo 6. Se ha llevado a cabo un estudio de simulación cuyos resultados se dan en el Capítulo 7. Ha sido el objetivo comparar la maximización simultánea con dos procedimientos basados en la imputación para el modelo de vida acelerada. Finalmente, en el último capítulo se resumen los resultados y se abordan diferentes aspectos que aún permanecen sin ser resueltos o podrían ser aproximados de manera diferente. / Survival analysis deals with the evaluation of variables which measure the elapsed time until an event of interest. One particularity survival analysis has to account for are censored data, which arise whenever the time of interest cannot be measured exactly, but partial information is available. Four types of censoring are distinguished: right-censoring occurs when the unobserved survival time is bigger, left-censoring when it is less than an observed time, and in case of interval-censoring, the survival time is observed within a time interval. We speak of doubly-censored data if also the time origin is censored.In Chapter 1 of the thesis, we first give a survey on statistical methods for interval-censored data, including both parametric and nonparametric approaches. In the second part of Chapter 1, we address the important issue of noninformative censoring, which is assumed in all the methods presented. Given the importance of optimization procedures in the further chapters of the thesis, the final section of Chapter 1 is about optimization theory. This includes some optimization algorithms, as well as the presentation of optimization tools, which have played an important role in the elaboration of this work. We have used the mathematical programming language AMPL to solve the maximization problems arisen. One of its main features is that optimization problems written in the AMPL code can be sent to the internet facility 'NEOS: Server for Optimization' and be solved by its available solvers.In Chapter 2, we present the three data sets analyzed for the elaboration of this dissertation. Two correspond to studies on HIV/AIDS: one is on the survival of Tuberculosis patients co-infected with HIV in Barcelona, the other on injecting drug users from Badalona and surroundings, most of whom became infected with HIV as a result of their drug addiction. The complex censoring patterns in the variables of interest of the latter study have motivated the development of estimation procedures for regression models with interval-censored covariates. The third data set comes from a study on the shelf life of yogurt. We present a new approach to estimate the shelf lives of food products taking advantage of the existing methodology for interval-censored data.Chapter 3 deals with the theoretical background of an accelerated failure time model with an interval-censored covariate, putting emphasize on the development of the likelihood functions and the estimation procedure by means of optimization techniques and tools. Their use in statistics can be an attractive alternative to established methods such as the EM algorithm. In Chapter 4 we present further regression models such as linear and logistic regression with the same type of covariate, for the parameter estimation of which the same techniques are applied as in Chapter 3. Other possible estimation procedures are described in Chapter 5. These comprise mainly imputation methods, which consist of two steps: first, the observed intervals of the covariate are replaced by an imputed value, for example, the interval midpoint, then, standard procedures are applied to estimate the parameters.The application of the proposed estimation procedure for the accelerated failure time model with an interval-censored covariate to the data set on injecting drug users is addressed in Chapter 6. Different distributions and covariates are considered and the corresponding results are presented and discussed. To compare the estimation procedure with the imputation based methods of Chapter 5, a simulation study is carried out, whose design and results are the contents of Chapter 7. Finally, in the closing Chapter 8, the main results are summarized and several aspects which remain unsolved or might be approximated in another way are addressed.
112

Messung der Vulnerabilität der Armut - Eine statistische Analyse mit deutschen Paneldaten / Measuring Vulnerability to Poverty - A Statistical Analysis Using German Panel Data

Landau, Katja 24 May 2012 (has links)
No description available.
113

Regression analysis of caterpillar 793D haul truck engine failure data and through-life diagnostic information using the proportional hazards model

Carstens, Wiehahn Alwyn 03 1900 (has links)
Thesis (MScEng)--Stellenbosch University, 2012. / ENGLISH ABSTRACT: Physical Asset Management (PAM) is becoming a greater concern for companies in industry today. The widely accepted British Standards Institutes’ specification for optimized management of physical assets and infrastructure is PAS55. According to PAS55, PAM is the “systematic and co-ordinated activities and practices through which an organization optimally manages its physical assets, and their associated performance, risks and expenditures over their life cycle for the purpose of achieving its organizational strategic plan”. One key performance area of PAM is Asset Care Plans (ACP). These plans are maintenance strategies which improve or ensure acceptable asset reliability and performance during its useful life. Maintenance strategies such as Condition Based Maintenance (CBM) acts upon Condition Monitoring (CM) data, disregarding the previous failure histories of an asset. Other maintenance strategies, such as Usage Based Maintenance (UBM), is based on previous failure histories, and does not consider CM data. Regression models make use of both CM data and previous failure histories to develop a model which represents the underlying failure behaviour of the asset under study. These models can be of high value in ACP development due to the fact that Residual Useful Life (RUL) can be estimated and/or the long term life cycle cost can be optimized. The objective of this thesis was to model historical failure data and CM data well enough so that RUL or optimized preventive maintenance instant estimations can be made. These estimates were used in decision models to develop maintenance schedules, i.e. ACPs. Several regression models were evaluated to determine the most suitable model to achieve the objectives of this thesis. The model found to be most suitable for this research project was the Proportional Hazards Model (PHM). A comprehensive investigation on the PHM was undertaken focussing on the mathematics and the practical implementation thereof. Data obtained from the South African mining industry was modelled with the Weibull PHM. It was found that the developed model produced estimates which were accurate representations of reality. These findings provide an exciting basis for the development of futureWeibull PHMs that could result in huge maintenance cost savings and reduced failure occurrences. / AFRIKAANSE OPSOMMING: Fisiese Bate Bestuur (FBB) is besig om ’n groter bekommernis vir maatskappye in die bedryf te word. Die Britse Standaarde Instituut se spesifikasie vir optimale bestuur van fisiese bates en infrastruktuur is PAS55. Volgens PAS55 is FBB die “sistematiese en gekoördineerde aktiwiteite en praktyke wat deur ’n organisasie optimaal sy fisiese bates, hul verwante prestasie, risiko’s en uitgawes vir die doel van die bereiking van sy organisatoriese strategiese plan beheer oor hul volle lewensiklus te bestuur”. Een Sleutel Fokus Area (SFA) van FBB is Bate Versorgings Plan (BVP) ontwikkeling. Hierdie is onderhouds strategieë wat bate betroubaarheid verbeter of verseker tydens die volle bruikbare lewe van die bate. Een onderhoud strategie is Toestands Gebasseeerde Onderhoud (TGO) wat besluite baseer op Toestand Monitering (TM) informasie maar neem nie die vorige falingsgeskiedenis van die bate in ag nie. Ander onderhoud strategieë soos Gebruik Gebasseerde Onderhoud (GGO) is gebaseer op historiese falingsdata maar neem nie TM inligting in ag nie. Regressiemodelle neem beide TM data en historiese falings geskiedenis data in ag ten einde die onderliggende falings gedrag van die gegewe bate te verteenwoordig. Hierdie modelle kan baie nuttig wees vir BVP ontwikkeling te danke aan die feit dat Bruikbare Oorblywende Lewe (BOL) geskat kan word en/of die langtermyn lewenssilus koste geoptimeer kan word. Die doelwit van hierdie tesis was om historiese falingsdata en TT data goed genoeg te modelleer sodat BOL of optimale langtermyn lewensiklus kostes bepaal kan word om opgeneem te word in BVP ontwikkeling. Hierdie bepalings word dan gebruik in besluitnemings modelle wat gebruik kan word om onderhoud skedules op te stel, d.w.s. om ’n BVP te ontwikkel. Verskeie regressiemodelle was geëvalueer om die regte model te vind waarmee die doel van hierdie tesis te bereik kan word. Die mees geskikte model vir die navorsingsprojek was die Proporsionele Gevaarkoers Model (PGM). ’n Omvattende ondersoek oor die PGM is onderneem wat fokus op die wiskunde en die praktiese implementering daarvan. Data is van die Suid-Afrikaanse mynbedryf verkry en is gemodelleer met behulp van die Weibull PGM. Dit was bevind dat die ontwikkelde model resultate geproduseer het wat ’n akkurate verteenwoordinging van realiteit is. Hierdie bevindinge bied ’n opwindende basis vir die ontwikkeling van toekomstige Weibull Proporsionele Gevaarkoers Modelle wat kan lei tot groot onderhoudskoste besparings en minder onverwagte falings.
114

Estimativas de (co) varância genética de pesos do nascimento até a maturidade em rebanhos da raça Nelore usando modelos de regressão aleatória e de características múltiplas

Boligon, Arione Augusti [UNESP] 25 February 2008 (has links) (PDF)
Made available in DSpace on 2014-06-11T19:26:07Z (GMT). No. of bitstreams: 0 Previous issue date: 2008-02-25Bitstream added on 2014-06-13T19:33:22Z : No. of bitstreams: 1 boligon_aa_me_jabo.pdf: 786716 bytes, checksum: 55a12f5a16a7a8f8acd0c213b48d9308 (MD5) / Fundação de Amparo à Pesquisa do Estado de São Paulo (FAPESP) / Foram estimados parâmetros genéticos para pesos do nascimento à idade adulta de animais da raça Nelore por meio de análises uni, bi e multicaracterísticas e modelos de regressão aleatória. Os dados utilizados são de animais nascidos de 1975 e 2002, provenientes de 8 fazendas participantes do Programa de Melhoramento Genético da Raça Nelore (PMGRN). Os pesos foram obtidos do nascimento aos 8 anos de idade. Nas análises uni, bi e multicaracterísticas foram utilizados pesos em idades padrão como nascimento, desmama, ano, sobreano e aos 2, 3 e 5 anos de idade. Também foram realizadas análises utilizando o peso mais próximo aos 4,5 anos de idade como indicativo de peso adulto, considerando uma única medida a partir de 2, 3 e 4 anos de idade ou como registros repetidos de pesos a partir dessas mesmas idades. Nas análises de regressão aleatória, foram utilizados pesos de fêmeas do nascimento aos 8 anos de idade, considerando como variáveis independentes polinômios de Legendre da idade na data da pesagem. A variância residual foi modelada por meio de classes variando de 1 a 5. Foram utilizados 8 modelos de coeficientes de regressão aleatória para os efeitos direto e materno de animal, e de ambiente permanente de animal e materno. O modelo multicaracterística, incluindo registros de pesos ao desmame e à seleção é o mais indicado para a avaliação genética de pesos pós-desmama. Em avaliações genéticas para a característica de peso adulto, o emprego de modelos de repetibilidade, considerando pesos a partir de 3 anos de idade, seria o mais adequado em relação à utilização de medida única... / Weight records of Nelore cattle from birth to mature age were analyzed using univariate, bivariate, multivariate and random regression models. Records of Nelore cattle born from 1975 to 2002, from 8 herds participating in the Nelore Cattle Breeding Program (NCBP) were used. The weights were obtained from birth to 8 years of age. Weights at birth, weaning, yearling, 18 months and 2, 3 and 5 years of age were analyzed using univariate, bivariate and multivariate models. Also, as indicative of the mature weight, the weight closest to 4.5 years of age, was analyzed considering only one record or repeated records obtained from 2, 3 and 4 years of age. For random regression models age of cow varied from birth to 8 years. Direct and maternal genetic and, animal and maternal permanent environmental variances were modeled by random regression on Legendre polynomials of age at recording, with order of fit from 3 to 6 and a total of 8 models. Residual variances were modeled by a step function with 1 or 5 classes. The multivariate model including weight records at weaning and at selection age is the most indicated for genetic evaluation of pos-weaning weights. For genetic evaluation of mature weight to use repeated records obtained from 3 years of age is better than only one record per animal. The random regression models were able to model changes of variances with age adequately, with parameter estimates similar to those obtained by multivariate analyses. The model with direct and maternal genetic effects, animal and maternal permanent environmental effects ajusted by quartic, cubic, sixth and cubic polynomials, respectively, and residual variances modeled by 5 classes, was the most adequate to describe the covariance structure of the data...(Complete abstract, click electronic access below)
115

Estudo genético quantitativo do fluxo lácteo em bovinos da raça Holandesa

Laureano, Monyka Marianna Massolini [UNESP] 24 November 2008 (has links) (PDF)
Made available in DSpace on 2014-06-11T19:32:15Z (GMT). No. of bitstreams: 0 Previous issue date: 2008-11-24Bitstream added on 2014-06-13T19:42:44Z : No. of bitstreams: 1 laureano_mmm_dr_jabo.pdf: 1370732 bytes, checksum: 917b233b8c336006b0fff4eae272a7b4 (MD5) / Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES) / Parâmetros genéticos para o fluxo lácteo medido no dia do controle (FLDC) de primeiras lactações de vacas da raça Holandesa foram estimados utilizando modelos de dimensão finita (TDM) e modelos de regressão aleatória. Para os TDM foram analisadas 10 características por meio de modelos uni e bi e multi-características e de repetibilidade, que continham como aleatórios, o efeito genético aditivo e o efeito residual e, como efeitos fixos, o grupo de contemporâneos e as covariáveis idade da vaca ao parto. A variável número de dias em lactação foi incluída somente no modelo de repetibilidade. Para os MRA, foram considerados os efeitos aleatórios genético aditivo direto, de ambiente permanente e o residual. Foram considerados como efeitos fixos, o grupo de contemporâneos, os efeitos linear e quadrático da covariável idade da vaca ao parto e a curva média de lactação da população, modelada por meio de polinômios ortogonais de Legendre de quarta ordem. Os efeitos aleatórios genético aditivo e de ambiente permanente foram modelados por meio de regressão aleatória sobre polinômios ortogonais de Legendre e por meio de funções b-splines. Diferentes estruturas de variâncias residuais foram testadas, por meio de classes contendo 1, 7, 10, 20 e 43 variâncias residuais, para os MRA modelados por meio de polinômios de Legendre. Já, para os MRA modelados por funções b-splines, a estrutura residual foi considerada heterogênea, contendo 7 classes de variâncias. Os MRA foram comparados usando o teste de razão de verossimilhança, o critério de informação de Akaike e o critério de informação de Bayesiano de Schwarz. As estimativas de herdabilidade (h2) para os FLDC variaram de 0,23 a 0,32 nas análises unicaracterísticas, de 0,24 a 0,32 nas bi-características e de 0,28 a 0,37 nas multicaracterísticas. Os valores de h2 estimados variaram no decorrer da... / Flow milk genetic parameters to the first lactation test-day milk yields of Holstein cattle were estimated using Test-day models (TDM) and Random regression models (RRM). Ten TDM differents traits were analyzed using uni, bi and multi-trait and repeatability animal models, that included the additive genetic as random effect and the fixed effects of contemporary group, age of cow (linear and quadratic) as covariables. The days in milk (linear) variable was included only at repeatability model. To RRM were included the additive genetic, permanent environmental and residual as random effects, the fixed effects of contemporary group, age of cow as covariable (linear and quadratic effects) and a 4th-order Legendre orthogonal polynomials of days in milk, to model the mean trend. The additive genetic and permanent environmental effects were fitted by Legendre orthogonal polynomials and b-splines functions. Different structures of residual variances were used, through the variances classes containing 1, 7, 10, 20, and e 43 residual variances, to the models fitted by Legendre orthogonal polynomials. Moreover, for the RRM fitted by b-splines-functions, the residual estructure was considered heterogeneous, having 7 variance classes. The RRM were compared by Likelihood ratio test, Bayesian and Akaike´s information criteria. The heritability estimated ranged from 0.23 to 0.32 by uni-trait analyses, from 0.24 to 0.32 by bi-traits analyses and from 0.28 to 0.37 by multi-trait analyses. The h2 estimates varied during the lactation being the highest estimate at the fourth month. The estimate obtained by the repeatability model was 0.27, and a repeatability estimate of 0.66. For the MRA fitted by Legendre orthogonal polynomials, related to the residual variance, the best model the one that deemed 7 residual classes. For the additive and permanent environmental effects, the having 3th-order... (Complete abstract click electronic access below)
116

Estimação de parâmetros genéticos para características de crescimento em bovinos da raça Canchim com modelos de dimensão finita e infinita

Baldi Rey, Fernando Sebastián [UNESP] 26 September 2008 (has links) (PDF)
Made available in DSpace on 2014-06-11T19:32:15Z (GMT). No. of bitstreams: 0 Previous issue date: 2008-09-26Bitstream added on 2014-06-13T20:03:29Z : No. of bitstreams: 1 baldirey_fs_dr_jabo.pdf: 751142 bytes, checksum: 4a3bdaf84424f12abb37e90cff761fdc (MD5) / Fundação de Amparo à Pesquisa do Estado de São Paulo (FAPESP) / Foram estimados parâmetros genéticos para pesos do nascimento à idade adulta de animais da raça Canchim por meio de análises uni, bi e multicaracterística, e por modelos de regressão aleatória. Os dados analisados são provenientes do rebanho da raça Canchim da Embrapa Pecuária Sudeste, localizada no município de São Carlos, São Paulo. Os pesos foram obtidos do nascimento até os nove anos e meio de idade. Nas análises uni, bi e multicaracterística foram utilizados pesos em ao nascimento, desmama, 12, 18, 24 e 30 meses de idade e, na idade adulta. Na análise unicaracterística foram utilizados quatro modelos, em que, diferentes efeitos aleatórios (efeito genético materno e de ambiente permanente materno) foram adicionados em seqüência. Nas análises de regressão aleatória, foram utilizados pesos de fêmeas do nascimento até os nove anos e meio de idade, considerando como funções base polinômios de Legendre e funções “b-splines”. A variância residual foi modelada utilizando 1, 4, 11 e 19 classes. Foram utilizados 12 modelos de regressão aleatória sobre polinômios de Legendre de segunda à sétima ordem para modelar a trajetória da variância dos efeitos genético aditivo direto e aditivo materno e de ambiente permanente direto e materno. Vinte modelos de regressão aleatória sobre funções “bsplines” foram considerados, empregando polinômios linear, quadrático e cúbico para cada segmento individual. Polinômios do mesmo grau foram considerados no modelo para todos os efeitos aleatórios. Até sete segmentos foram utilizados para os efeitos genético direto e de ambiente permanente do animal. Para os efeitos genético aditivo materno e de ambiente permanente materno foi utilizado um único segmento com dois nós nos extremos da curva Os efeitos maternos influenciam os pesos do nascimento aos dois anos de idade sendo o peso à desmama... / Genetic parameters were estimated for weights taken from birth to mature age in Canchim (5/8 Charolais + 3/8 Zebu) cattle of breed by one, two and multitrait analyses and by random regression models. The data analyzed were from a herd of Canchim beef cattle belonging to Embrapa’s Southeast Cattle Research Center, located in São Carlos county, state of São Paulo. Weights were taken from birth to nine and half years of age. Weights at birth, weaning, 12, 18, 24 and 30 months of age and at mature age were analyzed using one, two and multitrait models. In onetrait analyses, four models were tested, in which different random effects (genetic and environment permanent maternal effects) were added. For random regression models age of cow varied from birth to 3.542 days of age. Legendre polynomials and b-splines functions of age at recording were used as basis functions in random regression models. Residual variances were modeled by a step function with 1, 4, 11 and 19 classes. A total of 12 random regression models using Legendre polynomials as basis functions, from second to seventh order, were used to model direct and maternal genetic effects, animal and maternal permanent environmental effects. A total of twenty analyses, considering linear, quadratic and cubic b-splines functions and up to nine knots, were carried out. Spline functions of the same order were considered for all random effects. Maternal effects influenced weights from birth until two years of age, being weaning weight the most affected by maternal effects. Direct heritabilities obtained by twotrait and multitrait analyses were higher than estimates obtained from onetrait analyses. In order to estimate genetic parameters for weights after selection it is important to consider weights before selection and the multitrait analyses is the most adequate. The model with direct and maternal genetic effects, animal and maternal... (Complete abstract click electronic access below)
117

Uma família de modelos de regressão com a distribuição original da variável resposta

Paula, Marcelo de 05 April 2013 (has links)
Made available in DSpace on 2016-06-02T20:04:52Z (GMT). No. of bitstreams: 1 5021.pdf: 1591649 bytes, checksum: 6798e65e3b572fcfe760f083f660ff50 (MD5) Previous issue date: 2013-04-05 / Financiadora de Estudos e Projetos / We know that statistic modeling by regression had a stronger impulse since generalized linear models (GLMs) development in 70 decade beginning of the XX century, proposed by Nelder e Wedderburn (1972). GLMs theory can be interpret like a traditional linear regression model generalization, where outcomes don't need necessary to assume a normal distribution, that is, any distribution belong to exponential distributions family. In binary logistic regression case, however, in many practice situations the outcomes response is originally from a discrete or continuous distribution, that is, the outcomes response has an original distribution that is not Bernoulli distribution and, although, because some purpose this variable was later dicothomized by an arbitrary cut of point C. In this work we propose a regression models family with original outcomes information, whose probability distribution or density function probability belong to exponential family. We present the models construction and development to each class, incorporating the original distribution outcomes response information. The proposed models are an extension of Suissa (1991) and Suissa and Blais (1995) works which present methods of estimating the risk of an event de_ned in a sample subspace of a continuous outcome variable. Simulation studies are presented in order to illustrate the performance of the developed methodology. For original normal outcomes we considered logistic, exponential, geometric, Poisson and lognormal models. For original exponential outcomes we considered logistic, normal, geometric, Poisson and lognormal models. In contribution to Suissa and Blais (1995) works we attribute two discrete outcomes for binary model, geometric and Poisson, and we also considered a normal distributions with multiplicative heteroscedastic structures continuous outcomes. In supplement we also propose the binary model with inated power series distributions outcomes considering a sample subspace of a zero inated geometric outcomes. We do several artificial data studies comparing the model of original distribution information regression model with usual regression model. Simulation studies are presented in order to illustrate the performance of the developed methodology. A real data set is analyzed by using the proposed models. Assuming a correct speci_ed distribution, the incorporation of this information about outcome response in the model produces more eficient likelihood estimates. / É sabido que a área de modelagem estatística por regressão sofreu um grande impulso desde o desenvolvimento dos modelos lineares generalizados (MLGs) no início da década de 70 do Século XX, propostos por Nelder e Wedderburn (1972). A teoria dos MLGs pode ser interpretada como uma generalização do modelo de regressão linear tradicional, em que a variável resposta não precisa necessariamente assumir a distribuição normal, e sim, qualquer distribuição pertencente à família exponencial de distribuições. Em algumas situações, porém, a distribuição da variável resposta Se originalmente fruto de uma outra distribuição discreta ou contínua, ou seja, a variável resposta tem uma distribuição original que não Se a usualmente considerada. Um exemplo desta situação Se a dicotomização de uma variável discreta ou contínua por meio de um ponto de corte arbitrário. Além disso, a variável resposta pode estar relacionada, de alguma forma, com uma outra variável de interesse. Nesse trabalho propomos uma família de modelos de regressão com a informação da variável resposta original, cuja distribuição de probabilidades ou função densidade de probabilidade pertence à família exponencial. O modelo de regressão logística com resposta normal e log-normal desenvolvido por Suissa e Blais (1995) Se apresentado como caso particular dos modelos de regressão com resposta de origem. Para a resposta de origem normal consideramos os modelos logístico, exponencial, geométrico, Poisson e log-normal. Para a resposta de origem exponencial consideramos os modelos logístico, normal, geométrico, Poisson e log-normal. Em contribuição ao trabalho de Suissa e Blais atribuímos duas respostas discretas ao modelo logístico, geométrico e de Poisson, e também consideramos uma resposta contínua normal com estrutura heteroscedástica. Adicionalmente, propomos também o modelo logístico com resposta pertencente à classe de distribuições séries de potências inflacionadas considerando o caso particular da resposta geométrica zero inflacionada. Realizamos vários estudos com dados artificiais comparando o modelo de regressão proposto com a informação da distribuição de origem e o modelo de regressão usual. Dois conjuntos de dados reais também são considerados. Assumindo uma distribuição corretamente especificada, o modelo produz estimativas de máxima verossimilhança mais eficientes e estimativas intervalares mais precisas para os coeficientes de regressão.
118

Modelos de regressão linear heteroscedásticos com erros t-Student: uma abordagem bayesiana objetiva / Heteroscedastics linear regression models with Student t erros: an objective bayesian analysis.

Aline Campos Reis de Souza 18 February 2016 (has links)
Neste trabalho, apresentamos uma extensão da análise bayesiana objetiva feita em Fonseca et al. (2008), baseada nas distribuições a priori de Jeffreys para o modelo de regressão linear com erros t-Student, para os quais consideramos a suposição de heteoscedasticidade. Mostramos que a distribuição a posteriori dos parâmetros do modelo regressão gerada pela distribuição a priori é própria. Através de um estudo de simulação, avaliamos as propriedades frequentistas dos estimadores bayesianos e comparamos os resultados com outras distribuições a priori encontradas na literatura. Além disso, uma análise de diagnóstico baseada na medida de divergência Kullback-Leiber é desenvolvida com a finalidade de estudar a robustez das estimativas na presença de observações atípicas. Finalmente, um conjunto de dados reais é utilizado para o ajuste do modelo proposto. / In this work , we present an extension of the objective bayesian analysis made in Fonseca et al. (2008), based on Jeffreys priors for linear regression models with Student t errors, for which we consider the heteroscedasticity assumption. We show that the posterior distribution generated by the proposed Jeffreys prior, is proper. Through simulation study , we analyzed the frequentist properties of the bayesian estimators obtained. Then we tested the robustness of the model through disturbances in the response variable by comparing its performance with those obtained under another prior distributions proposed in the literature. Finally, a real data set is used to analyze the performance of the proposed model . We detected possible in uential points through the Kullback -Leibler divergence measure, and used the selection model criterias EAIC, EBIC, DIC and LPML in order to compare the models.
119

Uma classe de modelos de regressão bivariados para respostas discreta e contínua

Oliveira, Willian Luís de 28 January 2016 (has links)
Submitted by Luciana Sebin (lusebin@ufscar.br) on 2016-09-20T17:56:33Z No. of bitstreams: 1 TeseWLO.pdf: 4950921 bytes, checksum: adf4e51b260eb25ef34f14a351022af5 (MD5) / Approved for entry into archive by Marina Freitas (marinapf@ufscar.br) on 2016-09-21T12:48:10Z (GMT) No. of bitstreams: 1 TeseWLO.pdf: 4950921 bytes, checksum: adf4e51b260eb25ef34f14a351022af5 (MD5) / Approved for entry into archive by Marina Freitas (marinapf@ufscar.br) on 2016-09-21T12:48:16Z (GMT) No. of bitstreams: 1 TeseWLO.pdf: 4950921 bytes, checksum: adf4e51b260eb25ef34f14a351022af5 (MD5) / Made available in DSpace on 2016-09-21T12:48:30Z (GMT). No. of bitstreams: 1 TeseWLO.pdf: 4950921 bytes, checksum: adf4e51b260eb25ef34f14a351022af5 (MD5) Previous issue date: 2016-01-28 / Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES) / In this thesis, a wide general class of models for mixed responses is proposed in which joint distributions are constructed by the conditional approach (probability density functions, (pdf), as the product of a marginal pdf and a conditional pdf). It is assumed that the distribution of the discrete response and the conditional distribution of the continuous response given the discrete variable belong to one- or two-parameter exponential family of distributions. Furthermore, the marginal means are related to the covariates by link functions using linear and/or nonlinear and/or non-parametric predictors and a dependency structure between the responses is introduced into the model via the conditional mean. Estimation methods, diagnostic analysis and in uence techniques are presented as well as a simulation study considering the Bernoulli-exponential and Poisson-normal semiparametric models, two particular cases of the proposed class. Finally, one of the proposed models is used in a real data set involving the total cost of care for each patient during hospitalization, the use or not of the intensive treatment units and the age of the patient. / Nesta tese é proposta uma classe ampla e geral de modelos bivariados para respostas mistas em que as distribuições conjuntas são construídas pelo método da fatoração (função densidade de probabilidade, (fdp), como o produto de uma fdp marginal e uma fdp condicional). É assumido que a distribuição da variável resposta discreta e a distribuição condicional da variável resposta contínua dada a variável discreta pertencem à família exponencial de distribuições uniparamétrica ou biparamétrica. Além disso, as médias marginais são relacionadas a covariáveis através de funções de ligação usando preditores linear e/ou não linear e/ou não paramétrico e uma estrutura de dependência entre as respostas é inserida no modelo via a média condicional. Métodos de estimação, análises de diagnóstico e técnicas de in uência são apresentadas assim como um estudo de simulação considerando os modelos Bernoulli-exponencial e Poisson-normal semiparamétrico, dois casos particulares da classe proposta. Finalmente, um dos modelos propostos é usado em um conjunto de dados reais envolvendo gastos totais com cuidados para cada paciente durante a hospitalização, o uso ou não da unidade de tratamento intensivo e a idade do paciente.
120

Modelos de regressão linear heteroscedásticos com erros t-Student : uma abordagem bayesiana objetiva / Heteroscedastics linear regression models with Student-t errors: an objective bayesian analysis

Souza, Aline Campos Reis de 18 February 2016 (has links)
Submitted by Luciana Sebin (lusebin@ufscar.br) on 2016-09-26T18:57:40Z No. of bitstreams: 1 DissACRS.pdf: 1390452 bytes, checksum: a5365fdbf745228c0174f2643b3f7267 (MD5) / Approved for entry into archive by Marina Freitas (marinapf@ufscar.br) on 2016-09-27T19:59:56Z (GMT) No. of bitstreams: 1 DissACRS.pdf: 1390452 bytes, checksum: a5365fdbf745228c0174f2643b3f7267 (MD5) / Approved for entry into archive by Marina Freitas (marinapf@ufscar.br) on 2016-09-27T20:00:01Z (GMT) No. of bitstreams: 1 DissACRS.pdf: 1390452 bytes, checksum: a5365fdbf745228c0174f2643b3f7267 (MD5) / Made available in DSpace on 2016-09-27T20:00:08Z (GMT). No. of bitstreams: 1 DissACRS.pdf: 1390452 bytes, checksum: a5365fdbf745228c0174f2643b3f7267 (MD5) Previous issue date: 2016-02-18 / Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES) / In this work , we present an extension of the objective bayesian analysis made in Fonseca et al. (2008), based on Je reys priors for linear regression models with Student t errors, for which we consider the heteroscedasticity assumption. We show that the posterior distribution generated by the proposed Je reys prior, is proper. Through simulation study , we analyzed the frequentist properties of the bayesian estimators obtained. Then we tested the robustness of the model through disturbances in the response variable by comparing its performance with those obtained under another prior distributions proposed in the literature. Finally, a real data set is used to analyze the performance of the proposed model . We detected possible in uential points through the Kullback -Leibler divergence measure, and used the selection model criterias EAIC, EBIC, DIC and LPML in order to compare the models. / Neste trabalho, apresentamos uma extensão da análise bayesiana objetiva feita em Fonseca et al. (2008), baseada nas distribuicões a priori de Je reys para o modelo de regressão linear com erros t-Student, para os quais consideramos a suposicão de heteoscedasticidade. Mostramos que a distribuiçãoo a posteriori dos parâmetros do modelo regressão gerada pela distribuição a priori e própria. Através de um estudo de simulação, avaliamos as propriedades frequentistas dos estimadores bayesianos e comparamos os resultados com outras distribuições a priori encontradas na literatura. Além disso, uma análise de diagnóstico baseada na medida de divergência Kullback-Leiber e desenvolvida com analidade de estudar a robustez das estimativas na presença de observações atípicas. Finalmente, um conjunto de dados reais e utilizado para o ajuste do modelo proposto.

Page generated in 0.368 seconds