Global ETD Search

311	Análise de contagens multivariadas. / Multivariate count analysis. Ho, Linda Lee 15 September 1995 (has links) Este trabalho apresenta uma análise estatística de contagens multivariadas proveniente de várias populações através de modelos de regressão. Foram considerados casos onde os vetores respostas obedeçam às distribuições Poisson multivariada e Poisson log-normal multivariada. Esta distribuição admite correlação de ambos sinais entre componentes do vetor resposta, enquanto que as distribuições mais usuais para dados de contagens (como a Poisson multivariada) admitem apenas correlação positiva entre as componentes do vetor resposta. São discutidos métodos de estimação e testes de hipóteses sobre os parâmetros do modelo para o caso bivariado. Estes modelos de regressão foram aplicados a um conjunto de dados referentes a contagens de dois tipos de defeitos em 100 gramas de fibras têxteis de quatro máquinas craqueadeiras, sendo duas de um fabricante e as outras de um segundo fabricante. Os resultados obtidos nos diferentes modelos de regressão foram comparados. Para estudar o comportamento das estimativas dos parâmetros de uma distribuição Poisson Log-Normal, amostras foram simuladas segundo esta distribuição. / Regression models are presented to analyse multivariate counts from many populations. Due to the random vector characteristic, we consider two classes of probability models: Multivariate Poisson distribution and Multivariate Poisson Log-Normal distribution. The last distribution admits negative and positive correlations between two components of a random vector under study, while other distributions (as Multivariate Poisson) admit only positive correlation. Estimation methods and test of hypothese on the parameters in bivariate case are discussed. The proposed techniques are illustrated by numerical examples, considering counts of two types of defects in 100g of textile fibers produced by four machines, two from one manufacturer and the other two from another one. The results from different regression models are compared. The empirical distribution of Poisson Log-Normal parameter estimations are studied by simulated samples. Bivariate Poisson distribution Engenharia de produção Modelo de regressão Poisson bivariada Regression model for counts
312	Modelo não linear Chanter: uma aplicação aos dados de crescimento de frutos do cacaueiro / Chanter Nonlinear Model: an application to cocoa fruits growth data Silva, Pollyane Vieira da 08 February 2018 (has links) Modelos não lineares como o Logístico e o Gompertz são amplamente usados para descrever vários processos biológicos por meio da curva de crescimento dada pela equação do modelo. O objetivo deste trabalho foi ajustar o modelo Chanter, assim como o Logístico e o Gompertz, utilizando um conjunto de dados do fruto do cacaueiro. O modelo Chanter é um híbrido entre o modelo Logístico e o modelo Gompertz cujos parâmetros podem ser interpretados similarmente. A comparação sobre a qualidade do ajuste entre os modelos foi feita utilizando as seguintes medidas estatísticas: o critério de informação de Akaike (AIC), o critério Peso de Akaike, o critério de informação de Bayes (BIC), o desvio padrão residual (DPR) e as medidas de não linearidade vício de Box e curvatura de Bates e Watts além de um estudo de simulação. Verificou-se que o modelo Chanter dentre os modelos estudados neste trabalho é o mais adequado para o ajuste dos dados do fruto do cacaueiro. / Nonlinear models such as Logistic and Gompertz are widely used to describe several biological processes using a growth curve given by the equation of the model. The objective of this work was to adjust the Chanter model, as well as the Logistic and the Gompertz, using a data set of cocoa fruit. The Chanter model is a hybrid between the Logistic model and the Gompertz model whose parameters can be interpreted similarly. A comparison of the quality of fit between the models was made using the following statistical measures: the Akaike information criterion (AIC), the Akaike weight criterion, Bayes information criterion (BIC), residual standard deviation (RSD), and measures of non-linearity Box addiction and Bates and Watts curvature as well as a simulation study. It was verified that the Chanter model is the most suitable one among the studied models for modeling the cocoa data. Growth models Measures of non-linearity Medidas de não linearidade Modelos de crescimento Nonlinear regression Regressão não linear
313	Desempenho produtivo do camarão cinza Litopenaeus vannamei, utilizando técnicas de povoamento direto e indireto SANTOS, Elaine Cristina Batista dos 10 February 2009 (has links) Submitted by (edna.saturno@ufrpe.br) on 2017-02-10T11:39:28Z No. of bitstreams: 1 Elaine Cristina Batista dos Santos.pdf: 495925 bytes, checksum: af23f3fff2e3cde71c7dbec53715876f (MD5) / Made available in DSpace on 2017-02-10T11:39:28Z (GMT). No. of bitstreams: 1 Elaine Cristina Batista dos Santos.pdf: 495925 bytes, checksum: af23f3fff2e3cde71c7dbec53715876f (MD5) Previous issue date: 2009-02-10 / The techniques of direct (Pdir) and indirect (Pind) settlement employed in the growthout of marine shrimp Litopenaeus vannamei, were analyzed, in order to determine their efficiency in the productive system of agribusiness. Data of 270 cultures from a commercial shrimp farm located in Rio Grande do Norte, Brazil, were used to relate the variables of management: time of culture (TC), stocking density (DE), pond area (VA), month of settlement (MP), year of settlement (AP), supplier of laboratory post larva (LFPL), direct settlement (Pdir) and indirect settlement (Pind), through the technique of multiple linear regression to estimate the parameters that influenced the cultures , with varying responses: production (PRD) productivity (PRDT), feed conversion factor (FCA), final weight (PMF) and survival rate (TS). These variables were related in terms of stocking density (DE) and days of culture (DC). For variables, PMF and FCA, the settlement form had not any influence (P ≥ 0.05). The other variables there was significant difference (P <0.05) of 6.8% and 6.4% more, on survival and productivity, respectively, when conducted Pind. For production, although the system Pind has given an increase of 6.0%, it no portment statistical difference (P ≥ 0.05). / As técnicas de povoamento direto (Pdir) e indireto (Pind) empregadas no cultivo do camarão marinho Litopenaeus vannamei foram analisadas, com o objetivo de determinar sua eficiência no sistema produtivo desse agronegócio. Dados de 270 cultivos comerciais, oriundos de uma fazenda de camarão localizada no Rio Grande do Norte, Brasil, foram utilizados para relacionar as variáveis de manejo: tempo de cultivo (TC), densidade de estocagem (DE), área do viveiro (AV), mês de povoamento (MP), ano de povoamento (AP), laboratório fornecedor de pós larva (LFPL), povoamento direto (Pdir) e povoamento indireto (Pind), através da técnica de regressão linear múltipla para estimar os parâmetros que influenciaram nos cultivos, tendo como variáveis respostas: produção (PRD), produtividade (PRDT), fator de conversão alimentar (FCA), peso final (PMF), e taxa de sobrevivência (TS). Essas variáveis foram relacionadas em função da densidade de estocagem (DE) e dias de cultivo (DC). Para as variáveis PMF e FCA, a forma de povoamento não exerceu nenhuma de influencia (P≥0,05). Nas demais variáveis observou-se diferença significativa (P<0,05) com incremento de 6,8% e 6,4%, na sobrevivência e produtividade, respectivamente, quando realizado Pind. Para produção, embora o sistema de Pind tenha conferido um incremento de 6,0%, este não apresentou diferença estatística (P ≥ 0,05). Camarão cinza Litopenaeus vannamei Bercário Regressão Shrimp Regression Growing
314	Competição de Modelos para Previsão de Mercado de Energia Elétrica em Curto e Longo Prazo Lacerda Moura, Wlademir 31 January 2010 (has links) Made available in DSpace on 2014-06-12T17:36:16Z (GMT). No. of bitstreams: 2 arquivo2565_1.pdf: 2503761 bytes, checksum: b0c6a694a5d13636516194de9e330025 (MD5) license.txt: 1748 bytes, checksum: 8a4605be74aa9ea9d79846c1fba20a33 (MD5) Previous issue date: 2010 / Companhia Energética de Pernambuco / Após as mudanças ocorridas, com a reestruturação do mercado de energia ao final da década de 90, a previsão de mercado veio ganhando destaque cada vez maior, com ênfase nos processos de planejamento do setor, modicidade tarifária e contratação de energia elétrica, onde se estabelece um limite que caso venha a ser rompido, poderá gerar prejuízos às distribuidoras de energia elétrica. Dessa forma, este trabalho visa encontrar o modelo mais adequado à série histórica de Energia Distribuída da CELPE (Companhia Energética de Pernambuco). Foram feitas simulações para curto prazo, com dados mensais no horizonte de doze meses à frente e longo prazo, com dados anuais e horizonte de quatro anos. Para o curto prazo foram testadas as metodologias de Amortecimento Exponencial, Box & Jenkins, Modelos Estruturais e Redes Neurais Artificiais, sendo testados vários modelos para cada aplicação. No longo prazo as metodologias utilizadas foram as de Regressão Dinâmica e o ANFIS. Ao final foram feitas comparações através do MAPE (Erro Médio Absoluto Percentual), sendo o melhor modelo o que obteve o menor valor de MAPE Previsão Energia distribuída Regressão dinâmica Inteligência artificial Redes neurais (RNA) Lógica fuzzy (LF)
315	Parametric and semi-parametric models for predicting genomic breeding values of complex traits in Nelore cattle / Modelos estatísticos paramétricos e semiparamétricos para a predição de valores genéticos genômicos de características complexas em bovinos da raça Nelore Espigolan, Rafael [UNESP] 23 February 2017 (has links) Submitted by RAFAEL ESPIGOLAN (espigolan@yahoo.com.br) on 2017-03-17T22:04:14Z No. of bitstreams: 1 Tese_Rafael_Espigolan.pdf: 1532864 bytes, checksum: c79ad7471b25137c47529f25762a83a2 (MD5) / Approved for entry into archive by Juliano Benedito Ferreira (julianoferreira@reitoria.unesp.br) on 2017-03-22T12:50:50Z (GMT) No. of bitstreams: 1 espigolan_r_dr_jabo.pdf: 1532864 bytes, checksum: c79ad7471b25137c47529f25762a83a2 (MD5) / Made available in DSpace on 2017-03-22T12:50:50Z (GMT). No. of bitstreams: 1 espigolan_r_dr_jabo.pdf: 1532864 bytes, checksum: c79ad7471b25137c47529f25762a83a2 (MD5) Previous issue date: 2017-02-23 / Fundação de Amparo à Pesquisa do Estado de São Paulo (FAPESP) / O melhoramento genético animal visa melhorar a produtividade econômica das futuras gerações de espécies domésticas por meio da seleção. A maioria das características de interesse econômico na pecuária é de expressão quantitativa e complexa, isto é, são influenciadas por vários genes e afetadas por fatores ambientais. As análises estatísticas de informações de fenótipo e pedigree permite estimar os valores genéticos dos candidatos à seleção com base no modelo infinitesimal. Uma grande quantidade de dados genômicos está atualmente disponível para a identificação e seleção de indivíduos geneticamente superiores com o potencial de aumentar a acurácia de predição dos valores genéticos e, portanto, a eficiência dos programas de melhoramento genético animal. Vários estudos têm sido conduzidos com o objetivo de identificar metodologias apropriadas para raças e características específicas, o que resultará em estimativas de valores genéticos genômicos (GEBVs) mais acurados. Portanto, o objetivo deste estudo foi verificar a possibilidade de aplicação de modelos semiparamétricos para a seleção genômica e comparar a habilidade de predição com os modelos paramétricos para dados reais (características de carcaça, qualidade da carne, crescimento e reprodutiva) e simulados. As informações fenotípicas e de pedigree utilizadas foram fornecidas por onze fazendas pertencentes a quatro programas de melhoramento genético animal. Para as características de carcaça e qualidade da carne, o banco de dados continha 3.643 registros para área de olho de lombo (REA), 3.619 registros para espessura de gordura (BFT), 3.670 registros para maciez da carne (TEN) e 3.378 observações para peso de carcaça quente (HCW). Um total de 825.364 registros para peso ao sobreano (YW) e 166.398 para idade ao primeiro parto (AFC) foi utilizado para as características de crescimento e reprodutiva. Genótipos de 2.710, 2.656, 2.749, 2.495, 4.455 e 1.760 animais para REA, BFT, TEN, HCW, YW e AFC foram disponibilizados, respectivamente. Após o controle de qualidade, restaram dados de, aproximadamente, 450.000 polimorfismos de base única (SNP). Os modelos de análise utilizados foram BLUP genômico (GBLUP), single-step GBLUP (ssGBLUP), Bayesian LASSO (BL) e as abordagens semiparamétricas Reproducing Kernel Hilbert Spaces (RKHS) e Kernel Averaging (KA). Para cada característica foi realizada uma validação cruzada composta por cinco “folds” e replicada aleatoriamente trinta vezes. Os modelos estatísticos foram comparados em termos do erro do quadrado médio (MSE) e acurácia de predição (ACC). Os valores de ACC variaram de 0,39 a 0,40 (REA), 0,38 a 0,41 (BFT), 0,23 a 0,28 (TEN), 0,33 a 0,35 (HCW), 0,36 a 0,51 (YW) e 0,49 a 0,56 (AFC). Para todas as características, os modelos GBLUP e BL apresentaram acurácias de predição similares. Para REA, BFT e HCW, todos os modelos apresentaram ACC similares, entretanto a regressão RKHS obteve o melhor ajuste comparado ao KA. Para características com maior quantidade de registros fenotípicos comparada ao número de animais genotipados (YW e AFC) o modelo ssGBLUP é indicado. Considerando o desempenho geral, para todas as características estudadas, a regressão RKHS é, particularmente, uma alternativa interessante para a aplicação na seleção genômica, especialmente para características de baixa herdabilidade. No estudo de simulação, genótipos, pedigree e fenótipos para quatro características (A, B, C e D) foram simulados utilizando valores de herdabilidade baseados nos obtidos com os dados reais (0,09, 0,12, 0,36 e 0,39 para cada característica, respectivamente). O genoma simulado consistiu de 735.293 marcadores e 1.000 QTLs distribuídos aleatoriamente por 29 pares de autossomos, com comprimento variando de 40 a 146 centimorgans (cM), totalizando 2.333 cM. Assumiu-se que os QTLs explicavam 100% da variação genética. Considerando as frequências do alelo menor maiores ou iguais a 0,01, um total de 430.000 marcadores foram selecionados aleatoriamente. Os fenótipos foram obtidos pela soma dos resíduos (aleatoriamente amostrados de uma distribuição normal com média igual a zero) aos valores genéticos verdadeiros, e todo o processo de simulação foi replicado 10 vezes. A ACC foi calculada por meio da correlação entre o valor genético genômico estimado e o valor genético verdadeiro, simulados da 12a a 15a geração. A média do desequilíbrio de ligação, medido entre os pares de marcadores adjacentes para todas as características simuladas foi de 0,21 para as gerações recentes (12a, 13a e 14a), e 0,22 para a 15a geração. A ACC para as características simuladas A, B, C e D variou de 0,43 a 0,44, 0,47 a 0,48, 0,80 a 0,82 e 0,72 a 0,73, respectivamente. Diferentes metodologias de seleção genômica implementadas neste estudo mostraram valores similares de acurácia de predição, e o método mais adequado é dependente da característica explorada. Em geral, as regressões RKHS obtiveram melhor desempenho em termos de ACC com menor valor de MSE em comparação com os outros modelos. / Animal breeding aims to improve economic productivity of future generations of domestic species through selection. Most of the traits of economic interest in livestock have a complex and quantitative expression i.e. are influenced by a large number of genes and affected by environmental factors. Statistical analysis of phenotypes and pedigree information allows estimating the breeding values of the selection candidates based on infinitesimal model. A large amount of genomic data is now available for the identification and selection of genetically superior individuals with the potential to increase the accuracy of prediction of genetic values and thus, the efficiency of animal breeding programs. Numerous studies have been conducted in order to identify appropriate methodologies to specific breeds and traits, which will result in more accurate genomic estimated breeding values (GEBVs). Therefore, the objective of this study was to verify the possibility of applying semi-parametric models for genomic selection and to compare their ability of prediction with those of parametric models for real (carcass, meat quality, growth and reproductive traits) and simulated data. The phenotypic and pedigree information used were provided by farms belonging to four animal breeding programs which represent eleven farms. For carcass and meat quality traits, the data set contained 3,643 records for rib eye area (REA), 3,619 records for backfat thickness (BFT), 3,670 records for meat tenderness (TEN) and 3,378 observations for hot carcass weight (HCW). A total of 825,364 records for yearling weight (YW) and 166,398 for age at first calving (AFC) were used as growth and reproductive traits of Nelore cattle. Genotypes of 2,710, 2,656, 2,749, 2,495, 4,455 and 1,760 animals were available for REA, BFT, TEN, HCW, YW and AFC, respectively. After quality control, approximately 450,000 single nucleotide polymorphisms (SNP) remained. Methods of analysis were genomic BLUP (GBLUP), single-step GBLUP (ssGBLUP), Bayesian LASSO (BL) and the semi-parametric approaches Reproducing Kernel Hilbert Spaces (RKHS) regression and Kernel Averaging (KA). A five-fold cross-validation with thirty random replicates was carried out and models were compared in terms of their prediction mean squared error (MSE) and accuracy of prediction (ACC). The ACC ranged from 0.39 to 0.40 (REA), 0.38 to 0.41 (BFT), 0.23 to 0.28 (TEN), 0.33 to 0.35 (HCW), 0.36 to 0.51 (YW) and 0.49 to 0.56 (AFC). For all traits, the GBLUP and BL models showed very similar prediction accuracies. For REA, BFT and HCW, models provided similar prediction accuracies, however RKHS regression had the best fit across traits considering multiple-step models and compared to KA. For traits which have a higher number of animals with phenotypes compared to the number of those with genotypes (YW and AFC), the ssGBLUP is indicated. Judged by overall performance, across all traits, the RKHS regression is particularly appealing for application in genomic selection, especially for low heritability traits. Simulated genotypes, pedigree, and phenotypes for four traits A, B, C and D were obtained using heritabilities based on real data (0.09, 0.12, 0.36 and 0.39 for each trait, respectively). The simulated genome consisted of 735,293 markers and 1,000 QTLs randomly distributed over 29 pairs of autosomes, with length varying from 40 to 146 centimorgans (cM), totaling 2,333 cM. It was assumed that QTLs explained 100% of genetic variance. Considering Minor Allele Frequencies greater or equal to 0.01, a total of 430,000 markers were randomly selected. The phenotypes were generated by adding residuals, randomly drawn from a normal distribution with mean equal to zero, to the true breeding values and all simulation process was replicated 10 times. ACC was quantified using correlations between the predicted genomic breeding value and true breeding values simulated for the generations of 12 to 15. The average linkage disequilibrium, measured between pairs of adjacent markers for all simulated traits was 0.21 for recent generations (12, 13 and 14), and 0.22 for generation 15. The ACC for simulated traits A, B, C and D ranged from 0.43 to 0.44, 0.47 to 0.48, 0.80 to 0.82 and 0.72 to 0.73, respectively. Different genomic selection methodologies implemented in this study showed similar accuracies of prediction, and the optimal method was sometimes trait dependent. In general, RKHS regressions were preferable in terms of ACC and provided smallest MSE estimates compared to other models. / FAPESP: 2014/00779-0 / FAPESP: 2015/13084-3 Acurácia Características e carcaça Regressão RKHS Seleção genômica SNP Accuracy Carcass traits Genomic selection RKHS regression
316	Análise espacial da distribuição dos casos de dengue no município de Osasco de 2007 a 2013 / Spatial analysis of the distribution of dengue cases in the city of Osasco from 2007 to 2013 Flavia Kelli Alvarenga Pinto 02 September 2016 (has links) As técnicas de análise espacial constituem-se em um importante instrumento para o entendimento dos condicionantes que compõem o processo de transmissão da dengue, contribuindo com o fornecimento de subsídios para as ações de vigilância e controle da doença. O objetivo desse trabalho foi caracterizar a distribuição espacial da dengue por meio do mapeamento dos casos no município de Osasco no período de 2007 a 2013; identificar a distribuição espacial e espaço temporal do risco de ocorrência de dengue; avaliar a relação da incidência de dengue com os índices larvários; e avaliar a relação entre dengue e os fatores socioeconômicos. Foram utilizados dados secundários obtidos na base de dados do Sistema de Informação de Agravos de Notificação (SINAN). A incidência anual, as principais medidas de frequência da doença e a correlação dos índices de Breteau (IB) e os casos de dengues foram analisados. Os casos notificados de dengue no município foram geocodificados a partir do eixo de logradouros e agrupados de acordo com os 928 setores censitários considerados no estudo, o que permitiu a elaboração de mapas temáticos. Utilizando-se o modelo discreto de Poisson para a identificação de conglomerados de maior ou menor risco para ocorrência de dengue no espaço e no espaço-tempo. A dependência espacial dos casos de dengue foi medida pelo Índice de Moran. Por meio de técnicas de análise de regressão linear e espacial as variáveis socioeconômicas foram associadas aos casos de dengue, no sentido de buscar o melhor modelo que esclarecesse a associação dos casos de dengue com os fatores socioeconômicos. Em todos os anos ocorreram casos de dengue e a incidência foi maior nos meses de março a maio. Os mapas gerados mostraram a distribuição espacial e espaço temporal da dengue no município. Não foi observado correlação estatística entre os casos de dengue e o IB. Na análise de espaço-temporal, foram identificados um aglomerado de alto risco, localizado na zona Norte, referente ao período de fevereiro a maio de 2007, e um outro aglomerado de baixo risco. O número de casos de dengue foi maior em áreas sem rede de abastecimento de água; com serviço de coleta do lixo; moradores de cor parda e renda domiciliar per capita de 1 a 2 salários mínimos. O modelo de regressão espacial se mostrou mais eficiente na tentativa de explicar a ocorrência da dengue em relação aos modelos lineares. As taxas de incidência de dengue em períodos epidêmicos e interepidêmicos sugerem que a transmissão de dengue é endêmica no município de Osasco. A ocorrência da dengue não apresenta padrão de distribuição uniforme. As análises espacial, espaço temporal e de modelagem por regressão apontam que a dengue atingiu diferentes estratos socioeconômicos, podendo ser atribuído a heterogeneidade espacial das condições de vida da população. Os resultados levantam a necessidade de estudos específicos dos métodos que estão sendo utilizados para medir infestações de Ae. aegypti no município. O método utilizado mostrou-se adequado para identificação de áreas de risco e por consequência direcionamento de ações e recursos do poder público / The spatial analysis techniques constitute an important tool for understanding the conditions that make up the process of dengue virus transmission, contributing to the provision of subsidies for the surveillance and control of the disease. The purpose of this study was to characterize the spatial distribution of dengue cases through mapping of cases in the city of Osasco in the period from 2007 to 2013; also, identify the spatial distribution and temporal space risk of dengue; evaluate the relationship between the incidence rates of dengue cases with the larval indices; as well evaluate the relationship between dengue and socioeconomic factors. Data were obtained from Sistema de Informação de Agravos de Notificação (SINAN Information System for Notifiable Diseases). The annual incidence, the main frequency measures of the disease and the correlation of the Breteau indexes (BI) and cases of dengue cases were analysed. Dengue cases registered in the city were geocoded by street names and grouped according to 928 census tracts, thus generating thematic maps. Incidence rates were calculated for the study period, as well as the identification of higher and lower-risk areas for spaceand space-time clusters of dengue. It was used the discrete Poisson model to identified the clusters of higher or lower risk for the occurrence of dengue cases in space and space-time. The spatial dependence of dengue cases was measured by Moran index. Through linear and spatial regression analysis techniques socioeconomic variables were associated with dengue cases, in order to seek the best model to clarify the association dengue cases with socioeconomic factors. In all the years there have been cases of dengue and the incidence was higher in the months from March to May. The maps showed the spatial and temporal distribution of dengue in the city space. However, there was no statistical correlation between cases of dengue and the IB. The spatio-temporal analysis, they identified a high risk cluster, located in the northern area for the period from February to May 2007, and another low-risk cluster. The number of cases of dengue was higher in areas without water supply system, garbage collection service, brown residents and per capita domiciliary income of 1 to 2 minimum wages. The spatial regression model was more efficient in trying to explain the occurrence of dengue cases in relation to linear models. In conclusion, the dengue incidence rates at epidemic and inter-epidemic periods suggest that dengue cases transmission is endemic in the city of Osasco. The occurrence of dengue has no uniform distribution pattern. The Spatial analysis, timeline and regression modeling indicate that dengue cases reached different socioeconomic strata, as a result, is attributing to spatial heterogeneity of living conditions of the population. Therefore, the results raise the need for specific studies of the methods being used to measure infestation of Ae. aegypti in the city. The method proved to be suitable for areas of risk identification and consequently direct actions and resources of government Análise espacial Dengue Estudos ecológicos Regressão espacial Dengue Ecological studies Spatial analysis Spatial regression
317	Análise discriminante com mistura de variáveis categóricas e contínuas / Discriminant Analysis with Mixed Categorical and Continuous Data Rene Sanda 22 June 1990 (has links) O objetivo do trabalho é apresentar os métodos mais consagrados de Análise Discriminante quando temos uma mistura de variáveis categóricas e contínuas. / The purpose of this dissertation is to analyze and compare Discriminant Analysis techniques in the presence of mixed categorical and continuous data. Análise Discriminante Regressão Logística. Credit Scoring Discrminant Analysis Kernel Krzanowski Logistic Regression
318	Finite mixture of regression models / Mistura finita dos modelos de regressão Luis Enrique Benites Sánchez 06 April 2018 (has links) This dissertation consists of three articles, proposing extensions of finite mixtures in regression models. Here we consider a flexible class of both univariate and multivariate distributions, which allow adequate modeling of asymmetric data that have multimodality, heavy tails and outlying observations. This class has special cases such as skew-normal, skew-t, skew-slash and skew normal contaminated distributions, as well as symmetric cases. Initially, a model is proposed based on the assumption that the errors follow a finite mixture of scale mixture of skew-normal (FM-SMSN) distribution rather than the conventional normal distribution. Next, we have a censored regression model where we consider that the error follows a finite mixture of scale mixture of normal (SMN) distribution. Next, we propose a censored regression model where we consider that the error follows a finite mixture of scale mixture of normal (SMN) distribution. Finally, we consider a finite mixture of multivariate regression where the error has a multivariate SMSN distribution. For all proposed models, two R packages were developed, which are reported in the appendix. / Esta tese composta por três artigos, visa propor extensões das misturas finitas nos modelos de regressão. Aqui vamos considerar uma classe flexível de distribuições tanto univariada como multivariada, que permitem modelar adequadamente dados assimmétricos, que presentam multimodalidade, caldas pesadas e observações atípicas. Esta classe possui casos especiais tais como as distribuições skew-normal, skew-t, skew slash, skew normal contaminada, assim como os casos simétricos. Inicialmente, é proposto um modelo baseado na suposição de que os erros seguem uma mistura finita da distribuição mistura de escala skew-normal (SMSN) ao invés da convencional distribuição normal. Em seguida, temos um modelo de regressão censurado onde consideramos que o erro segue uma mistura finita da distribuição da mistura de escala normal (SMN). E por último, é considerada um mistura finita de regressão multivariada onde o erro tem uma distribuição SMSN multivariada. Para todos os modelos propostos foram desenvolvidos dois pacotes do software R, que estão exemplificados no apêndice. Algoritmo EM Dados censurados Mistura finita Modelo de regressão linear
319	Modelos de regressão quantílica / Quantile Regression Models Bruno Ramos dos Santos 02 March 2012 (has links) Este trabalho trata de modelos de regressão quantílica. Foi feita uma introdução a essa classe de modelos para motivar a discussão. Em seguida, conceitos inferenciais, como estimação, intervalos de confiança, testes de hipóteses para os parâmetros são discutidos, acompanhados de alguns estudos de simulação. Para analisar a qualidade do ajuste, são apresentados o coeficiente de determinação e um teste de falta de ajuste para modelos de regressão quantílica. Também é proposta a utilização de gráficos para análise da qualidade do ajuste considerando a distribuição Laplace Assimétrica. Uma aplicação utilizando um banco de dados com informação sobre renda no Brasil foi utilizado para exemplificar os tópicos discutidos durante o texto. / This work is about quantile regression models. An introduction was made to this class of models to motivate the discussion. Then, inferential concepts, like estimation, confidence intervals, tests of hypothesis for the parameters are discussed, followed by some simulation studies. To analyse goodness of fit, a coefficient of determination and a lack-of-fit test for quantile regression models are presented. Its also proposed the use of graphs for the goodness of fit analysis considering the Asymmetric Laplace Distribution. An application using a data base with information about income in Brazil was used to exemplify the topics discussed during the text. Conceitos Inferenciais Modelos de Renda. Qualidade do Ajuste Regressão Quantílica Goodness of Fit Income Models. Inferential Concepts Quantile Regression
320	Modelos multivariados binários com funções de ligação assimétricas / Multivariate binary regression models with asymmetric link functions Rafael Braz Azevedo Farias 25 May 2012 (has links) Conjuntos de dados com respostas multivariadas aparecem frequentemente em pesquisas em que os dados são provenientes de questionários. Exemplos mais comuns são pesquisas de opinião, mais especificamente, pesquisas de marketing em que a preferência do consumidor em potencial é avaliado: pelo produto, marca, preço, praça, promoção e etc. Um tipo pesquisa de opinião que ganha grande destaque no Brasil de dois em dois anos são as pesquisas eleitorais de intenção de votos. Nós introduzimos nesta tese uma classe de modelos de regressão multivariados com funções de ligação assimétricas para o ajuste de conjuntos de dados com respostas multivariadas binárias. As funções de ligação consideradas são bastante flexíveis e robustas, contemplando funções de ligação simétricas como casos particulares. Devido a complexidade do modelo, nós discutimos a sua identificabilidade. A abordagem Bayesiana foi considerada e alguns algoritmos de Monte Carlo via Cadeia de Markov (MCMC) foram desenvolvidos. Nós descrevemos algumas ferramentas de seleção de modelos, os quais incluem o Critério de Informação da Deviance (DIC), a Pseudo-Verossimilhança Marginal e o Pseudo-Fator de Bayes. Adicionalmente, um estudo de simulação foi desenvolvido com dois objetivos; i) verificar a qualidade dos algoritmos desenvolvidos e ii) verificar a importância da escolha da função de ligação . No final da tese uma aplicação em um conjunto de dados real é considerada com o objetivo de ilustrar as metodologias e técnicas apresentadas. / Data sets with multivariate responses often appear in surveys where the data came from questionnaires. Opinion poll, sometimes simply referred to as a poll, are common examples of studies in which the responses are multivariate. One type poll that gain great prominence in Brazil in election years, is the survey of vote intent. However, despite the higher visibility of prognostic studies of election, opnion polls is a tool widely used to detect trends and positions of different social segments on various topics, be they political, social or governmental. We introduce in this work a class of multivariate regression models with asymmetric link functions to fit data sets with multivariate binary responses. The link functions here considered are quite flexible and robust, contemplating symmetrical link functions as special cases. Due to the complexity of the model, we discuss its identifiability. The Bayesian approach was considered and some Monte Carlo Markov Chain (MCMC) algorithms have been developed. Simulation studies have been developed with two objectives: i) verify the quality of the algorithms developed and ii) to verify the importance of choosing the link function. At the end of this work an application in a real data set is considered in order to illustrate the methodologies and techniques presented. modelos binários modelos elípticos-assimétricos regressão multivariada binary models multivariate regression models skew-elliptical distributions

Search results