• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 248
  • 4
  • 3
  • 1
  • 1
  • 1
  • 1
  • 1
  • Tagged with
  • 267
  • 267
  • 182
  • 173
  • 101
  • 87
  • 60
  • 56
  • 54
  • 44
  • 40
  • 36
  • 34
  • 29
  • 29
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
91

Modelos para dados de contagem com aplicações / Models for count data with applications

Mendes, Clarice Camargo 05 March 2007 (has links)
Orientador: Hildete Prisco Pinheiro / Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Matematica, Estatistica e Computação Cientifica / Made available in DSpace on 2018-08-08T17:00:10Z (GMT). No. of bitstreams: 1 Mendes_ClariceCamargo_M.pdf: 1127292 bytes, checksum: f015352011300a41bb50c17c81a49bb1 (MD5) Previous issue date: 2007 / Resumo: Ao lidarmos com dados de contagem, uma abordagem possível é estimar um Modelo Linear Generalizado com distribuição de Poisson. Freqüentemente nestes modelos costuma surgir o problema da superdispersão, um fenômeno que aparece quando estamos diante de uma variabilidade dos dados maior do que a média. Temos basicamente três soluções para este problema: abordagem bayesiana, assumindo que o parâmetro do modelo possui uma distribuição de probabilidade; estimação por Quase-verossimilhança, incluindo um fator de dispersão diferente da unidade ou uma função de variância diversa e, finalmente, o emprego de modelos mistos, com a separação de efeitos fixos e aleatórios. Outra ocorrência comum para dados de contagem é encontrarmos amostras que apresentem um número excessivo de zeros. Detectamos a presença da superdispersão, mas agora ela é devida à ocorrência de mais valores zero na amostra do que seria esperado para dados que seguissem a distribuição de Poisson. Para este caso Lambert (1982) apresenta a chamada regressão de Poisson inflacionada de zeros (ZIP - Zero lnflated Poisson). Através de uma aplicação a dados reais, em estudo referente à alimentação de rãs da espécie Adenomera, identificamos os melhores modelos para explicar a quantidade de comida ingerida em função dos efeitos de sexo e da estação do ano. Utilizamos técnicas de diagnóstico para avaliar o impacto que uma determinada observação exerce na estimativa dos parâmetros. / Abstract: When one deals with count data, a possible approach is to fit a generalized linear model with Poisson distribution. Usually it may occur the problem of superdispersion, when the variability of the data is greater then the mean. There are three basic solutions to this problem: the Bayesian approach, when we assume that the parameter of the mo deI has a distribution of probability; the Quasilikelihood estimation, including a non-unitary dispersion parameter or a different variance function and, finally, the mixed models. Another possible occurrence to count data is the presence of samples with an excess of zeros. We detect the presence of the superdispersion, but now it is due to more zero counts than expected from the Poisson distribution. For this case, Lambert (1982) presents the Zero Infiated Poisson (ZIP) mode. As an application to real data, in the study of frogs' nourishment from the species Adenomera, we identify the best models to explain the quantity of swallowed food related to sex and season effects. We employ techniques of diagnosis to verify the impact of a specific observation in the parameter estimations / Mestrado / Bioestatistica / Mestre em Estatística
92

Classificação de séries temporais via Classificador de Bayes empregando Modelos Lineares Dinâmicos

Aguiar, Diana Dorgam de, 92-99171-6468 09 August 2017 (has links)
Submitted by Divisão de Documentação/BC Biblioteca Central (ddbc@ufam.edu.br) on 2017-12-04T14:17:52Z No. of bitstreams: 2 license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) Dissertação_Diana D. Aguiar.pdf: 2526734 bytes, checksum: ef02491a952f20781293fdfd0e5f5052 (MD5) / Approved for entry into archive by Divisão de Documentação/BC Biblioteca Central (ddbc@ufam.edu.br) on 2017-12-04T14:18:04Z (GMT) No. of bitstreams: 2 license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) Dissertação_Diana D. Aguiar.pdf: 2526734 bytes, checksum: ef02491a952f20781293fdfd0e5f5052 (MD5) / Made available in DSpace on 2017-12-04T14:18:04Z (GMT). No. of bitstreams: 2 license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) Dissertação_Diana D. Aguiar.pdf: 2526734 bytes, checksum: ef02491a952f20781293fdfd0e5f5052 (MD5) Previous issue date: 2017-08-09 / CAPES - Coordenação de Aperfeiçoamento de Pessoal de Nível Superior / In this work we present a new approach for applications in Discriminant Analysis (DA) to problems whose observations in the training set are from time series, using the Bayes classifier and modeling the classes distributions in with Linear Dynamic Models. Theoretical developments were conducted to obtain an analytic form for the classe posterior probability. The simulation studies have been developed to evaluate the proposed approach, to evaluate different strategies to estimate the model variance and determine the classification error rates (ET) to compare them with other usual approaches in AD. Time series were simulated with different structures of classes separation and with different sizes for the training set. The proposed approach was also applied to data from real problems with different degrees of difficulty with respect to the classes number, the time series size and number of observations in the training set. With real data the proposed classifier was compared with other classifiers in terms of error rate. Although it is needed most complete studies, the results suggest that this parametric approach developed constitutes a promising alternative for problems in AD with time series, particularly in a challenging context when the size time series is much large than the number of observations in the classes. / Na presente dissertação apresentamos uma nova abordagem para aplicações em Análise Discriminante (AD) para problemas cujas observações no conjunto de treinamento são oriundas de séries temporais, empregando o Classificador de Bayes e modelando as distribuições nas classes com o emprego de Modelos Lineares Dinâmicos. Foram realizados os desenvolvimentos teóricos necessários para a obtenção de uma forma analítica para as probabilidades a posteriori das classes. Para avaliar a abordagem proposta foram desenvolvidos estudos de simulação, tanto para avaliar as estratégias da escolha do procedimento da estimação da variância, como também, determinar as taxas de erro (TE) de classificação para compará-las com outras abordagens usuais para classificadores em AD. Foram simuladas observações de séries temporais com diferentes estruturas de separação das classes e com diferentes tamanhos para o conjunto de treinamento. A abordagem proposta também foi aplicada em dados de problemas reais, com diferentes graus de dificuldades com relação ao número de classes, tamanho das séries e o número de observações no conjunto de treinamento, sendo então comparadas suas TE com as de outros classificadores. Embora sejam necessários estudos mais completos, os resultados obtidos sugerem que a abordagem paramétrica desenvolvida se constitui em uma alternativa promissora para esta categoria de problemas em AD, com observações de séries temporais, em particular, em um contexto bastante desafiador na prática quando temos séries com tamanhos grandes com relação ao número de observações nas classes.
93

Efeitos da gestÃo escolar e caracterÃsticas individuais do diretor determinantes do desempenho dos estudantes do ensino fundamental brasileiro / Individual characteristic effect of determinative the pertaining to school management and of the director of the performance of the students of brazilian basic education

Leandro Oliveira Costa 13 September 2006 (has links)
Conselho Nacional de Desenvolvimento CientÃfico e TecnolÃgico / Utilizando as metodologias de Modelos Lineares HierÃrquicos e Modelos Estruturais com Dados em Painel sobre os dados do SAEB 2001 e 2003, foram analisados os efeitos da gestÃo escolar e das caracterÃsticas individuais do diretor determinantes ao desempenho cognitivo dos estudantes do ensino fundamental brasileiro. As variÃveis sobre as caracterÃsticas individuais dos alunos apresentaram resultados semelhantes à literatura nacional, ou seja, as condiÃÃes socioeconÃmicas e a raÃa sÃo fatores relevantes para explicar a performance nos exames de proficiÃncia em matemÃtica. Entretanto, constatou-se um resultado distinto quanto à melhor performance dos estudantes do sexo feminino, o qual pode estar relacionado com o que se obteve para a variÃvel repetÃncia, visto que a maioria dos estudantes que repetem sÃo do sexo masculino. Entre as vinte e sete variÃveis ao nÃvel da escola, somente oito divergiram os resultados entre os dois modelos. Verificou-se que a qualidade dos educadores, professores e diretores, pode ser medida tanto pelos seus nÃveis de escolaridade quanto por suas experiÃncias no ambiente escolar. De onde se conclui que a estrutura fÃsica e pedagÃgica deve ser direcionada ao incentivo à alta freqÃÃncia dos alunos e professores, ou seja, ambientes modernamente equipados e bem conservados. No cÃmputo geral dos resultados pode-se concluir que a escola brasileira necessita de recursos financeiros para serem aplicados em salÃrios mais altos para diretores e professores, docentes mais qualificados, e em uma estrutura que incentiva a presenÃa dos estudantes (como computadores com acesso à Internet) para melhorar o desempenho cognitivos dos estudantes. / By using the methodologies of Hierarchic Linear Models and Structural Models with Panel Data on the data of SAEB in 2001 and 2003, it was analyzed the effect of school management and the principalâs individual characteristics determinants to the students cognitive performance in the Brazilian primary schooling. When analyzing the individual characteristics of the students, it has been found similar results to national literature, that is, the socioeconomic conditions and the race are important factors to determine the performance in the examinations of proficiency in math. An interesting result is the best performance of the female students. This apparent contradiction may be related to what it was obtained for the schooling recurrence variable, since the majority of the repeater students are male. Among the twenty seven school variables, only eight of them diverged the results between the two models. The results obtained verified that the quality of the educators, teachers and principals, may be measured by their levels of schooling and experience in the school environment. Also signaling that the physical and pedagogical structure must be directed to the incentive the high frequency of the students and teachers, that is, well conserved and modernly equipped environments. The overall results indicate that the Brazilian schooling system needs financial resources to be applied to higher wages for teachers and principals, teachers more qualified, and a better structure that stimulates the students to go to school (as computers with access to the Internet) to improve the cognitive performance of the students.
94

Modelos Birnbaum-Saunders bivariados / Models bivariate Birnbaum-Saunders

Benites Sánchez, Luis Enrique, 1983- 03 July 2014 (has links)
Orientador: Filidor Edilfonso Vilca Labra / Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Matemática Estatística e Computação Científica / Made available in DSpace on 2018-08-24T23:42:51Z (GMT). No. of bitstreams: 1 BenitesSanchez_LuisEnrique_M.pdf: 5806394 bytes, checksum: be4e77277f256bd4832454c572be588c (MD5) Previous issue date: 2014 / Resumo: Vários trabalhos tem sido feitos sobre a distribuição BS univariada e suas extensões. A versão bivariada deste modelo foi apresentada recentemente por Kundu et al. (2010). Eles propuseram uma distribuição BS bivariada com estrutura de dependência e estabeleceram várias propriedades atrativas para a distribuição BS bivariada, que possui uma estreita relação com a distribuição normal bivariada; assim como a distribuição BS univariada tem com a distribuição normal univariada. Este trabalho apresenta um estudo de alguns aspectos de inferência, análise de diagnóstico e análise de tempo de vida baseada na função taxa de falha da distribuição BS bivariada: aspectos de inferência serão através de testes de hipótese considerando as estatísticas de Wald, Razão de Verossimilhança e Escore; o análise de diagnóstico será baseada na metodologia de Cook (1986) e a discussão sobre análise sobrevivência será baseada na idéia de Basu (1971). Finalmente, exemplos numéricos serão apresentados para ilustrar as metodologias propostas e as propriedades das estatísticas serão investigadas por meio de simulações de Monte Carlo / Abstract: Several works have been done on the univariate BS distribution and its extensions, the bivariate version of this model was presented only recently by Kundu et al. (2010). They proposed a bivariate BS distribution with dependence structure and established several attractive properties of that bivariate distribution. It possesses a close relationship with the bivariate normal distribution just as the univariate BS distribution has with the univariate normal. In this work provides a study some aspect of inference, analysis of diagnostics and lifetime analysis based on the failure rate function of bivariate BS distributions: Hypotheses test studies are considered using the Wald, Score and Likelihood Ratios statistics, the analysis of diagnostics is based on the Cook (1986) approach, and the discussion on lifetime analysis is based on the idea of Basu (1971). Finally, numerical examples are given to illustrate our methodology and the properties of the statistics are investigated through Monte Carlo simulations / Mestrado / Estatistica / Mestre em Estatística
95

Modelo de regressão linear Sinh-Normal : Aplicações à tempo de vidas / Linear Regression model Sinh-Normal : Applications to life times

Maehara Sánchez, Rocío Paola, 1983- 03 July 2014 (has links)
Orientador: Filidor Edilfonso Vilca Labra / Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Matemática Estatística e Computação Científica / Made available in DSpace on 2018-08-24T22:21:27Z (GMT). No. of bitstreams: 1 MaeharaSanchez_RocioPaola_M.pdf: 3392400 bytes, checksum: 820e10611571e2e9984d25f94c00ced2 (MD5) Previous issue date: 2014 / Resumo: A família de distribuições Sinh-Normal é uma classe de distribuições simétricas com três parâmetros, e devido à presença destes parâmetros esta família é flexível. Quando a distribuição Sinh-Normal é unimodal, esta distribuição pode ser utilizada em lugar da distribuição normal, e consequentemente nos modelos de regressão. Uma subclasse das distribuições é o log-transformação da distribuição de tempo de fadiga Birnbaum-Saunders. Assim, várias propriedades da distribuição Birnbaum-Saunders e algumas generalizações podem ser obtidas. O principal objetivo deste trabalho é estudar alguns aspectos de estimação e análise de diagnóstico no modelo de regressão Sinh-Normal. A análise de diagnóstico baseia-se na metodologia de Cook (1986). Duas análises de dados são realizadas para ver como o modelo proposto pode ser utilizado na prática. Além disso, investigamos um teste de homogeneidade dos parâmetros de forma no modelo de regressão Sinh-Normal. Obtemos as estatísticas de escore para este teste. Finalmente, um exemplo numérico é apresentado para ilustrar a metodologia e as propriedades das estatísticas escore são investigadas através de simulações de Monte Carlo / Abstract: The family of Sinh-normal distributions is a class of symmetric distributions with three parameters, and due to presence of these parameters it is a very flexible distribution. When the Sinh-normal distribution is unimodal, it distribution could be used in place of the normal distribution and consequently in regression model. A subclass de distribution of Sinh-normal distributions is the log-transformation of the Birnbaum-Saunders fatigue-time distribution. So, several properties of the Birnbaum-Saunders distribution and some generalization can be obtained. The main objective of work is to study some aspect of estimation and analysis of diagnostics in the Sinh-Normal regression model. The analysis of diagnostics is based on the Cook (1986) approach. Two data analysis is performed to see how the proposed model can be used in practice. Furthermore, we investigate a test of homogeneity for shape parameters in the Sin-Normal regression model. We obtain the score statistics for such test. Finally, a numerical example is given to illustrate our methodology and the properties of the score statistics is investigated through Monte Carlo simulations / Mestrado / Estatistica / Mestra em Estatística
96

Inserção do setor sucroalcooleiro na matriz energetica do Brasil : uma analise de insumo-produto

Cunha, Marcelo Pereira da, 1967- 28 February 2005 (has links)
Orientador: Jose Antonio Scaramucci / Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Matematica, Estatistica e Computação Cientifica / Made available in DSpace on 2018-08-04T02:55:09Z (GMT). No. of bitstreams: 1 Cunha_MarceloPereirada_M.pdf: 671663 bytes, checksum: 87af7e834b9701c03bd716e529e67ed9 (MD5) Previous issue date: 2005 / Resumo: O objetivo deste estudo é quantificar alguns impactos sobre a economia brasileira decorrentes de uma maior participação do setor sucroalcooleiro na matriz energética, especificamente o aumento da produção de eletricidade a partir da queima do bagaço de cana-de-açúcar (processo de co-geração) e maior oferta de álcool como combustível para a frota leve de veículos. São analisados os impactos sobre a estrutura da economia, emprego, nível de produção e PIB. Para tal, aplicamos o modelo de insumo-produto, utilizando-se uma base de dados estimada referente a 1999, que foi obtida com a desagregação de alguns setores produtivos, como geração de eletricidade, transmissão e distribuição de eletricidade, produção de álcool, produção de gasoálcool e gás natural. Os dados usados foram obtidos das contas nacionais fornecidas pelo IBGE, do Balanço Energético Nacional divulgado pelo Ministério de Minas e Energia e outras fontes diversas. A metodologia empregada parte da descrição tecnológica (bottom-up) dos setores produtores de eletricidade ¿ termoelétricas a gás natural, co-geração a partir da biomassa de cana-de-açúcar e hidroeletricidade. Esses novos setores são inseridos na economia brasileira, em determinadas condições de operação, resultando em mudanças econômicas que são então quantificadas / Abstract: This work aims at investigating the impacts on the Brazilian economy of a greater contribution to the energy matrix of the sugarcane agro-industry, more specifically, of an increase on the production of electricity from bagasse (combined heat and power process) and fuel ethanol as well. The effects on the economy structure, employment, production level and GDP are analyzed. An input-output (I-O) model based on an estimated database for 1999 is used for that. I-O tables were obtained by disaggregating some economic sectors ¿ such as electricity generation, transmission and distribution (treated separately), ethanol, gasoline, and natural gas ¿ from the national accounts provided by IBGE, using energy data from MME and other sources of information. The analysis starts from a bottom-up technological description of the sectors producing electricity from natural gas, sugarcane bagasse and hydro energy. These sectors are inserted in the Brazilian economy, under certain operation conditions, resulting in economic changes that are then quantified. / Mestrado / Matematica Aplicada / Mestre em Matemática Aplicada
97

Analise estatistica de polimorfismo molecular em sequencias de DNA utilizando informações filogeneticas

Kiihl, Samara Flamini, 1980- 25 February 2005 (has links)
Orientador: Hildete Prisco Pinheiro / Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Matematica, Estatistica e Computação Cientifica / Made available in DSpace on 2018-08-04T03:26:12Z (GMT). No. of bitstreams: 1 Kiihl_SamaraFlamini_M.pdf: 1063133 bytes, checksum: 4c4cce349b3bd30501a820e973a44fb2 (MD5) Previous issue date: 2005 / Resumo: Variacao genetica no nivel de nucleotideo e uma fonte poderosa de informacao para o estudo da evolucao de uma populacao. Importantes aspectos da evolucao de populacoes naturais tem sido investigados utilizando sequencias de nucleotideos. A quantidade ? = 4N?, em que N e o tamanho efetivo da populacao e ? e a taxa de mutacao por sequencia (gene, locus) por geracao, e um parametro essencial porque determina o grau de polimorfismo em um locus. O sucesso da inferencia sobre a evolucao de uma populacao e medido pela acuracia da estimacao deste parametro. Esta dissertacao de mestrado apresenta diversos metodos de estimacao do parametro ?, bem como uma comparacao entre eles atraves de simulacoes e aplicacoes a dados reais. Utilizando informacoes filogeneticas de amostras de sequencias de DNA, constr'oi-se um modelo linear onde o coeficiente da variavel independente e a estimativa do parametro ?. Verificou-se que utilizando informacoes filogeneticas dos dados obtem-se estimadores bem mais eficientes / Abstract: Genetic variation at the nucleotide level is a powerful source of information for studying the evolution of a population. Important aspects of the evolution of a population have been investigated by using nucleotide sequences. The quantity ? = 4N?, where N is the effective size of the population and ? is the mutation rate per sequence (gene, locus) per generation, is an essential parameter because it determines the degree of polymorphism at the locus. The degree of success in our inference about the evolution of a population is measured to some extent by the accuracy of estimation of this essential parameter. This work presents some methods of estimation of this parameter, comparisons between the different methods through computational simulations and applications to real data. The evolution of a species can be seen through a phylogenetic tree and a linear model can be constructed by using the phylogenetic information to estimate ?. It has been verified that the use of such information leads us to more accurate estimators of ? / Mestrado / Estatistica / Mestre em Estatística
98

Uma Abordagem Híbrida para Estimação de Desempenho de Comunicação em Plataformas Baseadas em Barramentos

ESMERALDO, Guilherme Álvaro Rodrigues Maia 09 March 2012 (has links)
Submitted by Pedro Henrique Rodrigues (pedro.henriquer@ufpe.br) on 2015-03-05T17:24:50Z No. of bitstreams: 2 thesis-garme.pdf: 4355850 bytes, checksum: 99bfb83bbe20bef9c48abe89d91706a0 (MD5) license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5) / Made available in DSpace on 2015-03-05T17:24:51Z (GMT). No. of bitstreams: 2 thesis-garme.pdf: 4355850 bytes, checksum: 99bfb83bbe20bef9c48abe89d91706a0 (MD5) license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5) Previous issue date: 2012-03-09 / Com o aumento da complexidade e demanda por desempenho dos sistemas embarcados e redução do custo dos microprocessadores, projetistas de sistemas embarcados têm considerado sistemas multiprocessadores como as soluções para suas aplicações. Com o avanço nas tecnologias de integração tornou-se possível integrar em um chip bilhões de transistores. Desde que um microprocessador embarcado utiliza somente alguns poucos milhões de transistores, dez ou mais microprocessadores podem ser integrados em um único chip para formar um Multi- Processor System-on-Chip (MPSoC). No projeto desses sistemas, são necessárias a especificação e validação do comportamento funcional da aplicação do sistema antes da implementação final, através de modelos funcionais executáveis e estruturas de testbenches. Técnicas, como Projeto Baseado em Plataforma (PBP), procuram, através de reuso de componentes, bem como de modelos abstratos em nível de sistema, fornecer mecanismos para simplificar e tornar mais dinâmico o processo de desenvolvimento de MPSoCs, aumentando assim a produtividade dos projetistas. Nesta abordagem, o sistema a ser desenvolvido é, inicialmente, especificado através de uma descrição em alto nível, que sofrerá refinamentos até atingir a implementação final em hardware. As funções do sistema, contidas nessa especificação, são selecionadas para serem implementadas em software ou em hardware. Estes componentes fazem parte de uma arquitetura predefinida, conhecida como plataforma, que pode ser modificada para ser adaptada às restrições de projeto. MPSoCs são compostos por muitos componentes de processamento que executam processo concorrentes que se comunicam, portanto suas arquiteturas de comunicação on-chip devem atender às necessidades de comunicação das aplicações. Assim, enquanto existe uma grande quantidade de trabalhos que suportam as fases de particionamento/mapeamento, comparativamente, pouca pesquisa tem endereçado o problema de análise de comunicação para auxiliar o projeto de arquiteturas de comunicação dessas sistemas. As técnicas existentes para explorar as opções de configuração da estrutura de comunicação são imprecisas, pois fazem estimativas estáticas, descartando efeitos dinâmicos da arquitetura, como contenção de barramento, ou possuem baixa eficiência, pois têm que simular cada configuração do espaço de projeto. O objetivo deste trabalho é oferecer suporte de análise de comunicação nos processos de vi seleção e refinamento das arquiteturas de comunicação, após a aplicação ter sido particionada e mapeada para uma plataforma, de acordo com o PBP. O uso da abordagem proposta permite que o projetista obtenha estimativas precisas de desempenho de comunicação para as configurações de barramento de todo o espaço de projeto, e, consequentemente, possa selecionar uma configuração que melhor atenda às restrições de comunicação do projeto.
99

[en] ANALYSIS OF MEDIA E DISPERSION IN UNREPLICATED FACTORIAL EXPERIMENTS FOR THE OPTIMIZATION OF INDUSTRIAL PROCESSES / [pt] ANÁLISE DA MÉDIA E DISPERSÃO EM EXPERIMENTOS FATORIAIS NÃO REPLICADOS PARA OTIMIZAÇÃO DE PROCESSOS INDUSTRIAIS

ANTONIO FERNANDO DE CASTRO VIEIRA 20 December 2004 (has links)
[pt] Esta tese reúne as técnicas estatísticas indicadas para a modelagem da média e da dispersão das características de qualidade de processos e produtos, em experimentos fatoriais não replicados, resultando na definição de um roteiro integrado e detalhado de análise. A motivação vem de que, apesar de haver várias publicações sobre regressão linear clássica, modelos lineares generalizados (MLG), transformação da resposta e planejamento de experimentos, não existe um texto que reúna e descreva em detalhe todos os aspectos da modelagem da média e da dispersão em experimentos fatoriais. Os poucos textos sobre esse assunto não descrevem vários aspectos importantes em estudos dessa natureza, por exemplo, como são aplicados os testes de significância dos coeficientes dos MLG, e quais são as estatísticas e os gráficos indicados para verificar a adequação do modelo. Ademais, nada foi encontrado na literatura sobre a identificação de modelos em experimentos fatoriais. Todos esses aspectos são detalhados nessa tese. Uma vez construído o modelo, é mostrado como usá-lo para obter as condições ótimas de operação dos processos e produtos. Além do cumprimento desse objetivo principal, a tese traz algumas contribuições adicionais; a saber: a) aponta limitações em todos quatro métodos da literatura que se propõem a escolher a transformação mais adequada para a resposta. Esses métodos não produziram resultados satisfatórios quando houve interações significativas entre os fatores; b) propõe a utilização de métodos de transformação da resposta como fonte de indicação da função de ligação a ser usada nos modelos lineares generalizados; e c) propõe a utilização da função de log-verossimilhança para uma escolha conjunta da distribuição de probabilidade e da função de ligação, nos modelos lineares generalizados. / [en] This thesis puts together the statistical techniques indicated for modelling the mean and dispersion of quality characteristics of products and processes via unreplicated factorial experiments, resulting in the definition of an integrated and detailed script for the analysis. It was motivated by the fact that, although there are many publications about classic linear regression, generalized linear models (GLMs), response transformation and design of experiments, there is no one text which put together and describe in detail all the aspects of the modelling of the mean and the dispersion in factorial experiments. The few texts on the subject do not describe a number of important aspects in studies of this nature, e.g. how significance tests for the coefficients in GLMs should be applied and which are the statistics and plots indicated for checking model adequacy. In addition, nothing was found in the literature about model identification in factorial experiments. All these aspects are detailed in this thesis. Once the model is built, we show how to use it in order to obtain the optimal operating conditions for products and processes. Besides achieving this main objective, the thesis brings some additional contributions, namely: a) it points out limitations in all the four methods in the literature which have the purpose of selecting the most adequate transformation of the response; b) it proposes using response transformation methods as a source of indication of the link function to use in GLMs, and c) it proposes using the loglikelihood function for the joint choice of the probability distribution and of the link function in GLMs.
100

Modelos lineares generalizados mistos multivariados para caracterização genética de doenças / Multivariate generalized linear mixed models for genetic characterization of diseases

Baldoni, Pedro Luiz, 1989- 24 August 2018 (has links)
Orientador: Hildete Prisco Pinheiro / Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Matemática, Estatística e Computação / Made available in DSpace on 2018-08-24T09:34:36Z (GMT). No. of bitstreams: 1 Baldoni_PedroLuiz_M.pdf: 4328843 bytes, checksum: 0ab04f375988e62ac31097716ac0eaa5 (MD5) Previous issue date: 2014 / Resumo: Os Modelos Lineares Generalizados Mistos (MLGM) são uma generalização natural dos Modelos Lineares Mistos (MLM) e dos Modelos Lineares Generalizados (MLG). A classe dos MLGM estende a suposição de normalidade dos dados permitindo o uso de várias outras distribuições bem como acomoda a superdispersão frequentemente observada e também a correlação existente entre observações em estudos longitudiais ou com medidas repetidas. Entretanto, a teoria de verossimilhança para MLGM não é imediata uma vez que a função de verossimilhança marginal não possui forma fechada e envolve integrais de alta dimensão. Para solucionar este problema, diversas metodologias foram propostas na literatura, desde técnicas clássicas como quadraturas numéricas, por exemplo, até métodos sofisticados envolvendo algoritmo EM, métodos MCMC e quase-verossimilhança penalizada. Tais metodologias possuem vantagens e desvantagens que devem ser avaliadas em cada tipo de problema. Neste trabalho, o método de quase-verossimilhança penalizada (\cite{breslow1993approximate}) foi utilizado para modelar dados de ocorrência de doença em uma população de vacas leiteiras pois demonstrou ser robusto aos problemas encontrados na teoria de verossimilhança deste conjunto de dados. Além disto, os demais métodos não se mostram calculáveis frente à complexidade dos problemas existentes em genética quantitativa. Adicionalmente, estudos de simulação são apresentados para verificar a robustez de tal metodologia. A estabilidade dos estimadores e a teoria de robustez para este problema não estão completamente desenvolvidos na literatura / Abstract: Generalized Linear Mixed Models (GLMM) are a generalization of Linear Mixed Models (LMM) and of Generalized Linear Models (GLM). The class of models GLMM extends the normality assumption of the data and allows the use of several other probability distributions, for example, accommodating the over dispersion often observed and also the correlation among observations in longitudinal or repeated measures studies. However, the likelihood theory of the GLMM class is not straightforward since its likelihood function has not closed form and involves a high order dimensional integral. In order to solve this problem, several methodologies were proposed in the literature, from classical techniques as numerical quadrature¿s, for example, up to sophisticated methods involving EM algorithm, MCMC methods and penalized quasi-likelihood. These methods have advantages and disadvantages that must be evaluated in each problem. In this work, the penalized quasi-likelihood method (\cite{breslow1993approximate}) was used to model infection data in a population of dairy cattle because demonstrated to be robust in the problems faced in the likelihood theory of this data. Moreover, the other methods do not show to be treatable faced to the complexity existing in quantitative genetics. Additionally, simulation studies are presented in order to verify the robustness of this methodology. The stability of these estimators and the robust theory of this problem are not completely studied in the literature / Mestrado / Estatistica / Mestre em Estatística

Page generated in 0.0834 seconds