Global ETD Search

211	Modelos estatísticos para dados politômicos nominais em estudos longitudinais com uma aplicação à área agronômica / Statistical models for nominal polytomous data in longitudinal studies with an application to agronomy Vinicius Menarin 14 January 2016 (has links) Estudos em que a resposta de interesse é uma variável categorizada são bastante comuns nas mais diversas áreas da Ciência. Em muitas situações essa resposta é composta por mais de duas categorias não ordenadas, denominada então de uma variável politômica nominal, e em geral o objetivo do estudo é associar a probabilidade de ocorrência de cada categoria aos efeitos de variáveis explicativas. Ademais, existem tipos especiais de estudos em que os dados são coletados diversas vezes para uma mesma unidade amostral ao longo do tempo, os estudos longitudinais. Estudos assim requerem o uso de modelos estatísticos que considerem em sua formulação algum tipo de estrutura que suporte a dependência que tende a surgir entre observações feitas em uma mesma unidade amostral. Neste trabalho são abordadas duas extensões do modelo de logitos generalizados, usualmente empregado quando a resposta é politômica nominal com observações independentes entre si. A primeira consiste de uma modificação das equações de estimação generalizadas para dados nominais que se utiliza de razões de chances locais para descrever a dependência entre as observações da variável resposta politômica ao longo dos diversos tempos observados. Este tipo de modelo é denominado de modelo marginal. A segunda proposta abordada consiste no modelo de logitos generalizados com a inclusão de efeitos aleatórios no preditor linear, que também leva em conta uma dependência entre as observações. Esta abordagem caracteriza o modelo de logitos generalizados misto. Há diferenças importantes inerentes às interpretações dos modelos marginais e mistos, que são discutidas e que devem ser levadas em consideração na escolha da abordagem adequada. Ambas as propostas são aplicadas em um conjunto de dados proveniente de um experimento da área agronômica realizado em campo, conduzido sob um delineamento casualizado em blocos com esquema fatorial para os tratamentos. O experimento foi acompanhado ao longo de seis estações do ano, caracterizando assim uma estrutura longitudinal, sendo a variável resposta o tipo de vegetação observado no campo (touceiras, plantas invasoras ou espaços vazios). Os resultados encontrados são satisfatórios, embora a dependência presente nos dados não seja tão caracterizada; por meio de testes como da razão de verossimilhanças e de Wald diversas diferenças significativas entre os tratamentos foram encontradas. Ainda, devido às diferenças metodológicas das duas abordagens, o modelo marginal baseado nas equações de estimação generalizadas mostra-se mais adequado para esses dados. / Studies where the response is a categorical variable are quite common in many fields of Sciences. In many situations this response is composed by more than two unordered categories characterizing a nominal polytomous outcome and, in general, the aim of the study is to associate the probability of occurrence of each category to the effects of variables. Furthermore, there are special types of study where many measurements are taken over the time for the same sampling unit, called longitudinal studies. Such studies require special statistical models that consider some kind of structure that support the dependence that tends to arise from the repeated measurements for the same sampling unit. This work focuses on two extensions of the baseline-category logit model usually employed in cases when there is a nominal polytomous response with independent observations. The first one consists in a modification of the well-known generalized estimating equations for longitudinal data based on local odds ratios to describe the dependence between the levels of the response over the repeated measurements. This type of model is also known as a marginal model. The second approach adds random effects to the linear predictor of the baseline-category logit model, which also considers a dependence between the observations. This characterizes a baseline-category mixed model. There are substantial differences inherent to interpretations when marginal and mixed models are compared, what should be considered in the choice of the most appropriated approach for each situation. Both methodologies are applied to the data of an agronomic experiment installed under a complete randomized block design with a factorial arrangement for the treatments. It was carried out over six seasons, characterizing the longitudinal structure, and the response is the type of vegetation observed in field (tussocks, weeds or regions with bare ground). The results are satisfactory, even if the dependence found in data is not so strong, and likelihood-ratio and Wald tests point to several differences between treatments. Moreover, due to methodological differences between the two approaches, the marginal model based on generalized estimating equations seems to be more appropriate for this data. Dados categorizados nominais Equações de estimação generalizadas Medidas repetidas no tempo Modelos lineares generalizados mistos generalized estimating equations generalized linear mixed models nominal categorical data repeated measurements over time
212	Estimação de parâmetros genéticos para características de crescimento, reprodução e categóricas em uma população de bovinos de corte compostos (Bos taurus x Box indicus) sob abordagem bayesiana e modelos lineares generalizados mistos / Estimation of genetic parameters for traits of growth, reproduction and categorical in a population of composite beef cattle (Bos taurus x Bos indicus) in Bayesian approach and generalized linear mixed models Tiago Almeida de Oliveira 30 August 2012 (has links) Os objetivos deste trabalho foram avaliar diferentes modelos de seleção com base nos efeitos aleatórios maternos considerados para características de crescimento e perímetro escrotal, estimar parâmetros genéticos para pesos do nascimento aos 12 meses (pesos ao nascer, a desmama e aos 12 meses de idade); perímetro escrotal aos 12 meses e correlações genéticas entre as características para bovinos compostos Montana Tropical, em análises uni, bicaracterísticas. Estimar parâmetros genéticos para as características categóricas de musculosidade, precocidade e conformação aos 12 meses em modelos uni e bicaracterísticas utilizando diferentes metodologias para análise (modelos mistos, modelos thresholds bayesianos e modelos lineares generalizados mistos) e compará-los. Nas análises feitas para as características de crescimento e perímetro escrotal os efeitos maternos influenciaram os pesos do nascimento aos 12 meses de idade. As estimativas de herdabilidade direta obtidas das análises bicaracterísticas foram superiores àquelas obtidas das análises unicaracterísticas e as estimativas pela análise bicaracterística para as herdabilidades foram 0,27 para peso ao nascer; 0,18 para peso à desmama; 0,20 para peso aos 12 meses; e 0,19 para perímetro escrotal aos 12 meses. As correlações genéticas estimadas entre pesos obtidos em idades jovens com peso ao ano foram moderadas a baixas (< 0,60). A correlação genética obtida entre perímetro escrotal e características de crescimento foram 0,04, e <0,01 com peso a desmama indicando baixa associação entre as características e de 0,38 com peso aos 12 meses o que pode ao longo do tempo gerar animais mais pesados aos 12 meses. A seleção com base em características de crescimento em qualquer idade pode promover ganhos genéticos moderados no peso corporal de animais do composto Montana Tropical. É importante considerar nas análises os pesos prévios à seleção para estimar parâmetros genéticos para pesos após a seleção. Para as características morfológicas as estimativas de herdabilidade foram de baixas a moderadas e houve diferença entre o modelo linear e o de limiar e o modelo linear generalizado misto, na obtenção de estimativas de herdabilidades e correlações genéticas, de características categóricas morfológicas multinomiais. As estimativas dos parâmetros genéticos obtidas por modelo de limiar foram superiores aos demais métodos avaliados, com valores de 0,42; 0,37 e 0,25 para musculosidade, precocidade e conformação aos 12 meses, e as correlações genéticas estimadas em conjunto com peso a desmama para musculosidade, precocidade e conformação aos 12 meses foram 0,89; 0,22 e 0,83 respectivamente. Os escores visuais de conformação, precocidade e musculatura aos 12 meses podem responder rapidamente à seleção individual. / The objectives this study were to evaluate different models of selection based on maternal random effects considered for growth traits and scrotal circumference; to estimate genetic parameters for weights from birth to 12 months (birth weight, weaning and 12 months old), scrotal circumference at 12 months and to estimate genetic correlations between traits for cattle composite Montana Tropical, by univariate and two-trait analysis. To estimate genetic parameters for categorical traits of muscling, precocity and conformation at 12 months in uni-and two-trait models using different methodologies for analysis (mixed models, Bayesian models thresholds and generalized linear mixed models) and compare them. In the analysis made for growth traits and scrotal circumference, maternal effects influenced the weights from birth to 12 months of age. Direct heritability estimates obtained from two-trait analyzes were higher than those obtained using univariate models, and the estimates of heritability for the two traits analysis were 0.27 for birth weight, 0.18 for weaning weight, 0.20 for weight at 12 months , and 0.19 for scrotal circumference at 12 months. The genetic correlation obtained between weights at young ages and yearling weight were moderate to low ( < 0.60). Genetic correlation obtained between scrotal circumference and growth traits were 0.04, and < 0.01 with weaning weight indicating a low correlation between the traits and 0.38 from weight at 12 months which may over time provide heavier animals at 12 months. Selection based on growth traits at any age can provide moderate genetic gains in body weight of animals of the composite Montana Tropical. It is important to consider in the analysis to selecting the prior weights to estimate genetic parameters for weights after selection. For the morphological traits, heritability estimates were low to moderate and there was a difference between the threshold and linear model and generalized linear mixed model, for estimates of heritability and genetic correlations of morphological multinomial categorical traits. Estimates of genetic parameters by the threshold model were higher than the other methods evaluated, with values of 0.42, 0.37 and 0.25 for muscling, precocity, and conformation at 12 months, and the genetic correlations estimated in with weaning weight for muscling, precocity and conformation at 12 months were 0.89, 0.22 and 0.83 respectively. The visual scores of conformation, precocity and muscling at 12 months can respond quickly to individual selection. Bovinos de corte Inferência bayesiana Melhoramento Genético animal Modelos lineares generalizados Músculos Perímetro escrotal Teoria de estimação Conformation Estimation of Methods Muscling Scrotal Circumference
213	Variações no pico de fluxo expiratório associadas à exposição à poluição atmosférica e sensibilização alérgica em crianças em São Paulo (SP) / Variations in the peak expiratory flow associated to air pollution and allergic sensitization in children in São Paulo Joya Emilie de Menezes Correia 24 February 2006 (has links) A poluição atmosférica está associada a efeitos adversos à saúde, desde diminuição da função pulmonar até mortalidade. Nos últimos 20 anos a incidência de doenças respiratórias alérgicas tem aumentado em vários países. Além de fatores genéticos, existe a possibilidade da poluição atmosférica ser um dos fatores contribuintes para esse aumento. Com o intuito de investigar os efeitos da poluição atmosférica no pico de fluxo expiratório de crianças com sensibilização alérgica e sem, este estudo foi realizado. Acompanhou-se 96 crianças com idade entre 9 e 11 anos, com medições do pico de fluxo expiratório em todos os dias letivos entre 1 de abril e 7 de julho de 2004. Foram colhidas amostras de sangue para dosagem de IgE e hemograma (eosinofilia), de esfregaço nasal para realização de citologia, de fezes (parasitoses). Foram realizados testes cutâneos de hipersensibilidade imediata para ácaros (Dermatophagoides pteronyssinus, Dermatophagoides farinae e Blomia tropicalis), cachorro (Canis familiaris), gato (Felis domesticus), barata (Periplaneta americana) e pool de fungos (Aspergillus fumigatus, Alternaria alternata, Cladosporium herbarium, Chaetomium globosum, Mucor mucedo, Pullularia pullulans, Penicillium notatum). Foram obtidos dados dos poluentes da temperatura e umidade relativa do ar para todos os dias do estudo. A análise foi realizada por meio de regressão linear (GEE). Os resultados mostraram haver redução do pico defluxo expiratório associada à exposição aos diversos poluentes. Esse efeito ocorreu tanto para as concentrações médias dos poluentes algumas horas antes do teste, bem como para as concentrações médias de três a sete dias. A redução do pico de fluxo expiratório esteve associada principalmente à exposição ao PM10, NO2 e O3. O efeito dos poluentes não diferiu segundo a sensibilização alérgica das crianças / The health effects of air pollution range from lung function decrements to mortality. In the last 20 years, there has been an increase in the incidence of allergic respiratory diseases worldwide. Even though genetic factors play an important role, air pollution has been discussed as one of the factors responsible for this increase. The objective of this study was to investigate the effects of air pollution on peak expiratory flow of children who were sensitized and children who were not. Ninety-six children (9 to 11 years old) were followed from April to July, 2004 with daily measurements of peak expiratory flow. Blood samples were collected for IgE and total blood count. Skin prick test was done using common allergens: mites (Dermatophagoides pteronyssinus, Dermatophagoides farinae e Blomia tropicalis), dog (Canis familiaris), cat (Felis domesticus), cockroach (Periplaneta americana) and fungus (Aspergillus fumigatus, Alternaria alternata, Cladosporium herbarium, Chaetomium globosum, Mucor mucedo, Pullularia pullulans, Penicillium notatum). Daily hourly concentrations of all criteria pollutants, temperature and relative humidity were available for the entire period. Analysis was performed with the generalized estimated equations (GEE). A decrease in peak flow measurements was found to be associated mainly with PM10, NO2 and O3, considering different time lags (hours, previous day, moving average). The effects of the pollutants were not different among children with or without allergic sensitization Alérgenos Criança Modelos lineares Pico de fluxo expiratório Poluição do ar/efeitos adversos Air pollution/adverse effects Allergens Child Linear models Peak expiratory flow rate
214	Biodiversidade e modelagem estatística da comunidade de poliquetas de fundos inconsolidados do complexo recifal Sebastião Gomes, Banco dos Abrolhos (BA, Brasil) / Biodiversity and statistical modeling of polychaete community in soft bottom of Sebastião Gomes reef complex, Abrolhos Bank (BA, Brazil) Michele Quesada da Silva 21 August 2013 (has links) Embora recifes de coral sejam hotspots de biodiversidade para corais e peixes, não se sabe se são para pequenos invertebrados marinhos. Este estudo visou verificar se o complexo recifal Sebastião Gomes é um hotspot de biodiversidade de poliquetas, bem como caracterizar a comunidade estrutural e funcional desses organismos que habitam o sedimento ao redor do recife. Através de modelos lineares generalizados (glm), tendo como variáveis preditoras características do sedimento e/ou posicionamento das estações de coleta ao redor do recife (transectos perpendiculares às faces sul, oeste, norte e leste), buscou-se compreender os padrões de: diversidade alfa; abundância total de poliquetas; abundância das espécies mais representativas; e abundância dos diferentes hábitos tróficos. Foram coletados 2399 indivíduos identificados em 116 espécies, indicando que Sebastião Gomes pode ser um hotspot. Todos descritores da comunidade foram maiores próximos ao recife, onde predominaram sedimentos grossos e carbonáticos. Já a posição ao redor do recife foi importante apenas para alguns descritores, tais como abundância total e dos hábitos tróficos carnívoros e detritívoros, todos maiores nos transectos norte e leste, expostos aos ventos. A abundância de poliquetas foi mais baixa em todo transecto sul, mais suscetível à ressuspensão de sedimento causada pelas frentes frias que atingem essa região / Although coral reefs are biodiversity hotspots for corals and fishes, it is not known whether they are also for small marine invertebrates. The present study aimed to verify if Sebastião Gomes reef complex is a polychaete biodiversity hotspot, as well to describe the structural and functional community of these organisms which inhabit sediments around the reef. Generalized linear models (glm) with sediment features and station position around the reef (perpendicular transects to the South, West, East and North faces) as predictor variables were used to understand the patterns of: alpha diversity; total polychaete abundance; most representative species abundance; and abundance of different trophic habits. 2399 individuals identified in 116 species were collected, indicating that Sebastião Gomes may be a hotspot. All community descriptors were higher near the reef, where coarse and carbonate sediments preponderate. However, the position around the reef was important only for some descriptors, such as total abundance and abundance of carnivorous and deposit feeders. All of them higher in the North and East transects, that are exposed to wind. The polychaete abundance was lower in the whole South transect, nevertheless it is more susceptible to sediment resuspension caused by cold fronts that reach the region Banco dos Abrolhos hotspot modelos lineares generalizados Polychaeta recife Sebastião Gomes Abrolhos Bank generalized linear models hotspot Polychaeta Sebastião Gomes reef
215	Modelos para análise de dados discretos longitudinais com superdispersão / Models for analysis of longitudinal discrete data in the presence of overdispersion Fernanda Bührer Rizzato 08 February 2012 (has links) Dados longitudinais na forma de contagens e na forma binária são muito comuns, os quais, frequentemente, podem ser analisados por distribuições de Poisson e de Bernoulli, respectivamente, pertencentes à família exponencial. Duas das principais limitações para modelar esse tipo de dados são: (1) a ocorrência de superdispersão, ou seja, quando a variabilidade dos dados não é adequadamente descrita pelos modelos, que muitas vezes apresentam uma relação pré-estabelecida entre a média e a variância, e (2) a correlação existente entre medidas realizadas repetidas vezes na mesma unidade experimental. Uma forma de acomodar a superdispersão é pela utilização das distribuições binomial negativa e beta binomial, ou seja, pela inclusão de um efeito aleatório com distribuição gama quando se considera dados provenientes de contagens e um efeito aleatório com distribuição beta quando se considera dados binários, ambos introduzidos de forma multiplicativa. Para acomodar a correlação entre as medidas realizadas no mesmo indivíduo podem-se incluir efeitos aleat órios com distribuição normal no preditor linear. Esses situações podem ocorrer separada ou simultaneamente. Molenberghs et al. (2010) propuseram modelos que generalizam os modelos lineares generalizados mistos Poisson-normal e Bernoulli-normal, incorporando aos mesmos a superdispersão. Esses modelos foram formulados e ajustados aos dados, usando-se o método da máxima verossimilhança. Entretanto, para um modelo de efeitos aleatórios, é natural pensar em uma abordagem Bayesiana. Neste trabalho, são apresentados modelos Bayesianos hierárquicos para dados longitudinais, na forma de contagens e binários que apresentam superdispersão. A análise Bayesiana hierárquica é baseada no método de Monte Carlo com Cadeias de Markov (MCMC) e para implementação computacional utilizou-se o software WinBUGS. A metodologia para dados na forma de contagens é usada para a análise de dados de um ensaio clínico em pacientes epilépticos e a metodologia para dados binários é usada para a análise de dados de um ensaio clínico para tratamento de dermatite. / Longitudinal count and binary data are very common, which often can be analyzed by Poisson and Bernoulli distributions, respectively, members of the exponential family. Two of the main limitations to model this data are: (1) the occurrence of overdispersion, i.e., the phenomenon whereby variability in the data is not adequately captured by the model, and (2) the accommodation of data hierarchies owing to, for example, repeatedly measuring the outcome on the same subject. One way of accommodating overdispersion is by using the negative-binomial and beta-binomial distributions, in other words, by the inclusion of a random, gamma-distributed eect when considering count data and a random, beta-distributed eect when considering binary data, both introduced by multiplication. To accommodate the correlation between measurements made in the same individual one can include normal random eects in the linear predictor. These situations can occur separately or simultaneously. Molenberghs et al. (2010) proposed models that simultaneously generalizes the generalized linear mixed models Poisson-normal and Bernoulli-normal, incorporating the overdispersion. These models were formulated and tted to the data using maximum likelihood estimation. However, these models lend themselves naturally to a Bayesian approach as well. In this paper, we present Bayesian hierarchical models for longitudinal count and binary data in the presence of overdispersion. A hierarchical Bayesian analysis is based in the Monte Carlo Markov Chain methods (MCMC) and the software WinBUGS is used for the computational implementation. The methodology for count data is used to analyse a dataset from a clinical trial in epileptic patients and the methodology for binary data is used to analyse a dataset from a clinical trial in toenail infection named onychomycosis. Análise de dados longitudinais Distribuição de Bernoulli Distribuição de Poisson Inferência Bayesiana Modelos lineares generalizados Modelos mistos Bayesian inference Bernoulli distribution Generalized linear models Longitudinal data Mixed models Poisson distribution
216	Tendência de mortalidade por câncer de colo de útero e útero porção não especificada no estado de Minas Gerais – 1980 a 2005 Alves, Christiane Maria Meurer 13 February 2009 (has links) Submitted by Renata Lopes (renatasil82@gmail.com) on 2016-10-06T17:59:14Z No. of bitstreams: 1 christianemariameureralves.pdf: 1154792 bytes, checksum: 93b03559e6d95acbb4dbb3661f857e03 (MD5) / Approved for entry into archive by Adriana Oliveira (adriana.oliveira@ufjf.edu.br) on 2016-10-07T12:14:33Z (GMT) No. of bitstreams: 1 christianemariameureralves.pdf: 1154792 bytes, checksum: 93b03559e6d95acbb4dbb3661f857e03 (MD5) / Made available in DSpace on 2016-10-07T12:14:33Z (GMT). No. of bitstreams: 1 christianemariameureralves.pdf: 1154792 bytes, checksum: 93b03559e6d95acbb4dbb3661f857e03 (MD5) Previous issue date: 2009-02-13 / Introdução: O câncer de colo de útero, desde a década de 50, dispõe de um exame capaz de detectá-lo em fase incipiente e curável. A disponibilidade do teste de Papanicolaou parece ser a principal motivação para a queda de mortalidade por câncer de colo de útero em vários países ao redor do mundo. Buscou-se com este estudo avaliar o comportamento da mortalidade por câncer de colo de útero e útero porção não especificada, no período de 1980-2005, no Estado de Minas Gerais. Optou-se pela utilização de modelo de regressão linear e pela abordagem idadeperíodo-coorte. Material e Métodos: Foram coletados os dados de óbito e população disponíveis no DATASUS. Para avaliação da tendência de mortalidade por idade e período, utilizou-se o modelo de regressão linear; as taxas também foram log-transformadas para que se obtivesse o percentual de mudança da mortalidade por ano. A análise período-coorte foi feita através do método não paramétrico de Tarone e Chu. Resultados: Encontrou-se queda na mortalidade por câncer de colo de útero e útero porção não especificada para a análise idade e período. A redução foi principalmente relacionada com os casos de câncer de útero porção não especificada. Na análise idade-período-coorte houve redução menor que a esperada para as coortes de 1901-1908 e 1921-1928. Houve redução maior que a esperada para as coortes de 1913-1920, 1929-1932, 1937-1946, 1949-1956, 19631970 e 1969-1976. Encontrou-se ainda redução maior que a esperada para o período de 2000-2001. Conclusão: Foi evidenciada a redução da mortalidade por câncer de colo de útero e útero porção não especificada no Estado de Minas Gerais no período estudado. Os achados mostram influência das coortes de nascimento sobre a queda da mortalidade. / Introduction: Cervical cancer has had since the fifties, an exam capable of detecting it in its early and curable stage. The availability of the Papanicolaou smear test seems to be the principal reason for the fall in the mortality due to cervical cancer in many countries throughout the world. The aim of this study was to assess the trends of the mortality due to cervical cancer and uterus not otherwise specified (NOS) in the period from 1980-2005, in the state of Minas Gerais. We opted for the model of linear regression and the age-period-cohort approach. Material and Methods: Data related to death and population available at DATASUS were collected. To assess the tendency of mortality by age and period the approach of linear regression was used; the taxes were also log transformed in order to obtain the percentage of change in the mortality by year. The period-cohort analysis was carried out using Tarone & Chu’s non parametric method. Results: A reduction in the mortality due to cervical cancer and uterus not otherwise specified (NOS) for the age and period analyzed was found. The reduction was mainly related with the cases of cancer of uterus not otherwise specified (NOS). In the age-period-cohort analysis the reduction was less than expected for the cohorts from 1901-1908 and 1921-1928. There was a reduction bigger than expected for the cohorts from 1913-1920, 1929-1932, 1937-1946, 19491956, 1963-1970 and 1969-1976. It was also found a bigger reduction than expected for the period from 2000-2001. Conclusion: The reduction in the mortality due to cervical cancer and uterus not otherwise specified (NOS) in the state of Minas Gerais was unmistakable in the period studied. The findings show the influence of the birth cohorts over the decrease in mortality. CNPQ::CIENCIAS DA SAUDE::SAUDE COLETIVA Neoplasias de colo de útero Mortalidade Modelos lineares Modelos idade-período-coorte Uterine cervical neoplasma Mortality Linear models Age-period-cohort models
217	Fatores associados à proficiência em leitura e matemática : uma aplicação do modelo linear hierárquico com dados longitudinais do Projeto GERES / Factors associated with proficiency in reading and mathematics : an application of hierarchical linear models with longitudinal data of the GERES Project Dalben, Adilson, 1965- 24 August 2018 (has links) Orientadores: Luiz Carlos de Freitas, Dalton Francisco de Andrade / Tese (doutorado) - Universidade Estadual de Campinas, Faculdade de Educação / Made available in DSpace on 2018-08-24T22:44:15Z (GMT). No. of bitstreams: 1 Dalben_Adilson_D.pdf: 5011742 bytes, checksum: e9c6413b4e6fb98c276dcbdecd13440b (MD5) Previous issue date: 2014 / Resumo: Esta pesquisa é um estudo sobre a eficácia e equidade escolar que tem ganhado atenção especial nos países que usam as avaliações em larga escala a serviço da gestão do sistema educativo. No Brasil, que desde a década de 1990 colocou a avaliação educacional como recurso central em suas políticas educacionais, mas coletando dados seccionais, que são muito frágeis para essa finalidade. Essa fragilidade decorre da alta associação que os fatores extraescolares, sobretudo o nível socioeconômico do aluno, têm sobre as medidas de proficiência. Diante disso, foram usados dados longitudinais e a análise foi feita por meio de modelos lineares hierárquicos. Esta pesquisa teve como objetivo principal desenvolver um modelo estatístico capaz de identificar tais fatores para a realidade brasileira, considerando que a aprendizagem é um processo complexo, isto é, ela é influenciada simultaneamente por múltiplos fatores. Foram desenvolvidos modelos de valor agregado que não só identificam tais variáveis, como também caracterizam sua influência em alunos com distintas proficiências no início de cada período de escolarização. A base de dados utilizada nesses modelos foi fornecida pelo Projeto GERES, que, no período de 2005 a 2008, coletou dados dos mesmos alunos de 1ª a 4ª séries de uma amostra de 312 escolas em cinco grandes cidades brasileiras. Foram medidas as proficiências em Leitura e Matemática de 35.538 alunos e coletadas informações de contexto desses alunos, seus familiares, professores, diretores e escola. Após a redução do grande número de informações disponibilizadas pelo Projeto GERES, feita por meio da Análise Fatorial Exploratória (AFE), as variáveis resultantes foram reorganizadas em três arquivos usados para análise em modelos lineares hierárquicos de três níveis. Os resultados encontrados evidenciam uma significativa instabilidade nos efeitos que as variáveis têm sobre a proficiência, tanto em leitura quanto em matemática. Ao final da pesquisa, são encontrados alguns fatores que influenciam positivamente e negativamente a proficiência em Leitura e Matemática e outros que afetam especificamente cada uma dessas áreas, indicando que podem colaborar para o aumento da eficácia e da equidade das escolas. No entanto, constatam-se também algumas variáveis que têm comportamentos incoerentes com o esperado e outras com comportamentos opostos nas duas áreas. Assim, dos achados das pesquisas, comprova-se que, com base nos dados utilizados, procedimentos metodológicos e modelos estatísticos adotados, os modelos de valor agregado melhoram a confiabilidade das análises em comparação aos modelos que usam dados seccionais, mas ainda são inviáveis como ferramentas para a gestão do sistema educativo, sobretudo para o uso meritocrático de seus resultados. Dessa forma, esta pesquisa corrobora os achados de outras realizadas no âmbito internacional e permite afirmar que a qualidade da modelagem estatística depende da qualidade dos dados que busca modelar, podendo gerar distorções, estabelecer relações inesperadas ou levar a conclusões equivocadas. Em contrapartida, trata-se de recursos que podem ser usados no sistema educativo, fornecendo dados importantes para a orientação das políticas públicas numa perspectiva de avaliação formativa, com vistas ao melhoramento da qualidade de ensino oferecido pelas escolas e à melhor formação dos profissionais docentes e não-docentes que nelas trabalham / Abstract: This research is a study on school effectiveness and equality in Brazil, adding up to a number of other researches that have drawn special attention in countries that use large-scale evaluations at the service of the education system management. In the Brazil has regarded the educational evaluation as a central resource in national education policies, but using cross-sectional data, which are far more fragile for such purpose. This fragility has derived from the great influence that extra-school factors, particularly the students¿ socioeconomic status, exerts on proficiency measures. Longitudinal data was used in the analyses with hierarchical linear models. The main objective of this research was to develop a statistical model to identify such factors in the Brazilian reality, considering that learning is a complex process, i.e. it is simultaneously influenced by multiple factors. Value-added models were developed not only to identify such variables, but also to characterize their influence on students showing different proficiencies at the beginning of every school term. The data base used in those models was provided by the GERES Project, which collected data of the same students from the 1st to the 4th grade from a sample of 312 schools in five Brazilian cities from 2005 to 2008. Proficiencies of 35,538 students were measured, and information about these students¿ context, family, teachers, principals and school were gathered. After the reduction of the great amount of information made available by the GERES Project by means of Exploratory Factor Analysis (EFA), the resulting variables were reorganized in three files used for analysis in three-level hierarchical linear models. The results evidenced significant instability in the effects that the variables have on proficiency both in Reading and in Mathematics. At the end of the research, some factors that influence Reading and Mathematics proficiency either positively or negatively, as well as other factors that specifically affect one of those areas, were found, thus indicating that they may contribute to increased school effectiveness and equality. However, some variables whose behavior was inconsistent with the one expected, and others with opposite behaviors in the two areas were also found. Therefore, from the research findings, based on the data used, the methodological procedures and the statistical models adopted, it has been evidenced that value-added models improve the analysis reliability in comparison with models that use cross-sectional data, but they are still impracticable as tools for education system management, particularly for meritocratic use of their results. Hence, this research has corroborated the findings of other studies carried out over the world and has enabled us to state that the quality of the statistical modeling depends on the quality of data that it attempts to model, and it may generate distortions, establish unexpected relationships or lead to misleading conclusions. On the other hand, these resources may be used in the education system by providing important data for guiding public policies in a educative evaluation perspective, aiming at improving the quality of teaching offered by schools, teachers and other professionals that work in the school setting / Doutorado / Ensino e Práticas Culturais / Doutor em Educação Avaliação educacional Eficácia no ensino Modelos de valor agregado Modelos lineares hierárquicos Método longitudinal Educational evaluation Teaching effectiveness Value added models Hierarchical linear models Longitudinal method
218	Diagnóstico em modelos de regressão linear e não-linear com erros simétricos / Diagnostic in linear and nonlinear regression models with symmetrical errors Reis, Sandra Santos dos, 1983- 24 August 2018 (has links) Orientador: Mauricio Enrique Zevallos Herencia / Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Matemática, Estatística e Computação Científica / Made available in DSpace on 2018-08-24T02:03:22Z (GMT). No. of bitstreams: 1 Reis_SandraSantosdos_M.pdf: 1897835 bytes, checksum: 24e50267c694dbcb380ddcfc9d7bdace (MD5) Previous issue date: 2013 / Resumo: Neste trabalho discutimos a detecção de observações influentes em modelos simétricos lineares e não lineares. Em primeiro lugar é realizado um estudo de simulação para avaliar o desempenho de três métodos de estimação em dados gerados por quatro situações: sem observações influentes, com outliers na variável resposta, com observações influentes de média alavancagem e com observações influentes de alta alavancagem. São analisados dois métodos de máxima verossimilhança e um método robusto. Foram considerados modelos de regressão linear e não linear com erros logísticos tipo II e t-Student. Em segundo lugar é discutida detecção de observações influentes mediante a distância de Cook generalizada, a estatística de Peña e a estatística de Andrews-Pregibon. Em particular é discutida a conveniência de utilizar a metodologia de limiares para caracterizar uma observação como influente ou não influente, assim como o efeito da estimação de parâmetros na construção de limiares. Estas medidas foram aplicadas a conjuntos de dados reais e simulados considerando o ajuste de alguns modelos simétricos com uma adaptação no método de estimação scoring de Fisher / Abstract: We discuss the detection of influential observations in symmetrical linear and nonlinear regression models. First a simulation study is conducted to evaluate the performance of three estimation methods on data generated by four situations: without influential observations with outliers in the response variable, with influential observations average leverage and influential observations with high leverage. Two methods of maximum likelihood and robust method are analyzed. We considered linear and nonlinear regression models with logistic-II and Student-t errors. Secondly detection of influential observations by generalized Cook's distance, the statistic PeÃ?a and Andrews - Pregibon statistic is discussed. In particular the convenience of using the methodology to characterize a threshold observation as influential or not influential, as well as the effect of parameter estimation in the construction of thresholds is discussed. These measures were applied to sets of real and simulated data considering the fit of some symmetrical regression models with an adaptation estimation method of Fisher scoring / Mestrado / Estatistica / Mestra em Estatística Estimativa de parâmetro Modelos lineares (Estatistica) Modelos não lineares (Estatística) Observações influentes (Estatística) Parameter estimation Linear models (Statistics) Nonlinear models (Statistics) Influential observations
219	[en] APPLYING RISK CLASSIFICATION METHOD IN CAR INSURANCE MARKET / [pt] MÉTODO DE CLASSIFICAÇÃO DE RISCO APLICADO AO MERCADO DE SEGUROS DE AUTOMÓVEIS WILSON LINS MORGADO 14 February 2005 (has links) [pt] A estimação do risco em seguros de automóveis representa um difícil problema de regressão. As dificuldades vão desde a utilização de um grande número de variáveis discretas como explicativas, até a distribuição particular dos ruídos e uma quantidade expressiva de categorias com valores nulos e valores discrepantes. Supondo que os problemas de estimação estejam relacionados com a classificação do risco adotada pelo mercado, este trabalho propõe um método de classificação alternativo. O método desenvolvido foi baseado na técnica de análise fatorial, e no algoritmo de agrupamento de dados denominado fuzzy clustering system. Para avaliar a eficiência do método em solucionar os problemas de estimação, optou-se por utilizar o erro resultante da aplicação de modelos lineares generalizados. Ao final, o erro de estimação obtido diante da classificação proposta, foi comparado ao obtido diante da classificação usual de mercado. / [en] The estimation of car insurance risk rate represents a difficult regression problem. One of the difficulties of this problem is the use of a number of discrete independent variables and a specific error distribution that presents an expressive number of null and outlier values. Assuming that these estimation problems are related to the risk classification adopted by the insurance companies, this work proposes an alternative classification method. This method is based on factorial analysis techniques and on the algorithm known as Fuzzy Clustering System. To evaluate the efficiency of this method in solving the problems identified, the risk was estimated using generalized linear models. The errors from each model were obtained and compared between classifications. [pt] ANALISE FATORIAL [en] FACTOR ANALYSIS [pt] MODELOS LINEARES GENERALIZADOS [en] GENERALIZED LINEAR MODELS [en] CAR INSURANCE RATEMAKING [pt] CLASSIFICACAO DO RISCO [en] RISK CLASSIFICATION
220	MODELOS DE PREVISÃO APLICADOS AO CONTROLE DE QUALIDADE COM DADOS AUTOCORRELACIONADOS / FORECAST MODEL APPLIED TO QUALITY CONTROL WITH AUTOCORRELATIONAL DATA Klidzio, Regiane 04 September 2009 (has links) This research has a topic forecast models applied to industrial productive processes with the objective of verifying the stability of the process through control charts applied to the residues originated from linear and non-linear model. In the presence of autocorrelation data, it was necessary to look for a mathematical model which are produce independent and identically distributed residues. This investigation about the stability of the process goes by the verification of the volatility is influence in the detection of points that are capable to affect the productive process performance. This fact shows the existence of the volatility in productive processes, which it is just used until now in economic variables. The data used for analysis belong to three different industries in different segments. The mathematic models were used multivariate dynamic equation, ARIMA and ARIMA-ARCH model. According to the control charts the statistical techniques used to eliminate the serial autocorrelation was statistically adequate comparing to the classic model used by each industry analyzed. Besides, it was verified, in the period that the volatility occurs corresponds to the period the shows a lack of stability detected by Shewhart control charts. The mathematic models were able to represent the productive process, facilitating understands the behavior of the variables, and help to accomplish the forecast and monitoring the process. / A presente pesquisa tem como tema a abordagem de modelos de previsão, aplicados a processos produtivos industriais, com o objetivo de verificar a estabilidade do processo por meio de gráficos de controle, aplicado aos resíduos oriundos de modelagem linear e nãolinear. Como as observações eram autocorrelacionadas, foi necessário buscar um modelo matemático pelo qual foram obtidos resíduos independentes e normalmente distribuídos. A investigação da estabilidade do processo passa pela verificação da influência da volatilidade na detecção de pontos amostrais que são potenciais para afetar o desempenho do processo produtivo. Esse fato comprova a existência da volatilidade em processos produtivos que, até o momento, é trabalhada apenas em variáveis econômicas. Os dados utilizados para análise pertencem a três empresas de segmentos distintos. O modelo matemático foi ajustado utilizando modelo de regressão dinâmica multivariada, modelo ARIMA e modelo ARIMAARCH. De acordo com os gráficos de controle, as técnicas estatísticas empregadas para eliminar a autocorrelação serial dos dados mostraram-se adequadas estatisticamente, se comparadas com o modelo clássico utilizado por cada empresa analisada. Além disso, verificou-se que, no período que ocorre volatilidade corresponde a um período fora de controle detectado nos gráficos de controle de Shewhart. Os modelos matemáticos encontrados foram capazes de representar os processos produtivos, possibilitando compreender o comportamento das variáveis e auxiliaram na realização das previsões e na monitoração do processo. Séries temporais Modelos lineares e não-lineares Autocorrelação Previsão Gráficos de controle Time series Linear e non-linear models Autocorrelation Forecast Control charts

Search results