Imputação de dados em experimentos com interação genótipo por ambiente: uma aplicação a dados de algodão / Data imputation in trials with genotype by environment interaction: an application on cotton data

Sergio Arciniegas Alarcón 06 February 2009 (has links)
Os experimentos multiambientes são um tipo especial dos experimentos bifatoriais, muito usados em melhoramento genético de plantas, nos quais algumas cultivares são avaliadas em diferentes locais. Geralmente nesses estudos se encontra uma resposta diferencial das cultivares em cada local que é chamada de interação genótipo x ambiente ou G x E, que é bem explicada por modelos de efeitos aditivos e interação multiplicativa (AMMI). Frequentemente os experimentos G x E podem ser desbalanceados e um ou vários genótipos não serem testados em alguns locais. Às vezes para o pesquisador recomendar os ambientes pode ser de interesse obter estimativas daquelas combinações genótipo ambiente que não foram testadas e tais estimativas podem ser calculadas explorando a informação inerente a aquelas combinações que foram atualmente obtidas. Além do interesse do pesquisador por essas estimativas, os da- dos ausentes podem causar alguma modificação na estimação tradicional dos parâmetros nos modelos AMMI, pois para estimar os parâmetros é necessário um processo sequencial fazendo uma análise de variância com uma posterior decomposição por valor singular da matriz de residuais, a qual não pode ser calculada se existir uma matriz de interação com dados faltantes. Para resolver esses problemas Bergamo (2007) e Bergamo et al. (2008) propuseram uma nova técnica através do uso de imputação múltipla livre de distribuição (IMLD) e é por essa razão que se decidiu avaliar o recente desenvolvimento comparando-o com algumas metodologias de imputação que têm sido usadas com sucesso nos experimentos G x E com dados ausentes como os mínimos quadrados alternados ALS(0), ALS(1) (CALINSKI et al., 1992) e estimativas robustas r-AMMI1 e r-AMMI2 (DENIS; BARIL, 1992). Assim, foi de- senvolvido um estudo de simulação baseado em uma matriz de dados reais genótipos (15) ambientes (27) do ensaio estadual de algodoeiro herbáceo 2000/01 (FARIAS, 2005), fazendo retiradas aleatórias de 10%, 20% e 30%, imputando os dados e comparando os métodos através da raiz quadrada da diferença preditiva média (RMSPD), a estatística de similari- dade de Procrustes e o coe…ciente de correlação não paramétrico de Spearman. Também foi feita uma análise sobre a escolha de componentes multiplicativos de um modelo AMMI quando se têm matrizes completadas (observados + imputados). Os resultados do estudo de simulação mostraram que segundo a distribuição da RMSPD padronizada, o método r- AMMI1 é o melhor, superando o IMLD. Entretanto, utilizando a estatística de Procrustes se encontrou que completando matrizes com ALS(0) se obtém a maior similaridade com relação à matriz de dados originais, também foi mostrado que os cinco métodos considerados têm uma alta correlação entre as imputações e os correspondentes dados reais. Finalmente, recomenda-se utilizar a imputação de dados para a estimação dos parâmetros de um modelo AMMI sob ocorrência de dados ausentes, mas para determinar o número de componentes multiplicativos é preferível tomar a decisão somente sobre a informação observada. / The multienvironment trials are a special type of the two-factor experiments, widely used in genetic improvement of plants, where some cultivars are assessed in diferent locations. Generally, in these studies there is a di¤erential response of cultivars in each location that is called genotype environment interaction, or G x E, which is well explained by the additive main e¤ects and multiplicative interaction models (AMMI). Often the experiments GE may be unbalanced and one or several genotypes were not tested in some locations. Sometimes for the environments recommendations, the researcher may be interested in obtain estimates of those combinations G x E that were not tested and such estimates can be calcu- lated using the information of those combinations that were actually obtained. Additionally to the interest of the researchers in these estimates, the missing data may cause some pro- blems in the classical estimation of parameters in the AMMI models, because the parameter estimation need of a sequential process doing an analysis of variance followed by a singular value decomposition, which can not be calculated if there is a matrix of interaction with missing data. To solve these problems Bergamo (2007) and Bergamo et al. (2008) proposed a new technique using the distribution free multiple imputation (IMLD), and for this reason was decided to evaluate the recent development through the comparison with some methods of imputation that have been used successfully in experiments GE with missing data like the AMMI estimates based on alternating least squares ALS(0), ALS(1) (CALINSKI et al. 1992) and AMMI estimates with robust sub-model r-AMMI1 and r-AMMI2 (DENIS; BARIL, 1992). Thus, was developed a simulation study based on a matrix of true data genotypes (15) environments (27) of the upland cotton variety trials (ensaio estadual de algodoeiro her- báceo) 2000/01 (FARIAS, 2005), doing missed random (10%, 20%, 30%), imputing the data and comparing the methods through the root mean square predictive di¤erence (RMSPD) of the true value, the Procrustes statistic and the Spearman´s ranks correlation coe¢ cient. Also was made an analysis on the choice of the multiplicative components of an AMMI model after imputation on the complete data sets (observed + imputed). The results of the simulation study has shown that according to the distribution of RMSPD standardized, the r-AMMI1 method is better than the IMLD. However, using the Procrustes statistic was found that imputing data matrix with ALS(0), is obtained the greatest similarity related to the true data matrix. The …ve methods considered show high correlation between the true and the imputed missing values. Finally, is recommended using the imputation data for the estimation of the parameters of an AMMI model under the presence of missing data, but for choosing the number of multiplicative terms is preferable take the decision only on the observed information.

Comparação de métodos de estimação de componentes de variância e parâmetros genéticos considerando o delineamento III aplicado a caracteres quantitativos em milho / Comparison of estimation methods for variance components and genetic parameters considering the Design III applied to quantitative characters in maize

Angela Mello Coelho 09 April 2010 (has links)
Esse trabalho teve como objetivo comparar métodos de estimação de componentes de variância e parâmetros genéticos, considerando tanto o delineamento estatístico fatorial instalado em látice quadrado como o delineamento genético III. Como referência, foram utilizados três conjuntos de dados reais, em melhoramento genético de milho, relativos aos caracteres de produção de grãos (gramas por parcela), altura da folha bandeira ao chão (centímetros) e o número de folhas entre a primeira espiga e o pendão; sendo que a altura da folha bandeira e o número de folhas foram obtidos pela média entre cinco plantas competitivas para cada parcela. O método da Análise da Variância (ANOVA), conforme indicado pelo Delineameno III, foi utilizado na análise dos dados e estimação dos componentes de variância relativos ao modelo matemático, variâncias genéticas, coeficiente de herdabilidade e grau médio de dominância para cada um dos três caracteres estudados. Essas estimativas foram utilizadas na simulação de 1000 conjuntos de dados com características semelhantes a cada um dos conjuntos de dado reais considerados. Os métodos da ANOVA e da máxima verossimilhança restrita (REML) foram utilizados na predição dos parâmetros já mencionados para cada um dos conjuntos de dados simulados dentro de cada caráter. As 1000 estimativas obtidas por cada método, para cada caráter estudado, foram utilizadas no cálculo de estatísticas descritivas (média, desvio-padrão e acurácia relativa) e na montagem de gráficos de Box-plot. Utilizando as informações obtidas a partir das estimativas fornecidas por cada método e em posse dos valores reais que essas estimativas deveriam prever (valor utilizado na simulação dos dados) foi possível comparar ambos os métodos quanto à eficiência das estimativas por eles fornecidas. Ambos os métodos apresentaram características semelhantes na predição da maioria dos componentes de variância relativos ao modelo matemático, sendo que as maiores disparidades se deram para os componentes relativos aos efeitos de progênie (?p2) e as interações entre progênie e linhagem (?pt2) e entre progênie, linhagem e ambiente (?pta2); os quais são os componentes de maior peso no cálculo das variâncias e parâmetros genéticos. O método da ANOVA foi o bastante eficiente na predição de ?p2, sendo que o método da REML se aproxima dos resultados obtidos pelo método da ANOVA conforme diminuem os valores de referência para esse componente; para ?pt2 o método da REML se mostrou mais eficiente conforme maior é o valor de referência, porém, perde eficiência e se aproxima do método da ANOVA conforme o valor de referência do componente diminui. Ambos os métodos se mostraram ineficientes na predição de ?pta2, porém o método da REML foi o menos eficiente. O melhor desempenho do método da ANOVA na predição dos componentes de variância de maior peso no cálculo das variâncias genéticas levou a um melhor desempenho desse método na predição de todos os parâmetros genéticos, com exceção da variância de dominância, a qual depende unicamente de ?pt2. Porém, foi observada uma tendência no método da ANOVA, em média, na superestimação do grau médio de dominância em cerca de 45% do seu valor de referência, independentemente do caráter estudado. / This work aimed to compare estimation methods for variance components and genetic parameters, considering the factorial statistical design set in randomized blocks and the genetic Design III. As reference, three sets of real data were used, on maize genetic improvement, related to the characters: grain yield (grams by plot), plant height, measured from the ground to the °ag leaf in centimeters, and the number of leaves above the uppermost ear. The analysis of variance method (ANOVA), accordingly to the proposed by the Design III, was used on the analysis of the data and estimation of the variance components derived from the mathematical model, genetic variances, heritability and average degree of dominance for each of the studied characters. This estimatives were used on the simulation of 1000 data sets with similar characteristics to the real data analyzed. The ANOVA and restricted maximum likelihood (REML) methods were used on the prediction of the already mentioned parameters for each of the simulated data sets within each character. The 1000 estimatives obtained by each method, for each studied character, were used on the calculation of descriptive statistics (mean, standard deviation and relative accuracy) and for the ¯tting of box-plot graphics. Through the information obtained from the estimatives given by each method and in possession of the actual values that they should predict (values used in the simulation of the data sets) it was possible to compare both methods as to the e±ciency of the estimatives given by them. Both methods presented similar characteristics on the prediction of most of the variance components derived from the mathematical model, being that most di®erences were pertinent to the components related to the e®ects of progeny (¾2 p) and to the interactions between progeny and parental inbred (¾2 pt) and between progeny, parental inbred and environment (¾2 pta); which are the components of greater importance on the calculation of the genetic parameters. The ANOVA method was very e±cient on the prediction of ¾2 p, being that the smaller the reference value for this component, more the REML method approached the results obtained by the ANOVA method; for larger values of ¾2 pt the most e±cient was the REML method, but its e±ciency decayed and approached the ANOVA method for smaller reference values for this component. Both methods were poorly e±cient on the prediction of ¾2 pta, but the REML method was the least e±cient. The better performance of the ANOVA method on the prediction of the variance components of greater importance on the calculation of the genetic variances lead to a better performance of the ANOVA method on the prediction of all genetic parameters, with exception to the dominance variance, which depended solely on ¾2 pt. However, it was observed a tendency on the ANOVA method, in average, on the overestimation of the average degree of dominance of around 45% of the actual reference value, independently of the studied character.

Métodos de regressão e uni-multivariado para a redução do número de repetições em experimentos intermediários de um programa de melhoramento de soja. / Regression and uni-multivariate methodologies for reduction of the replication number in experiments of the intermediary phase of a soybean breeding program.

Fernando Toledo Santos de Miranda 28 April 2004 (has links)
A fase intermediária de um programa de melhoramento de soja caracteriza-se pela avaliação de grande número de genótipos (cerca de 100 linhagens) em diversos ambientes, fato que torna esta etapa bastante dispendiosa. A utilização de métodos estatísticos que permitam uma análise da interação genótipos x ambientes (GxE) mais refinada, pode permitir, com o ganho em precisão gerado, uma compensação ao aumento esperado na interação GxE em conseqüência da diminuição do número de repetições nesses experimentos. A metodologia de Eberhart & Russell (1966) (ER) utiliza a regressão linear como ferramenta para modelar a interação GxE, enquanto que a metodologia AMMI utiliza a análise da variância para modelar os efeitos de genótipos e de ambientes e a decomposição de valores singulares para modelar apenas a interação GxE. O objetivo deste trabalho foi avaliar a possibilidade de redução do número de repetições em experimentos com 72 linhagens em delineamento em blocos casualizados com duas repetições subdivididas em conjuntos experimentais (BCCE), conduzidos em quatro locais / épocas de cultivo e três anos agrícolas. Os experimentos foram analisados em BCCE e também em blocos aumentados (BA) considerando-se aleatoriamente uma das duas repetições. Como ferramentas auxiliares foram empregadas as metodologias ER e AMMI. A análise conjunta dos 12 ambientes através da metodologia AMMI foi utilizada como padrão para comparações, através de correlações de Spearman (rs). Em relação a este padrão, a média das rs dos três anos foi estimada em: 54% para as médias dos experimentos em BA; 64% para os experimentos em BCCE; 65% para os experimentos em BA analisados pela metodologia ER; 69% para os experimentos em BCCE analisados pela metodologia ER; 73% para os experimentos em BA analisados pela metodologia AMMI e 74% para os experimentos em BCCE avaliados pela metodologia AMMI. Os resultados obtidos permitiram concluir que as metodologias para o estudo da interação GxE são capazes de aumentar as rs com o padrão, indicando a possibilidade de redução de duas para uma repetição nos experimentos intermediários através do uso de: a) metodologia AMMI ao invés da seleção baseada nas médias das duas repetições; b) metodologia ER (em dois dos três anos avaliados) ao invés da seleção baseada nas médias das duas repetições; c) metodologia AMMI (em dois dos três anos avaliados) ao invés da seleção baseada na metodologia ER. Com a redução do número de repetições (duas para uma) é possível diminuir sensivelmente os custos com a experimentação na fase intermediária de programas de melhoramento. / The intermediary phase of a soybean breeding program involves the evaluation of a large number of genotypes (about 100 lines) in several environments, becoming this a very expensive step. The utilization of statistical methods that allow a refined analysis of the genotype x environment (GxE) interaction, may generate gains in precision as a compensation to the expected increase in the GxE estimate and, thus, to permit the reduction of the replication number. Eberhart & Russell (1966) (ER) methodology utilizes linear regression to study G x E interaction; the AMMI methodology employs the analysis of variance to fit effects of genotypes and environments and singular values decomposition to fit only the GxE interaction. The objective of this research was to evaluate experiments with 72 lines in randomized block design with two replications subdivided in sets with common checks (BCCE); these experiments were carried out in four locations / sow dates during three agriculture years. The experiments were analyzed in BCCE and also in augmented blocks (BA) by considering only one replication taking at random. As auxiliary tools were used ER and AMMI methodologies. The joint analysis of the 12 environments through the AMMI methodology was used as pattern for comparisons through Spearman correlation (rs). In relation to this pattern, the mean of rs in the three years was estimated in: 54% for means of BA experiments, 64% for BCCE experiments, 65% for BA experiments analyzed with ER, 69% for BCCE experiments analyzed with ER methodology, 73% for BA experiments analyzed with AMMI methodology and, 74% for BCCE experiments analyzed with AMMI methodology. The results indicated that the application of auxiliary methods for understanding GxE interaction were able to increase the rs with the pattern, opening the possibility for reducing the replication number in the experiments of the intermediary steps of soybean breeding programs. In conclusion, it was verified the possibility to reduce from two (BCCE) by one (BA) replication by using the following auxiliary methods of analysis: a) AMMI method instead of means of two replications as the unique selection criterion; b) ER method (in two of the three evaluated years) instead of means of two replications as the unique selection criterion; c) AMMI method (in two of the three evaluated years) instead of selection as based on ER method. The reduction from two to one replication makes possible to lower reasonably the experimental costs during the intermediary step of breeding programs.

Estruturação da comunidade de trepadeiras em uma floresta estacional semidecídua / Community structure of climbing plants in a seasonal semideciduos forest

Van Melis, Juliano, 1981- 28 January 2013 (has links)
Orientador: Fernando Roberto Martins / Tese (doutorado) - Universidade Estadual de Campinas, Instituto de Biologia / Made available in DSpace on 2018-08-23T02:32:50Z (GMT). No. of bitstreams: 1 VanMelis_Juliano_D.pdf: 2552550 bytes, checksum: 8227a941fa221a10cce8b272ae92449f (MD5) Previous issue date: 2013 / Resumo: Apesar da importância que as trepadeiras apresentam em florestas tropicais, estudos sobre a montagem da comunidade de lianas (trepadeiras lenhosas e sublenhosas) que investiguem desde a contribuição dos fatores abióticos e bióticos até fatores intrínsecos (coexistência entre indivíduos) são escassos. O objetivo geral desta tese é pesquisar a estruturação da comunidade das espécies de lianas em uma Floresta Estacional Semidecídua (FES), investigando (1) a importância relativa dos fatores ambientais e espaciais para diferentes espécies de lianas, (2) a estruturação filogenética da comunidade de trepadeiras em diferentes ambientes, e (3) os efeitos diretos ou mediados das árvores e arbustos para o número de espécies e indivíduos de trepadeiras. Mostramos que (1) grande parte da variação na composição de espécies de lianas em uma FES é devido a fatores não investigados (fatores estocásticos) e o espaço (autocorrelação espacial). Portanto, concluímos que os maiores determinantes na variação da composição de espécies de lianas em uma FES é a aleatoriedade (sendo reflexo da variação estocástica das populações) e a limitação por dispersão (demonstrada pela alta autocorrelação espacial). No segundo capítulo (2), encontramos que uma maioria discreta das parcelas apresentou maior aproximação filogenética do que o esperado ao acaso na comunidade de trepadeiras amostrada. Houve pouca influência de variáveis relacionadas à dinâmica florestal na variação da aproximação filogenética, sendo que áreas com árvores mais altas e maior proporção de árvores do presente apresentavam maior aproximação filogenética que outras áreas. Concluímos que em áreas de dossel mais baixo e menor proporção de árvores do presente (clareiras) não apresentam menor sinal filogenético, pois todas as espécies de lianas apresentariam potencial de existirem nestas áreas, enquanto que nas áreas de floresta madura haveria a existência de filtros ambientais para a existência de poucos ramos filogenéticos. Por último (3), encontramos que os atributos da comunidade de árvores e arbustos são fatores importantes na variação dos atributos da comunidade de lianas, sendo parte dele decorrente do distúrbio no dossel. Mas o distúrbio no dossel como fator direto é mais importante na variação da abundância e número de espécies de lianas em uma Floresta Estacional Semidecídua / Abstract: Despite the fact that climbing plants present in tropical forests, studies which investigate the contribution of abiotic and biotic factors or intrinsic factors (coexistence between individuals) on community assembly of lianas (woody and sub-woody climbers) are scarce. The overall objective of this thesis is to research the community structure of liana species in a Seasonal Semideciduous Forest (SSF), investigating (1) the relative importance of environmental and spatial factors on community assembly of lianas, (2) the phylogenetic structure of climbing plants community along the forest development (treefall gaps to old-growth forest), and (3) the direct or indirect effects of trees and shrubs for the number of species and individuals of climbing plants. We show that (1) much of the variation in species composition of lianas in a SSF is due to stochastic factors and space. Therefore, we conclude that the major determinants of variation in lianas' species composition in a TSF are stochastic variance of populations, shown by the unexplained factors, and dispersion limitation, shown by spatial autocorrelation. In the second chapter (2), we found that a slight majority of the sample plots showed cluster phylogenetic structure in the climbing plants community. There was a slight influence of variables related to forest dynamics in the variation of the phylogenetic structure, and areas with tall trees and higher proportion of present trees had higher values of clustering in phylogenetic structure than other areas. We conclude that in areas of lower canopy and smaller proportion of present trees (treefall gaps) showed few phylogenetic branches, since all species of climbing plants would be existing in these areas, while areas of old-growth forest would demonstrate environmental filters for the climbing plants. Finally, we also found (3) that the community of trees and shrubs' attributes (abundance and species richness) are important factors in the variation of attributes liana community (species richness and abundance), being part of it due to the canopy disturbance. But canopy disturbance was the more important direct factor in variance of abundance and species richness of lianas in a Seasonal Semideciduous Forest / Doutorado / Doutor em Biologia Vegetal

Modelo de juntas soldadas por FSW utilizando métodos de aprendizagem de máquina através de dados experimentais / Welded joint model by FSW using machine learning methods through experimental data

Arcila Gago, Manuel Felipe, 1987- 23 August 2018 (has links)
Orientador: Janito Vaqueiro Ferreira / Dissertação (mestrado) - Universidade Estadual de Campinas, Faculdade de Engenharia Mecânica / Made available in DSpace on 2018-08-23T16:12:48Z (GMT). No. of bitstreams: 1 ArcilaGago_ManuelFelipe_M.pdf: 7192169 bytes, checksum: 7b23a08769656a07765344e20d1f6ad4 (MD5) Previous issue date: 2013 / Resumo: A variedade de materiais no setor aeronáutico para redução de peso e custo tem se proliferado a um grau intensivo, onde têm sido revisadas diferentes pesquisas para encontrar outros tipos de materiais de fácil maneabilidade para construção de peças que satisfazem as restrições impostas. Assim, existe uma procura constante de soluções para facilitar a produção, e ao mesmo tempo aumentar a segurança das aeronaves levando em consideração pontos importantes como a fadiga e ruptura do material. Um material frequentemente utilizado que atende a estes requisitos devido a suas propriedades de densidade e resistência é o alumínio, e é neste ambiente que existe um processo de manufatura utilizado para a soldagem conhecido como "Friction Stir Welding" (FSW). No presente momento, estudos para criação de modelos que representem características mecânicas utilizadas em projetos em função de parâmetros do processo tem sido pesquisados. Embora este processo seja de difícil modelagem devidos as suas complexidades, tem sido estudado e utilizado diferentes algoritmos que possibilitem o melhoramento da representação do modelo, tais como os relacionados com máquinas de aprendizagem (ML) e suas diferentes otimizações. Neste contexto, a presente pesquisa tem seu foco na obtenção de um modelo baseado no algoritmo de aprendizagem de Máquina de Vetores de Suporte (SVM), e também com outros algoritmos tais como Regressão Polinomial (RP) e Rede Neural Artificial (RNA), buscando encontrar modelos que representem o processo de soldagem por FSW através das propriedades mecânicas obtidas pelos ensaios de tração e por análise de variância (ANOVA), entendendo suas vantagens e, posteriormente, recomendar quais dos algoritmos de aprendizagem tem maior beneficio / Abstract: In the aerospace industry to reduce weight and cost, a great quantity of materials has been used, which has generated research to find types of materials, that have been better maneuverability and to guarantee the properties required to development of pieces for the industry. Thus, the studies look for optimize between production easiness and increase the aircraft safety, taking into consideration important issues such as fatigue and fracture of the materials. One of the most common approach used is aluminum by their mechanical properties (density and strength), although it has many problems to be welding with the traditional methods. Currently, the Friction Stir Welding (FSW) process is used in the industry, as well in the academy. However, the FSW is difficult to model by the complexities in the physical phenomenal occurred during the weld process, as result, has been studied and used different algorithms that allow enhance the model representation. The Machine Learning (ML) is a methodology studied to obtain the model optimized. In this context, the present research focus by to obtain a model-based in learning algorithm using Support Vector Machine (SVM). Although comparisons were made with other algorithms such as Polynomial Regression (PR) and Artificial Neural Network (ANN), searching to find models that represent the FSW process weld using the mechanical properties obtained by tensile tests and analysis of variance (ANOVA). Finally, conclusions to understand the advantages learning algorithms are presented / Mestrado / Mecanica dos Sólidos e Projeto Mecanico / Mestre em Engenharia Mecânica

O uso de ondaletas em modelos FANOVA / Wavelets FANOVA models

Kist, Airton, 1971- 19 August 2018 (has links)
Orientador: Aluísio de Souza Pinheiro / Tese (doutorado) - Universidade Estadual de Campinas, Instituto de Matemática, Estatística e Computação Científica / Made available in DSpace on 2018-08-19T09:39:03Z (GMT). No. of bitstreams: 1 Kist_Airton_D.pdf: 4639620 bytes, checksum: 2a0cc586e73dd5d71aa0eacf07be101d (MD5) Previous issue date: 2011 / Resumo: O problema de estimação funcional vem sendo estudado de formas variadas na literatura. Uma possibilidade bastante promissora se dá pela utilização de bases ortonormais de wavelets (ondaletas). Essa solução _e interessante por sua: frugalidade; otimalidade assintótica; e velocidade computacional. O objetivo principal do trabalho é estender os testes do modelo FANOVA de efeitos fixos, com erros i.i.d., baseados em ondaletas propostos em Abramovich et al. (2004), para modelos FANOVA de efeitos fixos com erros dependentes. Propomos um procedimento iterativo tipo Cocharane-Orcutt para estimar os parâmetros e a função. A função é estimada de forma não paramétrica via estimador ondaleta que limiariza termo a termo ou estimador linear núcleo ondaleta. Mostramos que, com erros i.i.d., a convergência individual do estimador núcleo ondaleta em pontos diádicos para uma variável aleatória com distribuição normal implica na convergência conjunta deste vetor para uma variável aleatória com distribuição normal multivariada. Além disso, mostramos a convergência em erro quadrático do estimador nos pontos diádicos. Sob uma restrição é possível mostrar que este estimador converge nos pontos diádicos para uma variável com distribuição normal mesmo quando os erros são correlacionados. O vetor das convergências individuais também converge para uma variável normal multivariada / Abstract: The functional estimation problem has been studied variously in the literature. A promising possibility is by use of orthonormal bases of wavelets. This solution is appealing because of its: frugality, asymptotic optimality, and computational speed. The main objective of the work is to extend the tests of fixed effects FANOVA model with iid errors, based on wavelet proposed in Abramovich et al. (2004) to fixed effects FANOVA models with dependent errors. We propose an iterative procedure Cocharane-Orcutt type to estimate the parameters and function. The function is estimated through a nonparametric wavelet estimator that thresholded term by term or wavelet kernel linear estimator. We show that, with iid errors, the individual convergence of the wavelet kernel estimator in dyadic points for a random variable with normal distribution implies the joint convergence of this vector to a random variable with multivariate normal distribution. Furthermore, we show the convergence of the squared error estimator in the dyadic points. Under a restriction is possible to show that this estimator converges in dyadic points to a variable with normal distribution even when errors are correlated. The vector of individual convergences also converges to a multivariate normal variable / Doutorado / Estatistica / Doutor em Estatística


Zanella, Andreia 03 April 2008 (has links)
The search for education quality has emerged so growing in recent years. It has noticed a major concern before the current educational picture by the society, government, professors and students. This study searched to evaluate the satisfaction of the students of the Department of Statistics of the Federal University of Santa Maria about the professors perfomance, the infrastructure offered to the discipline of Statistics, it is also evalvate the degree of importance assigned by the student to these aspects. The development of the work is based on literature research and field, with qualitative approach. The data collection was conducted through a closed questionnaire, based on the Likert scale, with responses ranging into five levels of satisfaction/importance. For the data analysis, was used the tools of multivariate analysis, including cluster analysis (which has summarized the information in profiles of some groups formed by courses that had a similar behavior) and factor analysis (which enabled the validation of a research tool). It was used even the descriptive statistics for characterization of the courses and analysis of variance that allowed verify the difference among the answers to the questions by each group of courses. During the evaluation about the satisfaction with the work of the professor, the infrastructure and the discipline, could be observed that the issues presented the group 4, with Zootechnics, Archivist and Electrical Engineering courses, with a higher level of satisfaction. In the opposite, it has been the group 2, formed by Psychology and Odontology with the lowest levels of satisfaction. In some variables, the group 3, formed by Economics, Social Sciences, Geography, Chemical Engineering, Agriculture, Pharmacy, Medicine, Administration and Veterinary Medicine, showed up statistically equal to the group 4. For the other issues, the group 1, formed by Forestry Engineering, Civil Engineering, Physical Education and Computer Science and group 3 had an intermediary degree of satisfaction. In evaluating the importance of variables, could be noticed a good degree of importance gave to these variables by all groups of courses. The validation of the questionnaire of satisfaction suggested the elimination of two variables that had little relevance. The twenty-one other variables in the instrument were grouped into four distinct groups of variables: didactic-pedagogic capacity of the professor; organization/ responsibility presented by the professor; infrastructure offered, and discipline of Statistics, providing greater uniformity among the variables within each group. / A busca por qualidade na educação tem surgido de forma crescente durante os últimos anos. Percebe-se uma maior preocupação diante do atual quadro educacional por parte da sociedade, governo, professores e alunos. A presente pesquisa buscou avaliar a satisfação dos alunos do Departamento de Estatística da Universidade Federal de Santa Maria quanto à atuação do professor, à infra-estrutura oferecida e à disciplina Estatística. É avaliado também o grau de importância atribuído pelo aluno a estes aspectos. O desenvolvimento do trabalho constitui-se de pesquisa bibliográfica e de campo, com abordagem qualiquantitativa. A coleta dos dados foi realizada por meio de um questionário fechado, baseado na escala Likert, com respostas variando em cinco níveis de satisfação/importância. Para análise dos dados, recorreu-se às ferramentas da análise multivariada, entre elas, a análise de agrupamento (que possibilitou resumir a informação em perfis de alguns grupos formados pelos cursos que apresentaram um comportamento similar) e a análise fatorial (que possibilitou a validação do instrumento de pesquisa). Utilizou-se ainda a estatística descritiva para caracterização dos cursos e a análise de variância que possibilitou verificar a diferença entre as respostas atribuídas às questões por cada grupo de cursos. Na etapa de avaliação da satisfação quanto ao trabalho do professor, à infra-estrutura e à disciplina, pôde-se observar que as questões apresentaram o grupo 4, composto pelo cursos de Zootecnia, Arquivologia e Engenharia Elétrica, com um nível mais elevado de satisfação. No oposto, tem-se o grupo 2, formado pelos cursos de Psicologia e Odontologia com os menores graus de satisfação. Em algumas variáveis, o grupo 3, formado pelos cursos de Economia, Ciências Sociais, Geografia, Engenharia Química, Agronomia, Farmácia, Medicina, Administração e Medicina Veterinária, mostrou-se estatisticamente igual ao grupo 4. Para as demais questões, o grupo 1, formado pelos cursos de Engenharia Florestal, Engenharia Civil, Educação Física e Ciência da Computação e o grupo 3 apresentaram-se em um grau intermediário de satisfação. Na avaliação da importância das variáveis, pôde-se notar um bom grau de importância atribuído a tais variáveis por todos os grupos de cursos. A validação do questionário de satisfação sugeriu a eliminação de duas variáveis que apresentaram pouca relevância. As vinte e uma variáveis restantes no instrumento ficaram agrupadas em quatro grupos distintos de variáveis: Capacidade didático-pedagógica do professor; organização/responsabilidade apresentada pelo professor; infraestrutura oferecida; e, disciplina de Estatística, proporcionando maior homogeneidade entre as variáveis dentro de cada grupo.

An investigation into the relationship between satisfaction with life and sense of coherence amongst the unemployed

Mankayi, Dolphia Thozama January 1996 (has links)
Magister Commercii (Industrial Psychology) - MCom(IPS) / The present study investigated the relationship between the Sense Of Coherence and Satisfaction With Life amongst the unemployed. The study attempted to test the following hypotheses. 1. People with a high Sense Of Coherence tend to be satisfied with their lives in general. 2. Demographic variables such as age, gender, race and level of education have an influence on the subjects' scores on the Sense Of Coherence and Satisfaction With Life scales. 3. Length of unemployment has an impact on the subjects' Sense Of Coherence and Satisfaction With Life. In this study, subjects were drawn from the Department of Manpower in the Western Cape region. The data were obtained from a sample of 100 participants. Of this 100, 52 were males. Subjects were asked to complete the Sense Of Coherence and the Satisfaction With Life scales. Statistical procedures that were used are Multiple Linear Regression analysis, Product Moment Correlational Co-efficients, Analysis of Variance test (ANOVA) and the Cronbach Alphas of the various scales. It was found that Sense Of Coherence correlated significantly with Satisfaction With Life, thus supporting the first hypothesis. This led to the conclusion that a person with a strong Sense Of Coherence tends to be more satisfied with his/her life. However, a person with a weaker Sense Of Coherence finds it difficult to make sense out of his/her life. It was also found that most of the demographic variables did not reach any statistical significance. The general trend in this sample was that younger people had higher education and had been unemployed for fewer years. In comparison, older people were found to have less education and had been unemployed for more years. It was concluded that formal and informal education system will be necessary to develop and equip both young and older people with the experience and skills to use at work. This study was concluded by the discussion of the implications of the findings and suggestions for future research.

Investigating innovation : measurement, standardization and practical application

Boonzaaier, Gerhardus Petrus 29 April 2010 (has links)
Growing competition, globalisation and changing circumstances make innovation a prerequisite for the growth, success and survival of any private or public organisation. While innovation in technology, production, marketing and finance all remain essential, it is innovation in management that is most desperately in short supply. A literature study could not reveal the existence of any scale that measures all the factors and processes relevant to organisational innovation. A scale for managerial innovation was developed. This scale is based on the work of various researchers in the field of innovation. The major tasks in the process were connected to the structural arrangements and social patterns that facilitate the tasks are discussed. Innovation consists of a set of processes carried out at the micro-level, by individuals and groups of individuals, and these micro-processes are in turn stimulated, facilitated and enhanced - or the opposite - by a set of macro-structural conditions. A semantic differential scale was developed to measure managerial innovation. The scale consists of 88 items and was designed to reflect the major factors and processes of organisational innovation. Various statistical tests were used to evaluate the scale and data obtained through the scale. Five Factors were identified after the data was analysed using factor analysis. The five factors are Factor 1 (leadership and culture), Factor 2 (employee acquisition and development), Factor 3 (variables that facilitate problem solving and aid in innovation), Factor 4 (variables that impact negatively on innovation), and Factor 5 (variables external to the organisation that influence innovation). The Alpha Cronbach test for reliability showed a very high degree of reliability and the scale conformed to the criteria of content validity. Analysis Of Variance (ANOVA) was used to perform comparative analysis on the biographical variables. The relationships between age, gender, level of education, industry, length of service, and the combined effect of age and gender, age and length of service, gender and industry, and gender and length of service and the five factors were analysed. Age seems to play a significant role in Factor 1 and Factor 2 (i.e. leadership and culture as well as employee acquisition and development). For Factor 1 and Factor 2 average achievement in terms of innovation seems to increase with age. With regard to Factor 3, 4 and 5 age does not seem to impact on achievement significantly. The results of this study indicate that there are no significant relationship between gender and innovation. The results of this study indicate that there is a positive relationship between level of education and innovation for Factors 3, 4 and 5. It was found to differ significantly between the levels for two factors, namely Factor 1: leadership and culture, and Factor 2: employee acquisition and development. They seem to decline as the level of education increases. The results of this study indicate that for all five factors there seem to be a very significant difference in average achievement when individuals from different industries are compared. The results of this study indicate that there is not a significant relationship between length of service and innovation. The ANOVA results for combined variables indicate a significant difference in average achievement Factor 1 (leadership and culture) when the research participants are grouped based on both age and gender. In general, males of any age group tested equal to or higher than their female counterparts for Factor 1. Also apparent from the results is that generally the scores for Factor 1 seemed to increase with age. For Factor 2, 3, 4, and 5 there is no significant difference in achievement when participants are grouped according to age and gender. The results of the tests for difference in achievement when the research participants are grouped according to age and length of service, do not indicate that there is any significant difference in average achievement between the groups. / Thesis (PhD)--University of Pretoria, 2009. / Human Resource Management / unrestricted

Účinnost plánovaného experimentu / Effectiveness of DOE

Pfefferová, Alena January 2008 (has links)
Diplomová práce se zabývá plánováním a analýzou experimentu. Je zde zkoumán vliv počtu centrálních bodů v plánu experimentu na nalezení významných faktorů procesu. Pro určení tohoto vlivu je použita metoda Monte Carlo, pomocí které hledáme míru nalezení významných faktorů procesu. Simulace experimentu je vytvořena v programu MATLAB, kde se především využívá Statistics toolbox pro generování náhodných čísel. V závěru je zhodnoceno a graficky ukázáno, jak je určení významnosti faktoru procesu závislé na počtu uvažovaných faktorů experimentu a na počtu měření v centrálním bodě.

