Global ETD Search

151	Teste estatístico para contribuição de genótipos e ambientes na matriz de interação GE / Statistical test for contribution in the interaction matrix of genotypes and environments Mirian Fernandes Carvalho Araújo 21 July 2008 (has links) O presente trabalho teve por objetivos propor um método para testar a contribuição de cada genótipo e ambiente para a interação genótipos X ambientes em ensaios multi-ambientais através de um teste F e implementar uma rotina computacional para a realização da análise de dados segundo o teste proposto. O estudo avalia quatro conjuntos de dados, cada um com diferentes números de genótipos dentro de ambientes com quatro blocos. Para um dos conjuntos, simulou-se as somas de quadrados das linhas (genótipos) e colunas (ambientes) da matriz de interação genótipos X ambientes (GE) gerando 500, 5000 e 10000 experimentos para verificar a distribuição empírica. Os resultados indicaram um ajuste à distribuição qui-quadrado não-central para as linhas e colunas da matriz de interação GE, verificados também pelo teste de Kolmogorov-Smirnov e o gráfico QQplot. Na aplicação do teste F proposto aos quatro conjuntos de dados, identificou-se os genótipos e ambientes que contribuiram mais para a interação genótipos X ambientes. Dessa forma, os melhoristas podem selecionar bons genótipos e ambientes nos seus estudos. / The objective of the present work was to propose a method for testing the con- tribution of each element in a genotypes X environments interaction using multi-environment analyses by means of an F test and implementation of a computational routine to analyze the data according to the test proposed. The study evaluated four data sets, each with a di®erent number of genotypes and environments, in a block design with four repetitions. In one group, the sum of squares within rows (genotypes) and columns (environments) of the genotypes X environments (GE) matrix was simulated, generating 500, 5000 and 10000 experiments to verify the empirical distribution. Results indicate a non-central chi-squared distribution for rows and columns of the GE interaction matrix, which was also verified by the Kolmogorov-Smirnov test and QQplot graph. Application of the F test to the four data sets identified the genotypes and environments that contributed the most to the genotypes X environments interaction. In this way, geneticists can select good genotypes and environments in their studies. Análise de dados Distribuição qui-quadrada Genética estatística Genótipos. Genotypes X environments interaction Modified F test. Non-central chi-squared distribution
152	Minerafórum : um recurso de apoio para análise qualitativa em fóruns de discussão Azevedo, Breno Fabrício Terra January 2011 (has links) Esta tese aborda o desenvolvimento, uso e experimentação do MineraFórum. Trata-se de um recurso para auxiliar o professor na análise qualitativa das contribuições textuais registradas por alunos em fóruns de discussão. A abordagem desta pesquisa envolveu técnicas de mineração de textos utilizando grafos. As interações proporcionadas pelas trocas de mensagens em um fórum de discussão representam uma importante fonte de investigação para o professor. A partir da análise das postagens, o docente pode identificar quais alunos redigiram contribuições textuais que contemplam conceitos relativos ao tema da discussão, e quais discentes não o fizeram. Desta forma, é possível ter subsídios para motivar a discussão dos conceitos importantes que fazem parte do tema em debate. Para atingir o objetivo do presente estudo, foi necessário realizar uma revisão da literatura onde foram abordados temas como: a Educação a Distância (EAD); Ambientes Virtuais de Aprendizagem; os principais conceitos da área de Mineração de Textos e, por último, trabalhos correlacionados a esta tese. A estratégia metodológica utilizada no processo de desenvolvimento do MineraFórum envolveu uma série de etapas: 1) a escolha de uma técnica de mineração de textos adequada às necessidades da pesquisa; 2) verificação da existência de algum software de mineração de textos que auxiliasse o professor a analisar qualitativamente as contribuições em um fórum de discussão; 3) realização de estudos preliminares para avaliar a técnica de mineração escolhida; 4) definição dos indicadores de relevância das mensagens; elaboração de fórmulas para calcular a relevância das postagens; 5) construção do sistema; 6) integração do MineraFórum a três Ambientes Virtuais de Aprendizagem e, por último, 7) a realização de experimentos com a ferramenta. / This thesis presents the development, use and experimentation of the MineraFórum software. It is a resource that can help teachers in doing qualitative analyses of text contributions in discussion forums. This research included the use of text mining techniques with graphs. Message exchange in discussion forums are an important source of investigation for teachers. By analyzing students’ posts, teachers can identify which learners wrote contributions that have concepts related to the debate theme, and which students did not succeed to do so. This strategy may also give teachers the necessary elements to motivate discussion of concepts relevant to the topic being debated. To accomplish the objectives of this study, a review of the literature was carried on topics such as: Distance Learning; Virtual Learning Environments; main concepts in Text Mining; and studies related to this thesis. The methodological strategy used in the development of MineraFórum followed these steps: 1) choosing a text mining technique suitable to the needs of the research; 2) checking whether there was software available to help teachers to do qualitative analysis of contributions in discussion forums; 3) doing preliminary studies to evaluate the selected mining technique; 4) defining indicators of relevance in the messages; elaborating formulas to calculate relevance in posts; 5) building the system; 6) integrating MineraFórum to three Virtual Learning Environments, and 7) carrying experiments with the tool. Computador na educação Fórum de discussão Ambiente virtual Ambiente de aprendizagem Análise de dados Text mining Discussion forum Qualitative analysis Thematic relevance Virtual learning environments
153	Group recommendation strategies based on collaborative filtering Ricardo de Melo Queiroz, Sérgio January 2003 (has links) Made available in DSpace on 2014-06-12T15:59:01Z (GMT). No. of bitstreams: 2 arquivo4812_1.pdf: 2843132 bytes, checksum: cf053779fad5d73c77a2b107542256b3 (MD5) license.txt: 1748 bytes, checksum: 8a4605be74aa9ea9d79846c1fba20a33 (MD5) Previous issue date: 2003 / Ricardo de Melo Queiroz, Sérgio; de Assis Tenório Carvalho, Francisco. Group recommendation strategies based on collaborative filtering. 2003. Dissertação (Mestrado). Programa de Pós-Graduação em Ciência da Computação, Universidade Federal de Pernambuco, Recife, 2003. Recommendations for groups Recommender systems Collaborative filtering symbolic data analysis Information filtering Recomendação para grupos Sistemas de recomendação Filtragem colaborativa Análise de dados simbólicos Filtragem de informação
154	Extensões e aplicações de redes neuro-imunológicas / Extensions and applications of neuro-immune network Knidel, Helder 04 October 2006 (has links) Orientadoesr: Fernando José Von Zuben, Leandro Nunes de Castro / Dissertação (mestrado) - Universidade Estadual de Campinas, Faculdade de Engenharia Elétrica e de Computação / Made available in DSpace on 2018-08-17T00:46:41Z (GMT). No. of bitstreams: 1 Knidel_Helder_M.pdf: 7578387 bytes, checksum: d653b5bd7e4bf2758525ced52374d42d (MD5) Previous issue date: 2006 / Resumo: Esta dissertação propõe a extensão e desenvolvimento de ferramentas imuno-inspiradas. As ferramentas desenvolvidas destinam-se à resolução de problemas de agrupamento e classificação de dados com atributos binários ou reais. Inspirados em idéias advindas do sistema imunológico, os algoritmos propostos apresentam robustez e soluções parcimoniosas. Uma característica comum presente nas ferramentas desenvolvidas é a definição automática do número de protótipos por meio de estágios de clonagem e poda. Baseado na projeção de protótipos, empregando uma técnica de escalonamento multidimensional, desenvolveu-se uma ferramenta de visualização de redes imunológicas com dados numéricos multivariados, com o propósito de obter uma descrição da estrutura global dos grupos, visualizar a presença e forma de grupos, descobrir protótipos pouco representativos e identificar outliers. Por fim, a aplicação de um algoritmo proposto em conjunto com uma heurística desenvolvida e um algoritmo de busca local iterativa solucionou de forma inovadora um problema relacionado à área de equalização de canais em telecomunicações / Abstract: This thesis considers the extension and development of immune-inspired tools. The developed tools are devoted to the resolution of clustering and classification problems with binary or real-valued data attributes. Inspired by ideas of the immune system, the considered algorithms have produced robust and parsimonious solutions. A common feature in the developed tools is the automatic definition of the number of prototypes by means of cloning and pruning stages. Based on the projection of prototypes, using a technique of multidimensional scaling, a visualization tool of immune networks with multivariate numerical data was developed, making it possible to get a description of the global structure of the groups, to visualize the presence and form of groups, to discover low representative prototypes and to identify outliers. Finally, a device composed of one of the tools considered above, a dedicated heuristic and an algorithm for iterative local search was developed. The application of this device solved in an innovative way a problem related to channel equalization / Mestrado / Engenharia de Computação Redes neurais (Computação) Mineração de dados (Computação) Análise de dados Inteligência artificial Immune systems Artificial neural networks Data mining Data analysis
155	O efeito de fatores institucionais no incremento da arrecadação do ISSQN nos municípios de médio e grande porte do Nordeste Couto, Felipe Mascarenhas 23 February 2018 (has links) Fundação de Apoio a Pesquisa e à Inovação Tecnológica do Estado de Sergipe - FAPITEC/SE / The Tax on Services of any nature, is the main tax tribute collected by most of the municipalities of the Northeast, it is interesting to discuss the factors that drive their collection, without there being an immediate burden on the population (rate increase). The objective of this work is to analyze the effect of institutional factors on the collection of the Tax on Services of any Nature (ISSQN) in the medium and large municipalities of the Northeast region. Therefore, the vision of the new institutional economy, which conceptualizes the institutions and presents the institutional factors that will promote the growth of a country or region, will be presented as a theoretical reference. The other part of the theoretical framework presents the concepts of taxation theory until the characteristics and transformations of the Brazilian tax system, the municipal tax systems, and, in particular, the ISSQN, are reached. As empirical strategy, panel data analysis was used, measuring the impact of institutional factors through dummy variables. It was observed that the institutional factors, besides guaranteeing good institutional relations, also affects the collection, being that in the majority of the studied factors, in a positive way. / O Imposto sobre Serviços de Qualquer Natureza, é o principal tributo próprio arrecadado pela maioria dos municípios do Nordeste, é interessante a discussão dos fatores que impulsionam a sua arrecadação, sem que haja ônus imediato para a população (aumento de tarifa). O objetivo deste trabalho é analisar o efeito de fatores institucionais sobre a arrecadação do Imposto sobre Serviços de Qualquer Natureza (ISSQN) nos municípios de médio e grande porte da região Nordeste. Para tanto, será apresentado como referencial teórico a visão da nova economia institucional, que conceitua as instituições e apresenta os fatores institucionais que venham a promover o crescimento de um país ou região. A outra parte do referencial teórico apresenta os conceitos da teoria da tributação até chegar as características e transformações do sistema tributário brasileiro, dos sistemas tributários municipais, e, em particular, do ISSQN. Como estratégia empírica utilizou-se a análise de dados em painel, mensurando o impacto dos fatores institucionais através de variáveis dummy. Observou-se que os fatores institucionais, além de garantir boas relações institucionais, também afeta a arrecadação, sendo que na maioria dos fatores estudados, de forma positiva. / São Cristóvão, SE ISSQN Análise de dados em painel Nordeste Tax on services of any nature Institutions Data analysis in panel Northeast (Brazil) CIENCIAS SOCIAIS APLICADAS::ECONOMIA
156	Analise do desempenho de escolas publicas cicladas e não cicladas pertencentes ao ensino fundamental / Analysis of the performance of public schools cycles belonging to the elementary school Almeida, Ivanete Bellucci 14 August 2018 (has links) Orientadores: Luiz Carlos de Freitas, Sueli Carrijo Rodrigues / Tese (doutorado) - Universidade Estadual de Campinas, Faculdade de Educação / Made available in DSpace on 2018-08-14T17:52:21Z (GMT). No. of bitstreams: 1 Almeida_IvaneteBellucci_D.pdf: 8095925 bytes, checksum: 5fa53a1b0cafbc3ac03539e6f70c5795 (MD5) Previous issue date: 2009 / Resumo: Nossa pesquisa mediu a eficiência das escolas públicas cicladas e não cicladas do ensino fundamental, centrando-se nos municípios de Campinas, Belo Horizonte e Rio de Janeiro. Criamos variáveis categorizadas para entender a influência do trabalho pedagógico do professor em relação ao tipo de escola (ciclada e não ciclada) e, simultaneamente, interessou-nos associar esse trabalho pedagógico com um fator que, juntamente com as variáveis de proficiência média em leitura e matemática e a variável nível socioeconômico, tornaram-se determinantes para estabelecer a eficiência das escolas. Também foram igualmente observadas as aplicações de instrumentos compostos por itens utilizados ao longo do projeto GERES em períodos diferentes, os quais determinaram os impactos no desempenho da aprendizagem. Essas aplicações de instrumentos pré-testados e organizados em cadernos de testes de leitura e matemática respeitaram três fases distintas: a de março de 2005, considerada como fase diagnóstica (entrada de dados), e duas outras, a de novembro de 2005 e novembro de 2006, consideradas como de avaliações de desempenho (resultados esperados). Outros instrumentos de coleta de dados foram utilizados para diagnosticar as condições familiares, escolares e da sala de aula durante as etapas de aplicação dos testes. Enriquecendo esses processos, nossa pesquisa apresentou uma contribuição à avaliação de desempenho das escolas públicas, baseada na interação de técnicas multivariadas de dados, notadamente a partir da Análise Fatorial (AF) e da seleção das variáveis mais significativas para a aplicação da metodologia de Análise por Envoltória de Dados (DEA) nesse universo pesquisado. O uso crescente dessa técnica tem sido justificado pelas várias possibilidades de análise de dados que a metodologia apresenta. Tanto a facilidade de uso como a de elaboração de cenários podem ser considerados alguns dos motivos que fizeram com que a técnica fosse cada vez mais aplicada. O modelo DEA facilita a identificação de escolas eficientes e não eficientes e desse modo estabelecer comparações entre as cicladas e não cicladas. Por meio da Análise por Envoltória de Dados foi possível identificar uma baixa discriminação entre as escolas cicladas e não cicladas, portanto, não pudemos afirmar categoricamente que as escolas cicladas ensinam mais do que as não cicladas, mas podemos destacar entre as nossas conclusões, nesta base de dados, que as proficiências médias das escolas cicladas são significativamente maiores do que das não cicladas. Esse resultado não pode ser extrapolado para todas as escolas do ensino fundamental, pois não trabalhamos com uma amostra que representa fielmente o sistema educacional brasileiro; o trabalho pedagógico do professor, associado às proficiências médias das escolas nos testes de leitura e matemática e os seus respectivos níveis socioeconômicos, neste caso analisados pelo estudo longitudinal, valorizou o agrupamento das nossas análises no contexto educacional. / Abstract: Our research measured the efficiency of the cycles education system schools (schools organized by cycles of learning) and the grades system schools (traditional system organized by grades) of elementary public education concentrating in the cities of Campinas, Belo Horizonte and Rio de Janeiro. We created categorized variables so as to understand the influence of the pedagogical work of the teacher in relation to the type of school (cycles system and grades system) and, simultaneously, we were interested in associating this pedagogical work with a factor that, together with the medium proficiency variables in reading and mathematics and the socioeconomic level variable, became determining to establish the schools' efficiency. Also, the applications of instruments composed by items used in the course of GERES Project in different periods were equally observed, which determined the impacts on the learning performance. The applications of these instruments, pre-tested and organized in reading and mathematics tests notebooks, respected three distinct phases: the March, 2005 one, considered as the diagnosis phase (data input) and two others, the November 2005 and the November 2006, considered as performance evaluation (expected results) phases. Other data collection instruments were used to diagnose families, schools and classrooms conditions during all the test application stages. Enriching those processes, our research contributed to the performance evaluation of public schools based on the interaction of data multivariable techniques, especially from the Factorial Analysis (AF) and from the selection of the most significant variables for the application of the Data Envelopment Analysis (DEA) methodology in the researched universe. The increasing use of this technique has been explained by the several data analysis possibilities that the methodology allows. Both the easiness to use it and to work out scenarios can be considered some of the reasons which allowed the technique to be more frequently applied. The DEA model makes it easy to identify the efficient and the non-efficient schools thus establishing comparisons between the cycles education system and the grades one. By means of the Data Envelopment Analysis it was possible to observe low prejudice between the cycles system and grades system schools, therefore, we could not categorically state that cycled system schools teach more than grades system schools, however, we can point out among our conclusions, under this database, that the cycled system schools' medium proficiencies are significantly higher than the grades system schools. This result cannot be inferred to all elementary education schools for we do not have a sample that reliably represents the Brazilian education system; the pedagogical work of the teacher, associated to the schools' medium proficiencies in the mathematics and reading tests and their respective socioeconomic levels, in this case, analyzed via longitudinal study, valued the grouping of our analysis in the educational context. / Doutorado / Ensino, Avaliação e Formação de Professores / Doutor em Educação Estudo longitudinal Eficiência Análise de dados Ensino fundamental Sistema de ensino em ciclos Desempenho escolar Longitudinal study Efficiency Data analysis Elementaryschool System of education in cycles Performance school
157	Criação de um banco de dados dinâmico e análise de medições Lidar em formato Web do Laboratório de Aplicações Ambientais a Laser do Instituto de Pesquisas Energéticas e Nucleares / Creation of a dynamic database and analysis of LIDAR measurements in web format at the laboratory of environmental laser applications at the Nuclear and Energy Research Institute Lucila Maria Viola Pozzetti 21 June 2006 (has links) O Laboratório de Aplicações Ambientais a Laser, situado no Centro de Lasers e Aplicações no IPEN (Instituto de Pesquisas Energéticas e Nucleares), efetua medidas das concentrações de aerossóis atmosféricos, enviando um feixe de laser à atmosfera e coletando a luz retroespalhada. Tal sistema fornece um grande número de parâmetros físicos que devem ser administrados de forma ágil para a obtenção de análises resultantes. Em conseqüência disso, a implementação de um banco de dados tornou-se imprescindível como instrumento de comunicação e visualização gráfica das medidas coletadas. Um critério de classificação destas valiosas informações foi adotado, estabelecendo níveis de armazenamento definidos a partir de características específicas aos tipos de dados determinados. A compilação e automação destas medidas promoverá a integração entre dados, análise e retorno otimizado de resultados das propriedades da atmosfera, propiciando futuras pesquisas e análise de dados. / The LIDAR system (Light Detection and Ranging) laser remote sensing at the Nuclear and Energy Research Institute Laboratory of Environmental Laser Applications allows on line measurements of variations in the concentrations of atmospheric aerosols by sending a laser beam to the atmosphere and collecting the backscattered light. Such a system supplies a great number of physical parameters that must be managed in an agile form to the attainment of a real time analysis. Database implementation therefore becomes an important toll of communication and graphical visualization of measurements. A criterion for classification of this valuable information was adopted, establishing defined levels of storage from specific characteristics of the determined data types. The compilation and automation of these measurements will promote optimized integration between data, analysis and retrieval of the resulting properties and of the atmosphere, improving future research and data analysis. análise de dados banco de dados LIDAR aerosols air pollution monitoring backscattering brazilian CNEN computer calculations data base management ecological concentration lasers LIDAR optical radar remote sensing
158	Análise da qualidade e da contribuição dos laudos periciais toxicológicos no processo de investigação criminal e sentença judicial em casos envolvendo substâncias ilícitas / Analysis of the quality and contribution of forensic toxicology reports in the process of criminal investigation and court decision in cases involving illegal substances Ricardo Luís Yoshida 04 March 2015 (has links) Atualmente, no meio jurídico, há um reconhecimento implícito de que as provas materiais necessitam de embasamento científico para alcançar a autenticidade imprescindível ao estabelecimento da convicção dos magistrados. A natureza de determinados exames, como a classificação de substâncias proibidas, demandam a utilização de técnicas e saberes oriundos das ciências naturais e tecnológicas. O trabalho pericial deve ser pautado pela cientificidade, com a aplicação de conhecimentos de diversas áreas, dentre as quais está incluída a estatística forense. Neste trabalho foram utilizadas ferramentas estatísticas para avaliar a qualidade e a contribuição dos laudos periciais para os casos envolvendo substâncias ilícitas e correlacionar o conteúdo destes documentos com a sentença judicial. Numa primeira etapa foram analisadas as informações contidas em laudos toxicológicos de drogas, com o intuito de quantificar a qualidade e importância que eles poderiam fornecer em um processo. Para isso foram analisados 1008 documentos oficiais de diversas jurisdições, divididos em 504 conjuntos de laudos preliminares e definitivos do mesmo caso forense A intenção foi apreciar um conjunto heterogêneo de documentos para possibilitar uma melhor análise. A quantificação foi apreciada através de equações empíricas elaboradas. A validação do método ocorreu por análise de dados multivariados. A metodologia empregada demonstrou-se bastante robusta. A segunda fase do trabalho foi aplicar o resultado dos exames da etapa precedente e correlacionar com a decisão judicial. Para tanto, foram esmiuçadas 167 sentenças proferidas em primeira instância e que continham os laudos elencados na primeira fase. A ferramenta utilizada foi a inferência Bayesiana. Os resultados apontaram que os laudos periciais sempre foram essenciais neste tipo de procedimento julgatório. A qualidade dos documentos produzidos encontrava-se entre boa e ótima, avalizada pelo parâmetro \"relevância do laudo\". Alguns aspectos nos documentos poderiam ser aperfeiçoados, como, por exemplo, a inserção de fotografias do material apreendido e/ou imagens alusivas às análises laboratoriais. Estes estudos permitiram estabelecer um valor de corte para a quantificação da qualidade dos laudos, a partir do qual houve 100% de concordância entre o laudo direcionado e a sentença, para casos de condenação onde o suspeito foi considerado traficante. Por fim, a metodologia proposta apresentou potencial promissor e possibilidade de ser utilizada em outros tipos de casos forenses, como, por exemplo, homicídios, suicídios e outros. / There is an implicit recognition in the current legal scenario that material evidences require scientific support in order to achieve the authenticity that the magistrates need for making decisions. The nature of certain exams, such as classification of prohibited substances, requires the use of techniques and knowledge from natural sciences and technology. The forensic work must rely on scientific methods and apply knowledge from several areas, including forensic statistics. The present work used statistic tools to evaluate the quality and the contribution of forensic reports about illegal substances; the goal is to correlate the content of these documents with the court ruling. In the first part we analyzed the information from toxicology reports on drugs, aiming at the quantification of the importance they might bear to court proceedings. We have parsed 1008 official documents from several jurisdictions, divided into 504 sets of preliminary and final reports from the same case. The objective was to evaluate a heterogeneous document set for a better analysis. The quantification was determined from elaborate empiric equations. The validation of the method was performed by multivariate data analysis. The methodology used in the present work has proved very robust. The second part was the application of the results from the previous part and correlation to the court ruling. We have thoroughly examined 167 rulings at first instance that contained the reports cited in the first part. We have used Bayesian inference, and the results indicated that forensic reports were always required in this type of court proceeding. The quality of the documents was considered good or excellent, as stated in the parameter \"relevance of the report\". Some aspects could be improved, for instance, images of collected material evidence or laboratory analytical procedures could be included. These studies allowed establishing a cut-off value for the quantification of the report quality, from which a 100% agreement between the report and the court decision was achieved, in cases where the suspect was found guilty. Finally, the proposed methodology in this work showed a good potential and could be used in other kinds of forensic cases, such as homicide, suicide and other forensic investigations. Análise de dados multivariados Inferência Bayesiana Laudo pericial Laudo toxicológico Sentença judicial Bayesian inference Court ruling Forensic report Multivariate data analysis Toxicology report
159	Imputação de dados em experimentos com interação genótipo por ambiente: uma aplicação a dados de algodão / Data imputation in trials with genotype by environment interaction: an application on cotton data Sergio Arciniegas Alarcón 06 February 2009 (has links) Os experimentos multiambientes são um tipo especial dos experimentos bifatoriais, muito usados em melhoramento genético de plantas, nos quais algumas cultivares são avaliadas em diferentes locais. Geralmente nesses estudos se encontra uma resposta diferencial das cultivares em cada local que é chamada de interação genótipo x ambiente ou G x E, que é bem explicada por modelos de efeitos aditivos e interação multiplicativa (AMMI). Frequentemente os experimentos G x E podem ser desbalanceados e um ou vários genótipos não serem testados em alguns locais. Às vezes para o pesquisador recomendar os ambientes pode ser de interesse obter estimativas daquelas combinações genótipo ambiente que não foram testadas e tais estimativas podem ser calculadas explorando a informação inerente a aquelas combinações que foram atualmente obtidas. Além do interesse do pesquisador por essas estimativas, os da- dos ausentes podem causar alguma modificação na estimação tradicional dos parâmetros nos modelos AMMI, pois para estimar os parâmetros é necessário um processo sequencial fazendo uma análise de variância com uma posterior decomposição por valor singular da matriz de residuais, a qual não pode ser calculada se existir uma matriz de interação com dados faltantes. Para resolver esses problemas Bergamo (2007) e Bergamo et al. (2008) propuseram uma nova técnica através do uso de imputação múltipla livre de distribuição (IMLD) e é por essa razão que se decidiu avaliar o recente desenvolvimento comparando-o com algumas metodologias de imputação que têm sido usadas com sucesso nos experimentos G x E com dados ausentes como os mínimos quadrados alternados ALS(0), ALS(1) (CALINSKI et al., 1992) e estimativas robustas r-AMMI1 e r-AMMI2 (DENIS; BARIL, 1992). Assim, foi de- senvolvido um estudo de simulação baseado em uma matriz de dados reais genótipos (15) ambientes (27) do ensaio estadual de algodoeiro herbáceo 2000/01 (FARIAS, 2005), fazendo retiradas aleatórias de 10%, 20% e 30%, imputando os dados e comparando os métodos através da raiz quadrada da diferença preditiva média (RMSPD), a estatística de similari- dade de Procrustes e o coeciente de correlação não paramétrico de Spearman. Também foi feita uma análise sobre a escolha de componentes multiplicativos de um modelo AMMI quando se têm matrizes completadas (observados + imputados). Os resultados do estudo de simulação mostraram que segundo a distribuição da RMSPD padronizada, o método r- AMMI1 é o melhor, superando o IMLD. Entretanto, utilizando a estatística de Procrustes se encontrou que completando matrizes com ALS(0) se obtém a maior similaridade com relação à matriz de dados originais, também foi mostrado que os cinco métodos considerados têm uma alta correlação entre as imputações e os correspondentes dados reais. Finalmente, recomenda-se utilizar a imputação de dados para a estimação dos parâmetros de um modelo AMMI sob ocorrência de dados ausentes, mas para determinar o número de componentes multiplicativos é preferível tomar a decisão somente sobre a informação observada. / The multienvironment trials are a special type of the two-factor experiments, widely used in genetic improvement of plants, where some cultivars are assessed in diferent locations. Generally, in these studies there is a di¤erential response of cultivars in each location that is called genotype environment interaction, or G x E, which is well explained by the additive main e¤ects and multiplicative interaction models (AMMI). Often the experiments GE may be unbalanced and one or several genotypes were not tested in some locations. Sometimes for the environments recommendations, the researcher may be interested in obtain estimates of those combinations G x E that were not tested and such estimates can be calcu- lated using the information of those combinations that were actually obtained. Additionally to the interest of the researchers in these estimates, the missing data may cause some pro- blems in the classical estimation of parameters in the AMMI models, because the parameter estimation need of a sequential process doing an analysis of variance followed by a singular value decomposition, which can not be calculated if there is a matrix of interaction with missing data. To solve these problems Bergamo (2007) and Bergamo et al. (2008) proposed a new technique using the distribution free multiple imputation (IMLD), and for this reason was decided to evaluate the recent development through the comparison with some methods of imputation that have been used successfully in experiments GE with missing data like the AMMI estimates based on alternating least squares ALS(0), ALS(1) (CALINSKI et al. 1992) and AMMI estimates with robust sub-model r-AMMI1 and r-AMMI2 (DENIS; BARIL, 1992). Thus, was developed a simulation study based on a matrix of true data genotypes (15) environments (27) of the upland cotton variety trials (ensaio estadual de algodoeiro her- báceo) 2000/01 (FARIAS, 2005), doing missed random (10%, 20%, 30%), imputing the data and comparing the methods through the root mean square predictive di¤erence (RMSPD) of the true value, the Procrustes statistic and the Spearman´s ranks correlation coe¢ cient. Also was made an analysis on the choice of the multiplicative components of an AMMI model after imputation on the complete data sets (observed + imputed). The results of the simulation study has shown that according to the distribution of RMSPD standardized, the r-AMMI1 method is better than the IMLD. However, using the Procrustes statistic was found that imputing data matrix with ALS(0), is obtained the greatest similarity related to the true data matrix. The ve methods considered show high correlation between the true and the imputed missing values. Finally, is recommended using the imputation data for the estimation of the parameters of an AMMI model under the presence of missing data, but for choosing the number of multiplicative terms is preferable take the decision only on the observed information. Algodão Análise de dados Análise de variância Correlação genética e ambiental Delineamento experimental Genética estatística. analysis of variance Cotton data analysis experimental design genetic and environmental correlation statistical genetic.
160	Análise de dados longitudinais em experimentos com cana-de-açúcar / Analysis of longitudinal data in experiments with sugar of cane Edjane Gonçalves de Freitas 25 February 2008 (has links) Nesse trabalho foi abordada a situação em que observações de produtividade da cana-de-açúcar (TCH) foram tomadas na mesma unidade experimental em diferentes condições de avalições (anos). Foram avaliados os perfis médios de resposta de 48 genótipos de cana-de-açúcar em dois experimentos: Experimento 1 e Experimento 2, durante três e cinco anos respectivamente, ambos com o delineamento de blocos ao acaso. Esse tipo de planejamento produz uma forma de relação entre as observações tomadas na mesma unidade experimental, portanto requer outras suposições, além das usuais, para que análise seja correta e os testes produzam resultados válidos. Para que as inferências sobre as médias de produtividade sejam válidas e seguras é necessário que o modelo da matriz de covariância dos dados seja apropriado. Diante disso, foram avalidos três alterantivas de análise para dados longitudinais (medidas repetidas no tempo ), sendo utilizados portanto, o modelo univariado, conforme o planejamento do tipo \"split-plot on time\", que impõe forte restrição quanto a matriz de variâncias-covariâncias; o modelo multivariado, que utiliza uma matriz de variâncias-covariâncias não-estruturada e o modelo mistos, que possibilita a seleção de uma matriz que melhor representa os dados. Contudo, verificou-se que não houve diferença entre os resultados dos testes para as diferentes metodologias. Porém, é interessante a continuidade do estudo em relação ao modelo misto, pois devido a sua flexibilidade e precisão é possível obter estimativas mais seguras dos componentes de variância e predizer os valores genotípicos, que por fim poderá proporcionar a predição de produção de uma futura colheita para um determinado genótipo. / This work has been dealt with situation in which observations of productivity of sugar of cane (TCH) were taken in the same unit experimental in different condition of assessments (years). The response profiles average of 48 genotypes of sugar of cane were evaluated in two experiments: Experiment 1 and Experiment 2, for three and five years respectively, both with the randomized complete block design. This type of planning produces a form of relationship between the observations made in the same unit experimental therefore requires other assumptions, in addition to the usual, so that analysis is correct and the test results valid. To that inferences on the means of productivity are valid and safe it is necessary that the model of covariance matrix of the data is appropriate. Therefore, were evaluated three alternatives for analysis of longitudinal data (repeated measures over time), the univariate model as the planning of the split-plot on time which imposes strong restrictions on variances - covariances matrix, the multivariate model, which uses a non-structured variances - covariances matrix and mixed model, which they are enable the selection of a matrix that best represents the data. However, it was found that there was no difference between the results of tests for the different methodologies. But it is interesting the continuity of the study in relation to mixed model, because due to its flexibility and accuracy will be possible to obtain more reliable estimates of the variance components and predict the genotypic values, which ultimately could provide a prediction of production of a future harvest for a given genotype. Análise de dados longitudinais Análise multivariada Cana-de-açúcar Medidas repetidas Cane of sugar Mixed model. Multivariate model Repeated measures over time Univariate model

Search results