Global ETD Search

51	Genotipagem de poliplóides: um modelo de urnas e bolas / Polyploid genotyping: an urn model Silvio Rodrigues de Faria Junior 30 May 2012 (has links) Desde os primórdios da agricultura e pecuária, o homem seleciona indivíduos com características desejáveis para reprodução e aumento da proporção de novos indivíduos com tais qualidades. Com o conhecimento da estrutura de DNA e o advento da engenharia genética, a identificação e caracterização de espécies e indivíduos conta com novas tecnologias para auxiliar no desenvolvimento de novas variedades de plantas e animais para diversos fins. Tais tecnologias envolvem procedimentos bioquímicos e físicos cada vez mais apurados que produzem medidas cada vez mais precisas, um exemplo disso são as técnicas que empregam a espectometria de massa para comparar polimorfismos de base única (SNPs). Nas plantas é comum a ocorrência de poliploidia, que consiste na presença de mais de dois cromossomos num mesmo grupo de homologia. A determinação do nível de ploidia é fundamental para a correta genotipagem e por consequência maior eficiência no estudo e aprimoramento genético de plantas. Neste trabalho caracterizamos o fenômeno da poliploidia com modelos probabilísticos de urnas e bolas, propondo um método eficiente e adequado de simulação, assim como uma técnica simples para inferir níveis de ploidia e classificar amostras bialélicas aproveitando características geométricas do problema. Análises de dados simulados e reais provenientes de um experimento de cana-de-açúcar foram realizadas com diferentes medidas de separação entre agrupamentos e diferentes condições experimentais. Para os dados reais, métodos gráficos descritivos evidenciam a corretude e coerência do método proposto, que pode ser generalizado para a genotipagem de locos multialélicos poliplóides. Encerramos o trabalho comparando nossos resultados com a abordagem SuperMASSA [Serang2012] que trouxe excelentes resultados ao problema. Todo código desenvolvido em linguagem R está disponibilizado com o texto. / Since the beginnings of agriculture and livestock, the man selects individuals with desirable characteristics to breed and increase the proportion of new individuals with such qualities. With knowledge of the DNA structure and the advent of genetic engineering, the identification and characterization of individual species can make use of new technologies to help develop new varieties of plants and animals for many purposes. These technologies involve complex biochemical and physical procedures that produce even more accurated measures, like techniques that employ mass spectrometry to compare single nucleotide polymorphisms (SNPs). In plants it is common the occurrence of polyploidy, which is the presence of more than two chromosomes in the same group of homology. The determination of polyploidy level is essential for correct SNPs genotype calling and therefore greater efficiency in the study and genetic improvement of plants. In this work we characterize the phenomenon of poliploidy with probabilistic urns and balls models, proposing an efficient and appropriate method of simulation, as well as a simple technique to infer ploydy levels and classify biallelic samples accurately taking advantage of geometrical characteristics of the problem. Analysis of simulated and real data from an experiment of sugarcane were conducted with different measures of separation between groups and different experimental conditions. For the actual data, descriptive graphical methods show the correctness and consistency of the proposed method, which can be generalized to multi-allelic loci genotyping polyploid. We end our work comparing our results with the SuperMASSA [Serang2012] approach that brought excellent results to the problem. All code developed in language R were provided with the text. agrupamentos genotipagem de SNPs MassARRAY modelos de urnas e bolas poliploidia simulação SuperMASSA. clustering MassARRAY poliploidy simulation SNPs genotype calling SuperMASSA. urns and balls models
52	AvaliaÃÃo de redes neurais competitivas em tarefas de quantizaÃÃo vetorial:um estudo comparativo / Evaluation of competitive neural networks in tasks of vector quantization (VQ): a comparative study Magnus Alencar da cruz 06 October 2007 (has links) nÃo hÃ / Esta dissertaÃÃo tem como principal meta realizar um estudo comparativo do desempenho de algoritmos de redes neurais competitivas nÃo-supervisionadas em problemas de quantizaÃÃo vetorial (QV) e aplicaÃÃes correlatas, tais como anÃlise de agrupamentos (clustering) e compressÃo de imagens. A motivaÃÃo para tanto parte da percepÃÃo de que hÃ uma relativa escassez de estudos comparativos sistemÃticos entre algoritmos neurais e nÃo-neurais de anÃlise de agrupamentos na literatura especializada. Um total de sete algoritmos sÃo avaliados, a saber: algoritmo K -mÃdias e as redes WTA, FSCL, SOM, Neural-Gas, FuzzyCL e RPCL. De particular interesse Ã a seleÃÃo do nÃmero Ãtimo de neurÃnios. NÃo hÃ um mÃtodo que funcione para todas as situaÃÃes, restando portanto avaliar a influÃncia que cada tipo de mÃtrica exerce sobre algoritmo em estudo. Por exemplo, os algoritmos de QV supracitados sÃo bastante usados em tarefas de clustering. Neste tipo de aplicaÃÃo, a validaÃÃo dos agrupamentos Ã feita com base em Ãndices que quantificam os graus de compacidade e separabilidade dos agrupamentos encontrados, tais como Ãndice Dunn e Ãndice Davies-Bouldin (DB). JÃ em tarefas de compressÃo de imagens, determinado algoritmo de QV Ã avaliado em funÃÃo da qualidade da informaÃÃo reconstruÃda, daÃ as mÃtricas mais usadas serem o erro quadrÃtico mÃdio de quantizaÃÃo (EQMQ) ou a relaÃÃo sinal-ruÃdo de pico (PSNR). Empiricamente verificou-se que, enquanto o Ãndice DB favorece arquiteturas com poucos protÃtipos e o Dunn com muitos, as mÃtricas EQMQ e PSNR sempre favorecem nÃmeros ainda maiores. Nenhuma das mÃtricas supracitadas leva em consideraÃÃo o nÃmero de parÃmetros do modelo. Em funÃÃo disso, esta dissertaÃÃo propÃe o uso do critÃrio de informaÃÃo de Akaike (AIC) e o critÃrio do comprimento descritivo mÃnimo (MDL) de Rissanen para selecionar o nÃmero Ãtimo de protÃtipos. Este tipo de mÃtrica mostra-se Ãtil na busca do nÃmero de protÃtipos que satisfaÃa simultaneamente critÃrios opostos, ou seja, critÃrios que buscam o menor erro de reconstruÃÃo a todo custo (MSE e PSNR) e critÃrios que buscam clusters mais compactos e coesos (Ãndices Dunn e DB). Como conseqÃÃncia, o nÃmero de protÃtipos obtidos pelas mÃtricas AIC e MDL Ã geralmente um valor intermediÃrio, i.e. nem tÃo baixo quanto o sugerido pelos Ãndices Dunn e DB, nem tÃo altos quanto o sugerido pelas mÃtricas MSE e PSNR. Outra conclusÃo importante Ã que nÃo necessariamente os algoritmos mais sofisticados do ponto de vista da modelagem, tais como as redes SOM e Neural-Gas, sÃo os que apresentam melhores desempenhos em tarefas de clustering e quantizaÃÃo vetorial. Os algoritmos FSCL e FuzzyCL sÃo os que apresentam melhores resultados em tarefas de quantizaÃÃo vetorial, com a rede FSCL apresentando melhor relaÃÃo custo-benefÃcio, em funÃÃo do seu menor custo computacional. Para finalizar, vale ressaltar que qualquer que seja o algoritmo escolhido, se o mesmo tiver seus parÃmetros devidamente ajustados e seus desempenhos devidamente avaliados, as diferenÃas de performance entre os mesmos sÃo desprezÃveis, ficando como critÃrio de desempate o custo computacional. / The main goal of this master thesis was to carry out a comparative study of the performance of algorithms of unsupervised competitive neural networks in problems of vector quantization (VQ) tasks and related applications, such as cluster analysis and image compression. This study is mainly motivated by the relative scarcity of systematic comparisons between neural and nonneural algorithms for VQ in specialized literature. A total of seven algorithms are evaluated, namely: K-means, WTA, FSCL, SOM, Neural-Gas, FuzzyCL and RPCL. Of particular interest is the problem of selecting an adequate number of neurons given a particular vector quantization problem. Since there is no widespread method that works satisfactorily for all applications, the remaining alternative is to evaluate the influence that each type of evaluation metric has on a specific algorithm. For example, the aforementioned vector quantization algorithms are widely used in clustering-related tasks. For this type of application, cluster validation is based on indexes that quantify the degrees of compactness and separability among clusters, such as the Dunn Index and the Davies- Bouldin (DB) Index. In image compression tasks, however, a given vector quantization algorithm is evaluated in terms of the quality of the reconstructed information, so that the most used evaluation metrics are the mean squared quantization error (MSQE) and the peak signal-to-noise ratio (PSNR). This work verifies empirically that, while the indices Dunn and DB or favors architectures with many prototypes (Dunn) or with few prototypes (DB), metrics MSE and PSNR always favor architectures with well bigger amounts. None of the evaluation metrics cited previously takes into account the number of parameters of the model. Thus, this thesis evaluates the feasibility of the use of the Akaikeâs information criterion (AIC) and Rissanenâs minimum description length (MDL) criterion to select the optimal number of prototypes. This type of evaluation metric indeed reveals itself useful in the search of the number of prototypes that simultaneously satisfies conflicting criteria, i.e. those favoring more compact and cohesive clusters (Dunn and DB indices) versus those searching for very low reconstruction errors (MSE and PSNR). Thus, the number of prototypes suggested by AIC and MDL is generally an intermediate value, i.e nor so low as much suggested for the indexes Dunn and DB, nor so high as much suggested one for metric MSE and PSNR. Another important conclusion is that sophisticated models, such as the SOM and Neural- Gas networks, not necessarily have the best performances in clustering and VQ tasks. For example, the algorithms FSCL and FuzzyCL present better results in terms of the the of the reconstructed information, with the FSCL presenting better cost-benefit ratio due to its lower computational cost. As a final remark, it is worth emphasizing that if a given algorithm has its parameters suitably tuned and its performance fairly evaluated, the differences in performance compared to others prototype-based algorithms is minimum, with the coputational cost being used to break ties. redes neurais competitivas aprendizado nÃo-supervisionado validaÃÃo de agrupamentos quantizaÃÃo vetorial robustez ao ruÃdo competitive neural networks unsupervised learning cluster validation vector quantization robustness to noise. TELEINFORMATICA
53	Análise de agrupamentos baseada na topologia dos dados e em mapas auto-organizáveis. / Data clustering based on data topology and self organizing-maps. Clodis Boscarioli 16 May 2008 (has links) Cada vez mais, na conjuntura das grandes tomadas de decisões, a análise de dados massivamente armazenados se torna uma necessidade das mais variadas áreas de conhecimento. A análise de dados envolve a realização de diferentes tarefas, que podem ser realizadas por diferentes técnicas e estratégias como análise de agrupamento de dados. Esta pesquisa enfatiza a realização da tarefa de análise de agrupamento de dados (Data Clustering) usando SOM (Self-Organizing Maps) como principal artefato. SOM é uma rede neural artificial baseada em aprendizado competitivo e não-supervisionado, o que significa que o treinamento é inteiramente guiado pelos dados e que os neurônios do mapa competem entre si. Essa rede neural possui a habilidade de formar mapeamentos que quantizam os dados, preservando a sua topologia. Este trabalho introduz uma nova metodologia de análise de agrupamentos a partir de SOM, que considera o mapa topológico gerado por ele e a topologia dos dados no processo de agrupamento. Uma análise experimental e comparativa é apresentada, evidenciando a potencialidade da proposta, destacando, por fim, as principais contribuições do trabalho. / More than ever, in environment of large decision making, the analysis of data stored massively becomes a real need in almost all knowledge areas. The data analyzing process covers the performing of different tasks that can be executed for different techniques and strategies as the data clustering analysis. This research is focused on the analysis task of data groups, called Data Clustering using Self Organizing Maps (SOM) as principal artifact. SOM is an artificial neural network based on competitive and unsupervised learning, what means that its training is entirely driven by the data, such the neurons of the map compete themselves for doing it. This neural network has the ability to build the mapping task that quantifies the source data, but preserving the topology. This work introduces a new clustering analysis methodology based on SOM, considering the topological map produced by it and also the topology of the data obtained in the clustering process. The experimental and comparative analysis are also presented to demonstrate the potential of the proposal, highlighting at the end the mainly contributions of the work. Análise de agrupamentos Análise exploratória de dados Descoberta de conhecimento Mapas Auto-organizáveis (SOM) Mineração de dados Data clustering Data mining Exploratory data analysis Knowledge discovery Self-organizing Maps (SOM)
54	APLICAÇÃO DE TÉCNICAS ESTATÍSTICAS MULTIVARIADAS EM DADOS DE CERÂMICA VERMELHA PRODUZIDA NA REGIÃO CENTRAL DO RIO GRANDE DO SUL Saad, Danielle de Souza 10 September 2009 (has links) This work aimed the application of multivaried statistical techniques using Software STATISTICA 7.0 for Windows, in the analysis of red ceramics data produced in the Central region of the state of the Rio Grande do Sul. The used variable had been: total monthly production, massive number of ceramic industries, bricks, structural blocks. The used techniques had been Cluster Analysis, Factor Analysis, and Principal Components Analysis. The objective of the technique of Cluster Analysis is to determine the degree of similarity between the variables. The Factor Analysis aims to reduce the number variable analyzed in agreement with the Cluster Analysis. The degree of contribution of the variable in the formation of the factors is identified by the technique of Principal Components Analysis. The work concluded that the techniques can be applied in data of ceramic products, because of the results had confirmed previous works. The employed techniques had demonstrated to be pertinent to the considered objectives. / Este trabalho visou empregar técnicas estatísticas multivariadas através do Software STATISTICA 7.0 for Windows, na análise de dados de cerâmica vermelha produzidos na região Central do estado do Rio Grande do Sul. As variáveis utilizadas foram: produção mensal total, número de indústrias cerâmicas, tijolos maciços, blocos de vedação e blocos estruturais. As técnicas utilizadas foram Análise de Agrupamento, Análise Fatorial, e Análise de Componentes Principais. O objetivo da técnica de Análise de Agrupamento é determinar o grau de similaridade entre as variáveis. A Análise Fatorial visa reduzir o número de variáveis analisadas em concordância com a Análise de Agrupamento. O grau de contribuição das variáveis na formação dos fatores é identificado pela técnica de Análise de Componentes Principais. No trabalho concluiu-se que as técnicas podem ser aplicadas em dados de produtos cerâmicos, pois os resultados obtidos confirmaram resultados e conclusões obtidas em trabalhos anteriores. As técnicas empregadas demonstraram ser pertinentes aos objetivos propostos. Cerâmica vermelha Análise de agrupamentos Análise fatorial Análise de componentes principais Red ceramics Cluster analysis Factor analysis Principal components analysis CNPQ::ENGENHARIAS::ENGENHARIA CIVIL
55	Avaliação de métodos para determinação do número ótimo de clusters em estudo de divergência genética entre acessos de pimenta / Evaluation of methods for determining the optimal number of clusters in the study of the genetic divergence among pepper accessions Faria, Priscila Neves 19 January 2009 (has links) Made available in DSpace on 2015-03-26T13:32:05Z (GMT). No. of bitstreams: 1 texto completo.pdf: 688077 bytes, checksum: 369ec0145d58b4c3f2d93ab69403df95 (MD5) Previous issue date: 2009-01-19 / Coordenação de Aperfeiçoamento de Pessoal de Nível Superior / Many times, the interpretation of the results in cluster analysis is done subjectively, that is, through inspection on dendograms, since there are no objective criteria to identify the formed clusters. In face of such a problem, the present study aimed to: (1) find out an objective way to achieve the cut-point (optimal number of clusters) in a dendogram in order to help on taking the right decision; (2) work out index concepts such as Root Mean Square Standard Deviation (RMSSTD) and R Squared (RS), explaining the contribution of each one of them in determining the optimal number of cluster; (3) method application, aiming to identify divergent accessions that will be used on improvement programs. An alternative solution for this problem is to use the RMSSTD and RS which are calculated according to the number of variables among and within the clusters formed, characterizing an objective way to determine the optimal number. Another solution is achieved by using the RS. Some morphological characteristics of the forty nine accessions of the species Capsicum chinense Jacq. from the Germplasm Bank of Vegetables of the Federal University of Viçosa (Banco de Germoplasma de Hortaliças da Universidade Federal de Viçosa, Minas Gerais Brazil) were analyzed by means of cluster analysis. The accessions were clustered based on the proposed techniques and an optimal number of clusters was achieved. The 49 accessions analyzed were classified into only seven clusters according to the graph of the RMSSTD versus the number of clusters and the graph of the RS versus the number of clusters. / Muitas vezes, a interpretação dos resultados em análise de agrupamentos é feita de forma subjetiva, isto é, através da inspeção de dendrogramas. Isto se deve ao fato de haver dificuldade em se encontrar na literatura um critério objetivo de fácil aplicação para identificar o número ideal de grupos formados. Diante deste problema, o presente trabalho teve por objetivos: 1) Avaliar a aplicabilidade de critério objetivo de se obter o ponto de corte (número ótimo de clusters) num dendrograma para a tomada de decisão; 2) trabalhar os conceitos de índices como RMSSTD (root mean square standard deviation) e RS (R-Squared), discutindo a contribuição de cada um destes na obtenção do número ótimo de clusters em acessos de Capsicum chinense; 3) aplicação do método, visando a identificar acessos divergentes de Capsicum chinense para serem utilizados em programas de melhoramento. Os índices RMSSTD e RS são calculados de acordo com as variáveis entre e dentro dos grupos formados, caracterizando uma forma objetiva para determinar o número ótimo. Para se obter o ponto de máxima curvatura da trajetória dos índices RMSSTD e RS em função do aumento do número de grupos (X), utilizou-se o Método da Máxima Curvatura Modificado. Foram analisadas, por meio da análise de agrupamentos, algumas características morfológicas de quarenta e nove acessos da espécie Capsicum chinense Jacq. do Banco de Germoplasma de Hortaliças da Universidade Federal de Viçosa. A partir das técnicas propostas agrupou-se os acessos, obtendo um número ótimo de grupos. Os resultados classificam os 49 acessos avaliados em apenas sete grupos de acordo com o gráfico do RMSSTD versus o número de grupos e o gráfico do RS versus o número de grupos. Análise de agrupamentos Capsicum chinense RMSSTD RS Método de máxima curvatura Cluster analysis Capsicum chinense R Squared CNPQ::CIENCIAS AGRARIAS
56	Algoritmos de agrupamento aplicados a dados de express?o g?nica de c?ncer: um estudo comparativo Ara?jo, Daniel Sabino Amorim de 11 November 2008 (has links) Made available in DSpace on 2014-12-17T15:47:48Z (GMT). No. of bitstreams: 1 DanielSAA.pdf: 691771 bytes, checksum: c2a3333a69e8d426409687ac8cfac27f (MD5) Previous issue date: 2008-11-11 / Coordena??o de Aperfei?oamento de Pessoal de N?vel Superior / The use of clustering methods for the discovery of cancer subtypes has drawn a great deal of attention in the scientiﬁc community. While bioinformaticians have proposed new clustering methods that take advantage of characteristics of the gene expression data, the medical community has a preference for using classic clustering methods. There have been no studies thus far performing a large-scale evaluation of different clustering methods in this context. This work presents the ﬁrst large-scale analysis of seven different clustering methods and four proximity measures for the analysis of 35 cancer gene expression data sets. Results reveal that the ﬁnite mixture of Gaussians, followed closely by k-means, exhibited the best performance in terms of recovering the true structure of the data sets. These methods also exhibited, on average, the smallest difference between the actual number of classes in the data sets and the best number of clusters as indicated by our validation criteria. Furthermore, hierarchical methods, which have been widely used by the medical community, exhibited a poorer recovery performance than that of the other methods evaluated. Moreover, as a stable basis for the assessment and comparison of different clustering methods for cancer gene expression data, this study provides a common group of data sets (benchmark data sets) to be shared among researchers and used for comparisons with new methods / O uso de t?cnicas de agrupamento na descoberta de subtipos de c?ncer tem atra?do grande aten??o da comunidade cient?ﬁca. Enquanto bioinformatas prop?em novas t?cnicas de agrupamento que levam em considera??o caracter?sticas dos dados de express?o g?nica, a comunidade m?dica prefere utilizar as t?cnicas cl?ssicas de agrupamento. De fato, n?o existem trabalhos na literatura que realizam uma avalia??o em grande escala de t?cnicas de agrupamento nesse contexto. Diante disso, este trabalho apresenta o primeiro estudo em grande escala de sete t?cnicas de agrupamento e quatro medidas de proximidade para a an?lise de 35 conjuntos de dados de express?o g?nica. Mais especiﬁcamente, os resultados mostram que a t?cnica mistura ﬁnita de gaussianas, seguida pelo k-means, apresentam os melhores resultados em termos de recupera??o da estrutura natural dos dados. Esses m?todos tamb?m apresentam a menor diferen?a entre o n?mero real de classes e o n?mero de grupos presente na melhor parti??o. Al?m disso, os m?todos de agrupamento hier?rquico, que v?m sendo bastante utilizados pela comunidade m?dica, apresentaram os piores resultados quando comparados com os outros m?todos investigados. Este trabalho tamb?m apresenta, como uma refer?ncia est?vel para a avalia??o e compara??o de diferentes algoritmos de agrupamento para dados de express?o g?nica de c?ncer, um conjunto de bases de dados (benchmark data sets) que pode ser compartilhado entre pesquisadores e usado na compara??o de novos m?todos Intelig?ncia artificial Bioinform?tica Aprendizado de m?quina An?lise de agrupamentos Express?o g?nica
57	An?lise de DFA e de agrupamento do perfil de densidade de po?os de petr?leo Costa, Kleber Carlos de Oliveira 22 April 2009 (has links) Made available in DSpace on 2014-12-17T14:08:35Z (GMT). No. of bitstreams: 1 KleberCOCpdf.pdf: 2178209 bytes, checksum: 588b533d30c060af9cf941e7001d3372 (MD5) Previous issue date: 2009-04-22 / In recent years, the DFA introduced by Peng, was established as an important tool capable of detecting long-range autocorrelation in time series with non-stationary. This technique has been successfully applied to various areas such as: Econophysics, Biophysics, Medicine, Physics and Climatology. In this study, we used the DFA technique to obtain the Hurst exponent (H) of the profile of electric density profile (RHOB) of 53 wells resulting from the Field School of Namorados. In this work we want to know if we can or not use H to spatially characterize the spatial data field. Two cases arise: In the first a set of H reflects the local geology, with wells that are geographically closer showing similar H, and then one can use H in geostatistical procedures. In the second case each well has its proper H and the information of the well are uncorrelated, the profiles show only random fluctuations in H that do not show any spatial structure. Cluster analysis is a method widely used in carrying out statistical analysis. In this work we use the non-hierarchy method of k-means. In order to verify whether a set of data generated by the k-means method shows spatial patterns, we create the parameter ? (index of neighborhood). High ? shows more aggregated data, low ? indicates dispersed or data without spatial correlation. With help of this index and the method of Monte Carlo. Using ? index we verify that random cluster data shows a distribution of ? that is lower than actual cluster ?. Thus we conclude that the data of H obtained in 53 wells are grouped and can be used to characterize space patterns. The analysis of curves level confirmed the results of the k-means / Nos ?ltimos anos, o DFA introduzido por Peng, foi estabelecido como uma importante ferramenta capaz de detectar autocorrela??o de longo alcance em s?ries temporais com n?o-estacionaridade. Esta t?cnica vem sendo aplicado com sucesso a diversas ?reas tais como: Econofis?ca, Biof?sica, Medicina, F?sica e Climatologia. No presente trabalho, utilizamos a t?cnica do DFA para obter o expoente de Hurst (H) do perfil el?trico de densidade (RHOB) de 53 po?os provindos do Campo Escola de Namorado. Neste trabalho queremos saber se podemos, ou n?o, utilizar este expoente para caracterizar espacialmente o campo. Duas hip?teses surgem: Na primeira o conjunto dos H reflete a geologia local, po?os com mesmo H se encontram pertos, e ent?o se pode pensar em utilizar H em procedimentos geoestat?sticos espaciais. Na segunda hip?tese cada po?o tem seu H, a informa??o dos H de cada po?o est? descorrelacionada e o conjunto dos perfis mostra apenas flutua??es aleat?rias em H que n?o revelam qualquer estrutura espacial. A an?lise de agrupamentos ? um m?todo bastante utilizado na realiza??o de an?lises estat?sticas. Nesta disserta??o utilizamos o m?todo de agrupamento n?o hier?rquico chamado m?todo do k-m?dia. Com o objetivo de verificar se um conjunto de dados gerados pelo m?todo do k-m?dia, ou de forma aleat?ria, forma padr?es espaciais, criamos o par?metro ? (?ndice de vizinhan?a). Altos ? implicam em dados mais agregados, baixos ? em dados dispersos ou sem correla??o espacial. Com aux?lio deste ?ndice e do m?todo de Monte Carlo verificamos que os dados agrupados aleatoriamente apresentam uma distribui??o mais baixa de ? do que os obtidos dos dados concretos e agrupados pelo k-m?dia. Desta forma conclu?mos que os dados de H obtidos nos 53 po?os est?o agrupados e podem ser usados na caracteriza??o espacial de campos. A an?lise de curvas de n?vel confirmou o resultado do k-m?dia DFA Perfil El?trico de Densidade (RHOB) An?lise de agrupamentos K-M?dia Electric density profile Group analysis K-Means Cluster
58	[en] DEVELOPMENT OF A METHODOLOGY FOR THE DETERMINATION OF METALS IN SEDIMENTS APPLYING CLOSED FLASK MICROWAVES FURNACE AND MULTIVARIATE STATISTICAL ANALYSIS OF METALS IN BACIA DE CAMPOS SEDIMENTS / [pt] METODOLOGIA PARA DETERMINAÇÃO DE METAIS EM SEDIMENTOS UTILIZANDO MICROONDAS COM FRASCO FECHADO E ANÁLISE ESTATÍSTICA MULTIVARIADA DAS CONCENTRAÇÕES DE METAIS EM SEDIMENTOS DA BACIA DE CAMPOS MARIA LUCIA TEIXEIRA GUERRA DE MENDONCA 02 August 2006 (has links) [pt] Foi estudada a otimização da digestão ácida de amostras de sedimento visando à determinação de metais (Al, Fe, Mn,Cr, Ni, V, Cu, Zn e Pb), usando-se microondas com frasco fechado. Para tal, verificou-se a recuperação destes utilizando materiais de referência certificados: MESS-3, sedimento marinho, do National Research Council of Canada (NRCC) e SRM 1645, sedimento de rio, do National Institute of Standards and Technology (NIST), sendo a determinação realizada por espectrometria de emissão óptica por plasma indutivamente acoplado (ICP-OES). O processo de digestão ácida com microondas em sistema fechado foi otimizado empregando- se planejamento fatorial com três variáveis e dois níveis. Como resultado, obteve-se as seguintes condições operacionais: potência máxima de 600W, o tempo total de digestão de 40 minutos e uma mistura ácida constituída de 2 mL HNO3 + 6 mL HCl para a digestão de 250 mg de amostra. Com base na metodologia desenvolvida, foi realizada a determinação destes elementos em 163 amostras de sedimento oriundas da região petrolífera da Bacia de Campos do Estado do Rio de Janeiro, Brasil. Os resultados obtidos foram avaliados empregando técnicas estatísticas univariadas e multivariadas como: regressão linear, regressão múltipla, análise de componente principal (PCA) e de agrupamento (CA). Foi feito também a comparação dos dados obtidos com os resultados do Diagnóstico ambiental das áreas de exploração e produção de petróleo da Bacia de Campos, Santos e Espírito Santo (2002) pelo laboratório contratado pela Petrobras. / [en] The optimization of acid digestion of sediment samples was studied with the purpose of determining the metals (Al, Fe, Mn, Cr, Ni, V, Cu, Zn and Pb) using closed microwaves sisteem. For that, the recovery of these metals was noticed using certified reference materials: MESS-3, marine sediment, from the National Research Council of Canada (NRCC) and SRM 1645, river sediment, from the National Institute of Standards and Technology (NIST), with the determination performed by inductively coupled plasma optic emission spectrometry (ICP-OES). The acid digestion process with closed microwave system was optimized using factorial planning with three variables and two levels. As a result, the following operational conditions were achieved: maximum power of 600W, total digestion time of 40 minutes, and an acid mixture of 2 mL HNO3 + 6 mL HCl for 250 mg of sample digestion. Determination of these elements in 163 sediment samples from in the oil region of Bacia de Campos in the state of Rio de Janeiro, Brazil, was based on the methodology developed. The results were evaluated employing univariate and multivariate statistical techniques such as: linear regression, multiple regressions, Principal Component Analysis (PCA) and Cluster Analysis (CA). The data were compared with the results from the environmental diagnosis of oil exploration and production areas in Bacia de Campos, Santos and Espírito Santo (2002) by laboratory contracting by Petrobras. [pt] METAIS [en] METALS [pt] SEDIMENTOS [en] SEDIMENT [pt] ANALISE DE COMPONENTES PRINCIPAIS [en] PRINCIPAL COMPONENT ANALYSIS [pt] ANALISE DE AGRUPAMENTOS [en] CLUSTERING SOFTWARE [pt] BACIA DE CAMPOS
59	[en] DATA CLUSTERING: ANALYSIS OF METHODS AND DEVELOPMENT OF APPLICATION FOR CLUSTER ANALYSIS / [pt] AGRUPAMENTOS DE DADOS: AVALIAÇÃO DE MÉTODOS E DESENVOLVIMENTO DE APLICATIVO PARA ANÁLISE DE GRUPOS MARCOS NEVES DO VALE 23 March 2006 (has links) [pt] A enorme massa de dados que é gerada pelas diversas empresas diariamente pode conter informações importantes que não são fáceis de serem extraídas. Com isso advém a necessidade de analisá-los automaticamente, de forma adequada, extraindo informação útil que pode agregar algum tipo de conhecimento. Uma das formas de se analisar os dados automaticamente é através da análise de agrupamentos. Ela procura encontrar grupos de dados semelhantes entre si. As técnicas de análise de agrupamentos revelam como os dados estão estruturados e resultam em um melhor entendimento sobre o negócio. Existe ainda hoje uma escassez de ferramentas para esse fim. Em um problema real de agrupamento de dados convém analisar os dados através da utilização de diferentes métodos, a fim de buscar aquele que melhor se adapte ao problema. Porém, as ferramentas existentes hoje em dia não são integradas, onde cada ferramenta possui um subconjunto dos métodos existentes de agrupamento. Dessa forma o usuário fica limitado à utilização de uma ferramenta específica ou é obrigado a conhecer diversas ferramentas diferentes, de forma a melhor analisar os dados de sua empresa. Esta dissertação apresenta uma revisão detalhada de todo o processo de análise de agrupamentos e o desenvolvimento de um aplicativo que visa não apenas a atender as deficiências presentes na maioria das ferramentas com esse fim, mas também a auxiliar, de forma mais completa, todo o processo de análise dos grupos. O aplicativo desenvolvido é de fácil utilização e permite que a ele sejam incorporados outros métodos eventualmente desenvolvidos pelo usuário. O aplicativo foi avaliado em três estudos de casos, os quais visam demonstrar a facilidade de uso do aplicativo, assim como avaliar as vantagens do uso de métodos de natureza fuzzy em uma base de dados real. / [en] The enormous data mass that is daily generated by several companies can contain critical information that might not be easily retrieved, considering that the amount of data is generally huge and/or the target information might be spread through different data bases. Taking that into consideration, it might be necessary to properly analyze the data in an automatic way, so useful and valuable information can be extracted. One way of automatically analyzing data is through cluster analysis. This type of analysis searches for related similar data. These clusters settle a data structure model and with proper analysis can reveal important information. The techniques used in cluster analysis disclose how data is structured and allow a better knowledge of the business. Still today there is a lack of tools for this purpose. On a real situation with a data cluster problem it is wise to analyze the data through different methods, so we can find the one that better fits the problem. However, today the existing tools are not integrated, and each tool has a subgroup of existing cluster methods. This way the user stays limited to use only one specific tool or is forced to be aware of a number of different tools, so he would be able to better analyze the company data. This study presents a detailed review of the whole group analysis process and develops an application that not only suggests how to cover the currently lack of tools for this purpose, but also to help the complete cluster analysis process in a more extended way. The application developed is user friendly and allows other methods developed by users to be incorporated. The application has been evaluated into three case studies with the purpose of demonstrating its user friendly, as well as evaluating the advantages of using fuzzy methods on a true data base. [pt] LOGICA FUZZY [en] FUZZY LOGIC [pt] ANALISE DE AGRUPAMENTOS [en] CLUSTERING SOFTWARE [pt] APLICATIVO [en] APPLICATORY [pt] AGRUPAMENTO [en] GROUPING [pt] EXTRACAO DE INFORMACAO [en] EXTRATION OF INFORMATION
60	VEGETAÇÃO E MECANISMOS DE REGENERAÇÃO NATURAL EM DIFERENTES AMBIENTES DA FLORESTA OMBRÓFILA MISTA NA FLONA DE SÃO FRANCISCO DE PAULA, RS. / VEGETATION AND MECHANISMS OF NATURAL REGENERATION IN DIFFERENTS ENVIROMENTS OF THE MIXED RAIN FOREST IN THE FLONA OF SÃO FRANCISCO DE PAULA,RS Chami, Luciane Belmonte 30 June 2008 (has links) This study evaluated the phitosociology of the Mixed Rain Forest and its mechanisms of regeneration (seeding banks, seed rain and soil seed bank). The data were collected in six conglomerates, being every one subdivided in 16 parcels of 20m x 20m. In the Chapter I it was studied the adult vegetation, where the tree and shrub species with circumference at the height of the chest equal or bigger than 30 cm were identified and measured. The species were classified in ecological groups and, on the basis of the density data, it was made an analysis of the grouping using the TWINSPAR method (Two-Way Indicattor Species Analysis). The groupings were characterized in relation to their horizontal structure. On the area, they 86 species were identified, being 18 pioneers, 25 secondary initials, 16 secondary delayed, 14 climax, and 13 were classified in more than one group. Three groupings were characterized (G1, G2 nd G3), in which gained special prominence the species Siphoneugena reitzii, Araucaria angustifolia and Sebastiania commersoniana, respectively in environments of hillside, of emergent trees and humid environments. In the chapter II based in the groupings formed in the adult vegetation, it was evaluated the mechanisms of regeneration. The seed rain was evaluated during the months of January to December of 2007, by means of the disposition of 96 collectors of 1 m2, in which it was observed the significant difference among the three groups in the quantity of seeds dispersed. In the study of the soil seed bank which was held through the collect of 5 cm of ground (taking out the burlap), it was observed that the group G1 showed significant difference in the quantity of storaged seeds in relation to groups G2 and G3. Seeding banks was showed in 72 showing unities of 2 m x 2 m, in which all the individuals with a size equal or bigger than 20 cm and DAP equal or lesser than 1 cm were identified and counted. The statistic analysis showed that, quantitatively, there was a significant difference among the three groups in relation to numbers of individuals in the seeding bank. For the joint analyses of the adult vegetation and mechanisms of regeneration, it is concluded, initially that the seeding bank, for having presented a bigger similarity with the vegetation, it can be the principal strategy of the maintenance of this forest. The seed rain is a basic strategy to the maintenance of the seeding bank. The seed bank didn´t present a flower potential for substituting the species present in the tree vegetation after alteration of the forest, being an essential strategy to the initial reestablishment of the area., due to the high density of the herbaceous plants. It was considered as tree basic species Araucaria angustifolia, Siphoneugena reitzii, llex brevicuspis, Podocarpus lambertii e Vernonia discolor, in hillside environments; Araucaria angustifolia, Casearia decandra, Blepharocalyx salicifolius, llex paraguariensis and Sebastiania brasiliensis in emergent tree environments; Araucaria angustifolia, Blepharocalyx salicifolius, Cryptocarya aschersoniana, llex brevicuspis, Sebastiania commersoinana e Siphoneugena reitzii in lands of bigger moistness. Through these informations one gives credit that such species will have greater possibility of stablishment in places with similar environment characteristics. / Este estudo avaliou a fitossociologia de Floresta Ombrófila Mista e os seus mecanismos de regeneração (banco de plântulas, chuva de sementes e banco de sementes do solo). Os dados foram coletados em seis conglomerados, sendo cada um subdividido em 16 parcelas de 20 m x 20 m. No Capítulo I, estudou-se a vegetação adulta onde as espécies arbóreas e arbustivas com circunferência à altura do peito (CAP) igual ou maior de 30 cm foram identificadas e medidas. As espécies foram classificadas em grupos ecológicos e, com base nos dados de densidade, foi realizada uma análise de agrupamento utilizando o método TWINSPAN (Two-way Indicator Species Analysis). Os agrupamentos foram caracterizados em relação à sua estrutura horizontal. Na área, foram identificadas 86 espécies, sendo 18 pioneiras, 25 secundárias iniciais, 16 secundárias tardias, 14 clímax, e 13 foram classificadas em mais de um grupo. Foram caracterizados três agrupamentos (G1, G2 e G3), em que se destacaram as espécies Siphoneugena reitzii, Araucaria angustifolia e Sebastiania commersoniana, respectivamente, em ambientes de encosta, de árvores emergentes e úmido. No capítulo II, partindo dos agrupamentos formados na vegetação adulta, foram avaliados os mecanismos de regeneração. A chuva de sementes foi avaliada durante os meses de janeiro a dezembro de 2007 por meio da disposição de 96 coletores de 1 m², na qual foi observada diferença significativa entre os três grupos na quantidade de sementes dispersadas. No estudo do banco de sementes do solo, realizado mediante a coleta de 5 cm de solo (retirando a serapilheira), observou-se que o grupo G1 demonstrou diferença significativa na quantidade de sementes estocadas em relação aos grupos G2 e G3. O banco de plântulas foi amostrado em 72 unidades amostrais de 2 m x 2 m, em que todos os indivíduos com altura igual ou maior que 20 cm e DAP igual ou menor 1 cm foram identificados e contados. A análise estatística mostrou que, quantitativamente, houve diferença significativa entre os três grupos quanto ao número de indivíduos no banco de plântulas. Pela análise conjunta da vegetação adulta e mecanismos de regeneração, conclui-se, inicialmente, que o banco de plântulas, por ter apresentado maior similaridade com a vegetação, pode ser a estratégia principal de manutenção dessa floresta. A chuva de sementes é uma estratégia fundamental à manutenção do banco de plântulas. O banco de sementes não apresentou potencial florístico para substituir as espécies presentes na vegetação arbórea após alteração da floresta, sendo uma estratégia essencial ao restabelecimento inicial da área, dada a elevada densidade de plantas herbáceas. Foram consideradas como espécies arbóreas fundamentais Araucaria angustifolia, Siphoneugena reitzii, Ilex brevicuspis, Podocarpus lambertii e Vernonia discolor, em ambientes de encosta; Araucaria angustifolia, Casearia decandra, Blepharocalyx salicifolius, Ilex paraguariensis e Sebastiania brasiliensis, em ambiente de arvores emergentes; Araucaria angustifolia, Blepharocalyx salicifolius, Cryptocarya aschersoniana, Ilex brevicuspis, Sebastiania commersoniana e Siphoneugena reitzii em terrenos de maior umidade. Por meio dessas informações, acredita-se que tais espécies terão maior chance de estabelecimento em locais com características ambientais semelhantes. Agrupamentos Grupos ecológicos TWINSPAN Chuva de sementes Banco de sementes Banco de plântulas Groupings Ecological groups TWINSPAN Seed rain Soil seed Bank Seeding bank

Search results