Spelling suggestions: "subject:"agrupamento""
51 |
Genotipagem de poliplóides: um modelo de urnas e bolas / Polyploid genotyping: an urn modelSilvio Rodrigues de Faria Junior 30 May 2012 (has links)
Desde os primórdios da agricultura e pecuária, o homem seleciona indivíduos com características desejáveis para reprodução e aumento da proporção de novos indivíduos com tais qualidades. Com o conhecimento da estrutura de DNA e o advento da engenharia genética, a identificação e caracterização de espécies e indivíduos conta com novas tecnologias para auxiliar no desenvolvimento de novas variedades de plantas e animais para diversos fins. Tais tecnologias envolvem procedimentos bioquímicos e físicos cada vez mais apurados que produzem medidas cada vez mais precisas, um exemplo disso são as técnicas que empregam a espectometria de massa para comparar polimorfismos de base única (SNPs). Nas plantas é comum a ocorrência de poliploidia, que consiste na presença de mais de dois cromossomos num mesmo grupo de homologia. A determinação do nível de ploidia é fundamental para a correta genotipagem e por consequência maior eficiência no estudo e aprimoramento genético de plantas. Neste trabalho caracterizamos o fenômeno da poliploidia com modelos probabilísticos de urnas e bolas, propondo um método eficiente e adequado de simulação, assim como uma técnica simples para inferir níveis de ploidia e classificar amostras bialélicas aproveitando características geométricas do problema. Análises de dados simulados e reais provenientes de um experimento de cana-de-açúcar foram realizadas com diferentes medidas de separação entre agrupamentos e diferentes condições experimentais. Para os dados reais, métodos gráficos descritivos evidenciam a corretude e coerência do método proposto, que pode ser generalizado para a genotipagem de locos multialélicos poliplóides. Encerramos o trabalho comparando nossos resultados com a abordagem SuperMASSA [Serang2012] que trouxe excelentes resultados ao problema. Todo código desenvolvido em linguagem R está disponibilizado com o texto. / Since the beginnings of agriculture and livestock, the man selects individuals with desirable characteristics to breed and increase the proportion of new individuals with such qualities. With knowledge of the DNA structure and the advent of genetic engineering, the identification and characterization of individual species can make use of new technologies to help develop new varieties of plants and animals for many purposes. These technologies involve complex biochemical and physical procedures that produce even more accurated measures, like techniques that employ mass spectrometry to compare single nucleotide polymorphisms (SNPs). In plants it is common the occurrence of polyploidy, which is the presence of more than two chromosomes in the same group of homology. The determination of polyploidy level is essential for correct SNPs genotype calling and therefore greater efficiency in the study and genetic improvement of plants. In this work we characterize the phenomenon of poliploidy with probabilistic urns and balls models, proposing an efficient and appropriate method of simulation, as well as a simple technique to infer ploydy levels and classify biallelic samples accurately taking advantage of geometrical characteristics of the problem. Analysis of simulated and real data from an experiment of sugarcane were conducted with different measures of separation between groups and different experimental conditions. For the actual data, descriptive graphical methods show the correctness and consistency of the proposed method, which can be generalized to multi-allelic loci genotyping polyploid. We end our work comparing our results with the SuperMASSA [Serang2012] approach that brought excellent results to the problem. All code developed in language R were provided with the text.
|
52 |
AvaliaÃÃo de redes neurais competitivas em tarefas de quantizaÃÃo vetorial:um estudo comparativo / Evaluation of competitive neural networks in tasks of vector quantization (VQ): a comparative studyMagnus Alencar da cruz 06 October 2007 (has links)
nÃo hà / Esta dissertaÃÃo tem como principal meta realizar um estudo comparativo do desempenho de algoritmos de redes neurais competitivas nÃo-supervisionadas em problemas de quantizaÃÃo vetorial (QV) e aplicaÃÃes correlatas, tais como anÃlise de agrupamentos (clustering) e compressÃo de imagens. A motivaÃÃo para tanto parte da percepÃÃo de que hà uma relativa escassez de estudos comparativos sistemÃticos entre algoritmos neurais e nÃo-neurais de anÃlise de agrupamentos na literatura especializada. Um total de sete algoritmos sÃo avaliados, a saber: algoritmo K -mÃdias e as redes WTA, FSCL, SOM, Neural-Gas, FuzzyCL e RPCL. De particular interesse à a seleÃÃo do nÃmero Ãtimo de neurÃnios. NÃo hà um mÃtodo que funcione para todas as situaÃÃes, restando portanto avaliar a influÃncia que cada tipo de mÃtrica exerce sobre algoritmo em estudo. Por exemplo, os algoritmos de QV supracitados sÃo bastante usados em tarefas de clustering. Neste tipo de aplicaÃÃo, a validaÃÃo dos agrupamentos à feita com base em Ãndices que quantificam os graus de compacidade e separabilidade dos agrupamentos encontrados, tais como Ãndice Dunn e Ãndice Davies-Bouldin (DB). Jà em tarefas de compressÃo de imagens, determinado algoritmo de QV à avaliado em funÃÃo da qualidade da informaÃÃo reconstruÃda, daà as mÃtricas mais usadas serem o erro quadrÃtico mÃdio de quantizaÃÃo (EQMQ) ou a relaÃÃo sinal-ruÃdo de pico (PSNR). Empiricamente verificou-se que, enquanto o Ãndice DB favorece arquiteturas com poucos protÃtipos e o Dunn com muitos, as mÃtricas EQMQ e PSNR sempre favorecem nÃmeros ainda maiores. Nenhuma das mÃtricas supracitadas leva em consideraÃÃo o nÃmero de parÃmetros do modelo. Em funÃÃo disso, esta dissertaÃÃo propÃe o uso do critÃrio de informaÃÃo de Akaike (AIC) e o critÃrio do comprimento descritivo mÃnimo (MDL) de Rissanen para selecionar o nÃmero Ãtimo de protÃtipos. Este tipo de mÃtrica mostra-se Ãtil na busca do nÃmero de protÃtipos que satisfaÃa simultaneamente critÃrios opostos, ou seja, critÃrios que buscam o menor erro de reconstruÃÃo a todo custo (MSE e PSNR) e critÃrios que buscam clusters mais compactos e coesos (Ãndices Dunn e DB). Como conseqÃÃncia, o nÃmero de protÃtipos obtidos pelas mÃtricas AIC e MDL à geralmente um valor intermediÃrio, i.e. nem tÃo baixo quanto o sugerido pelos Ãndices Dunn e DB, nem tÃo altos quanto o sugerido pelas mÃtricas MSE e PSNR. Outra conclusÃo importante à que nÃo necessariamente os algoritmos mais sofisticados do ponto de vista da modelagem, tais como as redes SOM e Neural-Gas, sÃo os que apresentam melhores desempenhos em tarefas de clustering e quantizaÃÃo vetorial. Os algoritmos FSCL e FuzzyCL sÃo os que apresentam melhores resultados em tarefas de quantizaÃÃo vetorial, com a rede FSCL apresentando melhor relaÃÃo custo-benefÃcio, em funÃÃo do seu menor custo computacional. Para finalizar, vale ressaltar que qualquer que seja o algoritmo escolhido, se o mesmo tiver seus parÃmetros devidamente ajustados e seus desempenhos devidamente avaliados, as diferenÃas de performance entre os mesmos sÃo desprezÃveis, ficando como critÃrio de desempate o custo computacional. / The main goal of this master thesis was to carry out a comparative study of the performance of algorithms of unsupervised competitive neural networks in problems of vector quantization (VQ) tasks and related applications, such as cluster analysis and image compression. This study is mainly motivated by the relative scarcity of systematic comparisons between neural and nonneural algorithms for VQ in specialized literature. A total of seven algorithms are evaluated, namely: K-means, WTA, FSCL, SOM, Neural-Gas, FuzzyCL and RPCL. Of particular interest is the problem of selecting an adequate number of neurons given a particular vector quantization problem. Since there is no widespread method that works satisfactorily for all applications, the remaining alternative is to evaluate the influence that each type of evaluation metric has on a specific algorithm. For example, the aforementioned vector quantization algorithms are widely used in clustering-related tasks. For this type of application, cluster validation is based on indexes that quantify the degrees of compactness and separability among clusters, such as the Dunn Index and the Davies- Bouldin (DB) Index. In image compression tasks, however, a given vector quantization algorithm is evaluated in terms of the quality of the reconstructed information, so that the most used evaluation metrics are the mean squared quantization error (MSQE) and the peak signal-to-noise ratio (PSNR). This work verifies empirically that, while the indices Dunn and DB or favors architectures with many prototypes (Dunn) or with few prototypes (DB), metrics MSE and PSNR always favor architectures with well bigger amounts. None of the evaluation metrics cited previously takes into account the number of parameters of the model. Thus, this thesis evaluates the feasibility of the use of the Akaikeâs information criterion (AIC) and Rissanenâs minimum description length (MDL) criterion to select the optimal number of prototypes. This type of evaluation metric indeed reveals itself useful in the search of the number of prototypes that simultaneously satisfies conflicting criteria, i.e. those favoring more compact and cohesive clusters (Dunn and DB indices) versus those searching for very low reconstruction errors (MSE and PSNR). Thus, the number of prototypes suggested by AIC and MDL is generally an intermediate value, i.e nor so low as much suggested for the indexes Dunn and DB, nor so high as much suggested one for metric MSE and PSNR. Another important conclusion is that sophisticated models, such as the SOM and Neural- Gas networks, not necessarily have the best performances in clustering and VQ tasks. For example, the algorithms FSCL and FuzzyCL present better results in terms of the the of the reconstructed information, with the FSCL presenting better cost-benefit ratio due to its lower computational cost. As a final remark, it is worth emphasizing that if a given algorithm has its parameters suitably tuned and its performance fairly evaluated, the differences in performance compared to others prototype-based algorithms is minimum, with the coputational cost being used to break ties.
|
53 |
Análise de agrupamentos baseada na topologia dos dados e em mapas auto-organizáveis. / Data clustering based on data topology and self organizing-maps.Clodis Boscarioli 16 May 2008 (has links)
Cada vez mais, na conjuntura das grandes tomadas de decisões, a análise de dados massivamente armazenados se torna uma necessidade das mais variadas áreas de conhecimento. A análise de dados envolve a realização de diferentes tarefas, que podem ser realizadas por diferentes técnicas e estratégias como análise de agrupamento de dados. Esta pesquisa enfatiza a realização da tarefa de análise de agrupamento de dados (Data Clustering) usando SOM (Self-Organizing Maps) como principal artefato. SOM é uma rede neural artificial baseada em aprendizado competitivo e não-supervisionado, o que significa que o treinamento é inteiramente guiado pelos dados e que os neurônios do mapa competem entre si. Essa rede neural possui a habilidade de formar mapeamentos que quantizam os dados, preservando a sua topologia. Este trabalho introduz uma nova metodologia de análise de agrupamentos a partir de SOM, que considera o mapa topológico gerado por ele e a topologia dos dados no processo de agrupamento. Uma análise experimental e comparativa é apresentada, evidenciando a potencialidade da proposta, destacando, por fim, as principais contribuições do trabalho. / More than ever, in environment of large decision making, the analysis of data stored massively becomes a real need in almost all knowledge areas. The data analyzing process covers the performing of different tasks that can be executed for different techniques and strategies as the data clustering analysis. This research is focused on the analysis task of data groups, called Data Clustering using Self Organizing Maps (SOM) as principal artifact. SOM is an artificial neural network based on competitive and unsupervised learning, what means that its training is entirely driven by the data, such the neurons of the map compete themselves for doing it. This neural network has the ability to build the mapping task that quantifies the source data, but preserving the topology. This work introduces a new clustering analysis methodology based on SOM, considering the topological map produced by it and also the topology of the data obtained in the clustering process. The experimental and comparative analysis are also presented to demonstrate the potential of the proposal, highlighting at the end the mainly contributions of the work.
|
54 |
APLICAÇÃO DE TÉCNICAS ESTATÍSTICAS MULTIVARIADAS EM DADOS DE CERÂMICA VERMELHA PRODUZIDA NA REGIÃO CENTRAL DO RIO GRANDE DO SULSaad, Danielle de Souza 10 September 2009 (has links)
This work aimed the application of multivaried statistical techniques using Software
STATISTICA 7.0 for Windows, in the analysis of red ceramics data produced in the Central
region of the state of the Rio Grande do Sul. The used variable had been: total monthly
production, massive number of ceramic industries, bricks, structural blocks. The used
techniques had been Cluster Analysis, Factor Analysis, and Principal Components Analysis.
The objective of the technique of Cluster Analysis is to determine the degree of similarity
between the variables. The Factor Analysis aims to reduce the number variable analyzed in
agreement with the Cluster Analysis. The degree of contribution of the variable in the
formation of the factors is identified by the technique of Principal Components Analysis. The
work concluded that the techniques can be applied in data of ceramic products, because of the
results had confirmed previous works. The employed techniques had demonstrated to be
pertinent to the considered objectives. / Este trabalho visou empregar técnicas estatísticas multivariadas através do Software
STATISTICA 7.0 for Windows, na análise de dados de cerâmica vermelha produzidos na
região Central do estado do Rio Grande do Sul. As variáveis utilizadas foram: produção
mensal total, número de indústrias cerâmicas, tijolos maciços, blocos de vedação e blocos
estruturais. As técnicas utilizadas foram Análise de Agrupamento, Análise Fatorial, e Análise
de Componentes Principais. O objetivo da técnica de Análise de Agrupamento é determinar o
grau de similaridade entre as variáveis. A Análise Fatorial visa reduzir o número de variáveis
analisadas em concordância com a Análise de Agrupamento. O grau de contribuição das
variáveis na formação dos fatores é identificado pela técnica de Análise de Componentes
Principais. No trabalho concluiu-se que as técnicas podem ser aplicadas em dados de produtos
cerâmicos, pois os resultados obtidos confirmaram resultados e conclusões obtidas em
trabalhos anteriores. As técnicas empregadas demonstraram ser pertinentes aos objetivos
propostos.
|
55 |
Avaliação de métodos para determinação do número ótimo de clusters em estudo de divergência genética entre acessos de pimenta / Evaluation of methods for determining the optimal number of clusters in the study of the genetic divergence among pepper accessionsFaria, Priscila Neves 19 January 2009 (has links)
Made available in DSpace on 2015-03-26T13:32:05Z (GMT). No. of bitstreams: 1
texto completo.pdf: 688077 bytes, checksum: 369ec0145d58b4c3f2d93ab69403df95 (MD5)
Previous issue date: 2009-01-19 / Coordenação de Aperfeiçoamento de Pessoal de Nível Superior / Many times, the interpretation of the results in cluster analysis is done subjectively, that is, through inspection on dendograms, since there are no objective criteria to identify the formed clusters. In face of such a problem, the present study aimed to: (1) find out an objective way to achieve the cut-point (optimal number of clusters) in a dendogram in order to help on taking the right decision; (2) work out index concepts such as Root Mean Square Standard Deviation (RMSSTD) and R Squared (RS), explaining the contribution of each one of them in determining the optimal number of cluster; (3) method application, aiming to identify divergent accessions that will be used on improvement programs. An alternative solution for this problem is to use the RMSSTD and RS which are calculated according to the number of variables among and within the clusters formed, characterizing an objective way to determine the optimal number. Another solution is achieved by using the RS. Some morphological characteristics of the forty nine accessions of the species Capsicum chinense Jacq. from the Germplasm Bank of Vegetables of the Federal University of Viçosa (Banco de Germoplasma de Hortaliças da Universidade Federal de Viçosa, Minas Gerais Brazil) were analyzed by means of cluster analysis. The accessions were clustered based on the proposed techniques and an optimal number of clusters was achieved. The 49 accessions analyzed were classified into only seven clusters according to the graph of the RMSSTD versus the number of clusters and the graph of the RS versus the number of clusters. / Muitas vezes, a interpretação dos resultados em análise de agrupamentos é feita de forma subjetiva, isto é, através da inspeção de dendrogramas. Isto se deve ao fato de haver dificuldade em se encontrar na literatura um critério objetivo de fácil aplicação para identificar o número ideal de grupos formados. Diante deste problema, o presente trabalho teve por objetivos: 1) Avaliar a aplicabilidade de critério objetivo de se obter o ponto de corte (número ótimo de clusters) num dendrograma para a tomada de decisão; 2) trabalhar os conceitos de índices como RMSSTD (root mean square standard deviation) e RS (R-Squared), discutindo a contribuição de cada um destes na obtenção do número ótimo de clusters em acessos de Capsicum chinense; 3) aplicação do método, visando a identificar acessos divergentes de Capsicum chinense para serem utilizados em programas de melhoramento. Os índices RMSSTD e RS são calculados de acordo com as variáveis entre e dentro dos grupos formados, caracterizando uma forma objetiva para determinar o número ótimo. Para se obter o ponto de máxima curvatura da trajetória dos índices RMSSTD e RS em função do aumento do número de grupos (X), utilizou-se o Método da Máxima Curvatura Modificado. Foram analisadas, por meio da análise de agrupamentos, algumas características morfológicas de quarenta e nove acessos da espécie Capsicum chinense Jacq. do Banco de Germoplasma de Hortaliças da Universidade Federal de Viçosa. A partir das técnicas propostas agrupou-se os acessos, obtendo um número ótimo de grupos. Os resultados classificam os 49 acessos avaliados em apenas sete grupos de acordo com o gráfico do RMSSTD versus o número de grupos e o gráfico do RS versus o número de grupos.
|
56 |
Algoritmos de agrupamento aplicados a dados de express?o g?nica de c?ncer: um estudo comparativoAra?jo, Daniel Sabino Amorim de 11 November 2008 (has links)
Made available in DSpace on 2014-12-17T15:47:48Z (GMT). No. of bitstreams: 1
DanielSAA.pdf: 691771 bytes, checksum: c2a3333a69e8d426409687ac8cfac27f (MD5)
Previous issue date: 2008-11-11 / Coordena??o de Aperfei?oamento de Pessoal de N?vel Superior / The use of clustering methods for the discovery of cancer subtypes has drawn a great deal of attention in the scientific community. While bioinformaticians have proposed new clustering methods that take advantage of characteristics of the gene expression data, the medical community has a preference for using classic clustering methods. There have been no studies thus far performing a large-scale evaluation of different clustering methods in this context. This work presents the first large-scale analysis of seven different clustering methods and four proximity measures for the analysis of 35 cancer gene expression data sets. Results reveal that the finite
mixture of Gaussians, followed closely by k-means, exhibited the best performance in terms of recovering the true structure of the data sets. These methods also exhibited, on average, the smallest difference between the actual number of classes in the data sets and the best number of clusters as indicated by our validation criteria. Furthermore, hierarchical methods, which
have been widely used by the medical community, exhibited a poorer recovery performance than that of the other methods evaluated. Moreover, as a stable basis for the assessment and comparison of different clustering methods for cancer gene expression data, this study provides a common group of data sets (benchmark data sets) to be shared among researchers and used
for comparisons with new methods / O uso de t?cnicas de agrupamento na descoberta de subtipos de c?ncer tem atra?do grande aten??o da comunidade cient?fica. Enquanto bioinformatas prop?em novas t?cnicas de agrupamento que levam em considera??o caracter?sticas dos dados de express?o g?nica, a comunidade m?dica prefere utilizar as t?cnicas cl?ssicas de agrupamento. De fato, n?o existem trabalhos na literatura que realizam uma avalia??o em grande escala de t?cnicas de agrupamento nesse
contexto. Diante disso, este trabalho apresenta o primeiro estudo em grande escala de sete t?cnicas de agrupamento e quatro medidas de proximidade para a an?lise de 35 conjuntos de dados de express?o g?nica. Mais especificamente, os resultados mostram que a t?cnica mistura finita de gaussianas, seguida pelo k-means, apresentam os melhores resultados em termos de recupera??o da estrutura natural dos dados. Esses m?todos tamb?m apresentam a menor diferen?a entre o n?mero real de classes e o n?mero de grupos presente na melhor parti??o. Al?m disso, os m?todos de agrupamento hier?rquico, que v?m sendo bastante utilizados pela comunidade m?dica, apresentaram os piores resultados quando comparados com os outros m?todos investigados. Este trabalho tamb?m apresenta, como uma refer?ncia est?vel para a avalia??o e
compara??o de diferentes algoritmos de agrupamento para dados de express?o g?nica de c?ncer, um conjunto de bases de dados (benchmark data sets) que pode ser compartilhado entre pesquisadores e usado na compara??o de novos m?todos
|
57 |
An?lise de DFA e de agrupamento do perfil de densidade de po?os de petr?leoCosta, Kleber Carlos de Oliveira 22 April 2009 (has links)
Made available in DSpace on 2014-12-17T14:08:35Z (GMT). No. of bitstreams: 1
KleberCOCpdf.pdf: 2178209 bytes, checksum: 588b533d30c060af9cf941e7001d3372 (MD5)
Previous issue date: 2009-04-22 / In recent years, the DFA introduced by Peng, was established as an important tool capable of detecting long-range autocorrelation in time series with non-stationary. This
technique has been successfully applied to various areas such as: Econophysics, Biophysics, Medicine, Physics and Climatology. In this study, we used the DFA technique to obtain the Hurst exponent (H) of the profile of electric density profile (RHOB) of 53 wells resulting from the Field School of Namorados. In this work we want to know if we can or not use H to spatially characterize the spatial data field. Two cases arise: In the first a set of H reflects the local geology, with wells that are geographically closer showing similar H, and then one can use H in geostatistical procedures. In the
second case each well has its proper H and the information of the well are uncorrelated, the profiles show only random fluctuations in H that do not show any spatial structure.
Cluster analysis is a method widely used in carrying out statistical analysis. In this work we use the non-hierarchy method of k-means. In order to verify whether a set of data
generated by the k-means method shows spatial patterns, we create the parameter ?
(index of neighborhood). High ? shows more aggregated data, low ? indicates dispersed or data without spatial correlation. With help of this index and the method of Monte Carlo. Using ? index we verify that random cluster data shows a distribution of ? that is lower than actual cluster ?. Thus we conclude that the data of H obtained in 53 wells are grouped and can be used to characterize space patterns. The analysis of curves level confirmed the results of the k-means / Nos ?ltimos anos, o DFA introduzido por Peng, foi estabelecido como uma importante ferramenta capaz de detectar autocorrela??o de longo alcance em s?ries temporais com n?o-estacionaridade. Esta t?cnica vem sendo aplicado com sucesso a diversas ?reas tais como: Econofis?ca, Biof?sica, Medicina, F?sica e Climatologia. No presente trabalho, utilizamos a t?cnica do DFA para obter o expoente de Hurst (H) do perfil el?trico de densidade (RHOB) de 53 po?os provindos do Campo Escola de Namorado. Neste trabalho queremos saber se podemos, ou n?o, utilizar este expoente
para caracterizar espacialmente o campo. Duas hip?teses surgem: Na primeira o conjunto dos H reflete a geologia local, po?os com mesmo H se encontram pertos, e ent?o se pode
pensar em utilizar H em procedimentos geoestat?sticos espaciais. Na segunda hip?tese cada po?o tem seu H, a informa??o dos H de cada po?o est? descorrelacionada e o
conjunto dos perfis mostra apenas flutua??es aleat?rias em H que n?o revelam qualquer estrutura espacial. A an?lise de agrupamentos ? um m?todo bastante utilizado na realiza??o de an?lises estat?sticas. Nesta disserta??o utilizamos o m?todo de agrupamento n?o hier?rquico chamado m?todo do k-m?dia. Com o objetivo de verificar se um conjunto de dados gerados pelo m?todo do k-m?dia, ou de forma aleat?ria, forma padr?es espaciais, criamos o par?metro ? (?ndice de vizinhan?a). Altos ? implicam em dados mais agregados, baixos ? em dados dispersos ou sem correla??o espacial. Com aux?lio deste ?ndice e do m?todo de Monte Carlo verificamos que os dados agrupados aleatoriamente apresentam uma distribui??o mais baixa de ? do que os obtidos dos dados
concretos e agrupados pelo k-m?dia. Desta forma conclu?mos que os dados de H obtidos nos 53 po?os est?o agrupados e podem ser usados na caracteriza??o espacial de campos.
A an?lise de curvas de n?vel confirmou o resultado do k-m?dia
|
58 |
[en] DEVELOPMENT OF A METHODOLOGY FOR THE DETERMINATION OF METALS IN SEDIMENTS APPLYING CLOSED FLASK MICROWAVES FURNACE AND MULTIVARIATE STATISTICAL ANALYSIS OF METALS IN BACIA DE CAMPOS SEDIMENTS / [pt] METODOLOGIA PARA DETERMINAÇÃO DE METAIS EM SEDIMENTOS UTILIZANDO MICROONDAS COM FRASCO FECHADO E ANÁLISE ESTATÍSTICA MULTIVARIADA DAS CONCENTRAÇÕES DE METAIS EM SEDIMENTOS DA BACIA DE CAMPOSMARIA LUCIA TEIXEIRA GUERRA DE MENDONCA 02 August 2006 (has links)
[pt] Foi estudada a otimização da digestão ácida de amostras de
sedimento visando à
determinação de metais (Al, Fe, Mn,Cr, Ni, V, Cu, Zn e
Pb), usando-se microondas
com frasco fechado. Para tal, verificou-se a recuperação
destes utilizando materiais de
referência certificados: MESS-3, sedimento marinho, do
National Research Council of
Canada (NRCC) e SRM 1645, sedimento de rio, do National
Institute of Standards and
Technology (NIST), sendo a determinação realizada por
espectrometria de emissão
óptica por plasma indutivamente acoplado (ICP-OES). O
processo de digestão ácida
com microondas em sistema fechado foi otimizado empregando-
se planejamento
fatorial com três variáveis e dois níveis. Como resultado,
obteve-se as seguintes
condições operacionais: potência máxima de 600W, o tempo
total de digestão de 40
minutos e uma mistura ácida constituída de 2 mL HNO3 + 6
mL HCl para a digestão
de 250 mg de amostra. Com base na metodologia
desenvolvida, foi realizada a
determinação destes elementos em 163 amostras de sedimento
oriundas da região
petrolífera da Bacia de Campos do Estado do Rio de
Janeiro, Brasil. Os resultados
obtidos foram avaliados empregando técnicas estatísticas
univariadas e multivariadas
como: regressão linear, regressão múltipla, análise de
componente principal (PCA) e
de agrupamento (CA). Foi feito também a comparação dos
dados obtidos com os
resultados do Diagnóstico ambiental das áreas de
exploração e produção de petróleo da
Bacia de Campos, Santos e Espírito Santo (2002) pelo
laboratório contratado pela
Petrobras. / [en] The optimization of acid digestion of sediment samples was
studied with the purpose
of determining the metals (Al, Fe, Mn, Cr, Ni, V, Cu, Zn
and Pb) using closed
microwaves sisteem. For that, the recovery of these metals
was noticed using certified
reference materials: MESS-3, marine sediment, from the
National Research Council of
Canada (NRCC) and SRM 1645, river sediment, from the
National Institute of
Standards and Technology (NIST), with the determination
performed by inductively
coupled plasma optic emission spectrometry (ICP-OES). The
acid digestion process
with closed microwave system was optimized using factorial
planning with three
variables and two levels. As a result, the following
operational conditions were
achieved: maximum power of 600W, total digestion time of
40 minutes, and an acid
mixture of 2 mL HNO3 + 6 mL HCl for 250 mg of sample
digestion. Determination of
these elements in 163 sediment samples from in the oil
region of Bacia de Campos in
the state of Rio de Janeiro, Brazil, was based on the
methodology developed. The
results were evaluated employing univariate and
multivariate statistical techniques
such as: linear regression, multiple regressions,
Principal Component Analysis (PCA)
and Cluster Analysis (CA). The data were compared with the
results from the
environmental diagnosis of oil exploration and production
areas in Bacia de Campos,
Santos and Espírito Santo (2002) by laboratory contracting
by Petrobras.
|
59 |
[en] DATA CLUSTERING: ANALYSIS OF METHODS AND DEVELOPMENT OF APPLICATION FOR CLUSTER ANALYSIS / [pt] AGRUPAMENTOS DE DADOS: AVALIAÇÃO DE MÉTODOS E DESENVOLVIMENTO DE APLICATIVO PARA ANÁLISE DE GRUPOSMARCOS NEVES DO VALE 23 March 2006 (has links)
[pt] A enorme massa de dados que é gerada pelas diversas
empresas diariamente
pode conter informações importantes que não são fáceis de
serem extraídas. Com
isso advém a necessidade de analisá-los automaticamente,
de forma adequada,
extraindo informação útil que pode agregar algum tipo de
conhecimento. Uma das
formas de se analisar os dados automaticamente é através
da análise de
agrupamentos. Ela procura encontrar grupos de dados
semelhantes entre si. As
técnicas de análise de agrupamentos revelam como os dados
estão estruturados e
resultam em um melhor entendimento sobre o negócio. Existe
ainda hoje uma
escassez de ferramentas para esse fim. Em um problema real
de agrupamento de
dados convém analisar os dados através da utilização de
diferentes métodos, a fim
de buscar aquele que melhor se adapte ao problema. Porém,
as ferramentas
existentes hoje em dia não são integradas, onde cada
ferramenta possui um
subconjunto dos métodos existentes de agrupamento. Dessa
forma o usuário fica
limitado à utilização de uma ferramenta específica ou é
obrigado a conhecer
diversas ferramentas diferentes, de forma a melhor
analisar os dados de sua
empresa. Esta dissertação apresenta uma revisão detalhada
de todo o processo de
análise de agrupamentos e o desenvolvimento de um
aplicativo que visa não
apenas a atender as deficiências presentes na maioria das
ferramentas com esse
fim, mas também a auxiliar, de forma mais completa, todo o
processo de análise
dos grupos. O aplicativo desenvolvido é de fácil
utilização e permite que a ele
sejam incorporados outros métodos eventualmente
desenvolvidos pelo usuário. O
aplicativo foi avaliado em três estudos de casos, os quais
visam demonstrar a
facilidade de uso do aplicativo, assim como avaliar as
vantagens do uso de
métodos de natureza fuzzy em uma base de dados real. / [en] The enormous data mass that is daily generated by several
companies can
contain critical information that might not be easily
retrieved, considering that the
amount of data is generally huge and/or the target
information might be spread
through different data bases. Taking that into
consideration, it might be necessary
to properly analyze the data in an automatic way, so
useful and valuable
information can be extracted. One way of automatically
analyzing data is through
cluster analysis. This type of analysis searches for
related similar data. These
clusters settle a data structure model and with proper
analysis can reveal important
information. The techniques used in cluster analysis
disclose how data is
structured and allow a better knowledge of the business.
Still today there is a lack
of tools for this purpose. On a real situation with a data
cluster problem it is wise
to analyze the data through different methods, so we can
find the one that better
fits the problem. However, today the existing tools are
not integrated, and each
tool has a subgroup of existing cluster methods. This way
the user stays limited to
use only one specific tool or is forced to be aware of a
number of different tools,
so he would be able to better analyze the company data.
This study presents a
detailed review of the whole group analysis process and
develops an application
that not only suggests how to cover the currently lack of
tools for this purpose, but
also to help the complete cluster analysis process in a
more extended way. The
application developed is user friendly and allows other
methods developed by
users to be incorporated. The application has been
evaluated into three case
studies with the purpose of demonstrating its user
friendly, as well as evaluating
the advantages of using fuzzy methods on a true data base.
|
60 |
VEGETAÇÃO E MECANISMOS DE REGENERAÇÃO NATURAL EM DIFERENTES AMBIENTES DA FLORESTA OMBRÓFILA MISTA NA FLONA DE SÃO FRANCISCO DE PAULA, RS. / VEGETATION AND MECHANISMS OF NATURAL REGENERATION IN DIFFERENTS ENVIROMENTS OF THE MIXED RAIN FOREST IN THE FLONA OF SÃO FRANCISCO DE PAULA,RSChami, Luciane Belmonte 30 June 2008 (has links)
This study evaluated the phitosociology of the Mixed Rain Forest and its mechanisms of regeneration (seeding banks, seed rain and soil seed bank). The data were collected in six conglomerates, being every one subdivided in 16 parcels of 20m x 20m. In the Chapter I it was studied the adult vegetation, where the tree and shrub species with circumference at the height of the chest equal or bigger than 30 cm were identified and measured. The species were classified in ecological groups and, on the basis
of the density data, it was made an analysis of the grouping using the TWINSPAR method (Two-Way
Indicattor Species Analysis). The groupings were characterized in relation to their horizontal structure.
On the area, they 86 species were identified, being 18 pioneers, 25 secondary initials, 16 secondary delayed, 14 climax, and 13 were classified in more than one group. Three groupings were characterized (G1, G2 nd G3), in which gained special prominence the species Siphoneugena reitzii, Araucaria angustifolia and Sebastiania commersoniana, respectively in environments of hillside, of
emergent trees and humid environments. In the chapter II based in the groupings formed in the adult vegetation, it was evaluated the mechanisms of regeneration. The seed rain was evaluated during the months of January to December of 2007, by means of the disposition of 96 collectors of 1 m2, in which it was observed the significant difference among the three groups in the quantity of seeds dispersed. In the study of the soil seed bank which was held through the collect of 5 cm of ground (taking out the burlap), it was observed that the group G1 showed significant difference in the quantity of storaged
seeds in relation to groups G2 and G3. Seeding banks was showed in 72 showing unities of 2 m x 2 m, in which all the individuals with a size equal or bigger than 20 cm and DAP equal or lesser than 1 cm were identified and counted. The statistic analysis showed that, quantitatively, there was a significant difference among the three groups in relation to numbers of individuals in the seeding bank.
For the joint analyses of the adult vegetation and mechanisms of regeneration, it is concluded, initially
that the seeding bank, for having presented a bigger similarity with the vegetation, it can be the
principal strategy of the maintenance of this forest. The seed rain is a basic strategy to the maintenance of the seeding bank. The seed bank didn´t present a flower potential for substituting the species present in the tree vegetation after alteration of the forest, being an essential strategy to the initial reestablishment of the area., due to the high density of the herbaceous plants. It was considered as tree basic species Araucaria angustifolia, Siphoneugena reitzii, llex brevicuspis, Podocarpus lambertii e Vernonia discolor, in hillside environments; Araucaria angustifolia, Casearia decandra,
Blepharocalyx salicifolius, llex paraguariensis and Sebastiania brasiliensis in emergent tree environments; Araucaria angustifolia, Blepharocalyx salicifolius, Cryptocarya aschersoniana, llex brevicuspis, Sebastiania commersoinana e Siphoneugena reitzii in lands of bigger moistness. Through these informations one gives credit that such species will have greater possibility of stablishment in places with similar environment characteristics. / Este estudo avaliou a fitossociologia de Floresta Ombrófila Mista e os seus mecanismos de regeneração (banco de plântulas, chuva de sementes e banco de sementes do solo). Os dados foram coletados em seis conglomerados, sendo cada um subdividido em 16 parcelas de 20 m x 20 m. No
Capítulo I, estudou-se a vegetação adulta onde as espécies arbóreas e arbustivas com circunferência à altura do peito (CAP) igual ou maior de 30 cm foram identificadas e medidas. As espécies foram classificadas em grupos ecológicos e, com base nos dados de densidade, foi realizada uma análise
de agrupamento utilizando o método TWINSPAN (Two-way Indicator Species Analysis). Os agrupamentos foram caracterizados em relação à sua estrutura horizontal. Na área, foram identificadas 86 espécies, sendo 18 pioneiras, 25 secundárias iniciais, 16 secundárias tardias, 14 clímax, e 13 foram classificadas em mais de um grupo. Foram caracterizados três agrupamentos (G1, G2 e G3), em que se destacaram as espécies Siphoneugena reitzii, Araucaria angustifolia e Sebastiania commersoniana, respectivamente, em ambientes de encosta, de árvores emergentes e
úmido. No capítulo II, partindo dos agrupamentos formados na vegetação adulta, foram avaliados os mecanismos de regeneração. A chuva de sementes foi avaliada durante os meses de janeiro a dezembro de 2007 por meio da disposição de 96 coletores de 1 m², na qual foi observada diferença
significativa entre os três grupos na quantidade de sementes dispersadas. No estudo do banco de sementes do solo, realizado mediante a coleta de 5 cm de solo (retirando a serapilheira), observou-se que o grupo G1 demonstrou diferença significativa na quantidade de sementes estocadas em relação aos grupos G2 e G3. O banco de plântulas foi amostrado em 72 unidades amostrais de 2 m x 2 m, em
que todos os indivíduos com altura igual ou maior que 20 cm e DAP igual ou menor 1 cm foram identificados e contados. A análise estatística mostrou que, quantitativamente, houve diferença significativa entre os três grupos quanto ao número de indivíduos no banco de plântulas. Pela análise conjunta da vegetação adulta e mecanismos de regeneração, conclui-se, inicialmente, que o banco de plântulas, por ter apresentado maior similaridade com a vegetação, pode ser a estratégia principal de manutenção dessa floresta. A chuva de sementes é uma estratégia fundamental à manutenção do banco de plântulas. O banco de sementes não apresentou potencial florístico para substituir as espécies presentes na vegetação arbórea após alteração da floresta, sendo uma estratégia essencial ao restabelecimento inicial da área, dada a elevada densidade de plantas herbáceas. Foram consideradas como espécies arbóreas fundamentais Araucaria angustifolia, Siphoneugena reitzii, Ilex brevicuspis, Podocarpus lambertii e Vernonia discolor, em ambientes de encosta; Araucaria
angustifolia, Casearia decandra, Blepharocalyx salicifolius, Ilex paraguariensis e Sebastiania brasiliensis, em ambiente de arvores emergentes; Araucaria angustifolia, Blepharocalyx salicifolius, Cryptocarya aschersoniana, Ilex brevicuspis, Sebastiania commersoniana e Siphoneugena reitzii em
terrenos de maior umidade. Por meio dessas informações, acredita-se que tais espécies terão maior chance de estabelecimento em locais com características ambientais semelhantes.
|
Page generated in 0.0794 seconds