• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 83
  • 3
  • 3
  • 1
  • 1
  • 1
  • 1
  • 1
  • Tagged with
  • 89
  • 43
  • 41
  • 29
  • 29
  • 26
  • 20
  • 16
  • 15
  • 10
  • 9
  • 9
  • 8
  • 8
  • 8
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
31

Converg?ncia ou diverg?ncia no desenvolvimento? um estudo multidimensional para o Sudeste e o Nordeste do Brasil, 1990-2010

Assis, Renato Silva de 02 August 2013 (has links)
Made available in DSpace on 2014-12-17T14:34:45Z (GMT). No. of bitstreams: 1 RenatoSA_DISSERT.pdf: 579996 bytes, checksum: ea1b221d1f258e0dd61c5b7549c8f5e1 (MD5) Previous issue date: 2013-08-02 / The analysis of some aspects of development in Brazil in the past three decades reveals an improvement on a range of indicators isolated in the south east the richest region and north east the poorest region. From a database of twenty variables, the main purpose the study was to verify if there are indications of convergence or divergence in five dimensions of development between the two regions from 1990 to 2010. Aiming to identify the states more similar and different, and to verify changes in the composition of low development groups and high development in the adressed period, was used the analysis of groupings (Cluster Analysis). Additionally, to test equality of distance between states all the time, was used the non-parametric Test of Wilcoxon. This makes it possible to verify IF the distance between the states of two regions has been increasing or has been falling, showing signs of divergence or convergence. The results of Cluster s analysis suggest that there are indications of convergence inside the cluster of north east, but the distance between two regions has not changed. The results of test of Wilcoxon suggests that there have been no changes statistically significant in the distance between the states, in the two regions the standards of development became more homogenous, but the two regions will be far apart / A an?lise de alguns aspectos do desenvolvimento no Brasil nas ?ltimas tr?s d?cadas evidencia que houve uma melhoria em uma s?rie de indicadores isolados tanto no Sudeste regi?o mais rica - como no Nordeste - regi?o mais pobre. A partir de uma base de dados de vinte vari?veis, o objetivo principal do estudo foi verificar se h? ind?cios de converg?ncia ou diverg?ncia em cinco dimens?es do desenvolvimento entre as duas regi?es no per?odo de 1990 a 2010. Visando identificar os estados mais similares e mais diferentes entre si, bem como verificar altera??es na composi??o dos grupos de baixo desenvolvimento e de alto desenvolvimento no per?odo abordado, foi empregado a An?lise de Agrupamentos (Cluster Analysis). Adicionalmente, para testar a igualdade das dist?ncias entre os estados ao longo do tempo, foi utilizado o teste n?o param?trico de Wilcoxon. Este ?ltimo tornou poss?vel verificar se a dist?ncia entre os estados das duas regi?es vem aumentando ou diminuindo, apresentando ind?cios de diverg?ncia ou converg?ncia. Os resultados da an?lise de Cluster sugerem que h? ind?cios de converg?ncia dentro do cluster do Nordeste, por?m, a dist?ncia entre as duas regi?es n?o foi alterada. Os resultados do teste de Wilcoxon sugerem que n?o houve mudan?as estatisticamente significativas na dist?ncia entre os estados. Dentro das duas regi?es os padr?es de desenvolvimento se tornaram mais homog?neos, por?m, as duas regi?es continuam muito distantes
32

Análise univariada e multivariada em progênies de Eucalyptus camaldulensis Dehnh em Mato Grosso

Silva, Jeane Cabral da 25 February 2014 (has links)
Submitted by Valquíria Barbieri (kikibarbi@hotmail.com) on 2018-05-09T22:31:51Z No. of bitstreams: 1 DISS_2014_Jeane Cabral da Silva.pdf: 1522894 bytes, checksum: 08cb6741edc42ba4263103950ec48fc8 (MD5) / Approved for entry into archive by Jordan (jordanbiblio@gmail.com) on 2018-05-24T12:55:24Z (GMT) No. of bitstreams: 1 DISS_2014_Jeane Cabral da Silva.pdf: 1522894 bytes, checksum: 08cb6741edc42ba4263103950ec48fc8 (MD5) / Made available in DSpace on 2018-05-24T12:55:25Z (GMT). No. of bitstreams: 1 DISS_2014_Jeane Cabral da Silva.pdf: 1522894 bytes, checksum: 08cb6741edc42ba4263103950ec48fc8 (MD5) Previous issue date: 2014-02-25 / O Eucalyptus camaldulensis Dehnh destaca-se entre as espécies do seu gênero, devido a sua ampla plasticidade e seus multiprodutos. O sucesso de um programa de melhoramento genético depende do germoplasma disponível, fatores ambientais e metodologias de seleção. O presente estudo objetivou avaliar a variabilidade e diversidade genética de 132 progênies de Eucalyptus camaldulensis utilizando os métodos univariado e multivariado, instalados na região de Santo Antônio do Leverger – MT, localizado na Serra de São Vicente. Dessa forma, utilizaram-se metodologias para avaliar a variabilidade genética através dos parâmetros genéticos e as técnicas de agrupamentos. O trabalho foi dividido em dois capítulos. No primeiro utilizou-se análise univariada para avaliar os parâmetros genéticos e os ganhos com a seleção. Os resultados indicaram variabilidade genética para os caracteres analisados, especialmente para o caráter DAP. Os maiores ganhos genéticos foram encontrados através da seleção individual, quando comparados à seleção entre e dentro. Assim, esses resultados são importantes na sequência do programa de melhoramento da espécie na área de abrangência do estudo, no Estado de Mato Grosso. No segundo capítulo utilizou-se a análise multivariada para determinar a divergência genética entre as progênies pelo método de agrupamentos Tocher, através das distâncias de Mahalanobis e a Euclidiana. Os resultados mostraram-se eficazes para a alocação das progênies em grupos divergentes, bem como para a classificação das progênies selecionadas, facilitando as estratégias de melhoramento genético da espécie. / The Eucalyptus camaldulensis Dehnh stands out between the species of the genus, due to the wide plasticity and their multi-products. The success of the genetic improvement program depends of the available germplasm, environmental factors and methodologies selection. The present study was estimate to evaluate the genetic variability and diversity to 132 progenies of Eucalyptus camaldulensis using analyze the univariate and multivariate methods, installed in the Santo Antônio de Leverger region - Mt, located in the Serra de São Vicente. Such a way were used methodologies to assess genetic variability through genetic parameters and a grouping techniques. The work was divided into chapters. In the first chapter were used the analysis univariate to evaluate the genetic parameters and the gains with the selection. The results indicated genetic variability for the analyzed characters in particular to DAP. The higher genetic gains were found through the individual selection when compared among the selection between and within. So, these results are important for the sequence of the improvement of the specie in the studies amount area in Mato Grosso State. In the second chapter were used the multivariate analysis for determining the genetic divergence between progenies for a groups methodologies, through the distances Mahalanobis and the Euclidiana. The results proved more effective for the progenies allocation in various groups, just as well for the select progenies classification, facilitates the strategies of the genetic improvemnet of the specie.
33

Contribui??o ao estudo de fus?o de mapas auto organiz?veis de Kohonen com pondera??o por meio de ?ndices de valida??o de agrupamentos

Pasa, Leandro Antonio 19 February 2016 (has links)
Submitted by Automa??o e Estat?stica (sst@bczm.ufrn.br) on 2017-01-04T13:19:42Z No. of bitstreams: 1 LeandroAntonioPasa_TESE.pdf: 2290404 bytes, checksum: 02409d9ddb38171fd363b99f26390d89 (MD5) / Approved for entry into archive by Arlan Eloi Leite Silva (eloihistoriador@yahoo.com.br) on 2017-01-05T18:51:41Z (GMT) No. of bitstreams: 1 LeandroAntonioPasa_TESE.pdf: 2290404 bytes, checksum: 02409d9ddb38171fd363b99f26390d89 (MD5) / Made available in DSpace on 2017-01-05T18:51:41Z (GMT). No. of bitstreams: 1 LeandroAntonioPasa_TESE.pdf: 2290404 bytes, checksum: 02409d9ddb38171fd363b99f26390d89 (MD5) Previous issue date: 2016-02-19 / A quantidade de informa??es coletadas e armazenadas cresce a cada dia nas mais diversas ?reas do conhecimento e t?cnicas de minera??o de dados s?o aplicadas a estes conjuntos de dados com o objetivo de extrair conhecimento ?til. A utiliza??o de um ou outro algoritmo, ou o mesmo algoritmo com diferentes atributos pode levar a diferentes resultados, devido ? diversidade dos conjuntos de dados. Na busca por solu??es eficientes para este problema, foram desenvolvidos m?todos de comit?s de m?quinas. Um comit? de m?quinas ? um conjunto de redes neurais trabalhando independentemente cujos resultados s?o combinados em uma ?nica sa?da, alcan?ando uma melhor generaliza??o do que cada uma das redes trabalhando separadamente. A proposta deste trabalho ? desenvolver um novo m?todo para comit?s de mapas de Kohonen, em que a combina??o (fus?o) dos mapas seja ponderada por ?ndices de valida??o de agrupamentos, que seja v?lido para combina??o de mapas de tamanhos iguais e mapas de tamanhos diferentes. O algoritmo proposto foi testado em variados conjuntos de dados provenientes do reposit?rio UCI e do Conjunto de Problemas Fundamentais de Agrupamento. As simula??es computacionais demonstram que o m?todo proposto neste trabalho ? capaz de alcan?ar resultados promissores, conseguindo elevar a performance em compara??o com um ?nico mapa de Kohonen. / The amount of collected and stored information is growing every day in several areas of knowledge and data mining techniques are applied to these datasets in order to extract useful knowledge. One or another algorithm, or the same algorithm with different attributes, can lead to different results due to the dataset diversity. To solve this problem, machines committees methods were developed. A machine committee is a set of neural networks working independently and the results are combined into a single output, achieving a better generalization. The purpose of this work is to develop a new method for Kohonen maps ensemble, where the maps fusion is weighted by cluster validation indices and is suitable for equal size maps fusion and for different size maps fusion. The proposed algorithm has been tested in multiple data sets from the UCI Machine Learning Repository and Fundamental Clustering Problems Suite. Computer simulations show the proposed method is able to reach encouraging results, obtaining raising performance compared with a single Kohonen map.
34

Novas estrat?gias para conserto de solu??es degeneradas no algoritmo k-means

Dantas, Nielsen Castelo Damasceno 05 October 2016 (has links)
Submitted by Automa??o e Estat?stica (sst@bczm.ufrn.br) on 2017-04-17T22:16:50Z No. of bitstreams: 1 NielsenCasteloDamascenoDantas_TESE.pdf: 581150 bytes, checksum: 9543323aa1568bdc35f349c906b0c64b (MD5) / Approved for entry into archive by Arlan Eloi Leite Silva (eloihistoriador@yahoo.com.br) on 2017-04-19T21:06:11Z (GMT) No. of bitstreams: 1 NielsenCasteloDamascenoDantas_TESE.pdf: 581150 bytes, checksum: 9543323aa1568bdc35f349c906b0c64b (MD5) / Made available in DSpace on 2017-04-19T21:06:11Z (GMT). No. of bitstreams: 1 NielsenCasteloDamascenoDantas_TESE.pdf: 581150 bytes, checksum: 9543323aa1568bdc35f349c906b0c64b (MD5) Previous issue date: 2016-10-05 / O k-means ? um algoritmo benchmark bastante utilizado na ?rea de minera??o de dados.Ele pertence ? grande categoria de heur?sticas com base em etapas delocaliza??o-aloca??o que, alternadamente, localiza centros de cluster e atribu?pontos de dados a eles at? que nenhuma melhoria seja poss?vel. Tais heur?sticass?o conhecidas por sofrer de um fen?meno chamado de degenera??o, em que,alguns dos clusters ficam vazios, e, portanto, fora de uso. Nesta tese, prop?e-sevarias compara??es e uma s?rie de estrat?gias para contornar solu??esdegeneradas durante a execu??o de k-means. Os experimentos computacionaisdemonstram que essas estrat?gias s?o eficientes e levam a melhoressolu??es de agrupamento na grande maioria dos casos testados.
35

Análise de agrupamento de semeadoras manuais quanto à distribuição do número de sementes / Cluster analysis of manual planters according to the distribution of the number of seeds

Patricia Peres Araripe 10 December 2015 (has links)
A semeadora manual é uma ferramenta que, ainda nos dias de hoje, exerce um papel importante em diversos países do mundo que praticam a agricultura familiar e de conservação. Sua utilização é de grande importância devido a minimização do distúrbio do solo, exigências de trabalho no campo, maior produtividade sustentável entre outros fatores. De modo a avaliar e/ou comparar as semeadoras manuais existentes no mercado, diversos trabalhos têm sido realizados, porém considerando somente medidas de posição e dispersão. Neste trabalho é utilizada, como alternativa, uma metodologia para a comparação dos desempenhos das semeadoras manuais. Neste caso, estimou-se as probabilidades associadas a cada categoria de resposta e testou-se a hipótese de que essas probabilidades não variam para as semeadoras quando comparadas duas a duas, utilizando o teste da razão das verossimilhanças e o fator de Bayes nos paradigmas clássico e bayesiano, respectivamente. Por fim, as semeadoras foram agrupadas considerando, como medida de distância, a medida de divergência J-divergência na análise de agrupamento. Como ilustração da metodologia apresentada, são considerados os dados para a comparação de quinze semeadoras manuais de diferentes fabricantes analisados por Molin, Menegatti e Gimenez (2001) em que as semeadoras foram reguladas para depositarem exatamente duas sementes por golpe. Inicialmente, na abordagem clássica, foram comparadas as semeadoras que não possuíam valores nulos nas categorias de resposta, sendo as semeadoras 3, 8 e 14 as que apresentaram melhores comportamentos. Posteriormente, todas as semeadoras foram comparadas duas a duas, agrupando-se as categorias e adicionando as contantes 0,5 ou 1 à cada categoria de resposta. Ao agrupar categorias foi difícil a tomada de conclusões pelo teste da razão de verossimilhanças, evidenciando somente o fato da semeadora 15 ser diferente das demais. Adicionando 0,5 ou 1 à cada categoria não obteve-se, aparentemente, a formação de grupos distintos, como a semeadora 1 pelo teste diferiu das demais e apresentou maior frequência no depósito de duas sementes, o exigido pelo experimento agronômico, foi a recomendada neste trabalho. Na abordagem bayesiana, utilizou-se o fator de Bayes para comparar as semeadoras duas a duas, no entanto as conclusões foram semelhantes às obtidas na abordagem clássica. Finalmente, na análise de agrupamento foi possível uma melhor visualização dos grupos de semeadoras semelhantes entre si em ambas as abordagens, reafirmando os resultados obtidos anteriormente. / The manual planter is a tool that today still has an important role in several countries around the world, which practices family and conservation agriculture. The use of it has importance due to minimizing soil disturbance, labor requirements in the field, most sustainable productivity and other factors. In order to analyze and/or compare the commercial manual planters, several studies have been conducted, but considering only position and dispersion measures. This work presents an alternatively method for comparing the performance of manual planters. In this case, the probabilities associated with each category of response has estimated and the hypothesis that these probabilities not vary for planters when compared in pairs evaluated using the likelihood ratio test and Bayes factor in the classical and bayesian paradigms, respectively. Finally, the planters were grouped considering as a measure of distance, the divergence measure J-divergence in the cluster analysis. As an illustration of this methodology, the data from fifteen manual planters adjusted to deposit exactly two seeds per hit of different manufacturers analyzed by Molin, Menegatti and Gimenez (2001) were considered. Initially, in the classical approach, the planters without zero values in response categories were compared and the planters 3, 8 and 14 presents the better behavior. After, all the planters were compared in pairs, grouping categories and adding the constants 0,5 or 1 for each response category. Grouping categories was difficult making conclusions by the likelihood ratio test, only highlighting the fact that the planter 15 is different from others. Adding 0,5 or 1 for each category, apparently not obtained the formation of different groups, such as planter 1 which by the test differed from the others and presented more frequently the deposit of two seeds, required by agronomic experiment and recommended in this work. In the Bayesian approach, the Bayes factor was used to compare the planters in pairs, but the findings were similar to those obtained in the classical approach. Finally, the cluster analysis allowed a better idea of similar planters groups with each other in the both approaches, confirming the results obtained previously.
36

Estabilidade em análise de agrupamento via modelo AMMI com reamostragem \"bootstrap\" / Stability in clustering analysis through the AMMI methodology with bootstrap

Débora Robert de Godoi 11 October 2013 (has links)
O objetivo deste trabalho é propor uma nova metodologia de interpretação da estabilidade dos métodos de agrupamento, para dados de vegetação, utilizando a metodologia AMMI e a reamostragem (bootstrap), para ganhar confiabilidade nos agrupamentos formados. Os dados utilizados são provenientes do departamento de genética da Escola Superior de Agricultura \"Luiz de Queiroz\", e visam à produtividade de soja. Primeiramente aplica-se a metodologia AMMI e então, é estimada a matriz de distâncias euclidianas - com base nos dados originais e obtidos via reamostragem (bootstrap) - para a aplicação dos métodos de agrupamento (vizinho mais próximo, vizinho mais distante, ligação média, centroide, mediana e Ward). Para a verificação da validade dos agrupamentos formados utiliza-se o coeficiente de correlação cofenética, e pelo teste de Mantel, é apresentada a distribuição empírica dos coeficientes de correlação cofenética. Os agrupamentos obtidos pelos diferentes métodos são, em sua maioria, semelhantes indicando que, em princípio, qualquer um desses métodos seria adequado para a representação. O método que apresenta resultados discrepantes em relação aos outros (tanto para os dados originais, quanto pelos dados obtidos via bootstrap) - na representação gráfica em dendrograma - é método de Ward. Este estudo é promissor na análise da validade de agrupamentos formados em dados de vegetação. / The objective of this work is to propose a new interpretation methodology of clustering methods for vegetation data stability, using the AMMI and bootstrap methodology, to gain reliability in the clusters formed. The database used is from the Departament of Genetics of Luiz de Queiroz College of Agriculture, aiming soybean yield. Firstly AMMI is applied, then the Euclidian distance matrix is estimated - based on the original data and on the acquired by the bootstrap method - for the application of clustering methods (nearest neighbor, furthest neighbor, average linkage, centroid , median and Ward). In order to assess the validity of clusters formed the cophenetic correlation coefficient is used, and the Mantel test, in order to show the empirical distribution of the cophenetic correlation coefficients. The clusters obtained by different methods are, in most cases, quite similar, indicating that in principle, any of these methods would be suitable for the representation. The method that presents discrepant results (for both the original and bootstrap method obtained data) - on the dendrogram graphical representation, compared to the others - is the Ward\'s. This study is promising in the analysis of validity of clusters formed in vegetation data.
37

A dinâmica da distribuição espacial da infecção por HIV e mortalidade por Aids no município de São Paulo 1996-2007 / Dynamics of spatial distribution of HIV infection and Aids mortality in São Paulo from 1996 to 2007

Danilo Rodrigues de Oliveira 05 October 2011 (has links)
Tendo em vista o objetivo geral de analisar o perfil epidemiológico da epidemia de Aids, numa abordagem espaço-temporal dos casos de infecção por HIV e dos óbitos por Aids no município de São Paulo, de 1996 a 2007, o presente estudo usa um delineamento ecológico transversal. A unidade de análise é o Distrito Administrativo. A partir desta unidade são calculados os riscos relativos de se infectar por HIV e de ir a óbito por Aids no período definido. A análise temporal é feita a partir das situações dos anos 1996, 2000, 2004 e 2007, para cada gênero, que indicará a situação do momento e a tendência ao longo do tempo. A análise estatística espacial auxilia a localizar distritos de risco significativamente acima e/ou abaixo da média do município. Foram utilizados os dados referentes a óbitos por Aids por Distrito Administrativo Residencial do município de São Paulo para o período de 1996 a 2007, por gênero e faixa etária da OMS (Organização Mundial de Saúde), obtidos no SINAM do sítio do PRO-AIM (Programa de Aprimoramento da Informação de Mortalidade). Os dados referentes aos totais de população por distrito, ano, gênero e mesmas faixas etárias foram obtidos no sítio da Fundação SEADE. Para o ano 2000, os dados correspondem ao Censo do IBGE e para os demais, às estimativas populacionais desta Fundação. Correspondeu à base cartográfica digital do IBGE setores Censitários para o Município de São Paulo, ano 2000. Foram calculados os riscos relativos (RR) do período e para cada ano para cada distrito administrativo para a infecção por HIV e mortalidade por Aids, por gênero e total da população. O RR foi calculado utilizando-se o programa SaTScan. Os endereços foram geocodificados com o programa Maptitude, a partir da base de logradouros do município de São Paulo, utilizando-se o endereço (rua e número) e o CEP. Os agrupamentos espaciais foram mapeados usando-se a técnica corocromática. Os mapas de agrupamentos mostram os agrupamentos de risco alto em vermelho e de risco baixo, em azul. A evolução da epidemia teve grandes modificações, antes era uma doença que atingia a população de classe alta, hoje o panorama do HIV/Aids nos mostra que a população menos favorecida do ponto de vista socioeconomico é mais afetada devido a falta de informações e preparo para lidar com as medidas preventivas. Pode-se afirmar que a distribuição espaço-temporal da mortalidade por Aids e infecção por HIV caminham de maneira muito semelhante. Em ambos, ocorrem agrupamentos espaciais significativos na região central e casos abaixo do esperado nas regiões centro-sul, sudeste e sul. / Given the overall objective to analyze the epidemiological profile of the AIDS epidemic, in a space-time approach of the cases of HIV infection and AIDS deaths in São Paulo, from 1996 to 2007, this study uses an ecological design cross. The unit of analysis is the Administrative District. From this unit are calculated relative risks of becoming infected with HIV and of dying from AIDS within the defined period. The temporal analysis is done by the circumstances of the years 1996, 2000, 2004 and 2007 for each gender, which indicates the current situation and trends over time. The spatial statistical analysis helps districts find significantly higher risk and / or below average in the municipality. We used data on deaths from AIDS by Administrative District Residential in São Paulo for the period 1996 to 2007, by gender and age of the WHO (World Health Organization), obtained on SINAM Site PRO-AIM ( Improvement Program for Information Mortality). The data on population totals by district, year, genre and the same age groups were obtained at the site of SEADE. For 2000, data correspond to the IBGE Census and for others, the population estimation of the Foundation. It corresponded to the digital base map of IBGE - census tracts for the city of São Paulo, 2000. We calculated relative risks (RR) for the period and for each year in each administrative district to HIV infection and AIDS mortality by gender and total population. The RR was calculated using the program SaTScan. The addresses were geocoded using the Maptitude program, from the base to street addresses in the city of São Paulo, using the address (street and number) and zip code. The spatial clusters were mapped using the corocromática technique. The maps show high risk clusters in red and low risk, in blue. The epidemic has had major modifications before it was a disease that affects the upper class population, today the landscape of HIV / AIDS shows that the less favored population in terms of socioeconomic background is more affected due to the lack of information and preparation to deal with preventive measures. It can be argued that the spatial and temporal distribution of mortality from AIDS and HIV infection much like walking. In both, significant spatial clusters occur in the central site and lower than expected cases in south-central, southeast and south.
38

RELAÇÃO SOLO-FITOSSOCIOLOGIA EM UM REMANESCENTE DE FLORESTA ESTACIONAL DECIDUAL / RELATION SOIL-PHYTOSOCIOLOGY IN A REMAINDER OF ESTACIONAL FOREST DECIDUAL

Almeida, Clarice Maboni de 30 July 2010 (has links)
The study aimed at evaluating tree and shrub vegetation concerning the slope of the soil in Seasonal Deciduous Forest. The vegetation assessment was conducted in 14 plots systematically distributed in the forest and divided into subplots of 10 x 10 m, in which individuals with circumference 1.3 m of soil (CAP) ≥ 30 cm were observed. These individuals represented class I while individuals with a CAP ≥ 15 < 30 cm represented class II. Vegetation was analyzed by means of the TWINSPAN (Two-way Indicator Species Analysis) method to classify groups, within which the horizontal structure of the forest was studied. In 36 subplots, morphological description of the soil profile was carried out, samples were collected for chemical analysis and clay was determined at three depths (0-10, 10-20 and 20-30 cm), as well as slope, which was classified as low slope (1 ≥ 15), medium slope (15 ≥ 35) and high slope (≥35). The relationship between clusters of vegetation, slope and soil characteristics was studied by means of Principal Component Analysis (PCA). In G1, indicator species were Trichilia claussenii, Cupania vernalis and Crysophyllum marginatum and, in G2, Luehea divaricata and Sebastiania commersoniana. In terms of horizontal structure, these species were among the three best represented ones. Both clusters occurred in areas of variable slope, however, G2 took place in an environment which was more susceptible to interference in the vegetation. From PCA, it could be observed that soil characteristics and slope explained 26% of the total variability, and, out of these, 72% was explained in the main component 1, showing a strong correlation between soil characteristics and the presence of phytosociological groups in different slopes. This relationship is stronger for the presence of the two groups in the ranges of medium and high slope, on the other hand, in terms of low slope, the two groups showed no positive correlation with soil characteristics. For G1 in high slope and G2 in medium and high slope, correlation is positive concerning the whole characteristics of cationic exchange. However, G1 in medium slope was strongly correlated to the complex of exchangeable acidity. G2 at higher slopes also shows high correlation with clay, the finer texture may confer a greater degree of aggregation and reactivity, allowing the development of large species such as Luehea divaricata and Cordia americana. In general, due to restrictions of soil and slope, maintaining of the remnants is prior, aiming at important environmental services for the region. / O estudo objetivou avaliar a vegetação arbórea e arbustiva em relação à formação de agrupamentos, declividade do terreno e influência do solo nos agrupamentos em Floresta Estacional Decidual. A avaliação da vegetação foi realizada em 14 parcelas distribuídas sistematicamente na floresta e divididas em subparcelas de 10 x 10 m, onde foram observados os indivíduos com CAP (circunferência a 1,3 m do solo) ≥ 30 cm, os quais representaram a classe I, e indivíduos com 15 ≤ CAP < 30 cm, representando a classe II. Na análise da vegetação utilizou-se o método TWINSPAN (Two-way Indicator Species Analysis) para classificação de grupos, dentro dos quais foi estudada a estrutura horizontal da floresta. Em 36 subparcelas foi realizada a descrição morfológica do perfil do solo, coletada amostra para análise química e determinação de argila em três profundidades (0-10, 10-20 e 20-30 cm), além da declividade, que foi classificada em baixa (1 ≥ 15º), média (15 ≥ 35º) e alta (≥ 35º). A relação com os grupos e características do solo foi estudada por meio de Análise de Componente Principal (PCA). No G1 as espécies indicadoras foram Trichilia claussenii, Cupania vernalis e Crysophyllum marginatum e no grupo G2 Luehea divaricata e Sebastiania commersoniania. Na estrutura horizontal essas espécies estiveram entre as três melhores representadas. Ambos os agrupamentos ocorreram em áreas com variáveis declividades, entretanto, o G2 ocorreu em ambiente mais susceptível às interferências na vegetação. A partir do PCA observou-se que as características do solo e declividade explicaram 26% da variabilidade total, sendo que desses 72% foi explicado no componente principal 1, demonstrando forte correlação entre as características dos solos e a presença dos grupos fitossociológicos em diferentes declividades. Essa relação foi mais expressiva para a presença dos dois grupos nos intervalos de média e alta declividade, por outro lado, em declividade baixa os dois grupos não apresentaram correlação positiva com as características do solo. Para G1 em alta e G2 em média e alta declividade, a correlação é positiva em relação ao conjunto de características de troca catiônica. Entretanto, o G1 em declividade média teve forte correlação com o complexo de acidez trocável. O G2 em maior declividade também apresenta alta correlação com a argila, essa textura mais fina talvez confira um maior poder de agregação e reatividade, permitindo o desenvolvimento de espécies de grande porte como Luehea divaricata e Cordia americana. De forma geral, devido às restrições de solo e declividade, a manutenção do remanescente é prioritária visando importantes serviços ambientais à região.
39

Selecionando candidatos a descritores para agrupamentos hierárquicos de documentos utilizando regras de associação / Selecting candidate labels for hierarchical document clusters using association rules

Santos, Fabiano Fernandes dos 17 September 2010 (has links)
Uma forma de extrair e organizar o conhecimento, que tem recebido muita atenção nos últimos anos, é por meio de uma representação estrutural dividida por tópicos hierarquicamente relacionados. Uma vez construída a estrutura hierárquica, é necessário encontrar descritores para cada um dos grupos obtidos pois a interpretação destes grupos é uma tarefa complexa para o usuário, já que normalmente os algoritmos não apresentam descrições conceituais simples. Os métodos encontrados na literatura consideram cada documento como uma bag-of-words e não exploram explicitamente o relacionamento existente entre os termos dos documento do grupo. No entanto, essas relações podem trazer informações importantes para a decisão dos termos que devem ser escolhidos como descritores dos nós, e poderiam ser representadas por regras de associação. Assim, o objetivo deste trabalho é avaliar a utilização de regras de associação para apoiar a identificação de descritores para agrupamentos hierárquicos. Para isto, foi proposto o método SeCLAR (Selecting Candidate Labels using Association Rules), que explora o uso de regras de associação para a seleção de descritores para agrupamentos hierárquicos de documentos. Este método gera regras de associação baseadas em transações construídas à partir de cada documento da coleção, e utiliza a informação de relacionamento existente entre os grupos do agrupamento hierárquico para selecionar candidatos a descritores. Os resultados da avaliação experimental indicam que é possível obter uma melhora significativa com relação a precisão e a cobertura dos métodos tradicionais / One way to organize knowledge, that has received much attention in recent years, is to create a structural representation divided by hierarchically related topics. Once this structure is built, it is necessary to find labels for each of the obtained clusters, since most algorithms do not produce simple descriptions and the interpretation of these clusters is a difficult task for users. The related works consider each document as a bag-of-words and do not explore explicitly the relationship between the terms of the documents. However, these relationships can provide important information to the decision of the terms that must be chosen as descriptors of the nodes, and could be represented by rass. This works aims to evaluate the use of association rules to support the identification of labels for hierarchical document clusters. Thus, this paper presents the SeCLAR (Selecting Candidate Labels using Association Rules) method, which explores the use of association rules for the selection of good candidates for labels of hierarchical clusters of documents. This method generates association rules based on transactions built from each document in the collection, and uses the information relationship between the nodes of hierarchical clustering to select candidates for labels. The experimental results show that it is possible to obtain a significant improvement with respect to precision and recall of traditional methods
40

Representação de coleções de documentos textuais por meio de regras de associação / Representation of textual document collections through association rules

Rossi, Rafael Geraldeli 16 August 2011 (has links)
O número de documentos textuais disponíveis em formato digital tem aumentado incessantemente. Técnicas de Mineração de Textos são cada vez mais utilizadas para organizar e extrair conhecimento de grandes coleções de documentos textuais. Para o uso dessas técnicas é necessário que os documentos textuais estejam representados em um formato apropriado. A maioria das pesquisas de Mineração de Textos utiliza a abordagem bag-of-words para representar os documentos da coleção. Essa representação usa cada palavra presente na coleção de documentos como possível atributo, ignorando a ordem das palavras, informa ções de pontuação ou estruturais, e é caracterizada pela alta dimensionalidade e por dados esparsos. Por outro lado, a maioria dos conceitos são compostos por mais de uma palavra, como Inteligência Articial, Rede Neural, e Mineração de Textos. As abordagens que geram atributos compostos por mais de uma palavra apresentam outros problemas além dos apresentados pela representação bag-of-words, como a geração de atributos com pouco signicado e uma dimensionalidade muito maior. Neste projeto de mestrado foi proposta uma abordagem para representar documentos textuais nomeada bag-of-related-words. A abordagem proposta gera atributos compostos por palavras relacionadas com o uso de regras de associação. Com as regras de associação, espera-se identicar relações entre palavras de um documento, além de reduzir a dimensionalidade, pois são consideradas apenas as palavras que ocorrem ou que coocorrem acima de uma determinada frequência para gerar as regras. Diferentes maneiras de mapear o documento em transações para possibilitar a geração de regras de associação são analisadas. Diversas medidas de interesse aplicadas às regras de associação para a extração de atributos mais signicativos e a redução do número de atributos também são analisadas. Para avaliar o quanto a representação bag-of-related-words pode auxiliar na organização e extração de conhecimento de coleções de documentos textuais, e na interpretabilidade dos resultados, foram realizados três grupos de experimentos: 1) classicação de documentos textuais para avaliar o quanto os atributos da representação bag-of-related-words são bons para distinguir as categorias dos documentos; 2) agrupamento de documentos textuais para avaliar a qualidade dos grupos obtidos com a bag-of-related-words e consequentemente auxiliar na obtenção da estrutura de uma hierarquia de tópicos; e 3) construção e avaliação de hierarquias de tópicos por especialistas de domínio. Todos os resultados e dimensionalidades foram comparados com a representação bag-of-words. Pelos resultados dos experimentos realizados, pode-se vericar que os atributos da representação bag-of-related-words possuem um poder preditivo tão bom quanto os da representação bag-of-words. A qualidade dos agrupamentos de documentos textuais utilizando a representação bag-of-related-words foi tão boa quanto utilizando a representação bag-of-words. Na avaliação de hierarquias de tópicos por especialistas de domínio, a utilização da representação bag-of-related-words apresentou melhores resultados em todos os quesitos analisados / The amount of textual documents available in digital format is incredibly large. Text Mining techniques are becoming essentials to manage and extract knowledge in big textual document collections. In order to use these techniques, the textual documents need to be represented in an appropriate format to allow the construction of a model that represents the embedded knowledge in these textual documents. Most of the researches on Text Mining uses the bag-of-words approach to represent textual document collections. This representation uses each word in a collection as feature, ignoring the order of the words, structural information, and it is characterized by the high dimensionality and data sparsity. On the other hand, most of the concepts are compounded by more than one word, such as Articial Intelligence, Neural Network, and Text Mining. The approaches which generate features compounded by more than one word to solve this problem, suer from other problems, as the generation of features without meaning and a dimensionality much higher than that of the bag-of-words. An approach to represent textual documents named bag-of-related-words was proposed in this master thesis. The proposed approach generates features compounded by related words using association rules. We hope to identify relationships among words and reduce the dimensionality with the use of association rules, since only the words that occur and cooccur over a frequency threshold will be used to generate rules. Dierent ways to map the document into transactions to allow the extraction of association rules are analyzed. Dierent objective interest measures applied to the association rules to generate more meaningful features and to the reduce the feature number are also analyzed. To evaluate how much the textual document representation proposed in this master project can aid the managing and knowledge extraction from textual document collections, and the understanding of the results, three experiments were carried out: 1) textual document classication to analyze the predictive power of the bag-of-related-words features, 2) textual document clustering to analyze the quality of the cluster using the bag-of-related-words representation 3) topic hierarchies building and evaluation by domain experts. All the results and dimensionalities were compared to the bag-of-words representation. The results presented that the features of the bag-of-related-words representation have a predictive power as good as the features of the bag-of-words representation. The quality of the textual document clustering also was as good as the bag-of-words. The evaluation of the topic hierarchies by domain specialists presented better results when using the bag-of-related-words representation in all the questions analyzed

Page generated in 0.0782 seconds