Spelling suggestions: "subject:"análise dde agrupamento"" "subject:"análise dee agrupamento""
1 |
Métodos de agrupamento difuso multivariado baseados no Fuzzy C-meansPIMENTEL, Bruno Almeida 21 September 2017 (has links)
Submitted by Fernanda Rodrigues de Lima (fernanda.rlima@ufpe.br) on 2018-10-05T21:21:36Z
No. of bitstreams: 2
license_rdf: 811 bytes, checksum: e39d27027a6cc9cb039ad269a5db8e34 (MD5)
TESE Bruno Almeida Pimentel.pdf: 1823660 bytes, checksum: 2dda6d26c679f00a5e642b456730f356 (MD5) / Approved for entry into archive by Alice Araujo (alice.caraujo@ufpe.br) on 2018-11-14T20:59:03Z (GMT) No. of bitstreams: 2
license_rdf: 811 bytes, checksum: e39d27027a6cc9cb039ad269a5db8e34 (MD5)
TESE Bruno Almeida Pimentel.pdf: 1823660 bytes, checksum: 2dda6d26c679f00a5e642b456730f356 (MD5) / Made available in DSpace on 2018-11-14T20:59:03Z (GMT). No. of bitstreams: 2
license_rdf: 811 bytes, checksum: e39d27027a6cc9cb039ad269a5db8e34 (MD5)
TESE Bruno Almeida Pimentel.pdf: 1823660 bytes, checksum: 2dda6d26c679f00a5e642b456730f356 (MD5)
Previous issue date: 2017-09-21 / CNPq / A prática de agrupar objetos de acordo com as similaridades e propriedades observadas é uma atividade importante para muitos ramos da ciência. A sua importância deve-se ao fato que a organização dos dados em grupos é uma forma fundamental para entender e aprender sobre eles. Em Biologia, por exemplo, existe a preocupação de dividir os diferentes animais ou plantas em grupos para melhor entendimento das funções biológicas. Em muitas problemas, além de informar a qual grupo um determinado objeto pertence, é necessário entender quão similar este objeto está para todos os grupos da partição devido à imprecisão ou incerteza dos dados, surgindo, assim, o agrupamento difuso. O principal método de agrupamento difuso bastante conhecido é o Fuzzy C-Means (FCM), o qual tem algumas desvantagens tal como considerar que todos os grupos possuem formas esféricas. Outra desvantagem é que não existe a possibilidade de analisar qual variável (ou um sub-conjunto delas) foi mais importante para definir o valor final do grau de pertinência. Este trabalho apresenta diferentes métodos de agrupamento usando a abordagem difusa presentes na literatura atual e introduz métodos de agrupamento difuso onde os graus de pertinência são multivariados. Desta forma, dado um objeto, é possível calcular o grau dele pertencer a um dado grupo segundo uma variável. A partir deste tipo de grau de pertinência multivariado, duas vantagens podem ser apontadas: 1 - capacidade de interpretar a pertinência de cada objeto para um dado grupo segundo cada variável; 2 - obtenção de mais informação dos dados levando a uma maior qualidade de agrupamento. O objetivo deste trabalho é propor duas categorias de métodos: a primeira é baseada no Fuzzy C-Means e a segunda é baseada no Possibilistic Fuzzy C-Means. Além disso, também são propostos índices de interpretação para avaliar a qualidade do agrupamento para grupo e variável a partir da partição difusa obtida por cada método proposto. Com o objetivo de avaliar o desempenho dos métodos, um estudo comparativo em relação ao agrupamento difuso usando o experimento Monte Carlo é realizado. Foram planejados experimentos com dados sintéticos e reais e um índice de validação é usado para avaliar os métodos. Além disso, aplicação com dados biológicos é apresentada mostrando a utilidade dos métodos propostos. Os resultados mostraram que os métodos multivariados são preferíveis quando as variáveis são independentes e possuem variabilidades intra-classe diferentes. / The practice of classifying objects according to the observed similarities and properties is an important activity for many branches of science. Its importance is due to the fact that the organization of data into groups is a fundamental mode to understand and learn about ones. In Biology, for example, there is concern divide the different animals or plants into groups for better understanding of biological functions. In many problems, besides informing the group which a particular object belongs, it is necessary to understand how this object is similar for all groups due to of the vagueness or uncertainty of the data, emerging, so the fuzzy clustering. The primary method of fuzzy clustering is the Fuzzy C-Means (FCM), which has some disadvantages as considering that all groups have spherical shapes. Another disadvantage is that there is not the possibility to analyze which variable (or a subset of them) was more important to set the final value of the degree of membership. This work presents different clustering methods using fuzzy approach present in the current literature and introduces fuzzy clustering methods where the degrees of membership are multivariate. Thus, given an object, it is possible to calculate the degree it belongs to a group according to a given variable. From this type of degree multivariate relevance, two advantages can be pointed out: 1 - ability to interpret the relevance of each object for a given group according to each variable; 2 – getting more information from the data leading to a better quality of clustering. The objective of this work is to propose two types of methods: the first one is based on the Fuzzy C-Means and the second one is based on the Possibilistic Fuzzy C-Means. Moreover, interpretation indices are also proposed for assessing the quality of the clustering according to each cluster and variable from a fuzzy partition obtained by each proposed method. Aiming to evaluate the performance of the methods, a comparative study with respect to fuzzy clustering using the Monte Carlo experiment is carried out. Experiments with synthetic and real data and a validation index is used to evaluate the methods were planned. Furthermore, application with biological data is presented showing the usefulness of the proposed methods. The results showed that multivariate methods are preferable when the variables are independent and have different intra-class variabilities.
|
2 |
Estudo de "Clusters" de GaAs pelo método de espalhamento múltiplo (SCF-Sw-Xa)Castilho, Caio Mario Castro de 15 July 1976 (has links)
Orientador: Nelson de Jesus Parada / Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Fisica Gleb Wataghin / Made available in DSpace on 2018-07-14T07:41:43Z (GMT). No. of bitstreams: 1
Castilho_CaioMarioCastrode_M.pdf: 1670944 bytes, checksum: 35084297eed51d724e9bdda86de32efa (MD5)
Previous issue date: 1976 / Resumo: No presente trabalho estudamos diversos "clusters" de GaAs com os átomos-constituintes dispostos segundo a configuração do cristal, utilizando o método de espalhamento múltiplo auto-consistente com parâmetro a para o termo de troca variável (SCF - SW - Xa).
Os diversos "clusters" diferenciam-se pelo número de átmos escolhidos, pela natureza do átomo no centro do sistema e pelo potencial em cada uma das regiões. Com as modificações procedidas de um "cluster" para outro, e com a auto-consistência, analisamos a evolução dos níveis de energia obtidos bem como a carga em cada uma das regiões do sistema.
Considerando a natureza covalente das ligações neste semicondutor e devido ao fato de se tomar como vazio o exterior da esfera que circunscreve o "cluster", é proposto um novo critério para a localização do "gap", distinto de considerar a transição entre o último nível "cheio" e o primeiro nível "vazio". Dentro desta ótica obtem-se um valor para o "gap" da mesma ordem de grandeza do valor experimental, cujo valor evolui no sentido aproximar-se deste, quando são efetuadas as modificações com o intuito de reproduzir melhor as condições do cristal real / Abstract: Not informed. / Mestrado / Física / Mestre em Física
|
3 |
Um estudo sobre alguns metodos hierarquicos para analise de agrupamentosPereira, Jose Raimundo Gomes 28 June 1993 (has links)
Orientador : Gabriela Stangenhaus / Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Matematica, Estatistica e Ciencia da Computação / Made available in DSpace on 2018-07-18T10:41:08Z (GMT). No. of bitstreams: 1
Pereira_JoseRaimundoGomes_M.pdf: 2767365 bytes, checksum: b413d4772f9d1c459c584d50dc1bc011 (MD5)
Previous issue date: 1993 / Resumo: Dez métodos hierárquicos aglomerativos para Análise de Agrupamentos tiveram seus desempenhos comparados ante a diferentes estruturas de dados. Foi construido um experimento com estrutura fatorial, onde os fatores eram diferentes aspectos de estrutura de dados. A presença de grupos com sobreposição, a matriz de dispersão dentro dos grupos e a correlação entre as variáveis foram alguns dos fatores considerados. Amostras foram simuladas sob as diferentes condições determinadas pelos cruzamentos dos níveis dos fatores. Os métodos foram aplicados à essas amostras e seus desempenhos mensurados quanto a recuperação das estruturas de grupos embutidas nas amostras. Dentre os fatores estudados, as sobreposição dos grupos foi o que mais afetou o desempenho dos métodos. São feitas sugestões para o emprego de alguns dos métodos. Não sendo detectada a presença de observações com valores discrepantes nos dados é sugerido o emprego dos métodos da Média das Ligações e o Centróide. Ante a presença de observações com essa característica é sugerido o emprego dos métodos da Ligação de Densidades em Dois Estágios e do Beta-Flexível. Nos dois casos ou na falta de informações sobre os dados, é sugerido que o método. De Ward deve sempre ser empregado / Abstract: Not informed / Mestrado / Mestre em Estatística
|
4 |
Uso de ligantes fosforados na sintonização da reatividade de clusters tetranucleares de iridio derivados de [HIr4(CO)10(u-PPh2)]Ziglio, Claudio Marcos 27 July 2018 (has links)
Orientador: Maria Domingues Vargas / Tese (doutorado) - Universidade Estadual de Campinas, Instituto de Quimica / Made available in DSpace on 2018-07-27T03:00:58Z (GMT). No. of bitstreams: 1
Ziglio_ClaudioMarcos_D.pdf: 8415486 bytes, checksum: fa12871011a3b1389a45064245dee548 (MD5)
Previous issue date: 2000 / Doutorado
|
5 |
Caracterização e avaliação climática da estação de crescimento de cultivos agrícolas para o Estado de Minas GeraisMachado, Marco Aurélio de Mello 04 March 1994 (has links)
Submitted by Nathália Faria da Silva (nathaliafsilva.ufv@gmail.com) on 2017-07-27T11:39:56Z
No. of bitstreams: 1
texto completo.pdf: 9736684 bytes, checksum: 2102e8c0f37a0b96558d38a8a065ee35 (MD5) / Made available in DSpace on 2017-07-27T11:39:56Z (GMT). No. of bitstreams: 1
texto completo.pdf: 9736684 bytes, checksum: 2102e8c0f37a0b96558d38a8a065ee35 (MD5)
Previous issue date: 1994-03-04 / Coordenação de Aperfeiçoamento de Pessoal de Nível Superior / Utilizou-se da metodologia e dos resultados de Análise de Agrupamento, apresentados por RIBEIRO (1983) e por ASPIAZU et alii (1990), para delimitação de regiões climaticamente homogêneas do Estado de Minas Gerais, por intermédio do estudo de Índices Meteorológicos. As 10 regiões, consideradas neste estudo, foram analisadas quanto as suas demandas hídricas (respectivamente evapotranspiração potencial e real) e também pelo regime pluviométrico, para o estabelecimento de informações úteis aos produtores e aqueles que lidam com as tomadas de decisão no ambiente agrícola. Além disso, foram investigadas as relações entre as datas prováveis de inicio das chuvas e o comprimento da estação de crescimento de cultivos agrícolas, com especial destaque para a cultura do milho. A utilização da metodologia foi satisfatória, além de terem sido vantajosos os critérios estabelecidos para definição de uma data de inicio das chuvas, embora com limitações. Os resultados, ora obtidos, permitem ao técnico extensionista e ao administrador público, quando conjugados com informações do agricultor, estabelecer épocas propícias ao plantio de culturas, onde o risco de secas é minimizado, bem como maximizar o conjunto de operações ligados ao sistema de manejo.
|
6 |
RELAÇÃO ENTRE PRECIPITAÇÃO E TURBIDEZ EM CURSOS D ÁGUA NO ESPÍRITO SANTOPENEDO, P. H. S. 28 August 2015 (has links)
Made available in DSpace on 2016-08-29T15:37:14Z (GMT). No. of bitstreams: 1
tese_9152_Dissertação Pedro Penedo.pdf: 14665408 bytes, checksum: 299e8ef4a5e1fcbdb0e7a62a0118d5d8 (MD5)
Previous issue date: 2015-08-28 / Objetivou-se com a realização deste trabalho avaliar a relação entre a turbidez e características morfométricas e de uso do solo em 50 bacias hidrográficas no Estado do Espírito Santo. Foram selecionados 50 pontos de adução de água bruta operados pela Companhia Espírito Santense de Saneamento (CESAN) para tratamento e fornecimento à rede de abastecimento público. Para controle do processo de tratamento e dosagem de reagentes, dados de turbidez são coletados periodicamente. Neste estudo foi utilizado médias mensais de turbidez de 48 meses, de Janeiro de 2006 a Dezembro de 2008. As bacias hidrográficas foram delimitadas com a utilização de um modelo digital de elevação hidrologicamente consistido, obtido em ambiente SIG, bem como as respectivas características morfométricas. Os dados de precipitação média mensal de estações pluviométricas referentes ao período foram espacializados utilizando a técnica geoestatística krigagem ordinária. Os dados de uso do solo são oriundos do banco de dados do Instituto Estadual do Meio Ambiente IEMA e da base de dados geográficos do Estado do Espírito Santo Geobases. Foi realizada a análise de regressão entre a turbidez e a precipitação em todas as bacias, resultando em equações com r2 variando entre 0,90 e 0,015. Após eliminação de variáveis independentes com alto coeficiente de correlação entre si, para redução da multicolinearidade, aplicou-se a técnica de análise de agrupamento hierárquico para agrupar as bacias quanto as características morfométricas e de uso de solo similares. Foi realizada a análise de correlação parcial entre as variáveis nos grupos obtidos, para avaliação de sua influencia na turbidez. Foi realizada a análise de regressão múltipla entre as variáveis e a turbidez nos grupos obtidos, resultando em equações ajustadas com r2 entre 0,68 e 0,16. As variações da interação da precipitação, das características morfométricas e de uso do solo com os níveis de turbidez que ocorrem em escala sub-mensal não puderam ser percebidos, o que pode ter contribuído para a imprecisão dos modelos ajustados.
Palavras-chave: bacias hidrográficas; análise de agrupamento; correlação parcial.
|
7 |
Técnicas de agrupamento de dados na mineração de dados químicosde Aguiar Loureiro, Juliana January 2005 (has links)
Made available in DSpace on 2014-06-12T16:01:13Z (GMT). No. of bitstreams: 2
arquivo7201_1.pdf: 2018800 bytes, checksum: 53a5a6f555847d7a5b53bef8739ece02 (MD5)
license.txt: 1748 bytes, checksum: 8a4605be74aa9ea9d79846c1fba20a33 (MD5)
Previous issue date: 2005 / O processo de descoberta de conhecimento em bases de dados (Knowledge
Discovery in Databases KDD) tem por objetivo extrair informações úteis
(conhecimento) a partir de uma extensa quantidade de dados. Este processo,
por sua vez, se constitui de várias etapas, entre elas, a atividade de mineração
dos dados, representada neste estudo sob forma de an´ alise de agrupamento.
Um problema característico dessa etapa é identificar qual ou quais métodos de
agrupamento podem realmente apresentar uma classificação útil e válida para
o conjunto de dados em estudo. Entre os mecanismos de apoio à triagem e
estudo das técnicas de análise de agrupamento está o conhecimento adquirido
sobre o conjunto de dados, o conhecimento de técnicas estatísticas para
realizar a análise exploratória dos dados e principalmente conhecer bem quais
algoritmos são adequados ao problema de interesse. A presente dissertação
visa considerar os procedimentos de KDD apropriados para a aplicação das
técnicas de análise de agrupamento a um conjunto de dados químicos
|
8 |
Algoritmos para determinação do número de grupos em estudos de formas planasOLIVEIRA, Rodrigo Alves de 05 February 2016 (has links)
Submitted by Isaac Francisco de Souza Dias (isaac.souzadias@ufpe.br) on 2016-07-11T16:55:56Z
No. of bitstreams: 2
license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5)
Rodrigo_CD.pdf: 1954769 bytes, checksum: 1848fe54bf3979180fcfc4966a04b492 (MD5) / Made available in DSpace on 2016-07-11T16:55:56Z (GMT). No. of bitstreams: 2
license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5)
Rodrigo_CD.pdf: 1954769 bytes, checksum: 1848fe54bf3979180fcfc4966a04b492 (MD5)
Previous issue date: 2016-02-05 / CAPES / Análise de formas planas é uma área de conhecimento bastante útil e sólida para lidar com
estudos de estruturas de objetos e informação geométrica. A fim de descrever objetos bidimensionais
é necessário especificar um sistema de coordenadas a qual deve ser invariante sob
locação, escala e rotação da configuração tal como as coordenadas de Kendall. E uma versão
linearizada do espaço de formas são as coordenadas tangentes, esta pertence ao espaço Euclidiano,
portanto, toda literatura de análise multivariada pode ser utilizada. Em diversas ocasiões
é necessário agrupar conjuntos de dados de tal maneira que se tenha grupos com características
mais homogêneos entre si. Para tanto Amaral et al. (2010a) desenvolveu o algoritmo K-médias
para lidar com análise de formas. Devido as desvantagens deste algoritmo, Jayasumana et al.
(2013) propôs o algoritmo Kernel K-médias. Estes dois algoritmos dependem da escolha do
número de grupos, K. E para o segundo, deve-se estimar o parâmetro de largura de banda. Em
situações em que não se conhecem os rótulos dos grupos, a escolha de um valor apropriado
para K é difícil. Para resolver esse desafio, medidas de validade tentam determinar como precisamente
se retratam os grupos dos dados. No entanto, diversas medidas de validade surgem,
e diferentes medidas geralmente produzem resultados discrepantes. Esta dissertação introduz
métodos para computar o número de grupos em um determinado conjunto de dados que lidam
com a natureza das estruturas planas. Os métodos propostos são baseados nas medidas de
validade Silhoueta, Davies-Bouldin e os Resíduos Procrustes. Gerou-se amostras de duas populações
da distribuição Bingham complexa a qual possui suporte na esfera unitária; e também
amostras de duas populações com espaço nos marcos. Considera-se vários cenários com alta
e baixa concentração dos dados. Percebe-se que os índices para coordenadas tangentes encontram
corretamente o número de grupos para dados de alta concentração assim como os índices
modificados para coordenadas de Kendall. Já em situações com baixa concentração os índices
para coordenadas tangentes não funcionam bem, portanto, não identificam o número correto de
grupos, ao contrário, os índices com natureza própria de formas planas conseguem estimar o
verdadeiro número de grupos para os dados simulados. Os índices mais apropriados são o Procruste
Residual e o Davies-Bouldin ajustado pela segunda vez. Análise de dados reais mostra
que os índices existentes para coordenadas tangentes e os índices modificados para coordenadas
de Kendall estimam o número correto de grupos. / Statistical Shape Analysis is a useful and solid area of knowledge for deal objects structures
study and geometrical information. In order to describe two-dimensional objects you must specify
a coordinate system which must be filter out translation, rotation and scale information of
the setting as the Kendall coordinates. One linearized version of the shape space in the vicinity
of a particular point of shape space is the tangent coordinates, that belongs to the Euclidian
space, so all multivariate analysis may be used. On several occasions it is necessary to group
data sets in such a way that it has groups with more homogeneous characteristics together.
Therefore, Amaral et al. (2010a) developed the K-means algorithm to deal with shape analysis.
Because of the disadvantages of this algorithm, Jayasumana et al. (2013) proposed Kernel
K-means algoritm. These two algorithms depends on the choice of the number of groups, K.
And for second, to estimate the bandwidth parameter. In situations in which there is no known
labels groups, the choice of an appropriate value for K is difficult. To overcome this challenge,
validity measures attempt to determine how accurately the clusters reflect the data. However,
numerous validity measures proliferate, and different measures often produce disparate results.
This paper introduces methods to compute the number of groups in a given data set that deal
with the nature of the planar shapes. The proposed methods are based on the validity of measures
Silhoutte, Davies-Bouldin and Procrustes Residuals. Samples were generated from two
populations of complex Bingham distribution which is supported on the unit sphere; and also
samples of two populatoin with space in the landmarks. Considered some scenarios with high
and low concentration of data. It is noticed that the contents are properly coordinated tangent
to the number of groups for high-concentration data, as well as modified indices for Kendall
coordinates. Already in situations with low concentration indexes to coordinate tangents do not
work well, so do not identify the correct number of groups, by contrast, the indexes with the
nature of planar shapes can estimate the true number of groups for the simulated data. The most
suitable index are Procrustes Residuals and Davies-Bouldin adapted the second time. Real data
analysis shows that the existing index for tangent coordinates and indexes modified to Kendall
coordinates estimate the correct number of groups.
|
9 |
Planejamento, sintese, caracterização e estudos da atividade de optica não-linear de clusters organometalicosRosseto, Renato 01 August 2018 (has links)
Orientador : Maria Domingues Vargas / Tese (doutorado) - Universidade Estadual de Campinas, Instituto de Quimica / Made available in DSpace on 2018-08-01T20:38:16Z (GMT). No. of bitstreams: 1
Rosseto_Renato_D.pdf: 6253294 bytes, checksum: 043f0e6f666c14c6457334986f59b283 (MD5)
Previous issue date: 2002 / Doutorado
|
10 |
Ação de campos magneticos em alguns sistemas quimicos e biologicosBarboza, Marco Antonio 01 August 2018 (has links)
Orientador : Jose Fernando Gregori Faigle / Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Quimica / Made available in DSpace on 2018-08-01T20:49:13Z (GMT). No. of bitstreams: 1
Barboza_MarcoAntonio_M.pdf: 5056659 bytes, checksum: 4d15b48e0fd3ed0120e13490eb2c9b05 (MD5)
Previous issue date: 2002 / Mestrado
|
Page generated in 0.0985 seconds