Submitted by Mario BC (mario@bc.ufrpe.br) on 2018-05-16T15:14:45Z
No. of bitstreams: 1
Manoel Rivelino Gomes de Oliveira.pdf: 1989352 bytes, checksum: c90a6cdc5ab597ebf9119b283df02988 (MD5) / Made available in DSpace on 2018-05-16T15:14:45Z (GMT). No. of bitstreams: 1
Manoel Rivelino Gomes de Oliveira.pdf: 1989352 bytes, checksum: c90a6cdc5ab597ebf9119b283df02988 (MD5)
Previous issue date: 2016-06-28 / Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - CAPES / The monitoring of water quality is of utmost importance for humanity, whether in rural or urban areas, since all living things depend on this liquid for survival, and it is getting increasingly scarce. The studies on water quality variables still benefits very little statistical methods to detect problems the same. This work aimed to develop a new approach to cluster analysis, from the combination of hierarchical methods and non-hierarchical clustering, showing that these statistical techniques can contribute effectively in studies related to quality variables gives water. This study will use a database related to quality variables gives water collected in cisterns plaques in four settlements located in the city of Serra Talhada Pajeu in the region in the interior of Pernambuco. The methodology used here were the multivariate statistical methods specifically the hierarchical cluster analysis and non-hierarchical and the silhouette of statistical indices as validation criteria of the obtained clusters. The idea is basically to compare the various clustering methods as the "quality" of the groups obtained, relating the quality of water variables of the plaques of cisterns, the various methods used. The groups obtained for cisterns now studied showed that in general the cisterns C14, C49 and C90, C98 are similar among themselves, and dissimilar to other groups according to hierarchical methods of grouping. Regarding the size of the groups, which is generally observed Group 1 scored the highest number of cisterns both in the hierarchical method with the Euclidean distance as the non-hierarchical method k - medoid, while the grouping of hierarchical methods with the metric of canberra and non hierarchical clustering k - mean and fuzzy grouping this behavior was not observed, and consequently the cisterns were better distributed among all groups. The Correlation cophenetic has indicated as better grouping of the average bond method. In fuzzy clustering only two groups were left with seven end eight cisterns respectively, as in the non-hierarchical clustering k - mean hear the formation of three groups which roughly classified the same number of cisterns, and yet it has been found that this grouping method rated a group of dissimilar cisterns of other cisterns classified in other groups where these tanks are easily identified, the is the cisterns C64, C65, C66, C71, C79 and C100 have rates fecal coliforms beyond
abnormality in other quality variables gives water. The k method - medoid also formed three groups, wherein the group 1 allocated many cisterns while groups 2 and 3 were with few observations where cisterns C75, C64 and C53 are the centroids or cisterns which represent each group respectively. Therefore, it is concluded that the hierarchical methods and non-hierarchical clustering aided by the silhouette of statistical index can, quite satisfactorily monitor the water quality boards tanks in a semiarid region of Nordeste Brasileiro. / O monitoramento da qualidade da água é de extrema importância para a humanidade, seja em regiões rurais, seja em regiões urbanas, visto que todos os seres vivos dependem desse líquido para sobrevivência, embora ele esteja ficando cada vez mais escasso. Os estudos realizados em variáveis de qualidade da água ainda se beneficiam muito pouco dos métodos estatísticos, para detectar problemas relacionados a mesma. Neste trabalho, objetivou-se desenvolver uma nova abordagem para a análise de agrupamento, a partir da combinação dos métodos hierárquicos e não-hierárquicos de agrupamento, mostrando que essas técnicas estatísticas podem contribuir de forma eficaz em estudos relacionados a variáveis de qualidade da água. Nesse estudo,utilizamos uma base dedados relacionada a variáveis de qualidade da água, coletada em cisternas de placas, em quatro assentamentos localizados no Município de Serra Talhada, na Região do Pajeú, no sertão do Estado de Pernambuco. A metodologia aqui utilizada foram os métodos estatísticos multivariados, mais especificamente a análise de agrupamento hierárquica e não hierárquica, e os índices da estatística da silhueta como critério de validação dos agrupamentos obtidos. A ideia consistiu basicamente em comparar os vários métodos de agrupamento quanto à “qualidade” dos grupos obtidos, relacionados as variáveis de qualidade da água das cisternas de placas, pelos vários métodos utilizados. Os agrupamentos
obtidos para as cisternas ora estudadas mostraram que, no geral, as cisternas C14, C49, C90e C98 são similares entre si e dissimilares em relação aos demais agrupamentos, de acordo com os métodos hierárquicos de agrupamento. Com relação ao tamanho dos grupos, observou-se que geralmente o grupo 1 classificou o maior número de cisternas tanto nos métodos hierárquicos com a distância euclidiana, quanto no método não hierárquico do k – medoid, enquanto que, nos métodos hierárquicos de agrupamento com a métrica de camberra e nos agrupamentos não hierárquicos de k – média e agrupamento fuzzy, esse comportamento não se verificou, e, consequentemente, as cisternas ficaram melhor distribuídas entre todos
os grupos.A Correção Cofenética indicou como melhor agrupamento o método da ligação média. No agrupamento fuzzy, apenas dois grupos ficaram com sete e oito cisternas respectivamente, já no agrupamento não hierárquico de k – média, houve uma formação de três grupos que classificaram aproximadamente o mesmo número de cisternas. Ainda se verificou que este método de agrupamento classificou um grupo de cisternas dissimilares das demais cisternas classificadas em outros grupos, pois estas cisternas são facilmente identificadas, ou seja, as cisternas C64, C65, C66, C71, C79 e C100 apresentam taxas “elevadas” de coliformes fecais,além de anormalidade em outras variáveis de qualidade da água. O método de k – medoid
também formou três grupos: o grupo 1 alocou muitas cisternas; já os grupos 2 e 3 ficaram com poucas observações,pois as cisternas C75, C64 e C53 são os centróides ou as cisternas que representam cada grupo respectivamente. Portanto, conclui-se que os métodos hierárquicos e não hierárquicos de agrupamento
auxiliados pelo índice da estatística da silhueta podem,de forma bastante satisfatória, monitorar a qualidade da água de cisternas de placas em uma região semiárida do Nordeste Brasileiro.
Identifer | oai:union.ndltd.org:IBICT/oai:tede2:tede2/7253 |
Date | 28 June 2016 |
Creators | OLIVEIRA, Manoel Rivelino Gomes de |
Contributors | CUNHA FILHO, Moacyr, FALCÃO, Ana Patrícia Siqueira Tavares, STOSIC, Tatijana, PISCOYA, Victor Casimiro, FALCÃO, Ana Patrícia Siqueira Tavares, ARAÚJO, Lázaro de Souto |
Publisher | Universidade Federal Rural de Pernambuco, Programa de Pós-Graduação em Biometria e Estatística Aplicada, UFRPE, Brasil, Departamento de Estatística e Informática |
Source Sets | IBICT Brazilian ETDs |
Language | Portuguese |
Detected Language | Portuguese |
Type | info:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/doctoralThesis |
Format | application/pdf |
Source | reponame:Biblioteca Digital de Teses e Dissertações da UFRPE, instname:Universidade Federal Rural de Pernambuco, instacron:UFRPE |
Rights | info:eu-repo/semantics/openAccess |
Relation | 768382242446187918, 600, 600, 600, 600, -6774555140396120501, -5836407828185143517, 2075167498588264571 |
Page generated in 0.0057 seconds