Submitted by Izabel Franco (izabel-franco@ufscar.br) on 2016-10-11T17:36:54Z
No. of bitstreams: 1
DissVAK.pdf: 4608619 bytes, checksum: 3022034b9035e4e8caf1195902d24581 (MD5) / Approved for entry into archive by Marina Freitas (marinapf@ufscar.br) on 2016-10-21T13:03:21Z (GMT) No. of bitstreams: 1
DissVAK.pdf: 4608619 bytes, checksum: 3022034b9035e4e8caf1195902d24581 (MD5) / Approved for entry into archive by Marina Freitas (marinapf@ufscar.br) on 2016-10-21T13:03:27Z (GMT) No. of bitstreams: 1
DissVAK.pdf: 4608619 bytes, checksum: 3022034b9035e4e8caf1195902d24581 (MD5) / Made available in DSpace on 2016-10-21T13:03:34Z (GMT). No. of bitstreams: 1
DissVAK.pdf: 4608619 bytes, checksum: 3022034b9035e4e8caf1195902d24581 (MD5)
Previous issue date: 2016-08-12 / Não recebi financiamento / Cluster analysis is the organization of a collection of patterns into clusters based on similarity
which is determined by using properties of data. Clustering techniques can be useful in a
variety of knowledge domains such as biotechnology, computer vision, document retrieval and
many others. An interesting area of biology involves the concept of microRNAs (miRNAs) that
are approximately 22 nucleotide-long non-coding RNA molecules that play important roles in
gene regulation. Clustering miRNA sequences can help to understand and explore sequences
belonging to the same cluster that has similar biological functions. This research work
investigates and explores seven unsupervised clustering algorithms based on graphs that can be
divided into three categories: algorithm based on region of influence, algorithm based on
minimum spanning tree and spectral algorithm. To assess the contribution of the proposed
algorithms, data from miRNA families stored in the online miRBase database were used in the
conducted experiments. The results of these experiments were presented, analysed and
evaluated using clustering validation indexes as well as visual analysis. / A análise de agrupamento é uma organização de coleção de padrões em grupos, baseando-se na
similaridade das propriedades pertencentes aos dados. A técnica de agrupamento pode ser
utilizado em muitas áreas de conhecimento como biotecnologia, visão computacional,
recuperação de documentos, entre outras. Uma área interessante da biologia envolve o conceito
de microRNAs (miRNAs), que são moléculas não-codificadas de RNA com aproximadamente
22 nucleotídeos e que desempenham um papel importante na regulação dos genes. O
agrupamento de sequências de miRNA podem ajudar em sua exploração e entendimento, pois
as sequências que pertencem ao mesmo grupo possuem uma função biológica similar. Esse
trabalho explora e investiga sete algoritmos de agrupamentos não-supervisionados baseados em
grafos que podem ser divididos em três categorias: algoritmos baseados em região de
influência, algoritmos baseados em árvore spanning minimal e algoritmo espectral. Para avaliar
a contribuição dos algoritmos propostos, os experimentos conduzidos utilizaram os dados das
famílias de miRNAs disponíveis no banco de dados denominado miRBase. Os resultados dos
experimentos foram apresentados, analisados e avaliados usando índices de validação de
agrupamento e análise visual.
Identifer | oai:union.ndltd.org:IBICT/oai:repositorio.ufscar.br:ufscar/8124 |
Date | 12 August 2016 |
Creators | Kasahara, Viviani Akemi |
Contributors | Nicoletti, Maria do Carmo |
Publisher | Universidade Federal de São Carlos, Câmpus São Carlos, Programa de Pós-graduação em Ciência da Computação, UFSCar |
Source Sets | IBICT Brazilian ETDs |
Language | Portuguese |
Detected Language | Portuguese |
Type | info:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/masterThesis |
Source | reponame:Repositório Institucional da UFSCAR, instname:Universidade Federal de São Carlos, instacron:UFSCAR |
Rights | info:eu-repo/semantics/openAccess |
Page generated in 0.0041 seconds