Neste trabalho desenvolvemos um novo algoritmo para clustering para dados de expressão gênica. As abordagens tradicionais utilizam um conjunto de dados na forma de uma tabela de duas dimensões, onde as linhas são os genes e as colunas são as condições experimentais. Nós utilizamos uma estrutura de três dimensões, acrescentando fatias de tempo. Implementamos nosso algoritmo e testamos com conjuntos de dados sintéticos e dados reais, usando índices de validação para comparar os resultados obtidos pelo nosso algoritmo com os resultados produzidos pelo algoritmo TriCluster. Os resultados mostraram que o nosso algoritmo é bom para dados de expressão gênica em três dimensões e pode ser aplicado a dados de outros domínios / In this study we developed a new clustring algorithm for gene expression data. Previous solutions use a dataset in the form of a table, where the rows are the genes and the columns are the experimental conditions. We used a three-dimensional structure adding time-slices. We implemented this algorithm and tested it with synthetic and real data, using validation index to compare our results with the results obtained by the TriCluster algotithm. Results show that our solution is good for three dimensional gene expression data and can be employed to other domains
Identifer | oai:union.ndltd.org:usp.br/oai:teses.usp.br:tde-09052007-155734 |
Date | 29 March 2007 |
Creators | Lopes, Tiago José da Silva |
Contributors | Telles, Guilherme Pimentel |
Publisher | Biblioteca Digitais de Teses e Dissertações da USP |
Source Sets | Universidade de São Paulo |
Language | Portuguese |
Detected Language | Portuguese |
Type | Dissertação de Mestrado |
Format | application/pdf |
Rights | Liberar o conteúdo para acesso público. |
Page generated in 0.0036 seconds