• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 83
  • 3
  • 3
  • 1
  • 1
  • 1
  • 1
  • 1
  • Tagged with
  • 89
  • 43
  • 41
  • 29
  • 29
  • 26
  • 20
  • 16
  • 15
  • 10
  • 9
  • 9
  • 8
  • 8
  • 8
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
1

Estudo e aplicações do método de agrupamento baseado no modelo

LEAL, Patrícia Batista January 2004 (has links)
Made available in DSpace on 2014-06-12T18:06:23Z (GMT). No. of bitstreams: 2 arquivo7262_1.pdf: 436705 bytes, checksum: fddac2f1f4b394bc765afe6cb4e3c334 (MD5) license.txt: 1748 bytes, checksum: 8a4605be74aa9ea9d79846c1fba20a33 (MD5) Previous issue date: 2004 / Coordenação de Aperfeiçoamento de Pessoal de Nível Superior / Análise de agrupamento é um termo genérico que abrange vários métodos numéricos para estudar dados multivariados com o intuito de classificar as observações em grupos homogêneos. Neste trabalho se apresenta uma síntese dos métodos de agrupamento existentes e se realiza uma descrição detalhada de um método particular de agrupamento hierárquico aglomerativo baseado em modelos que considera um critério bayesiano para a determinação do melhor modelo e dos possíveis grupos existentes. Duas aplicações desta metodologia foram realizadas. A primeira utilizando o banco de dados do Instituto de Pesquisa Econômica e Aplicada que contém informações sobre finançãs públicas. A segunda com o banco de dados do Sistema Único de Saúde relacionadas a área de saúde. Na realização das duas foram utilizados os municípios de Pernambuco visando uma classificação dos mesmos verificando os grupos mais homogêneos, os municípios com valores extremos para cada variável. É apresentada também uma discussão dos resultados obtidos
2

Feiras livres de Cascavel e de Ocara: Caracterização, análise da renda e das formas de governança dos feirantes

Coêlho, Jackson Dantas January 2008 (has links)
COELHO, Jackson Dantas. Feiras livres de Cascavel e de Ocara: caracterização, análise da renda e das formas de governanças dos feirantes. 2008. 151 f.: Dissertação (mestrado) - Universidade Federal do Ceará. Mestrado Acadêmico em Economia Rural (MAER). Centro de Ciências Agrárias. Fortaleza-CE. 2008 / Submitted by Francisco Helder Macêdo Rangel (fhelder@ufc.br) on 2014-09-16T15:21:31Z No. of bitstreams: 1 2008_dis_jdcoelho.pdf: 1792359 bytes, checksum: cd2e4395680cdde57f5f61e015f0ef5e (MD5) / Approved for entry into archive by Margareth Mesquita(margaret@ufc.br) on 2014-09-17T13:28:35Z (GMT) No. of bitstreams: 1 2008_dis_jdcoelho.pdf: 1792359 bytes, checksum: cd2e4395680cdde57f5f61e015f0ef5e (MD5) / Made available in DSpace on 2014-09-17T13:28:35Z (GMT). No. of bitstreams: 1 2008_dis_jdcoelho.pdf: 1792359 bytes, checksum: cd2e4395680cdde57f5f61e015f0ef5e (MD5) Previous issue date: 2008 / It was looked for to identify, in this work, the characteristics that differentiate the merchants that act in free markets of cities with different levels of development (Cascavel and Ocara). Primary data were collected in questionnaaires applied with the merchants; some statistical tests confirmed the absence of significant difference for some lifted up variables, with base in the comparison of the cities for the criterion of IDH, reason for which the cluster analysis was adopted for best differentiate the merchants. Among the reached results, stand out; the more adopted purchase forms are the cash sale and pay after sold the merchandise, for the merchandise not produced by the merchant. The type of sold product, the proximity of Ceasa, limited edafo-climatic conditions for agricultural products, middlemen's existence, the merchant's socioeconomic condition and means inthe merchandise purchase are factors that influence the governance form of the merchants transactions. Was ended that, in the Cascavel, the merchants depend less on the government transfers, and in Ocara, that dependence is larger, but smaller than it was imagined; the capital stock level among the merchants is very low; in infrastructure terms, Ocara's fair needs larger attention, given the lack of the basic, as a public market with points of water and bathrooms; Cascavel's fair, in spite of the existent infrastructure, also needs improvements, mainly in animals fair, in the subject of the cleaning, installation of equipments, night surveillance and standardization of clothing stands; and that BNB could study financing possibilities for the prone merchants to request loans – the ones that work with fruits and vegetables, pork/mutton or fish – and that, not being a producer, he/she buys the merchandise of no relatives producers or middlemen of out of the city, paying after sold the merchandise, in Cascavel, and the ones that sell alive animals or fish, buying to his/her view merchandise of middlemen of the city or no, in Ocara. / Buscaram-se identificar as características que diferentes os feirantes que atuam em feiras livres de municípios com níveis de desenvolvimento distintos (Cascavel e Ocara). Levantaram-se dados primários recolhidos em questionários aplicados com os feirantes; alguns testes estatísticos confirmaram a ausência de diferença significativa para algumas variáveis levantadas, com base na comparação dos municípios pelo critério de IDH, razão pela qual se adotou a análise de agrupamentos para melhor diferenciar os feirantes. Entre os resultados alcançados, destacam-se as formas de compra mais adotadas, a compra à vista e a no “apurado”, para a mercadoria não produzida pela feirante. O tipo de produto vendido, a proximidade da Ceasa, limitadas condições edafo-climáticas para produtos agropecuários, existência de intermediários, condição socioeconômico do feirante e facilidades na compra de mercadoria são fatores que influenciam forma de governança das transações dos feirantes. Conclui-se que, em Cascavel, os feirantes dependem menos das transferências governamentais e, em Ocara, essa dependência é maior, mas menor do que se imaginava; o nível de capital social entre os feirantes é muito baixo; em termos de infra-estrutura, a feira de Ocara necessita de atenção maior, dada da falta do básico, como um mercado público com pontos d'água e banheiros; a feira de Cascavel, apesar da infra-estrutura existente, também necessita de melhorias, principalmente na feira dos animais, na limpeza, na instalação de equipamentos, na vigilância noturna e na padronização de bancas de vestuário; além disso, vê-se que o BNB poderia estudar possibilidades de financiamentos pra os feirantes mais propensos a solicitar empréstimos – os que lidam com hortifrutigranjeiros, carne suína/criação ou peixe/frutos do mar – e que, em não produzindo, compram a mercadoria de produtos não parentes ou intermediários de fora do município, pagando no “apurado”, em Cascavel; e os que vendem animais vivos ou peixe, comprando à vista sua mercadoria de intermediários do município ou não, em Ocara.
3

On the evaluation of clustering results: measures, ensembles, and gene expression data analysis / Sobre a avaliação de resultados de agrupamento: medidas, comitês e análise de dados de expressão gênica

Pablo Andretta Jaskowiak 27 November 2015 (has links)
Clustering plays an important role in the exploratory analysis of data. Its goal is to organize objects into a finite set of categories, i.e., clusters, in the hope that meaningful and previously unknown relationships will emerge from the process. Not every clustering result is meaningful, though. In fact, virtually all clustering algorithms will yield a result, even if the data under analysis has no true clusters. If clusters do exist, one still has to determine the best configuration of parameters for the clustering algorithm in hand, in order to avoid poor outcomes. This selection is usually performed with the aid of clustering validity criteria, which evaluate clustering results in a quantitative fashion. In this thesis we study the evaluation/validation of clustering results, proposing, in a broad context, measures and relative validity criteria ensembles. Regarding measures, we propose the use of the Area Under the Curve (AUC) of the Receiver Operating Characteristics (ROC) curve as a relative validity criterion for clustering. Besides providing an empirical evaluation of AUC, we theoretically explore some of its properties and its relation to another measure, known as Gamma. A relative criterion for the validation of density based clustering results, proposed with the participation of the author of this thesis, is also reviewed. In the case of ensembles, we propose their use as means to avoid the evaluation of clustering results based on a single, ad-hoc selected, measure. In this particular scope, we: (i) show that ensembles built on the basis of arbitrarily selected members have limited practical applicability; and (ii) devise a simple, yet effective heuristic approach to select ensemble members, based on their effectiveness and complementarity. Finally, we consider clustering evaluation in the specific context of gene expression data. In this particular case we evaluate the use of external information from the Geno Ontology for the evaluation of distance measures and clustering results / Técnicas de agrupamento desempenham um papel fundamental na análise exploratória de dados. Seu objetivo é a organização de objetos em um conjunto finito de categorias, i.e., grupos (clusters), na expectativa de que relações significativas entre objetos resultem do processo. Nem todos resultados de agrupamento são relevantes, entretanto. De fato, a vasta maioria dos algoritmos de agrupamento existentes produzirá um resultado (partição), mesmo em casos para os quais não existe uma estrutura real de grupos nos dados. Se grupos de fato existem, a determinação do melhor conjunto de parâmetros para estes algoritmos ainda é necessária, a fim de evitar a utilização de resultados espúrios. Tal determinação é usualmente feita por meio de critérios de validação, os quais avaliam os resultados de agrupamento de forma quantitativa. A avaliação/validação de resultados de agrupamentos é o foco desta tese. Em um contexto geral, critérios de validação relativos e a combinação dos mesmos (ensembles) são propostas. No que tange critérios, propõe-se o uso da área sob a curva (AUC Area Under the Curve) proveniente de avaliações ROC (Receiver Operating Characteristics) como um critério de validação relativo no contexto de agrupamento. Além de uma avaliação empírica da AUC, são exploradas algumas de suas propriedades teóricas, bem como a sua relação com outro critério relativo existente, conhecido como Gamma. Ainda com relação à critérios, um índice relativo para a validação de resultados de agrupamentos baseados em densidade, proposto com a participação do autor desta tese, é revisado. No que diz respeito à combinação de critérios, mostra-se que: (i) combinações baseadas em uma seleção arbitrária de índices possuem aplicação prática limitada; e (ii) com o uso de heurísticas para seleção de membros da combinação, melhores resultados podem ser obtidos. Finalmente, considera-se a avaliação/validação no contexto de dados de expressão gênica. Neste caso particular estuda-se o uso de informação da Gene Ontology, na forma de similaridades semânticas, na avaliação de medidas de dissimilaridade e resultados de agrupamentos de genes.
4

On the evaluation of clustering results: measures, ensembles, and gene expression data analysis / Sobre a avaliação de resultados de agrupamento: medidas, comitês e análise de dados de expressão gênica

Jaskowiak, Pablo Andretta 27 November 2015 (has links)
Clustering plays an important role in the exploratory analysis of data. Its goal is to organize objects into a finite set of categories, i.e., clusters, in the hope that meaningful and previously unknown relationships will emerge from the process. Not every clustering result is meaningful, though. In fact, virtually all clustering algorithms will yield a result, even if the data under analysis has no true clusters. If clusters do exist, one still has to determine the best configuration of parameters for the clustering algorithm in hand, in order to avoid poor outcomes. This selection is usually performed with the aid of clustering validity criteria, which evaluate clustering results in a quantitative fashion. In this thesis we study the evaluation/validation of clustering results, proposing, in a broad context, measures and relative validity criteria ensembles. Regarding measures, we propose the use of the Area Under the Curve (AUC) of the Receiver Operating Characteristics (ROC) curve as a relative validity criterion for clustering. Besides providing an empirical evaluation of AUC, we theoretically explore some of its properties and its relation to another measure, known as Gamma. A relative criterion for the validation of density based clustering results, proposed with the participation of the author of this thesis, is also reviewed. In the case of ensembles, we propose their use as means to avoid the evaluation of clustering results based on a single, ad-hoc selected, measure. In this particular scope, we: (i) show that ensembles built on the basis of arbitrarily selected members have limited practical applicability; and (ii) devise a simple, yet effective heuristic approach to select ensemble members, based on their effectiveness and complementarity. Finally, we consider clustering evaluation in the specific context of gene expression data. In this particular case we evaluate the use of external information from the Geno Ontology for the evaluation of distance measures and clustering results / Técnicas de agrupamento desempenham um papel fundamental na análise exploratória de dados. Seu objetivo é a organização de objetos em um conjunto finito de categorias, i.e., grupos (clusters), na expectativa de que relações significativas entre objetos resultem do processo. Nem todos resultados de agrupamento são relevantes, entretanto. De fato, a vasta maioria dos algoritmos de agrupamento existentes produzirá um resultado (partição), mesmo em casos para os quais não existe uma estrutura real de grupos nos dados. Se grupos de fato existem, a determinação do melhor conjunto de parâmetros para estes algoritmos ainda é necessária, a fim de evitar a utilização de resultados espúrios. Tal determinação é usualmente feita por meio de critérios de validação, os quais avaliam os resultados de agrupamento de forma quantitativa. A avaliação/validação de resultados de agrupamentos é o foco desta tese. Em um contexto geral, critérios de validação relativos e a combinação dos mesmos (ensembles) são propostas. No que tange critérios, propõe-se o uso da área sob a curva (AUC Area Under the Curve) proveniente de avaliações ROC (Receiver Operating Characteristics) como um critério de validação relativo no contexto de agrupamento. Além de uma avaliação empírica da AUC, são exploradas algumas de suas propriedades teóricas, bem como a sua relação com outro critério relativo existente, conhecido como Gamma. Ainda com relação à critérios, um índice relativo para a validação de resultados de agrupamentos baseados em densidade, proposto com a participação do autor desta tese, é revisado. No que diz respeito à combinação de critérios, mostra-se que: (i) combinações baseadas em uma seleção arbitrária de índices possuem aplicação prática limitada; e (ii) com o uso de heurísticas para seleção de membros da combinação, melhores resultados podem ser obtidos. Finalmente, considera-se a avaliação/validação no contexto de dados de expressão gênica. Neste caso particular estuda-se o uso de informação da Gene Ontology, na forma de similaridades semânticas, na avaliação de medidas de dissimilaridade e resultados de agrupamentos de genes.
5

Comparação e escolha de agrupamentos: uma proposta utilizando a entropia / Comparison and selection of the clustering: a method using entropy

Souza, Estevão Freitas de 06 August 2007 (has links)
A análise de agrupamentos (cluster analysis) é o conjunto de ferramentas estatísticas de análise multivariada para encontrar ou revelar a existência de grupos em uma amostra. A literatura apresenta muitos métodos para particionar um conjunto de dados. Porém, ao utilizá-los, o pesquisador muitas vezes se depara com o problema de decidir em quantos grupos deverá ser feita essa divisão, bem como comparar agrupamentos obtidos por diferentes métodos estabelecendo quão semelhantes eles são. Neste trabalho é feita uma revisão dos principais métodos de comparação de agrupamentos e é apresentada uma nova técnica para a escolha do número ideal de grupos, baseada na diferença de entropias. Afim de avaliá-la, estudos de simulação foram realizados comparando-a com outras técnicas conhecidas: a estatística Gap e a silhueta média. Os resultados indicaram que a nova proposta é tão ou mais eficiente que as demais, no sentido de encontrar o número correto de grupos. Além disso, ela também é computacionalmente mais rápida e de simples implementação. Duas aplicações a dados reais são apresentadas, ambas na área de genética. / Cluster analysis is the set of multivariate statistical techniques to uncover or discover groups in a sample. There?s plenty of methods in the literature to partition a dataset. But, when doing so, the user is frequently faced with the problem of choosing the appropriate number of groups and, also, how to compare clusterings obtained through different methods and establish how similar they are. In the present work, it is presented a revision of methods to compare clusterings and proposed a new technique to choose the appropriate number of groups, based on the difference of entropies. To evaluate it, a simulation study was made comparing it with other already known techniques: the Gap statistic and the silhouette. The results indicated that the new approach is more or as efficient as the others, in the sense of finding the correct number of clusters. Moreover, it is computationally faster and simple to implement. Two application are shown, both in genetics.
6

Agrupamento espectral através de grafos Laplacianos e uma aplicação no cultivo da soja /

Moura, Larissa. January 2018 (has links)
Orientador: Alice Kimie Miwa Libardi / Banca: Thiago de Melo / Banca: Washington Mio / Resumo: O objetivo desta dissertação é apresentar uma versão detalhada do artigo: "A Tutorial on Spectral Clustering" de U. von Luxburg sobre agrupamentos através de grafos Laplacianos, suas propriedades e mostrar alguns resultados da teoria de agrupamentos. Além disso, serão apresentados três algoritmos de agrupamentos e ilustraremos um deles com uma aplicação no cultivo da soja em diferentes condições de cultivo / Abstract: The main goal of this dissertation is to present a detailed version of the paper: " A Tutorial on Spectral Clustering" of U. von Luxburg on clusters, through Laplacian graphs, their properties and to show some results of the cluster theory. In addition, it will be presented three clustering algorithms and we will illustrate one of them with an application in the soybean cultivation, under different conditions / Mestre
7

Agrupamento espectral através de grafos Laplacianos e uma aplicação no cultivo da soja. / Spectral clustering through Laplacian graphs and an application in soybean cultivation.

Moura, Larissa 16 February 2018 (has links)
Submitted by Larissa Moura null (moura.larie@gmail.com) on 2018-02-26T11:39:11Z No. of bitstreams: 1 moura_larissa_sjrp.pdf: 1591130 bytes, checksum: 7997e476e0c0da8c86b51d6ce91c8898 (MD5) / Approved for entry into archive by Elza Mitiko Sato null (elzasato@ibilce.unesp.br) on 2018-02-26T19:05:03Z (GMT) No. of bitstreams: 1 moura_l_me_sjrp.pdf: 1591130 bytes, checksum: 7997e476e0c0da8c86b51d6ce91c8898 (MD5) / Made available in DSpace on 2018-02-26T19:05:04Z (GMT). No. of bitstreams: 1 moura_l_me_sjrp.pdf: 1591130 bytes, checksum: 7997e476e0c0da8c86b51d6ce91c8898 (MD5) Previous issue date: 2018-02-16 / Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES) / O objetivo desta dissertação é apresentar uma versão detalhada do artigo: “A Tutorial on Spectral Clustering” de U. von Luxburg sobre agrupamentos através de grafos Laplacianos, suas propriedades e mostrar alguns resultados da teoria de agrupamentos. Além disso, serão apresentados três algoritmos de agrupamentos e ilustraremos um deles com uma aplicação no cultivo da soja em diferentes condições de cultivo. / The main goal of this dissertation is to present a detailed version of the paper: “ A Tutorial on Spectral Clustering” of U. von Luxburg on clusters, through Laplacian graphs, their properties and to show some results of the cluster theory. In addition, it will be presented three clustering algorithms and we will illustrate one of them with an application in the soybean cultivation, under different conditions.
8

Comparação e escolha de agrupamentos: uma proposta utilizando a entropia / Comparison and selection of the clustering: a method using entropy

Estevão Freitas de Souza 06 August 2007 (has links)
A análise de agrupamentos (cluster analysis) é o conjunto de ferramentas estatísticas de análise multivariada para encontrar ou revelar a existência de grupos em uma amostra. A literatura apresenta muitos métodos para particionar um conjunto de dados. Porém, ao utilizá-los, o pesquisador muitas vezes se depara com o problema de decidir em quantos grupos deverá ser feita essa divisão, bem como comparar agrupamentos obtidos por diferentes métodos estabelecendo quão semelhantes eles são. Neste trabalho é feita uma revisão dos principais métodos de comparação de agrupamentos e é apresentada uma nova técnica para a escolha do número ideal de grupos, baseada na diferença de entropias. Afim de avaliá-la, estudos de simulação foram realizados comparando-a com outras técnicas conhecidas: a estatística Gap e a silhueta média. Os resultados indicaram que a nova proposta é tão ou mais eficiente que as demais, no sentido de encontrar o número correto de grupos. Além disso, ela também é computacionalmente mais rápida e de simples implementação. Duas aplicações a dados reais são apresentadas, ambas na área de genética. / Cluster analysis is the set of multivariate statistical techniques to uncover or discover groups in a sample. There?s plenty of methods in the literature to partition a dataset. But, when doing so, the user is frequently faced with the problem of choosing the appropriate number of groups and, also, how to compare clusterings obtained through different methods and establish how similar they are. In the present work, it is presented a revision of methods to compare clusterings and proposed a new technique to choose the appropriate number of groups, based on the difference of entropies. To evaluate it, a simulation study was made comparing it with other already known techniques: the Gap statistic and the silhouette. The results indicated that the new approach is more or as efficient as the others, in the sense of finding the correct number of clusters. Moreover, it is computationally faster and simple to implement. Two application are shown, both in genetics.
9

Diagnóstico do processo de Berlliner, comportamento elementar e modo de erro que são causadores das maiores interrupções de energia elétrica

Silva, Vanessa Nóbrega da 18 November 2013 (has links)
Submitted by Daniella Sodre (daniella.sodre@ufpe.br) on 2015-04-13T12:33:40Z No. of bitstreams: 2 DISSERTAÇÃO Vanessa Nóbrega da Silva.pdf: 1860704 bytes, checksum: c83db0ac4446bfadfa4ef90a8403ad60 (MD5) license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5) / Made available in DSpace on 2015-04-13T12:33:40Z (GMT). No. of bitstreams: 2 DISSERTAÇÃO Vanessa Nóbrega da Silva.pdf: 1860704 bytes, checksum: c83db0ac4446bfadfa4ef90a8403ad60 (MD5) license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5) Previous issue date: 2013-11-18 / CAPES / O desempenho humano tem sido estudado com mais acuidade com o objetivo de se dispor de ambientes mais confiáveis e eficientes, de modo que as limitações impostas a ele sejam estudadas, analisadas e propostas medidas que auxiliem na minimização dos erros que decorrem do elemento humano. Nesse cenário, várias taxonomias do erro humano foram propostas por diversos estudiosos como: Rasmussen (1983), Reason (1990) e Berliner (1964). Estas taxonomias apresentam algumas formas dos tipos de erros humanos, tais como os erros por falta de conhecimento, de regra, de ação, erros baseados na memória, no engano, nas maneiras como o erro ocorre dentre outros. O estudo está alicerçado no modelo proposto por Vilela (2013) em que a taxonomia proposta pelo autor foi adaptada através da inserção do tipo de erro "lapso" a estrutura e, posteriormente, foi realizado um estudo dos modos de falha, comportamento elementar e processo de Berliner que causaram mais interrupções de energia elétrica entre os anos de 1998 e 2009. Para tanto, a metodologia foi baseada em uma análise multivariada chamada de análise de agrupamentos (cluster) que auxiliou na divisão dos erros humanos por grupos de características semelhantes e evidenciou quais grupos eram responsáveis pelas maiores interrupções de energia elétrica. A metodologia auxilia na identificação mais realística do comportamento humano que ocasionou o erro e, por conseguinte, fornece suporte para uma proposição de soluções que possam contribuir para a redução dos erros humanos. O resultado da análise de agrupamento identificou os grupos 3 e 4 como os maiores ocasionadores de interrupções de energia elétrica com o processo de Berliner perceptivo com 69,62% dos erros e o cognitivo com 94,73%, respectivamente. Também foi realizada uma mensuração dos custos envolvidos na interrupção de energia elétrica e ficou evidenciado um alto valor na perda de faturamento da empresa no período estudado.
10

Comparative analysis of clustering methods for gene expresion data

Gesteira Costa Filho, Ivan January 2003 (has links)
Made available in DSpace on 2014-06-12T15:59:06Z (GMT). No. of bitstreams: 2 arquivo4839_1.pdf: 1378221 bytes, checksum: f1a933734804959bb52fd2eef936641b (MD5) license.txt: 1748 bytes, checksum: 8a4605be74aa9ea9d79846c1fba20a33 (MD5) Previous issue date: 2003 / Large scale approaches, namely proteomics and transcriptomics, will play the most important role of the so-called post-genomics. These approaches allow experiments to measure the expression of thousands of genes from a cell in distinct time points. The analysis of this data can allow the the understanding of gene function and gene regulatory networks (Eisen et al., 1998). There has been a great deal of work on the computational analysis of gene expression time series, in which distinct data sets of gene expression, clustering techniques and proximity indices are used. However, the focus of most of these works are on biological results. Cluster validation has been applied in few works, but emphasis was given on the evaluation of the proposed validation methodologies (Azuaje, 2002; Lubovac et al., 2001; Yeung et al., 2001; Zhu & Zhang, 2000). As a result, there are few guidelines obtained by validity studies on which clustering methods or proximity indices are more suitable for the analysis of data from gene expression time series. Thus, this work performs a data driven comparative study of clustering methods and proximity indices used in the analysis of gene expression time series (or time courses). Five clustering methods encountered in the literature of gene expression analysis are compared: agglomerative hierarchical clustering, CLICK, dynamical clustering, k-means and self-organizing maps. In terms of proximity indices, versions of three indices are analysed: Euclidean distance, angular separation and Pearson correlation. In order to evaluate the methods, a k-fold cross-validation procedure adapted to unsupervised methods is applied. The accuracy of the results is assessed by the comparison of the partitions obtained in these experiments with gene annotation, such as protein function and series classification

Page generated in 0.0888 seconds