• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 4
  • 1
  • Tagged with
  • 5
  • 5
  • 4
  • 4
  • 4
  • 3
  • 2
  • 2
  • 2
  • 2
  • 2
  • 2
  • 2
  • 2
  • 2
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
1

Agrupamento de dados simbólicos usando abordagem Possibilistic

Pimentel, Bruno Almeida 25 February 2013 (has links)
Submitted by Daniella Sodre (daniella.sodre@ufpe.br) on 2015-03-09T13:28:57Z No. of bitstreams: 2 BrunoAlmeidaPimentel.pdf: 2629725 bytes, checksum: 3c61892a3e135f9ca4c87c3fa5a73068 (MD5) license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5) / Made available in DSpace on 2015-03-09T13:28:57Z (GMT). No. of bitstreams: 2 BrunoAlmeidaPimentel.pdf: 2629725 bytes, checksum: 3c61892a3e135f9ca4c87c3fa5a73068 (MD5) license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5) Previous issue date: 2013-02-25 / CNPq / Este trabalho relata sobre os diferentes métodos de agrupamento presentes na literatura atual e introduz métodos de agrupamento baseado na abordagem possibilística para dados intervalares. Tem como objetivo estender os métodos clássicos de agrupamento possibilístico para dados intervalares simbólicos. Além disso, é proposto uma nova abordagem possibilística em que há um grau de pertinência diferente para cada variável e classe. A abordagem possibilística considera a pertinência como possibilidades dos objetos a classes e a partição resultante dos dados pode ser entendida como uma partição possibilística. O algoritmo conhecido dessa categoria é o Possibilístic C-Means (PCM). No PCM, a otimização da função objetivo em alguns conjuntos de dados pode ajudar a identificar outliers e dados ruidosos. A Análise de Dados Simbólico (ADS) surgiu para lidar com variáveis simbólicas, que podem ser do tipo intervalos, histogramas, e até mesmo funções, a fim de considerar a variabilidade e/ou a incerteza inata aos dados. As técnicas de ADS tornam-se uma poderosa ferramenta quando usadas em métodos de agrupamentos, o que causa um constante crescimento em pesquisas para o aprimoramento destas técnicas usadas nos mais variados algoritmos, tais como em K-Means, Support Vector Machine (SVM) e Kernel. Objetivando avaliar o desempenho dos métodos propostos e os presentes na literatura, um estudo comparativo destes métodos em relação ao agrupamento de objetos simbólicos do tipo intervalo é realizado. Foram planejados experimentos com dados sintéticos, usando o experimento Monte Carlo, e dados reais. O índice corrigido de Rand (CR) e a taxa de erro global de classificação (OERC) são usados para avaliar os métodos.
2

Uma modificação da extensão do algoritmo AID para modelos lineares generalizados usando reamostragem Bootstrap

Presotti, Cátia Valéria 03 March 2006 (has links)
Made available in DSpace on 2016-06-02T20:06:11Z (GMT). No. of bitstreams: 1 DissCVP.pdf: 769628 bytes, checksum: 82a04371dc9ee3d93afa897684220b87 (MD5) Previous issue date: 2006-03-03 / Financiadora de Estudos e Projetos / One of the most frequently situation found by researchers is to find groups of similar individuals. The cluster analysis is a set of statistical techniques that identify mutually exclusive subgroups or classes over individuals, based on their similarity. When then main is to group means of treatments we can use contrasts, multiple comparitions or clustering techniques as the SCOTT-KNOTT test and AID (Automatic Interaction Detector) technique. In this work we focus on the comparition of the simulated power function of the asymptotic test and also of the bootstrap test for the extension of the AID algorithm for generalized linear models. The bootstrap power function over main the asymptotic power when the number of binomial sample is equal to one, and the number of treatments is equal to 8 and 12, in a completed randomized experiment with a single factor for binomial variables. / Uma das situações mais freqüentes encontradas por pesquisadores de diversas áreas do conhecimento é formar grupos de indivíduos que sejam, de alguma maneira, similares entre si. A análise de agrupamento é um conjunto de técnicas estatísticas que identificam subgrupos ou classes distintas de indivíduos mutuamente excludentes com base nas similaridades existentes entre os indivíduos, ou seja, os mais semelhantes pertencem ao mesmo grupo. No caso específico de uma única variável resposta e diversas explicativas, vários procedimentos podem ser utilizados, entre eles: contrastes de médias, comparações múltiplas ou técnicas aglomerativas, como teste de SCOTTKNOTT e a técnica AID - (Automatic Interaction Detector). As técnicas de agrupamento de médias podem não ser adequadas na aplicação em dados com distribuição diferente da normal. Nesse caso, utilizou-se a extensão do algoritmo AID, no qual se baseia o método de SCOTT-KNOTT. Essa extensão é usada em modelos lineares generalizados e adota, como medida de homogeneidade de grupos, uma estatística baseada na função desvio que tem assintoticamente distribuição quiquadrado. Neste trabalho, apresentam-se o método de reamostragem bootstrap adaptado para a extensão do algoritmo AID, sua curva poder simulada e a curva poder simulada assintótica, considerando um delineamento inteiramente ao acaso, com tamanho da amostra binomial nb, com r tratamentos e nr repetições por tratamento. Os resultados do estudo por simulação indicam que, conforme aumenta-se o tamanho da amostra binomial, o poder simulado dos dois testes aumenta rapidamente. Por outro lado, esse comportamento é mais acentuado conforme aumenta-se o número de tratamentos. Vale ressaltar que, para o caso extremo em que o tamanho da binomial é igual a 1 e o número de tratamentos igual a 8 e 12, a curva poder simulada do teste bootstrap é destacadamente superior à curva poder do teste assintótico para o número de repetições por tratamento estudado.
3

Modelagem fuzzy usando agrupamento condicional

Nogueira, Tatiane Marques 06 August 2008 (has links)
Made available in DSpace on 2016-06-02T19:05:32Z (GMT). No. of bitstreams: 1 2113.pdf: 882226 bytes, checksum: 022c380c1d469988d9e4617a030f17c3 (MD5) Previous issue date: 2008-08-06 / The combination of fuzzy systems with clustering algorithms has great acceptance in the scientific community mainly due to its adherence to the advantage balance principle of computational intelligence, in which different methodologies collaborate with each other potentializing the usefulness and applicability of the resulting systems. Fuzzy Modeling using clustering algorithms presents the transparency and comprehensibility typical of the linguistic fuzzy systems at the same time that benefits from the possibilities of dimensionality reduction by means of clustering. In this work is presented the Fuzzy-CCM method (Fuzzy Conditional Clustering based Modeling) which consists of a new approach for Fuzzy Modeling based on the Fuzzy Conditional Clustering algorithm aiming at providing new means to address the topic of interpretability of fuzzy rules bases. With the Fuzzy-CCM method the balance between interpretability and accuracy of fuzzy rules is dealt with through the definition of contexts defined by a small number of input variables and the generation of clusters induced by these contexts. The rules are generated in a different format, with linguistic variables and clusters in the antecedent. Some experiments have been carried out using different knowledge domains in order to validate the proposed approach by comparing the results with the ones obtained by the Wang&Mendel and conventional Fuzzy C-Means methods. The theoretical foundations, the advantages of the method, the experiments and results are presented and discussed. / A combinação de sistemas fuzzy com algoritmos de agrupamento tem grande aceitação na comunidade científica devido; principalmente, a sua aderência ao princípio de balanceamento de vantagens da inteligência computacional, no qual metodologias diferentes colaboram entre si, potencializando a utilidade e aplicabilidade dos sistemas resultantes. A modelagem fuzzy usando algoritmos de agrupamento apresenta a transparência e facilidade de compreensão típica dos sistemas fuzzy lingüísticos ao mesmo tempo em que se beneficia das possibilidades de redução da dimensionalidade por intermédio do agrupamento. Neste trabalho é apresentado o método Fuzzy-CCM (Fuzzy Conditional Clustering based Modeling), que consiste de uma nova abordagem de Modelagem Fuzzy baseada no algoritmo de Agrupamento Fuzzy Condicional, cujo objetivo é prover novos meios de tratar a questão da interpretabilidade de bases de regras fuzzy. Com o método Fuzzy-CCM, o balanço entre interpretabilidade e acuidade de regras fuzzy é tratado por meio da definição de contextos formados com um pequeno número de variáveis de entrada e a geração de grupos condicionados por estes contextos. As regras são geradas em um formato diferente, que contêm variáveis lingüísticas e grupos no seu antecedente. Alguns experimentos foram executados usando diferentes domínios de conhecimento a fim de validar a abordagem proposta, comparando os resultados obtidos usando a nova abordagem com os resultados obtidos usando os métodos Wang&Mendel e Fuzzy C-Means. A fundamentação teórica, as vantagens do método, os experimentos e os resultados obtidos são apresentados e discutidos.
4

Aprendizado semi-supervisionado e não supervisionado para análise de dados de expressão gênica

Assao, Fabiana Mari 27 May 2008 (has links)
Made available in DSpace on 2016-06-02T19:05:34Z (GMT). No. of bitstreams: 1 2160.pdf: 2987031 bytes, checksum: c428afa9febfedfbb3e778b30d48e9c0 (MD5) Previous issue date: 2008-05-27 / Data clustering has been seen, in the last decades, as an important tool for gene expression data analysis. In recent years, due to the progress in gene annotation research, a growing interest has been noticed for the semi-supervised clustering techniques, which use knowledge previously available about some gene functions to discover functions of other genes by means of clustering. This work investigates non-supervised and semi-supervised clustering algorithms applied to gene expression data. The goal is to perform an inspection on strengths and weaknesses of the use of such clustering methods and, based on these findings, to provide ways of obtaining results significant to biology. Algorithms with different characteristics were implemented and tested, with the objective of verifying evidences of eventual gains with the partial labeling, as compared to the non-supervised techniques. The experiments considered data sets from the gene expression domain as well as more generic domains. The obtained results were evaluated with validation measures usually applied in similar contexts. The analysis developed, though, emphasize the important role of computational techniques in biological data analysis, by accelerating the process of deriving results and conclusions, to better understand gene functions and structures. The results of this stydy justify the large investiment in the research of behavior of semi-supervised techniques in gene expression data, as we shall see. / O agrupamento de dados destacou-se nas últimas décadas como uma importante ferramenta para a análise de dados de expressão gênica. Nos últimos anos, em função do progresso das pesquisas para rotulação de genes, surgiu um interesse pelas técnicas de agrupamento semi-supervisionado, que utilizam o conhecimento prévio disponível sobre a função de alguns genes para descobrir funções de outros genes por meio do agrupamento. Neste trabalho são investigados algoritmos de agrupamento semi-supervisionado e não supervisionados aplicados a dados de expressão gênica. O intuito é realizar uma inspeção das vantagens e desvantagens da utilização destes métodos de agrupamento e, a partir disso, prover subsídios para obtenção de resultados significativos para a área de Biologia. Foram implementados e testados algoritmos de agrupamento com diferentes características, com o objetivo de verificar evidências de eventuais ganhos obtidos com a rotulação parcial dos genes com relação a técnicas não-supervisionadas. Os experimentos realizados consideraram conjuntos de dados do domínio de expressão gênica e de outros domínios mais genéricos. Os resultados obtidos foram avaliados com medidas de validação usualmente aplicadas em contextos semelhantes. Assim, as análises desenvolvidas reforçam o importante papel da computação na análise de dados biológicos, a fim de acelerar o processo de obtenção de resultados e conclusões, na compreensão das estruturas e funções dos genes. Os resultados obtidos neste trabalho justificam o grande investimento na pesquisa do comportamento de técnicas semi-supervisionadas em dados de expressão gênica, como veremos mais adiante.
5

Métodos de agrupamento na análise de dados de expressão gênica

Rodrigues, Fabiene Silva 16 February 2009 (has links)
Made available in DSpace on 2016-06-02T20:06:03Z (GMT). No. of bitstreams: 1 2596.pdf: 1631367 bytes, checksum: 90f2d842a935f1dd50bf587a33f6a2cb (MD5) Previous issue date: 2009-02-16 / The clustering techniques have frequently been used in literature to the analyse data in several fields of application. The main objective of this work is to study such techniques. There is a large number of clustering techniques in literature. In this work we concentrate on Self Organizing Map (SOM), k-means, k-medoids and Expectation- Maximization (EM) algorithms. These algorithms are applied to gene expression data. The analisys of gene expression, among other possibilities, identifies which genes are differently expressed in synthesis of proteins associated to normal and sick tissues. The purpose is to do a comparing of these metods, sticking out advantages and disadvantages of such. The metods were tested for simulation and after we apply them to a real data set. / As técnicas de agrupamento (clustering) vêm sendo utilizadas com freqüência na literatura para a solução de vários problemas de aplicações práticas em diversas áreas do conhecimento. O principal objetivo deste trabalho é estudar tais técnicas. Mais especificamente, estudamos os algoritmos Self Organizing Map (SOM), k-means, k-medoids, Expectation-Maximization (EM). Estes algoritmos foram aplicados a dados de expressão gênica. A análise de expressão gênica visa, entre outras possibilidades, a identificação de quais genes estão diferentemente expressos na sintetização de proteínas associados a tecidos normais e doentes. O objetivo deste trabalho é comparar estes métodos no que se refere à eficiência dos mesmos na identificação de grupos de elementos similares, ressaltando vantagens e desvantagens de cada um. Os métodos foram testados por simulação e depois aplicamos as metodologias a um conjunto de dados reais.

Page generated in 0.1083 seconds