Made available in DSpace on 2016-06-02T19:05:21Z (GMT). No. of bitstreams: 1
DissLCP.pdf: 1200368 bytes, checksum: 728208bb18c724a37e9c9e51c0521b56 (MD5)
Previous issue date: 2006-05-25 / Financiadora de Estudos e Projetos / Data mining is the phase of the knowledge discovery in database process where an
algorithm is applied to the available data, in order to prove a hypothesis or discover a still
unknown pattern. The traditional data mining techniques can deal only with single tables;
however it is interesting to look for patterns involving several related tables, aiming to
analyze the existing relation between the entities present in one table and the data of the same
entities present in another table.
Depending on the relationship existing between these tables, applying a traditional
algorithm to the joint table is not sufficient, as the joint table may contain duplicated attribute
values which interfere in the analysis process of the generated rules.
In order to solve this problem, this project adopts an approach which consists on
looking for association rules mining the joint table. The adopted process considers the groups
of tuples, where each group is formed by tuples of the same entity.
Following this approach the GFP-Growth algorithm was developed, which is presented
in this monograph along with its results and comparisons with other multi-relational
algorithms. / A mineração de dados é a etapa do processo de descoberta de conhecimento na qual um
algoritmo é aplicado sobre os dados disponíveis, com o intuito de provar uma hipótese ou
descobrir algum padrão até então desconhecido. As técnicas tradicionais de mineração de
dados tratam uma única tabela, no entanto é interessante buscar padrões que envolvam
múltiplas tabelas relacionadas, com o intuito de analisar a relação existente entre os dados de
uma entidade presentes em uma tabela e os dados dessa mesma entidade presentes em uma
outra tabela.
Dependendo do tipo de relacionamento existente entre essas tabelas, não basta realizar a
junção das mesmas para aplicar um algoritmo tradicional de mineração de dados na tabela
resultante, pois essa tabela pode conter duplicação de valores de atributos que interferem no
processo de análise das regras geradas.
Para resolver esse problema, este trabalho adota uma abordagem que consiste na busca
por regras de associação, realizando a mineração na tabela resultante da junção. O processo
adotado considera agrupamentos de tuplas, sendo que cada agrupamento é formado pelas
tuplas de uma mesma entidade.
Seguindo essa abordagem foi desenvolvido o algoritmo GFP-Growth, o qual é
apresentado nesta monografia juntamente com seus resultados e comparações com outros
algoritmos multi-relacionais.
Identifer | oai:union.ndltd.org:IBICT/oai:repositorio.ufscar.br:ufscar/332 |
Date | 25 May 2006 |
Creators | Pizzi, Luciene Cristina |
Contributors | Vieira, Marina Teresa Pires |
Publisher | Universidade Federal de São Carlos, Programa de Pós-graduação em Ciência da Computação, UFSCar, BR |
Source Sets | IBICT Brazilian ETDs |
Language | Portuguese |
Detected Language | Portuguese |
Type | info:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/masterThesis |
Format | application/pdf |
Source | reponame:Repositório Institucional da UFSCAR, instname:Universidade Federal de São Carlos, instacron:UFSCAR |
Rights | info:eu-repo/semantics/openAccess |
Page generated in 0.0023 seconds