• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 2
  • Tagged with
  • 2
  • 2
  • 2
  • 2
  • 2
  • 2
  • 2
  • 2
  • 2
  • 2
  • 1
  • 1
  • 1
  • 1
  • 1
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
1

Mineração multi-relacional: o algoritmo GFP-growth.

Pizzi, Luciene Cristina 25 May 2006 (has links)
Made available in DSpace on 2016-06-02T19:05:21Z (GMT). No. of bitstreams: 1 DissLCP.pdf: 1200368 bytes, checksum: 728208bb18c724a37e9c9e51c0521b56 (MD5) Previous issue date: 2006-05-25 / Financiadora de Estudos e Projetos / Data mining is the phase of the knowledge discovery in database process where an algorithm is applied to the available data, in order to prove a hypothesis or discover a still unknown pattern. The traditional data mining techniques can deal only with single tables; however it is interesting to look for patterns involving several related tables, aiming to analyze the existing relation between the entities present in one table and the data of the same entities present in another table. Depending on the relationship existing between these tables, applying a traditional algorithm to the joint table is not sufficient, as the joint table may contain duplicated attribute values which interfere in the analysis process of the generated rules. In order to solve this problem, this project adopts an approach which consists on looking for association rules mining the joint table. The adopted process considers the groups of tuples, where each group is formed by tuples of the same entity. Following this approach the GFP-Growth algorithm was developed, which is presented in this monograph along with its results and comparisons with other multi-relational algorithms. / A mineração de dados é a etapa do processo de descoberta de conhecimento na qual um algoritmo é aplicado sobre os dados disponíveis, com o intuito de provar uma hipótese ou descobrir algum padrão até então desconhecido. As técnicas tradicionais de mineração de dados tratam uma única tabela, no entanto é interessante buscar padrões que envolvam múltiplas tabelas relacionadas, com o intuito de analisar a relação existente entre os dados de uma entidade presentes em uma tabela e os dados dessa mesma entidade presentes em uma outra tabela. Dependendo do tipo de relacionamento existente entre essas tabelas, não basta realizar a junção das mesmas para aplicar um algoritmo tradicional de mineração de dados na tabela resultante, pois essa tabela pode conter duplicação de valores de atributos que interferem no processo de análise das regras geradas. Para resolver esse problema, este trabalho adota uma abordagem que consiste na busca por regras de associação, realizando a mineração na tabela resultante da junção. O processo adotado considera agrupamentos de tuplas, sendo que cada agrupamento é formado pelas tuplas de uma mesma entidade. Seguindo essa abordagem foi desenvolvido o algoritmo GFP-Growth, o qual é apresentado nesta monografia juntamente com seus resultados e comparações com outros algoritmos multi-relacionais.
2

Bio-TIM - Ambiente para convergência de informações em Bioinformática.

Oliveira, Gustavo Borges de 31 August 2005 (has links)
Made available in DSpace on 2016-06-02T19:06:28Z (GMT). No. of bitstreams: 1 DissGBO.pdf: 1833938 bytes, checksum: 24ceae16595b3b1073dda4958829de16 (MD5) Previous issue date: 2005-08-31 / Currently, some genomas of creatures are being mapping, so enormous amounts of data are being generated. This data is sometimes stored in different data sources and at many times, these sources are heterogeneous and distributed, which results in the necessity of the use of new query techniques and integration of data. After this, the biologists can usufruct greaters and better resources during the research process. This work has the proposal of to build a Bioinformatics environment for the integration of different data sources and their reorganization in a centered source that supports a flexible and efficient manner to build queries. The environment is called as Bio-TIM, which is composed by three layers. The main one is called "Mediator" and it is composed by a connection manager for databases management systems, by wrappers, by a Data Warehouse and by a specific database. / Atualmente, vários genomas de seres vivos estão sendo mapeados gerando enormes quantidades de dados, as quais são armazenadas em diferentes fontes de informações. O fato dos dispositivos de armazenamento de dados serem heterogêneos e distribuídos resulta na necessidade de criação de técnicas de consulta e integração de dados para que os biólogos possam usufruir de maiores e melhores recursos durante o processo de pesquisa. Este trabalho propôs um ambiente de bioinformática para a integração de diferentes fontes de dados e sua reorganização em uma fonte centralizada propiciando consultas flexíveis e eficientes. O ambiente foi denominado Bio-TIM, o qual é composto por três camadas, sendo a principal denominada Mediador . Ela é composta por um gerenciador de conexões a sistemas gerenciadores de bancos de dados, por tradutores, por um Data Warehouse e por um banco de dados específico.

Page generated in 0.1459 seconds