Made available in DSpace on 2014-06-12T15:51:10Z (GMT). No. of bitstreams: 1
license.txt: 1748 bytes, checksum: 8a4605be74aa9ea9d79846c1fba20a33 (MD5)
Previous issue date: 2008 / Os avanços tecnológicos têm aumentado drasticamente a magnitude dos dados armazenados
em diversos domínios de aplicação. Esta abundância de dados tem excedido a capacidade de
análise humana. Como conseqüência, algumas informações valiosas escondidas nestes
grandes volumes de dados não são descobertas. Este cenário impulsionou a criação de várias
técnicas capazes de extrair conhecimento de grandes volumes de dados. Algumas dessas
técnicas são resultantes do emergente campo de Descoberta de Conhecimento em Bases de
Dados (Knowledge Discovery in Databases - KDD).
O processo de KDD é composto de várias etapas. A etapa de preparação dos dados
consome de 50% a 90% do tempo e esforço necessário para a realização de todo o processo.
Quanto mais completa e consistente for a preparação, melhor será o resultado da mineração de
dados. Uma forma de garantir a completude e a consistência dos dados é utilizar uma
metodologia que aborde detalhadamente todas as atividades relacionadas à preparação dos
dados.
Muitas metodologias foram propostas para o desenvolvimento de projetos de KDD.
Apesar da maioria citar o processo de preparação dos dados, poucas metodologias específicas
para montagem de visão de dados têm sido propostas. Diante deste cenário, esta dissertação
tem como objetivos investigar as metodologias para o desenvolvimento de projetos de KDD,
enfatizando os aspectos relacionados à preparação dos dados, e como resultado da
investigação, propor uma metodologia para montagem de visões em bases de dados dirigidas
a problemas de Mineração de Dados. Esta metodologia engloba, de forma detalhada, todo
processo de preparação dos dados, desde o entendimento do problema até a geração da base.
A viabilidade prática da metodologia proposta, DMBuilding, é demonstrada através
da realização de um estudo de caso que utiliza uma base de dados de um problema real de
larga escala no domínio da análise de risco crédito. Os resultados ilustram os benefícios da
metodologia, comprovando sua relevância para a montagem de visão em bases de dados
Identifer | oai:union.ndltd.org:IBICT/oai:repositorio.ufpe.br:123456789/1559 |
Date | 31 January 2008 |
Creators | CARGNIN, Daniela |
Contributors | VASCONCELOS, Germano Crispim |
Publisher | Universidade Federal de Pernambuco |
Source Sets | IBICT Brazilian ETDs |
Language | Portuguese |
Detected Language | Portuguese |
Type | info:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/masterThesis |
Source | reponame:Repositório Institucional da UFPE, instname:Universidade Federal de Pernambuco, instacron:UFPE |
Rights | info:eu-repo/semantics/openAccess |
Page generated in 0.0022 seconds