Made available in DSpace on 2014-06-12T15:50:08Z (GMT). No. of bitstreams: 2
arquivo1928_1.pdf: 1948940 bytes, checksum: ed1bedfc483f596f442e5ff7208e1ed0 (MD5)
license.txt: 1748 bytes, checksum: 8a4605be74aa9ea9d79846c1fba20a33 (MD5)
Previous issue date: 2009 / Conselho Nacional de Desenvolvimento Científico e Tecnológico / Data Mining surgiu da necessidade de extração do conhecimento a partir de
volumosas massas de dados geradas pelas empresas/instituições. Com o crescimento da área e
o aumento do poder de processamento dos computadores, as organizações que prestam
serviços em KDD (Knowledge Discovery in Database) têm guardado, cada vez mais, um
grande número de documentos e processos referentes a projetos executados no passado.
Por outro lado, hoje, o desenvolvimento de projetos de Data Mining exige do
especialista o uso de diversas ferramentas, linguagens de programação e metodologias
associadas à sua experiência para resolução do problema. Um dos maiores problemas
práticos de KDD é como prover a interoperabilidade entre diferentes plataformas existentes,
de tal forma que os processos fiquem centralizados e documentados em um único ambiente.
Outro grande problema, hoje, é a falta de reuso de conhecimento devido à complexidade e
forte dependência do usuário. Neste contexto, as experiências adquiridas em projetos
anteriores não são devidamente documentadas, gerenciadas e controladas, gerando como
conseqüência a repetição de erros dos projetos anteriores. Em outras palavras, outro grande
problema prático é a falta de plataformas capazes de fazer o reuso do conhecimento adquirido
em projetos realizados no passado.
O principal objetivo deste trabalho é criar um framework híbrido para
desenvolvimento de soluções em Mineração de Dados que integra diversas ferramentas
disponíveis no mercado e disponibiliza um ambiente integrado para reuso do conhecimento na
área de KDD. Este ambiente possibilita a centralização e padronização dos artefatos gerados
ao longo do processo de KDD, assim como aproveita os melhores recursos de cada ferramenta
de mercado disponível.
Para validação do framework foram coletados os metadados de 69 projetos reais de
mineração de dados, 61 lições aprendidas dos profissionais que trabalharam nestes projetos e
654 entidades de conhecimento (congressos, softwares, publicações etc) da área de KDD.
Os estudos apresentados, principalmente para definição do início do projeto,
mostraram ser possível, através do framework, entender as características que levaram os
projetos a serem um sucesso ou fracasso. Assim, o framework é um ambiente que assegura o desenvolvimento de projetos em KDD de alta qualidade que atende às expectativas do cliente dentro do tempo e orçamento previstos
Identifer | oai:union.ndltd.org:IBICT/oai:repositorio.ufpe.br:123456789/1435 |
Date | 31 January 2009 |
Creators | CUNHA, Rodrigo Carneiro Leão Vieira da |
Contributors | ADEODATO, Paulo Jorge Leitão |
Publisher | Universidade Federal de Pernambuco |
Source Sets | IBICT Brazilian ETDs |
Language | Portuguese |
Detected Language | Portuguese |
Type | info:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/doctoralThesis |
Source | reponame:Repositório Institucional da UFPE, instname:Universidade Federal de Pernambuco, instacron:UFPE |
Rights | info:eu-repo/semantics/openAccess |
Page generated in 0.0022 seconds