Análise de Dados e Sistemas de Apoio à Decisão / Master in Data Analysis and Decision Support Systems / A performance dos diversos algoritmos de '"Data Mining" não depende exclusivamente destes, mas também da utilizaçãode um conjunto de técnicas, denominadas de pré- processamento, que precedem a aplicação dos referidos algoritmos.
Assim sendo, nesta dissertação procurou-se sistematizar e experimentar técnicas que permitissem discritizar variáveis contínuas e agrupar valores de variáveis nominais oriundas de um conjunto de dados referentes a um caso de atribuição de crédito. De forma a melhorar aquelas técnicas, reformulamos algumas e propusemos alterações.
Para avaliar a pertinência nas nossas propostas, efectuamos o pré-processamento dos referidos dados usando, por urn lado as técnicas convencionais e por outro as nossas propostas. Em ambas situações utilizamos o Discriminante Linear de Fisher e a Regressão logística e avaliamos a performance dos modelos de forma a avaliar as nossas propostas face às técnicas convencionais de pré-processamento. A performance foi vista segunda dois modos diferentes: 0 primeiro pela taxa de erro de uma regra de classificação; o segundo pela discriminação dos modelos descrito pelas curvas ROC e medido pelo índice de Gini.
Identifer | oai:union.ndltd.org:up.pt/oai:repositorio-aberto.up.pt:10216/7407 |
Date | 22 November 2005 |
Creators | Sarmento, António Maria Saavedra Rodrigues |
Publisher | Faculdade de Economia da Universidade do Porto, FEP |
Source Sets | Universidade do Porto |
Language | Portuguese |
Detected Language | Portuguese |
Type | Dissertação |
Format | application/pdf, application/pdf |
Rights | openAccess |
Page generated in 0.0426 seconds