Return to search

Classificação Supervisionada Usando Dados Simbólicos de Semântica Modal

Made available in DSpace on 2014-06-12T16:00:26Z (GMT). No. of bitstreams: 2
arquivo6609_1.pdf: 1572704 bytes, checksum: 1b78e99bab6319081e75d92d5e7f2d0d (MD5)
license.txt: 1748 bytes, checksum: 8a4605be74aa9ea9d79846c1fba20a33 (MD5)
Previous issue date: 2007 / Conselho Nacional de Desenvolvimento Científico e Tecnológico / A Análise de Dados Simbólicos (Symbolic Data Analysis) é um domínio na área de
descoberta automática de conhecimento que visa desenvolver métodos para dados descritos
por variáveis que podem assumir como valor conjuntos ou listas de categorias, intervalos ou
distribuições de probabilidade. Essas variáveis permitem levar em conta a variabilidade e/ou a
incerteza presente nos dados.
Este trabalho apresenta um classificador simbólico de semântica modal para dados
simbólicos de tipo intervalo. O classificador proposto apresenta duas etapas básicas, a
aprendizagem e a alocação, onde ambas necessitam de uma etapa precedente de préprocessamento
que transforma os dados simbólicos do tipo intervalo em dados simbólicos
modal. Cada exemplo do conjunto de aprendizagem é descrito por um vetor de intervalos.
Após o pré-processamento, cada exemplo passa a ser descrito por um vetor de distribuições de
pesos. Após a etapa de aprendizagem, cada classe é também descrita por um vetor de
distribuições de pesos que sintetiza as informações dos exemplos da classe. Cada novo
exemplo a ser atribuído a uma classe (etapa de alocação), representado por um vetor de
intervalos, após a fase de pré-processamento passa a ser descrito por um vetor de distribuições
de pesos. A alocação de um exemplo a uma classe é realizada através de funções de
dissimilaridade que comparam pares de vetores de distribuições de pesos. Algumas funções
de dissimilaridade desse tipo são consideradas nesse trabalho.
A avaliação do desempenho desse classificador é realizada através da aplicação do
mesmo a conjuntos de dados sintéticos em uma experiência Monte Carlo e a conjuntos de
dados reais usando a técnica de validação cruzada leave-one-out. O desempenho é medido
pela taxa (média) de erro de classificação e pelo tempo de execução das etapas de
aprendizagem e classificação. Além disso, o desempenho desse classificador foi comparado
com o desempenho de um classificador de tipo k-vizinhos mais próximos também de
semântica modal. Através desses exemplos, esse trabalho mostra alguns dos interesses desse
classificador de semântica modal

Identiferoai:union.ndltd.org:IBICT/oai:repositorio.ufpe.br:123456789/2707
Date January 2007
CreatorsCésar Donato Silva, Fábio
Contributorsde Assis Tenório Carvalho, Francisco
PublisherUniversidade Federal de Pernambuco
Source SetsIBICT Brazilian ETDs
LanguagePortuguese
Detected LanguagePortuguese
Typeinfo:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/masterThesis
Sourcereponame:Repositório Institucional da UFPE, instname:Universidade Federal de Pernambuco, instacron:UFPE
Rightsinfo:eu-repo/semantics/openAccess

Page generated in 0.0023 seconds