Spelling suggestions: "subject:"funções dde similaridade"" "subject:"funções dde similaridades""
1 |
Classificação Supervisionada Usando Dados Simbólicos de Semântica ModalCésar Donato Silva, Fábio January 2007 (has links)
Made available in DSpace on 2014-06-12T16:00:26Z (GMT). No. of bitstreams: 2
arquivo6609_1.pdf: 1572704 bytes, checksum: 1b78e99bab6319081e75d92d5e7f2d0d (MD5)
license.txt: 1748 bytes, checksum: 8a4605be74aa9ea9d79846c1fba20a33 (MD5)
Previous issue date: 2007 / Conselho Nacional de Desenvolvimento Científico e Tecnológico / A Análise de Dados Simbólicos (Symbolic Data Analysis) é um domínio na área de
descoberta automática de conhecimento que visa desenvolver métodos para dados descritos
por variáveis que podem assumir como valor conjuntos ou listas de categorias, intervalos ou
distribuições de probabilidade. Essas variáveis permitem levar em conta a variabilidade e/ou a
incerteza presente nos dados.
Este trabalho apresenta um classificador simbólico de semântica modal para dados
simbólicos de tipo intervalo. O classificador proposto apresenta duas etapas básicas, a
aprendizagem e a alocação, onde ambas necessitam de uma etapa precedente de préprocessamento
que transforma os dados simbólicos do tipo intervalo em dados simbólicos
modal. Cada exemplo do conjunto de aprendizagem é descrito por um vetor de intervalos.
Após o pré-processamento, cada exemplo passa a ser descrito por um vetor de distribuições de
pesos. Após a etapa de aprendizagem, cada classe é também descrita por um vetor de
distribuições de pesos que sintetiza as informações dos exemplos da classe. Cada novo
exemplo a ser atribuído a uma classe (etapa de alocação), representado por um vetor de
intervalos, após a fase de pré-processamento passa a ser descrito por um vetor de distribuições
de pesos. A alocação de um exemplo a uma classe é realizada através de funções de
dissimilaridade que comparam pares de vetores de distribuições de pesos. Algumas funções
de dissimilaridade desse tipo são consideradas nesse trabalho.
A avaliação do desempenho desse classificador é realizada através da aplicação do
mesmo a conjuntos de dados sintéticos em uma experiência Monte Carlo e a conjuntos de
dados reais usando a técnica de validação cruzada leave-one-out. O desempenho é medido
pela taxa (média) de erro de classificação e pelo tempo de execução das etapas de
aprendizagem e classificação. Além disso, o desempenho desse classificador foi comparado
com o desempenho de um classificador de tipo k-vizinhos mais próximos também de
semântica modal. Através desses exemplos, esse trabalho mostra alguns dos interesses desse
classificador de semântica modal
|
Page generated in 0.1079 seconds