Made available in DSpace on 2014-06-12T15:57:35Z (GMT). No. of bitstreams: 2
arquivo3210_1.pdf: 1552746 bytes, checksum: 98771d23cdfb48745520719f0b3134dd (MD5)
license.txt: 1748 bytes, checksum: 8a4605be74aa9ea9d79846c1fba20a33 (MD5)
Previous issue date: 2009 / Conselho Nacional de Desenvolvimento Científico e Tecnológico / Nas aplicações tradicionais de aprendizagem de máquina, os classificadores utilizam apenas
dados rotulados em seu treinamento. Os dados rotulados, por sua vez, são difíceis, caros, consomem
tempo e requerem especialistas humanos para serem obtidos em algumas aplicações
reais. Entretanto, dados não rotulados são abundantes e fáceis de serem obtidos mas há poucas
abordagens que os utilizam no treinamento. Para contornar esse problema existe a aprendizagem
semi-supervisionada.
A aprendizagem semi-supervisionada utiliza uma grande quantidade de dados não rotulados,
juntamente com dados rotulados, com a finalidade de construir classificadores melhores.
A abordagem semi-supervisionada obtém resultados melhores do que se utilizassem apenas
poucos padrões rotulados em uma abordagem supervisionada ou se utilizassem apenas padrões
não rotulados numa abordagem não supervisionada. O algoritmo semi-supervisionado pode ser
uma extensão de um algoritmo não supervisionado. Um algoritmo desse tipo pode se basear
em algoritmos de agrupamento não supervisionado, adicionando-se um termo em sua função
objetivo que faz uso de informações rotuladas para guiar o processo de aprendizagem do algoritmo.
Este trabalho apresenta um estudo da aprendizagem semi-supervisionada e apresenta um
novo algoritmo de agrupamento semi-supervisionado baseado no algoritmo Fuzzy C-Means.
Também, apresenta uma validação cruzada para o contexto de algoritmos semi-supervisionados.
Estudos experimentais são apresentados. Primeiro, o algoritmo semi-supervisionado proposto
é avaliado com dados completamente rotulados, comparado com alguns classificadores totalmente
supervisionados. Depois, o mesmo algoritmo semi-supervisionado é, então, avaliado e
comparado com três algoritmos também de agrupamento semi-supervisionados que otimizam
uma função objetivo no contexto da aprendizagem a partir de dados parcialmente rotulados.
Além disso, o comportamento do algoritmo é discutido e os resultados examinados através da
construção de intervalos de confiança.
Derivou deste trabalho, uma ferramenta contendo os algoritmos semi-supervisionados e o
ambiente experimental para validação desses algoritmos foi desenvolvida. Desse modo, foi
possível certificar que o novo algoritmo de agrupamento semi-supervisionad apresenta desempenho
melhor, ou pelo menos do mesmo nível, que algoritmos já consolidados na literatura
Identifer | oai:union.ndltd.org:IBICT/oai:repositorio.ufpe.br:123456789/2383 |
Date | 31 January 2009 |
Creators | MACARIO FILHO, Valmir |
Contributors | CARVALHO, Francisco de Assis Tenório |
Publisher | Universidade Federal de Pernambuco |
Source Sets | IBICT Brazilian ETDs |
Language | Portuguese |
Detected Language | Portuguese |
Type | info:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/masterThesis |
Source | reponame:Repositório Institucional da UFPE, instname:Universidade Federal de Pernambuco, instacron:UFPE |
Rights | info:eu-repo/semantics/openAccess |
Page generated in 0.0025 seconds