Spelling suggestions: "subject:"semisupervised learning"" "subject:"semissupervisio learning""
1 |
Uso de confiabilidade na rotula??o de exemplos em problemas de classifica??o multirr?tulo com aprendizado semissupervisionadoRodrigues, Fillipe Morais 21 February 2014 (has links)
Made available in DSpace on 2014-12-17T15:48:09Z (GMT). No. of bitstreams: 1
FillipeMR_DISSERT.pdf: 1204563 bytes, checksum: 66d7e69371d4103cf2e242609ed0bbb7 (MD5)
Previous issue date: 2014-02-21 / Conselho Nacional de Desenvolvimento Cient?fico e Tecnol?gico / The techniques of Machine Learning are applied in classification tasks to acquire
knowledge through a set of data or information. Some learning methods proposed in
literature are methods based on semissupervised learning; this is represented by small
percentage of labeled data (supervised learning) combined with a quantity of label and
non-labeled examples (unsupervised learning) during the training phase, which reduces,
therefore, the need for a large quantity of labeled instances when only small dataset of
labeled instances is available for training. A commom problem in semi-supervised
learning is as random selection of instances, since most of paper use a random selection
technique which can cause a negative impact. Much of machine learning methods treat
single-label problems, in other words, problems where a given set of data are associated
with a single class; however, through the requirement existent to classify data in a lot of
domain, or more than one class, this classification as called multi-label classification.
This work presents an experimental analysis of the results obtained using
semissupervised learning in troubles of multi-label classification using reliability
parameter as an aid in the classification data. Thus, the use of techniques of
semissupervised learning and besides methods of multi-label classification, were essential
to show the results / As t?cnicas de Aprendizado de M?quina s?o aplicadas em tarefas de classifica??o para a
aquisi??o de conhecimento atrav?s de um conjunto de dados ou informa??es. Alguns
m?todos de aprendizado utilizados pela literatura s?o baseados em aprendizado
semissupervisionado; este ? representado por pequeno percentual de exemplos rotulados
(aprendizado supervisionado) combinados com uma quantidade de exemplos rotulados e
n?o rotulados (n?o-supervisionado) durante a fase de treinamento, reduzindo, portanto, a
necessidade de uma grande quantidade de dados rotulados quando apenas um pequeno
conjunto de exemplos rotulados est? dispon?vel para treinamento. O problema da escolha
aleat?ria das inst?ncias ? comum no aprendizado semissupervisionado, pois a maioria dos
trabalhos usam a escolha aleat?ria dessas inst?ncias o que pode causar um impacto
negativo. Por outro lado, grande parte dos m?todos de aprendizado de m?quina trata de
problemas unirr?tulo, ou seja, problemas onde exemplos de um determinado conjunto s?o
associados a uma ?nica classe. Entretanto, diante da necessidade existente de classificar
dados em uma grande quantidade de dom?nios, ou em mais de uma classe, essa
classifica??o citada ? denominada classifica??o multirr?tulo. Este trabalho apresenta uma
an?lise experimental dos resultados obtidos por meio da utiliza??o do aprendizado
semissupervisionado em problemas de classifica??o multirr?tulo usando um par?metro de
confiabilidade como aux?lio na classifica??o dos dados. Dessa maneira, a utiliza??o de
t?cnicas de aprendizado semissupervisionado, bem como de m?todos de classifica??o
multirr?tulos, foram imprescind?veis na apresenta??o dos resultados
|
Page generated in 0.0956 seconds