Spelling suggestions: "subject:"regra doo vizinhos main próximo"" "subject:"regra doo vizinhas main próximo""
1 |
Classificação com exemplos de uma única classe baseada na busca pelos limites das características do problemaCABRAL, George Gomes 31 January 2014 (has links)
Submitted by Nayara Passos (nayara.passos@ufpe.br) on 2015-03-11T19:52:28Z
No. of bitstreams: 2
TESE George Gomes Cabral.pdf: 3153073 bytes, checksum: 0d149ea3bf3d88d754b81befbafa8b70 (MD5)
license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5) / Made available in DSpace on 2015-03-11T19:52:28Z (GMT). No. of bitstreams: 2
TESE George Gomes Cabral.pdf: 3153073 bytes, checksum: 0d149ea3bf3d88d754b81befbafa8b70 (MD5)
license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5)
Previous issue date: 2014 / FACEPE / A detecção de novidades é um problema com um grande número de aplicações. Em
algumas aplicações, o foco está na prevenção ou detecção de estados indesejados. Em alguns
casos, esses estados não são conhecidos durante o treinamento do modelo de classificador; em
outros, como monitoramento de máquinas, por exemplo, uma quebra da máquina pode ser bem
rara e exemplos desse caso podem ser bastante raros. Nestes casos, a abordagem mais aceita
consiste em se modelar o comportamento normal do sistema de forma a, no futuro, se detectar
eventos desconhecidos. Esse é o conceito básico de Classificação com Exemplos de uma Única
Classe (One-Class Classification - OCC).
Esta tese introduz duas versões de um método simples e efetivo para OCC, chamado de
FBDOCC (Feature Boundaries Detector for One-Class Classification). O FBDOCC funciona
analisando cada característica (dimensão) do problema e criando uma representação sintética da
classe novidade (desconhecida a priori) que engloba os dados da classe normal. Esse trabalho
também considera o uso do algoritmo Particle Swarm Optimization (PSO) na busca da melhor
configuração dos parâmetros do método proposto. Além disso, o presente trabalho introduz
também um procedimento para a melhoria do custo computacional durante o treinamento, da
técnica proposta, sem que haja a degradação na qualidade da classificação. Entre as motivações
por trás deste trabalho, estão a criação de um método com baixo custo computacional e com a
mesma ou melhor precisão na classificação que métodos para detecção de novidades do estado
da arte.
Vários experimentos foram executados com bases de dados do mundo real e artificiais
no intuito de comparar as duas versões desenvolvidas do método proposto com alguns dos
mais recentes e efetivos métodos OCC, são eles: Support Vector Data Description (SVDD),
One-Class SVM (OCSVM), Least Squares One-class SVM (LSOCSVM), Kernel Principal
Component Analysis (KPCA), Gaussian Process Prior OCC (GP-OCC), Condensed Nearest
Neighbor Data Description (CNNDD) e One-class Random Forests (OCRF). As métricas de
desempenho consideradas nos experimentos foram: (i) a area sob a curva ROC (Area Under the
Curve - AUC); (ii) o coeficiente de correlação deMatthews (Matthews Correlation Coefficient
- MCC); (iii) o tempo de treinamento; e (iv) a taxa de redução de protótipos. Em relação às
métricas AUC e MCC, a primeira versão do método FBDOCC apresentou a melhor média
global entre todos os métodos enquanto que a segunda versão do método proposto, FBDOCC2,
obteve resultados comparáveis aosmelhoresmétodos em experimentos onde o FBDOCC obteve
um baixo desempenho. O FBDOCC obteve os melhores resultados considerando o tempo de
treinamento em todas as bases de dados, exceto uma. Em adição, o FBDOCC foi bem mais
rápido que todos os métodos baseados em Máquinas de Vetores de Suporte.
Além disso, um estudo de caso foi realizado utilizando dados adquiridos em um hospital
local de renome. Estes dados são compostos de informações não-invasivas sobre as crianças
que compareceram ao hospital com sintomas de sopro no coração. Informações como idade,
peso, altura, etc., foram usadas para prever se a criança é ou cardiopata. Devido ao elevado
grau de desequilíbrio entre as classes (ou seja, o número de pacientes saudáveis foi consideravelmente
mais elevado), a abordagem adotada foi a de construir uma descrição dos casos
saudáveis deixando casos desconhecidos fora desta descrição. Os resultados mostram que dois
dos classificadores OCC aplicados (FBDOCC e OCSVM) obtiveram êxito nesta tarefa, resultando
na melhor taxa, entre os métodos investigados, de detecção baseada exclusivamente em
dados não-invasivo
|
2 |
Técnicas de redução de instâncias: ATISA e SSMA2Lima Pereira, Cesar 31 January 2010 (has links)
Made available in DSpace on 2014-06-12T15:55:36Z (GMT). No. of bitstreams: 2
arquivo2273_1.pdf: 1625266 bytes, checksum: 0eb4bb8ecfe790f72029c6e54c3438f6 (MD5)
license.txt: 1748 bytes, checksum: 8a4605be74aa9ea9d79846c1fba20a33 (MD5)
Previous issue date: 2010 / Fundação de Amparo à Ciência e Tecnologia do Estado de Pernambuco / Algoritmos de aprendizagem baseados em instâncias geralmente fazem uso de grandes conjuntos
de treinamento. Esses algoritmos podem necessitar de razoável espaço de armazenamento
para manter esses conjuntos, ou mesmo sofrer com elevado custo computacional para a realização
da aprendizagem, ou durante generalizações. Um processo de seleção de instâncias
específicas para uso na aprendizagem pode influenciar fortemente o desempenho dos algoritmos
baseados em instâncias. Eles podem ser melhorados em quesitos como: requisitos de
armazenamento, tempo de execução e também em poder de classificação. Uma variedade de
técnicas da literatura atuam com a finalidade da redução de instâncias em um conjunto de treinamento.
Duas novas técnicas serão introduzidas nesta dissertação. A primeira delas, ATISA
(Adaptive Threshold-based Instance Selection Algorithm), mantém instâncias com base em um
critério que usa a distância de cada instância ao seu inimigo mais próximo como um limiar.
Essa característica prioriza instâncias próximas às fronteiras de decisão, que são mais determinantes
no processo de classificação. O ATISA é apresentado em três diferentes algoritmos, cada
um com abordagens distintas. A segunda técnica proposta é uma adaptação do SSMA (Steady-
State Memetic Algorithm), já utilizado para a seleção de instâncias, para a síntese de protótipos.
Aqui chamado de SSMA2, ele é um algoritmo evolucionário que cria protótipos que representam
instâncias e que podem não estar contidos no conjunto original de treinamento. Durante
o processo de evolução, ele realiza um passo de busca local para refinar soluções, vem daí a
denominação memético. Ambos, ATISA e SSMA2, apresentaram-se como alternativas dentre
as técnicas de redução de instâncias existentes, de acordo com os experimentos realizados
|
Page generated in 0.0697 seconds