Spelling suggestions: "subject:"combinação dde classificados"" "subject:"combinação dde classificador""
1 |
Sistemas inteligentes híbridos para classificação de textoPereira Rodrigues, Joseane 31 January 2009 (has links)
Made available in DSpace on 2014-06-12T16:00:02Z (GMT). No. of bitstreams: 2
arquivo5821_1.pdf: 891518 bytes, checksum: 9560f5e12af9c2656653e6d7b10b47ed (MD5)
license.txt: 1748 bytes, checksum: 8a4605be74aa9ea9d79846c1fba20a33 (MD5)
Previous issue date: 2009 / Fundação de Amparo a Pesquisa do Estado da Bahia / Grande parte da informação contida em repositórios digitais, como a Web e
as Bibliotecas Digitais, está representada em formato de documentos de texto.
Sistemas de Recuperação de Informação têm sido usados para prover acesso a
documentos relevantes armazenados nesses repositórios. No entanto, esses
sistemas ainda apresentam limitações a serem superadas. Muitos dos problemas
desses sistemas têm sido tratados usando técnicas de classificação de texto
oriundas da Inteligência Artificial (em especial os algoritmos de Aprendizado de
Máquina). Cada técnica apresenta vantagens e limitações, considerando os
conjuntos de textos em que são aplicadas.
Este trabalho investigou técnicas de combinação de classificadores de
texto, em especial, técnicas baseadas em Boosting. Essas técnicas tentam
superar as limitações dos classificadores sendo combinados, mantendo suas
vantagens individuais, e assim apresentando um melhor desempenho nas tarefas
em que são aplicados. Trabalhos anteriores apontam problemas em aberto em
relação ao uso de métodos de combinação para classificadores de texto. Assim,
esperamos neste projeto avançar o estado da arte sobre o tema.
No trabalho realizado, implementamos uma variação de Boosting proposta
na literatura que usa informações de vizinhança, chamada LocalBoost. Essa
variação tem alcançado bons resultados comparativos em dados benchmark.
Propomos ainda uma variação do LocalBoost para tratamento de dados
desbalanceados, que foi avaliada em experimentos tanto com bases de
classificação de texto como para bases de dados não-textuais. Os resultados dos
experimentos revelaram a viabilidade do uso da variação proposta
|
2 |
Seleção dinâmica de classificadores baseada em filtragem e em distância adaptativaALMEIDA, Henrique Alexandre de Menezes Sabino 15 August 2014 (has links)
Submitted by Luiz Felipe Barbosa (luiz.fbabreu2@ufpe.br) on 2015-03-09T14:50:57Z
No. of bitstreams: 2
DISSERTAÇÃO Henrique Alexandre de Menezes Sabino.pdf: 6700092 bytes, checksum: 8c6bc8de7d1a8e7ec2a85b2753260399 (MD5)
license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5) / Made available in DSpace on 2015-03-09T14:50:57Z (GMT). No. of bitstreams: 2
DISSERTAÇÃO Henrique Alexandre de Menezes Sabino.pdf: 6700092 bytes, checksum: 8c6bc8de7d1a8e7ec2a85b2753260399 (MD5)
license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5)
Previous issue date: 2014-08-15 / Em aprendizagem de máquina, uma das dificuldades mais recorrentes é a escolha do
classificador que melhor resolve um determinado problema. Devido a isso, muitos estudos
mostraram que problemas de classificação têm maiores taxas de acerto quando classificadores
são combinados ao invés de apenas um classificador individual. A Seleção Dinâmica é uma
estratégia para a combinação de múltiplos classificadores que usa a região de competência, no
qual acredita-se que um subconjunto de classificadores seja mais competente para classificar
um dado padrão de consulta. A abordagem tradicional de seleção dinâmica é composta por
três fases: Superprodução, Região de Competência e Seleção Dinâmica. Vários métodos têm
sidos propostos na fase de Superprodução, responsável pela geração de classificadores, e na
fase de Seleção Dinâmica, responsável pela heurística de seleção, porém pouco foi estudado
sobre a fase de Região de Competência. A fase de Região de Competência é responsável pela
seleção dos padrões vizinhos do padrão de consulta, e é a principal informação para a seleção dos
classificadores através da heurística de seleção. Devido à importância da região de competência,
este trabalho propõe uma abordagem para seleção dinâmica que visa melhorar a definição da
região de competência, tendo como hipótese que uma melhor definição dessa região resulta em
um melhor desempenho de seleção dinâmica. Isso é realizado através de duas técnicas: filtragem
de instâncias e distância adaptativa. Essas técnicas têm como finalidade a redução de padrões
indesejáveis, e portanto são responsáveis por melhorar a qualidade da região de competência. Os
experimentos foram realizados em 17 bases de dados utilizando 6 métodos diferentes de seleção
dinâmica de classificadores. Os resultados mostraram que a abordagem proposta melhorou a taxa
de acerto da seleção dinâmica, em relação a abordagem tradicional, em 10 bases com diferenças
estatisticamente significativas, e em 5 dos 6 métodos de seleção dinâmica. No trabalho, também
foi analisada a influência dos componentes do sistema de seleção dinâmica, e as descrições
das bases de dados que influenciam a diferença dos resultados entre a abordagem proposta e
a abordagem tradicional. Os resultados dessas análises mostraram que o método de seleção
dinâmica e o classificador base são os componentes do sistema de seleção dinâmica que melhor
determinam a taxa de acerto, e que o número de dimensões e o número de classes são os fatores
que mais contribuem para a diferença de resultados entre as abordagens, proposta e tradicional.
|
3 |
"Combinação de classificadores simbólicos para melhorar o poder preditivo e descritivo de Ensembles" / Combination of symbolic classifiers to improve predictive and descriptive power of ensemblesBernardini, Flávia Cristina 17 May 2002 (has links)
A qualidade das hipóteses induzidas pelos atuais sistemas de Aprendizado de Máquina depende principalmente da quantidade e da qualidade dos atributos e exemplos utilizados no treinamento. Freqüentemente, resultados experimentais obtidos sobre grandes bases de dados, que possuem muitos atributos irrelevantes, resultam em hipóteses de baixa precisão. Por outro lado, muitos dos sistemas de aprendizado de máquina conhecidos não estão preparados para trabalhar com uma quantidade muito grande de exemplos. Assim, uma das áreas de pesquisa mais ativas em aprendizado de máquina tem girado em torno de técnicas que sejam capazes de ampliar a capacidade dos algoritmos de aprendizado para processar muitos exemplos de treinamento, atributos e classes. Para que conceitos sejam aprendidos a partir de grandes bases de dados utilizando Aprendizado de Máquina, pode-se utilizar duas abordagens. A primeira realiza uma seleção de exemplos e atributos mais relevantes, e a segunda ´e a abordagem de ensembles. Um ensemble ´e um conjunto de classificadores cujas decisões individuais são combinadas de alguma forma para classificar um novo caso. Ainda que ensembles classifiquem novos exemplos melhor que cada classificador individual, eles se comportam como caixas pretas, no sentido de nao oferecer ao usuário alguma explicação relacionada à classificação por eles fornecida. O objetivo deste trabalho é propor uma forma de combinação de classificadores simbólicos, ou seja, classificadores induzidos por algoritmos de AM simbólicos, nos quais o conhecimento é descrito na forma de regras if-then ou equivalentes, para se trabalhar com grandes bases de dados. A nossa proposta é a seguinte: dada uma grande base de dados, divide-se esta base aleatoriamente em pequenas bases de tal forma que é viável fornecer essas bases de tamanho menor a um ou vários algoritmos de AM simbólicos. Logo após, as regras que constituem os classificadores induzidos por esses algoritmos são combinadas em um único classificador. Para analisar a viabilidade do objetivo proposto, foi implementado um sistema na linguagem de programação lógica Prolog, com a finalidade de (a) avaliar regras de conhecimento induzidas por algoritmos de Aprendizado de Máquina simbólico e (b) avaliar diversas formas de combinar classificadores simbólicos bem como explicar a classificação de novos exemplos realizada por um ensemble de classificares simbólicos. A finalidade (a) é implementada pelo Módulo de Análise de Regras e a finalidade (b) pelo Módulo de Combinação e Explicação. Esses módulos constituem os módulos principais do RuleSystem. Neste trabalho, são descritos os métodos de construção de ensembles e de combinação de classificadores encontrados na literatura, o projeto e a documentação do RuleSystem, a metodologia desenvolvida para documentar o sistema RuleSystem, a implementação do Módulo de Combinação e Explicação, objeto de estudo deste trabalho, e duas aplicações do Módulo de Combinação e Explicação. A primeira aplicação utilizou uma base de dados artificiais, a qual nos permitiu observar necessidades de modificações no Módulo de Combinação e Explicação. A segunda aplicação utilizou uma base de dados reais. / The hypothesis quality induced by current machine learning algorithms depends mainly on the quantity and quality of features and examples used in the training phase. Frequently, hypothesis with low precision are obtained in experiments using large databases with a large number of irrelevant features. Thus, one active research area in machine learning is to investigate techniques able to extend the capacity of machine learning algorithms to process a large number of examples, features and classes. To learn concepts from large databases using machine learning algorithms, two approaches can be used. The first approach is based on a selection of relevant features and examples, and the second one is the ensemble approach. An ensemble is a set of classifiers whose individual decisions are combined in some way to classify a new case. Although ensembles classify new examples better than each individual classifier, they behave like black-boxes, since they do not offer any explanation to the user about their classification. The purpose of this work is to consider a form of symbolic classifiers combination to work with large databases. Given a large database, it is equally divided randomly in small databases. These small databases are supplied to one or more symbolic machine learning algorithms. After that, the rules from the resulting classifiers are combined into one classifier. To analise the viability of this proposal, was implemented a system in logic programming language Prolog, called RuleSystem. This system has two purposes; the first one, implemented by the Rule Analises Module, is to evaluate rules induced by symbolic machine learning algorithms; the second one, implemented by the Combination and Explanation Module, is to evaluate several forms of combining symbolic classifiers as well as to explain ensembled classification of new examples. Both principal modules constitute the Rule System. This work describes ensemble construction methods and combination of classifiers methods found in the literature; the project and documentation of RuleSystem; the methodology developed to document the RuleSystem; and the implementation of the Combination and Explanation Module. Two different case studies using the Combination and Explanation Module are described. The first case study uses an artificial database. Through the use of this artificial database, it was possible to improve several of the heuristics used by the the Combination and Explanation Module. A real database was used in the second case study.
|
4 |
Previsão de séries temporais usando séries exógenas e combinação de redes neurais aplicada ao mercado financeiroChristovam de Amorim Neto, Manoel 31 January 2008 (has links)
Made available in DSpace on 2014-06-12T15:56:23Z (GMT). No. of bitstreams: 2
arquivo2920_1.pdf: 2753004 bytes, checksum: d9cabbcda1b022b793399cc38a9d033c (MD5)
license.txt: 1748 bytes, checksum: 8a4605be74aa9ea9d79846c1fba20a33 (MD5)
Previous issue date: 2008 / A previsão de séries temporais tem sido usada em diversos problemas do mundo real,
tais como: meteorologia, previsão de carga em redes de computadores, análise de
mercado, entre outras, com o objetivo de minimizar riscos, auxiliar no planejamento e
na tomada de decisões.
Nesta dissertação, as séries temporais são analisadas para realizar previsões de
cotações de ações do mercado financeiro e, para tanto, uma metodologia baseada no
uso de séries exógenas e de combinação de classificadores é proposta.
As principais contribuições do presente trabalho são: i) utilização de séries
exógenas como variáveis de entrada para o classificador a fim de capturar
informações externas que influenciam na série a ser prevista; ii) utilização de
combinação de classificadores, em especial, combinação de Redes Neurais do tipo
MLP (Multi-Layer Perceptron); e, iii) concepção de uma nova medida de
desempenho SLG (Sum of Loses and Gains), que é mais aderente na área de
investimentos. Além disso, foram propostas diferentes abordagens para pré-processar
os dados.
Os estudos experimentais foram realizados utilizando a série temporal
correspondente à ação preferencial da Petrobras (PETR4). Os resultados mostraram
que o modelo proposto superou os modelos tradicionais, conseguindo prever a série
com maior precisão e relevância para os investidores
|
5 |
"Combinação de classificadores simbólicos para melhorar o poder preditivo e descritivo de Ensembles" / Combination of symbolic classifiers to improve predictive and descriptive power of ensemblesFlávia Cristina Bernardini 17 May 2002 (has links)
A qualidade das hipóteses induzidas pelos atuais sistemas de Aprendizado de Máquina depende principalmente da quantidade e da qualidade dos atributos e exemplos utilizados no treinamento. Freqüentemente, resultados experimentais obtidos sobre grandes bases de dados, que possuem muitos atributos irrelevantes, resultam em hipóteses de baixa precisão. Por outro lado, muitos dos sistemas de aprendizado de máquina conhecidos não estão preparados para trabalhar com uma quantidade muito grande de exemplos. Assim, uma das áreas de pesquisa mais ativas em aprendizado de máquina tem girado em torno de técnicas que sejam capazes de ampliar a capacidade dos algoritmos de aprendizado para processar muitos exemplos de treinamento, atributos e classes. Para que conceitos sejam aprendidos a partir de grandes bases de dados utilizando Aprendizado de Máquina, pode-se utilizar duas abordagens. A primeira realiza uma seleção de exemplos e atributos mais relevantes, e a segunda ´e a abordagem de ensembles. Um ensemble ´e um conjunto de classificadores cujas decisões individuais são combinadas de alguma forma para classificar um novo caso. Ainda que ensembles classifiquem novos exemplos melhor que cada classificador individual, eles se comportam como caixas pretas, no sentido de nao oferecer ao usuário alguma explicação relacionada à classificação por eles fornecida. O objetivo deste trabalho é propor uma forma de combinação de classificadores simbólicos, ou seja, classificadores induzidos por algoritmos de AM simbólicos, nos quais o conhecimento é descrito na forma de regras if-then ou equivalentes, para se trabalhar com grandes bases de dados. A nossa proposta é a seguinte: dada uma grande base de dados, divide-se esta base aleatoriamente em pequenas bases de tal forma que é viável fornecer essas bases de tamanho menor a um ou vários algoritmos de AM simbólicos. Logo após, as regras que constituem os classificadores induzidos por esses algoritmos são combinadas em um único classificador. Para analisar a viabilidade do objetivo proposto, foi implementado um sistema na linguagem de programação lógica Prolog, com a finalidade de (a) avaliar regras de conhecimento induzidas por algoritmos de Aprendizado de Máquina simbólico e (b) avaliar diversas formas de combinar classificadores simbólicos bem como explicar a classificação de novos exemplos realizada por um ensemble de classificares simbólicos. A finalidade (a) é implementada pelo Módulo de Análise de Regras e a finalidade (b) pelo Módulo de Combinação e Explicação. Esses módulos constituem os módulos principais do RuleSystem. Neste trabalho, são descritos os métodos de construção de ensembles e de combinação de classificadores encontrados na literatura, o projeto e a documentação do RuleSystem, a metodologia desenvolvida para documentar o sistema RuleSystem, a implementação do Módulo de Combinação e Explicação, objeto de estudo deste trabalho, e duas aplicações do Módulo de Combinação e Explicação. A primeira aplicação utilizou uma base de dados artificiais, a qual nos permitiu observar necessidades de modificações no Módulo de Combinação e Explicação. A segunda aplicação utilizou uma base de dados reais. / The hypothesis quality induced by current machine learning algorithms depends mainly on the quantity and quality of features and examples used in the training phase. Frequently, hypothesis with low precision are obtained in experiments using large databases with a large number of irrelevant features. Thus, one active research area in machine learning is to investigate techniques able to extend the capacity of machine learning algorithms to process a large number of examples, features and classes. To learn concepts from large databases using machine learning algorithms, two approaches can be used. The first approach is based on a selection of relevant features and examples, and the second one is the ensemble approach. An ensemble is a set of classifiers whose individual decisions are combined in some way to classify a new case. Although ensembles classify new examples better than each individual classifier, they behave like black-boxes, since they do not offer any explanation to the user about their classification. The purpose of this work is to consider a form of symbolic classifiers combination to work with large databases. Given a large database, it is equally divided randomly in small databases. These small databases are supplied to one or more symbolic machine learning algorithms. After that, the rules from the resulting classifiers are combined into one classifier. To analise the viability of this proposal, was implemented a system in logic programming language Prolog, called RuleSystem. This system has two purposes; the first one, implemented by the Rule Analises Module, is to evaluate rules induced by symbolic machine learning algorithms; the second one, implemented by the Combination and Explanation Module, is to evaluate several forms of combining symbolic classifiers as well as to explain ensembled classification of new examples. Both principal modules constitute the Rule System. This work describes ensemble construction methods and combination of classifiers methods found in the literature; the project and documentation of RuleSystem; the methodology developed to document the RuleSystem; and the implementation of the Combination and Explanation Module. Two different case studies using the Combination and Explanation Module are described. The first case study uses an artificial database. Through the use of this artificial database, it was possible to improve several of the heuristics used by the the Combination and Explanation Module. A real database was used in the second case study.
|
6 |
Investigação de combinações de técnicas de detecção de ruído para dados de expressão gênica / Investigation of ensembles of noise detection techniques for gene expression data.Libralon, Giampaolo Luiz 09 November 2007 (has links)
Ruído pode ser definido como um exemplo em um conjunto de dados que aparentemente é inconsistente com o restante dos dados existentes, pois não segue o mesmo padrão dos demais. Ruídos em conjuntos de dados podem reduzir o desempenho das técnicas de Aprendizado de Máquina (AM) empregadas e aumentar o tempo de construção da hipótese induzida, assim como sua complexidade. Dados são geralmente coletados por meio de medições realizadas em um domínio de interesse. Nesse sentido, nenhum conjunto de dados é perfeito. Erros de medições, dados incompletos, errados, corrompidos ou distorcidos, falhas humanas ou dos equipamentos utilizados, dentre muitos outros fatores, contribuem para a contaminação dos dados, e isso é particularmente verdadeiro para dados com elevada dimensionalidade. Sendo assim, a detecção de ruídos é uma tarefa crítica, principalmente em ambientes que exigem segurança e confiabilidade, uma vez que a presença desses pode indicar situações que degradam o desempenho do sistema ou a segurança e confiabilidade das informações. Algoritmos para a detecção e remoção de ruídos podem aumentar a confiabilidade de conjuntos de dados ruidosos. Nesse âmbito, esse trabalho investiga técnicas de detecção de ruído baseadas em distância, em que a remoção de ruídos é feita em uma etapa de pré-processamento, aplicadas a problemas de classificação de dados de Expressão Gênica, caracterizados pela presença de ruídos, elevada dimensionalidade e complexidade. O objetivo é melhorar o desempenho das técnicas de AM empregadas para solucioná-los. Por fim, combinações de técnicas de detecção de ruído são implementadas de modo a analisar a possibilidade de melhorar, ainda mais, o desempenho obtido. / Noise can be defined as an example which seems to be inconsistent with the remaining ones in a data set. The presence of noise in data sets can decrease the performance of Machine Learning (ML) techniques in the problem analysis and also increase the time taken to build the induced hypothesis and its complexity. Data are collected from measurements made which represent a given domain of interest. In this sense, no data set is perfect. Measurement errors, incomplete, corrupted, wrong or distorted examples, equipment problems or human fails, besides many other related factors, help contaminating the data, and this is particularly true for data sets with high dimensionality. For this reason, noise detection is a critical task, specially in domains which demand security and trustworthiness, since the presence of noise can lead to situations which degrade the system performance or the security and trustworthiness of the involved information. Algorithms to detect and remove noise may increase trustworthiness of noisy data sets. Based on that, this work evaluates distance-based noise detection techniques, in which noise removal is done by a pre-processing phase, in gene expression classification problems, characterized by the presence of noise, high dimensionality and complexity. The objective is to improve the performance of ML techniques used to solve these problems. Next, ensembles of noise detection techniques are developed in order to analyze the possibility to further improve the performance obtained.
|
7 |
Combinação de Classificadores para Reconhecimento de Padrões / Not availablePrampero, Paulo Sérgio 16 March 1998 (has links)
O cérebro humano é formado por um conjunto de neurônios de diferentes tipos, cada um com sua especialidade. A combinação destes diferentes tipos de neurônios é um dos aspectos responsáveis pelo desempenho apresentado pelo cérebro na realização de várias tarefas. Redes Neurais Artificiais são técnicas computacionais que apresentam um modelo matemático inspirado no sistema nervoso e que adquirem conhecimento através da experiência. Uma alternativa para melhorar o desempenho das Redes Neurais Artificiais é a utilização de técnicas de Combinação de Classificadores. Estas técnicas de combinação exploram as diferenças e as semelhanças das redes para a obtenção de resultados melhores. Dentre as principais aplicações de Redes Neurais Artificiais está o Reconhecimento de Padrões. Neste trabalho, foram utilizadas técnicas de Combinação de Classificadores para a combinação de Redes Neurais Artificiais em problemas de Reconhecimento de Padrões. / The human brain is formed by neurons of different types, each one with its own speciality. The combination of theses different types of neurons is one of the main features responsible for the brain performance in severa! tasks. Artificial Neural Networks are computation technics whose mathematical model is based on the nervous system and learns new knowledge by experience. An alternative to improve the performance of Artificial Neural Networks is the employment of Classifiers Combination techniques. These techniques of combination explore the difference and the similarity of the networks to achieve better performance. The main application of Artificial Neural Networks is Pattern Recognition. In this work, Classifiers Combination techniques were utilized to combine Artificial Neural Networks to solve Pattern Recognition problems.
|
8 |
Classificação de imagens tomográficas de ciência dos solos utilizando redes neurais e combinação de classificadores.Breve, Fabricio Aparecido 24 February 2006 (has links)
Made available in DSpace on 2016-06-02T19:05:16Z (GMT). No. of bitstreams: 1
DissFAB.pdf: 1452279 bytes, checksum: 36f870c836fe00e61421c842b6ef1291 (MD5)
Previous issue date: 2006-02-24 / Universidade Federal de Minas Gerais / Pattern Recognition is a subject being used in a multidisciplinary scope, with different approaches. One of them is its application in computerized tomography images, commonly acquired in order to do medical diagnosis, but they have been used in several other applications as well, including Soil Science. The objective of this work is to study and to discuss the performance of neural network-based classifiers (Multilayer Perceptron and
Radial Basis Functions) and classifier combiners (Bagging, Decision Templates and
Dempster-Shafer) applied to identify materials in Soil Science multispectral images, acquired
using Computerized Tomography. The results were evaluated by error estimation by Hold-
Out and the Kappa coefficient. / Reconhecimento de Padrões é uma área de âmbito multidisciplinar, com diversas abordagens. Uma delas é a aplicação em imagens de tomografia computadorizada, obtidas mais comumente para fins de diagnóstico médico, mas que também vêm sendo utilizadas nas mais variadas aplicações, inclusive Ciência dos Solos. O objetivo deste trabalho é estudar e discutir o desempenho de classificadores baseados em redes neurais (Perceptron de Múltiplas Camadas e Redes de Função de Base Radial) e da combinação de classificadores (Bagging, Decision Templates e Dempster-Shafer) na identificação de materiais em imagens
multiespectrais de Ciência de Solos obtidas através de tomografia computadorizada. Os
resultados foram avaliados através da estimativa de erro obtida pelo método Hold-Out e do
coeficiente Kappa.
|
9 |
Combinação de múltiplos classificadores para identificação de materiais em imagens ruidosas.Ponti Junior, Moacir Pereira 28 May 2004 (has links)
Made available in DSpace on 2016-06-02T19:05:55Z (GMT). No. of bitstreams: 1
DissMPPJ.pdf: 999212 bytes, checksum: f5206bea01cf1fed618936636cd00449 (MD5)
Previous issue date: 2004-05-28 / Material identification in images has been explored in multiple areas and very interesting
applications are arising in this field. This work uses noisy multispectral images from a
computerized tomograph scanner acquired with multiple energies for soil sciences applications and developes a recognition system to identify materials on the scanned body. Techniques of statistical classification were used. The individual classifiers: Parzen, k-nearest neighbors, logistic and linear Bayesian were combined in order to study the behavior of classifier combination techniques. For this task, we used the fixed rules combiners: majority voting, maximum, minimum, median, sum and product. Also, a second stage of combination was considered and used, the majority voting of combiners. The performance of the classifiers was analyzed through the leave-one-out cross-validation error estimation method and the Kappa coefficient. The advantages of the use of multiple energies in the problems of
identification of images and the behavior of each combination method are also demonstrated.
The results pointed out that the combination of classifiers gives better capacity of generalization and more stable results than the individual classifiers, using information supplied for all individual classifiers, including the weakest one, being recommended in classification of scarce, difficult discrimination data, on the presence of ambiguity or high`noise levels. / A identificação de materiais em imagens vem sendo explorada por diversas áreas para
aplicações muito interessantes. Neste trabalho utilizamos imagens multiespectrais ruidosas
obtidas por tomografia computadorizada adquiridas com múltiplas energias no propósito de estudos de ciência do solo. Através das imagens foi possível desenvolver uma sistema de
reconhecimento de padrões de forma a identificar os materiais do corpo imageado. Para esta tarefa foram utilizadas diversas técnicas de classificação. Os classificadores individuais:
Parzen, k-vizinhos mais próximos, logístico e Bayesiano linear foram combinados de modo a
estudar o comportamento de técnicas de combinação de classificadores. Foram utilizados os combinadores de regra fixa: votação por maioria, máximo, mínimo, mediana., soma e
produto. Foi também proposto e utilizado um segundo estágio de combinação, utilizando a
votação dos combinadores. O desempenho dos classificadores foi analisado através da
estimação de erro pelo método da validação cruzada leave-one-out e pelo coeficiente Kappa.
Foram demonstradas as vantagens da utilização de múltiplas energias nos problemas de
identificação de imagens e estudados os comportamentos de cada método de combinação. Os resultados apontaram que a combinação de classificadores possibilita melhor capacidade de generalização e resultados mais estáveis que os classificadores individuais, aproveitando as informações fornecidas por todos os classificadores individuais, inclusive os mais fracos, sendo recomendada na classificação de dados escassos ou difíceis em que apresentam ambiguidade ou altos índices de ruído.
|
10 |
Uma arquitetura para combinação de classificadores otimizada por métodos de poda com aplicação em credit scoringSilva Filho, Luiz Vieira e 17 February 2014 (has links)
Submitted by Lucelia Lucena (lucelia.lucena@ufpe.br) on 2015-03-09T19:29:39Z
No. of bitstreams: 2
license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5)
DISSERTAÇÃO Luíz Vieira e Silva Filho.pdf: 2176053 bytes, checksum: 4882a96e67804421bca22e07debc49da (MD5) / Made available in DSpace on 2015-03-09T19:29:39Z (GMT). No. of bitstreams: 2
license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5)
DISSERTAÇÃO Luíz Vieira e Silva Filho.pdf: 2176053 bytes, checksum: 4882a96e67804421bca22e07debc49da (MD5)
Previous issue date: 2014-02-17 / Sistemas de Múltiplos Classificadores (Multiple Classifiers Systems - MCS) se baseiam
na ideia de que combinar a opinião de vários especialistas pode produzir
melhores resultados do que quando se usa apenas um especialista. Diversas
técnicas de MCS foram desenvolvidas, apresentando pontos fortes e fracos,
a depender do contexto em que são aplicadas. Este trabalho propõe uma arquitetura
para MCS que visa potencializar a complementaridade entre essas
técnicas, possuindo dois objetivos principais: i) a combinação de métodos
de amostragem tradicionais, visando a geração de classificadores de melhor
desempenho que componham um pool de classificadores; ii) a aplicação de
um algoritmo de poda para remover do pool aqueles classificadores incompetentes
para lidar com o problema em questão, considerando os critérios de
seleção adotados. A arquitetura proposta foi avaliada em uma aplicação de
credit-scoring. Os métodos de amostragem usados foram o Bagging e o Random
Subspace com classificadores-base sendo árvores-de-decisão, construídas
com base no algoritmo CART. Para o processamento da poda foi usado o algoritmo
Orientation Ordering, e para combinação das saídas dos classificadores
do ensemble adotou-se o método Majority Vote. Os experimentos realizados
mostraram que a arquitetura proposta alcançou taxas de acerto similares ou
superiores às atingidas pelos métodos apresentados na literatura. Esses resultados
ainda foram obtidos com ensembles cujos tamanhos eram da ordemde
20% dos pools originais gerados na fase de treinamento.
|
Page generated in 0.1235 seconds