• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 21
  • 3
  • Tagged with
  • 24
  • 24
  • 11
  • 9
  • 9
  • 8
  • 8
  • 7
  • 7
  • 7
  • 7
  • 6
  • 6
  • 6
  • 5
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
1

Sistemas inteligentes híbridos para classificação de texto

Pereira Rodrigues, Joseane 31 January 2009 (has links)
Made available in DSpace on 2014-06-12T16:00:02Z (GMT). No. of bitstreams: 2 arquivo5821_1.pdf: 891518 bytes, checksum: 9560f5e12af9c2656653e6d7b10b47ed (MD5) license.txt: 1748 bytes, checksum: 8a4605be74aa9ea9d79846c1fba20a33 (MD5) Previous issue date: 2009 / Fundação de Amparo a Pesquisa do Estado da Bahia / Grande parte da informação contida em repositórios digitais, como a Web e as Bibliotecas Digitais, está representada em formato de documentos de texto. Sistemas de Recuperação de Informação têm sido usados para prover acesso a documentos relevantes armazenados nesses repositórios. No entanto, esses sistemas ainda apresentam limitações a serem superadas. Muitos dos problemas desses sistemas têm sido tratados usando técnicas de classificação de texto oriundas da Inteligência Artificial (em especial os algoritmos de Aprendizado de Máquina). Cada técnica apresenta vantagens e limitações, considerando os conjuntos de textos em que são aplicadas. Este trabalho investigou técnicas de combinação de classificadores de texto, em especial, técnicas baseadas em Boosting. Essas técnicas tentam superar as limitações dos classificadores sendo combinados, mantendo suas vantagens individuais, e assim apresentando um melhor desempenho nas tarefas em que são aplicados. Trabalhos anteriores apontam problemas em aberto em relação ao uso de métodos de combinação para classificadores de texto. Assim, esperamos neste projeto avançar o estado da arte sobre o tema. No trabalho realizado, implementamos uma variação de Boosting proposta na literatura que usa informações de vizinhança, chamada LocalBoost. Essa variação tem alcançado bons resultados comparativos em dados benchmark. Propomos ainda uma variação do LocalBoost para tratamento de dados desbalanceados, que foi avaliada em experimentos tanto com bases de classificação de texto como para bases de dados não-textuais. Os resultados dos experimentos revelaram a viabilidade do uso da variação proposta
2

Seleção dinâmica de classificadores baseada em filtragem e em distância adaptativa

ALMEIDA, Henrique Alexandre de Menezes Sabino 15 August 2014 (has links)
Submitted by Luiz Felipe Barbosa (luiz.fbabreu2@ufpe.br) on 2015-03-09T14:50:57Z No. of bitstreams: 2 DISSERTAÇÃO Henrique Alexandre de Menezes Sabino.pdf: 6700092 bytes, checksum: 8c6bc8de7d1a8e7ec2a85b2753260399 (MD5) license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5) / Made available in DSpace on 2015-03-09T14:50:57Z (GMT). No. of bitstreams: 2 DISSERTAÇÃO Henrique Alexandre de Menezes Sabino.pdf: 6700092 bytes, checksum: 8c6bc8de7d1a8e7ec2a85b2753260399 (MD5) license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5) Previous issue date: 2014-08-15 / Em aprendizagem de máquina, uma das dificuldades mais recorrentes é a escolha do classificador que melhor resolve um determinado problema. Devido a isso, muitos estudos mostraram que problemas de classificação têm maiores taxas de acerto quando classificadores são combinados ao invés de apenas um classificador individual. A Seleção Dinâmica é uma estratégia para a combinação de múltiplos classificadores que usa a região de competência, no qual acredita-se que um subconjunto de classificadores seja mais competente para classificar um dado padrão de consulta. A abordagem tradicional de seleção dinâmica é composta por três fases: Superprodução, Região de Competência e Seleção Dinâmica. Vários métodos têm sidos propostos na fase de Superprodução, responsável pela geração de classificadores, e na fase de Seleção Dinâmica, responsável pela heurística de seleção, porém pouco foi estudado sobre a fase de Região de Competência. A fase de Região de Competência é responsável pela seleção dos padrões vizinhos do padrão de consulta, e é a principal informação para a seleção dos classificadores através da heurística de seleção. Devido à importância da região de competência, este trabalho propõe uma abordagem para seleção dinâmica que visa melhorar a definição da região de competência, tendo como hipótese que uma melhor definição dessa região resulta em um melhor desempenho de seleção dinâmica. Isso é realizado através de duas técnicas: filtragem de instâncias e distância adaptativa. Essas técnicas têm como finalidade a redução de padrões indesejáveis, e portanto são responsáveis por melhorar a qualidade da região de competência. Os experimentos foram realizados em 17 bases de dados utilizando 6 métodos diferentes de seleção dinâmica de classificadores. Os resultados mostraram que a abordagem proposta melhorou a taxa de acerto da seleção dinâmica, em relação a abordagem tradicional, em 10 bases com diferenças estatisticamente significativas, e em 5 dos 6 métodos de seleção dinâmica. No trabalho, também foi analisada a influência dos componentes do sistema de seleção dinâmica, e as descrições das bases de dados que influenciam a diferença dos resultados entre a abordagem proposta e a abordagem tradicional. Os resultados dessas análises mostraram que o método de seleção dinâmica e o classificador base são os componentes do sistema de seleção dinâmica que melhor determinam a taxa de acerto, e que o número de dimensões e o número de classes são os fatores que mais contribuem para a diferença de resultados entre as abordagens, proposta e tradicional.
3

"Combinação de classificadores simbólicos para melhorar o poder preditivo e descritivo de Ensembles" / Combination of symbolic classifiers to improve predictive and descriptive power of ensembles

Bernardini, Flávia Cristina 17 May 2002 (has links)
A qualidade das hipóteses induzidas pelos atuais sistemas de Aprendizado de Máquina depende principalmente da quantidade e da qualidade dos atributos e exemplos utilizados no treinamento. Freqüentemente, resultados experimentais obtidos sobre grandes bases de dados, que possuem muitos atributos irrelevantes, resultam em hipóteses de baixa precisão. Por outro lado, muitos dos sistemas de aprendizado de máquina conhecidos não estão preparados para trabalhar com uma quantidade muito grande de exemplos. Assim, uma das áreas de pesquisa mais ativas em aprendizado de máquina tem girado em torno de técnicas que sejam capazes de ampliar a capacidade dos algoritmos de aprendizado para processar muitos exemplos de treinamento, atributos e classes. Para que conceitos sejam aprendidos a partir de grandes bases de dados utilizando Aprendizado de Máquina, pode-se utilizar duas abordagens. A primeira realiza uma seleção de exemplos e atributos mais relevantes, e a segunda ´e a abordagem de ensembles. Um ensemble ´e um conjunto de classificadores cujas decisões individuais são combinadas de alguma forma para classificar um novo caso. Ainda que ensembles classifiquem novos exemplos melhor que cada classificador individual, eles se comportam como caixas pretas, no sentido de n˜ao oferecer ao usuário alguma explicação relacionada à classificação por eles fornecida. O objetivo deste trabalho é propor uma forma de combinação de classificadores simbólicos, ou seja, classificadores induzidos por algoritmos de AM simbólicos, nos quais o conhecimento é descrito na forma de regras if-then ou equivalentes, para se trabalhar com grandes bases de dados. A nossa proposta é a seguinte: dada uma grande base de dados, divide-se esta base aleatoriamente em pequenas bases de tal forma que é viável fornecer essas bases de tamanho menor a um ou vários algoritmos de AM simbólicos. Logo após, as regras que constituem os classificadores induzidos por esses algoritmos são combinadas em um único classificador. Para analisar a viabilidade do objetivo proposto, foi implementado um sistema na linguagem de programação lógica Prolog, com a finalidade de (a) avaliar regras de conhecimento induzidas por algoritmos de Aprendizado de Máquina simbólico e (b) avaliar diversas formas de combinar classificadores simbólicos bem como explicar a classificação de novos exemplos realizada por um ensemble de classificares simbólicos. A finalidade (a) é implementada pelo Módulo de Análise de Regras e a finalidade (b) pelo Módulo de Combinação e Explicação. Esses módulos constituem os módulos principais do RuleSystem. Neste trabalho, são descritos os métodos de construção de ensembles e de combinação de classificadores encontrados na literatura, o projeto e a documentação do RuleSystem, a metodologia desenvolvida para documentar o sistema RuleSystem, a implementação do Módulo de Combinação e Explicação, objeto de estudo deste trabalho, e duas aplicações do Módulo de Combinação e Explicação. A primeira aplicação utilizou uma base de dados artificiais, a qual nos permitiu observar necessidades de modificações no Módulo de Combinação e Explicação. A segunda aplicação utilizou uma base de dados reais. / The hypothesis quality induced by current machine learning algorithms depends mainly on the quantity and quality of features and examples used in the training phase. Frequently, hypothesis with low precision are obtained in experiments using large databases with a large number of irrelevant features. Thus, one active research area in machine learning is to investigate techniques able to extend the capacity of machine learning algorithms to process a large number of examples, features and classes. To learn concepts from large databases using machine learning algorithms, two approaches can be used. The first approach is based on a selection of relevant features and examples, and the second one is the ensemble approach. An ensemble is a set of classifiers whose individual decisions are combined in some way to classify a new case. Although ensembles classify new examples better than each individual classifier, they behave like black-boxes, since they do not offer any explanation to the user about their classification. The purpose of this work is to consider a form of symbolic classifiers combination to work with large databases. Given a large database, it is equally divided randomly in small databases. These small databases are supplied to one or more symbolic machine learning algorithms. After that, the rules from the resulting classifiers are combined into one classifier. To analise the viability of this proposal, was implemented a system in logic programming language Prolog, called RuleSystem. This system has two purposes; the first one, implemented by the Rule Analises Module, is to evaluate rules induced by symbolic machine learning algorithms; the second one, implemented by the Combination and Explanation Module, is to evaluate several forms of combining symbolic classifiers as well as to explain ensembled classification of new examples. Both principal modules constitute the Rule System. This work describes ensemble construction methods and combination of classifiers methods found in the literature; the project and documentation of RuleSystem; the methodology developed to document the RuleSystem; and the implementation of the Combination and Explanation Module. Two different case studies using the Combination and Explanation Module are described. The first case study uses an artificial database. Through the use of this artificial database, it was possible to improve several of the heuristics used by the the Combination and Explanation Module. A real database was used in the second case study.
4

Previsão de séries temporais usando séries exógenas e combinação de redes neurais aplicada ao mercado financeiro

Christovam de Amorim Neto, Manoel 31 January 2008 (has links)
Made available in DSpace on 2014-06-12T15:56:23Z (GMT). No. of bitstreams: 2 arquivo2920_1.pdf: 2753004 bytes, checksum: d9cabbcda1b022b793399cc38a9d033c (MD5) license.txt: 1748 bytes, checksum: 8a4605be74aa9ea9d79846c1fba20a33 (MD5) Previous issue date: 2008 / A previsão de séries temporais tem sido usada em diversos problemas do mundo real, tais como: meteorologia, previsão de carga em redes de computadores, análise de mercado, entre outras, com o objetivo de minimizar riscos, auxiliar no planejamento e na tomada de decisões. Nesta dissertação, as séries temporais são analisadas para realizar previsões de cotações de ações do mercado financeiro e, para tanto, uma metodologia baseada no uso de séries exógenas e de combinação de classificadores é proposta. As principais contribuições do presente trabalho são: i) utilização de séries exógenas como variáveis de entrada para o classificador a fim de capturar informações externas que influenciam na série a ser prevista; ii) utilização de combinação de classificadores, em especial, combinação de Redes Neurais do tipo MLP (Multi-Layer Perceptron); e, iii) concepção de uma nova medida de desempenho SLG (Sum of Loses and Gains), que é mais aderente na área de investimentos. Além disso, foram propostas diferentes abordagens para pré-processar os dados. Os estudos experimentais foram realizados utilizando a série temporal correspondente à ação preferencial da Petrobras (PETR4). Os resultados mostraram que o modelo proposto superou os modelos tradicionais, conseguindo prever a série com maior precisão e relevância para os investidores
5

"Combinação de classificadores simbólicos para melhorar o poder preditivo e descritivo de Ensembles" / Combination of symbolic classifiers to improve predictive and descriptive power of ensembles

Flávia Cristina Bernardini 17 May 2002 (has links)
A qualidade das hipóteses induzidas pelos atuais sistemas de Aprendizado de Máquina depende principalmente da quantidade e da qualidade dos atributos e exemplos utilizados no treinamento. Freqüentemente, resultados experimentais obtidos sobre grandes bases de dados, que possuem muitos atributos irrelevantes, resultam em hipóteses de baixa precisão. Por outro lado, muitos dos sistemas de aprendizado de máquina conhecidos não estão preparados para trabalhar com uma quantidade muito grande de exemplos. Assim, uma das áreas de pesquisa mais ativas em aprendizado de máquina tem girado em torno de técnicas que sejam capazes de ampliar a capacidade dos algoritmos de aprendizado para processar muitos exemplos de treinamento, atributos e classes. Para que conceitos sejam aprendidos a partir de grandes bases de dados utilizando Aprendizado de Máquina, pode-se utilizar duas abordagens. A primeira realiza uma seleção de exemplos e atributos mais relevantes, e a segunda ´e a abordagem de ensembles. Um ensemble ´e um conjunto de classificadores cujas decisões individuais são combinadas de alguma forma para classificar um novo caso. Ainda que ensembles classifiquem novos exemplos melhor que cada classificador individual, eles se comportam como caixas pretas, no sentido de n˜ao oferecer ao usuário alguma explicação relacionada à classificação por eles fornecida. O objetivo deste trabalho é propor uma forma de combinação de classificadores simbólicos, ou seja, classificadores induzidos por algoritmos de AM simbólicos, nos quais o conhecimento é descrito na forma de regras if-then ou equivalentes, para se trabalhar com grandes bases de dados. A nossa proposta é a seguinte: dada uma grande base de dados, divide-se esta base aleatoriamente em pequenas bases de tal forma que é viável fornecer essas bases de tamanho menor a um ou vários algoritmos de AM simbólicos. Logo após, as regras que constituem os classificadores induzidos por esses algoritmos são combinadas em um único classificador. Para analisar a viabilidade do objetivo proposto, foi implementado um sistema na linguagem de programação lógica Prolog, com a finalidade de (a) avaliar regras de conhecimento induzidas por algoritmos de Aprendizado de Máquina simbólico e (b) avaliar diversas formas de combinar classificadores simbólicos bem como explicar a classificação de novos exemplos realizada por um ensemble de classificares simbólicos. A finalidade (a) é implementada pelo Módulo de Análise de Regras e a finalidade (b) pelo Módulo de Combinação e Explicação. Esses módulos constituem os módulos principais do RuleSystem. Neste trabalho, são descritos os métodos de construção de ensembles e de combinação de classificadores encontrados na literatura, o projeto e a documentação do RuleSystem, a metodologia desenvolvida para documentar o sistema RuleSystem, a implementação do Módulo de Combinação e Explicação, objeto de estudo deste trabalho, e duas aplicações do Módulo de Combinação e Explicação. A primeira aplicação utilizou uma base de dados artificiais, a qual nos permitiu observar necessidades de modificações no Módulo de Combinação e Explicação. A segunda aplicação utilizou uma base de dados reais. / The hypothesis quality induced by current machine learning algorithms depends mainly on the quantity and quality of features and examples used in the training phase. Frequently, hypothesis with low precision are obtained in experiments using large databases with a large number of irrelevant features. Thus, one active research area in machine learning is to investigate techniques able to extend the capacity of machine learning algorithms to process a large number of examples, features and classes. To learn concepts from large databases using machine learning algorithms, two approaches can be used. The first approach is based on a selection of relevant features and examples, and the second one is the ensemble approach. An ensemble is a set of classifiers whose individual decisions are combined in some way to classify a new case. Although ensembles classify new examples better than each individual classifier, they behave like black-boxes, since they do not offer any explanation to the user about their classification. The purpose of this work is to consider a form of symbolic classifiers combination to work with large databases. Given a large database, it is equally divided randomly in small databases. These small databases are supplied to one or more symbolic machine learning algorithms. After that, the rules from the resulting classifiers are combined into one classifier. To analise the viability of this proposal, was implemented a system in logic programming language Prolog, called RuleSystem. This system has two purposes; the first one, implemented by the Rule Analises Module, is to evaluate rules induced by symbolic machine learning algorithms; the second one, implemented by the Combination and Explanation Module, is to evaluate several forms of combining symbolic classifiers as well as to explain ensembled classification of new examples. Both principal modules constitute the Rule System. This work describes ensemble construction methods and combination of classifiers methods found in the literature; the project and documentation of RuleSystem; the methodology developed to document the RuleSystem; and the implementation of the Combination and Explanation Module. Two different case studies using the Combination and Explanation Module are described. The first case study uses an artificial database. Through the use of this artificial database, it was possible to improve several of the heuristics used by the the Combination and Explanation Module. A real database was used in the second case study.
6

Investigação de combinações de técnicas de detecção de ruído para dados de expressão gênica / Investigation of ensembles of noise detection techniques for gene expression data.

Libralon, Giampaolo Luiz 09 November 2007 (has links)
Ruído pode ser definido como um exemplo em um conjunto de dados que aparentemente é inconsistente com o restante dos dados existentes, pois não segue o mesmo padrão dos demais. Ruídos em conjuntos de dados podem reduzir o desempenho das técnicas de Aprendizado de Máquina (AM) empregadas e aumentar o tempo de construção da hipótese induzida, assim como sua complexidade. Dados são geralmente coletados por meio de medições realizadas em um domínio de interesse. Nesse sentido, nenhum conjunto de dados é perfeito. Erros de medições, dados incompletos, errados, corrompidos ou distorcidos, falhas humanas ou dos equipamentos utilizados, dentre muitos outros fatores, contribuem para a contaminação dos dados, e isso é particularmente verdadeiro para dados com elevada dimensionalidade. Sendo assim, a detecção de ruídos é uma tarefa crítica, principalmente em ambientes que exigem segurança e confiabilidade, uma vez que a presença desses pode indicar situações que degradam o desempenho do sistema ou a segurança e confiabilidade das informações. Algoritmos para a detecção e remoção de ruídos podem aumentar a confiabilidade de conjuntos de dados ruidosos. Nesse âmbito, esse trabalho investiga técnicas de detecção de ruído baseadas em distância, em que a remoção de ruídos é feita em uma etapa de pré-processamento, aplicadas a problemas de classificação de dados de Expressão Gênica, caracterizados pela presença de ruídos, elevada dimensionalidade e complexidade. O objetivo é melhorar o desempenho das técnicas de AM empregadas para solucioná-los. Por fim, combinações de técnicas de detecção de ruído são implementadas de modo a analisar a possibilidade de melhorar, ainda mais, o desempenho obtido. / Noise can be defined as an example which seems to be inconsistent with the remaining ones in a data set. The presence of noise in data sets can decrease the performance of Machine Learning (ML) techniques in the problem analysis and also increase the time taken to build the induced hypothesis and its complexity. Data are collected from measurements made which represent a given domain of interest. In this sense, no data set is perfect. Measurement errors, incomplete, corrupted, wrong or distorted examples, equipment problems or human fails, besides many other related factors, help contaminating the data, and this is particularly true for data sets with high dimensionality. For this reason, noise detection is a critical task, specially in domains which demand security and trustworthiness, since the presence of noise can lead to situations which degrade the system performance or the security and trustworthiness of the involved information. Algorithms to detect and remove noise may increase trustworthiness of noisy data sets. Based on that, this work evaluates distance-based noise detection techniques, in which noise removal is done by a pre-processing phase, in gene expression classification problems, characterized by the presence of noise, high dimensionality and complexity. The objective is to improve the performance of ML techniques used to solve these problems. Next, ensembles of noise detection techniques are developed in order to analyze the possibility to further improve the performance obtained.
7

Combinação de Classificadores para Reconhecimento de Padrões / Not available

Prampero, Paulo Sérgio 16 March 1998 (has links)
O cérebro humano é formado por um conjunto de neurônios de diferentes tipos, cada um com sua especialidade. A combinação destes diferentes tipos de neurônios é um dos aspectos responsáveis pelo desempenho apresentado pelo cérebro na realização de várias tarefas. Redes Neurais Artificiais são técnicas computacionais que apresentam um modelo matemático inspirado no sistema nervoso e que adquirem conhecimento através da experiência. Uma alternativa para melhorar o desempenho das Redes Neurais Artificiais é a utilização de técnicas de Combinação de Classificadores. Estas técnicas de combinação exploram as diferenças e as semelhanças das redes para a obtenção de resultados melhores. Dentre as principais aplicações de Redes Neurais Artificiais está o Reconhecimento de Padrões. Neste trabalho, foram utilizadas técnicas de Combinação de Classificadores para a combinação de Redes Neurais Artificiais em problemas de Reconhecimento de Padrões. / The human brain is formed by neurons of different types, each one with its own speciality. The combination of theses different types of neurons is one of the main features responsible for the brain performance in severa! tasks. Artificial Neural Networks are computation technics whose mathematical model is based on the nervous system and learns new knowledge by experience. An alternative to improve the performance of Artificial Neural Networks is the employment of Classifiers Combination techniques. These techniques of combination explore the difference and the similarity of the networks to achieve better performance. The main application of Artificial Neural Networks is Pattern Recognition. In this work, Classifiers Combination techniques were utilized to combine Artificial Neural Networks to solve Pattern Recognition problems.
8

Classificação de imagens tomográficas de ciência dos solos utilizando redes neurais e combinação de classificadores.

Breve, Fabricio Aparecido 24 February 2006 (has links)
Made available in DSpace on 2016-06-02T19:05:16Z (GMT). No. of bitstreams: 1 DissFAB.pdf: 1452279 bytes, checksum: 36f870c836fe00e61421c842b6ef1291 (MD5) Previous issue date: 2006-02-24 / Universidade Federal de Minas Gerais / Pattern Recognition is a subject being used in a multidisciplinary scope, with different approaches. One of them is its application in computerized tomography images, commonly acquired in order to do medical diagnosis, but they have been used in several other applications as well, including Soil Science. The objective of this work is to study and to discuss the performance of neural network-based classifiers (Multilayer Perceptron and Radial Basis Functions) and classifier combiners (Bagging, Decision Templates and Dempster-Shafer) applied to identify materials in Soil Science multispectral images, acquired using Computerized Tomography. The results were evaluated by error estimation by Hold- Out and the Kappa coefficient. / Reconhecimento de Padrões é uma área de âmbito multidisciplinar, com diversas abordagens. Uma delas é a aplicação em imagens de tomografia computadorizada, obtidas mais comumente para fins de diagnóstico médico, mas que também vêm sendo utilizadas nas mais variadas aplicações, inclusive Ciência dos Solos. O objetivo deste trabalho é estudar e discutir o desempenho de classificadores baseados em redes neurais (Perceptron de Múltiplas Camadas e Redes de Função de Base Radial) e da combinação de classificadores (Bagging, Decision Templates e Dempster-Shafer) na identificação de materiais em imagens multiespectrais de Ciência de Solos obtidas através de tomografia computadorizada. Os resultados foram avaliados através da estimativa de erro obtida pelo método Hold-Out e do coeficiente Kappa.
9

Combinação de múltiplos classificadores para identificação de materiais em imagens ruidosas.

Ponti Junior, Moacir Pereira 28 May 2004 (has links)
Made available in DSpace on 2016-06-02T19:05:55Z (GMT). No. of bitstreams: 1 DissMPPJ.pdf: 999212 bytes, checksum: f5206bea01cf1fed618936636cd00449 (MD5) Previous issue date: 2004-05-28 / Material identification in images has been explored in multiple areas and very interesting applications are arising in this field. This work uses noisy multispectral images from a computerized tomograph scanner acquired with multiple energies for soil sciences applications and developes a recognition system to identify materials on the scanned body. Techniques of statistical classification were used. The individual classifiers: Parzen, k-nearest neighbors, logistic and linear Bayesian were combined in order to study the behavior of classifier combination techniques. For this task, we used the fixed rules combiners: majority voting, maximum, minimum, median, sum and product. Also, a second stage of combination was considered and used, the majority voting of combiners. The performance of the classifiers was analyzed through the leave-one-out cross-validation error estimation method and the Kappa coefficient. The advantages of the use of multiple energies in the problems of identification of images and the behavior of each combination method are also demonstrated. The results pointed out that the combination of classifiers gives better capacity of generalization and more stable results than the individual classifiers, using information supplied for all individual classifiers, including the weakest one, being recommended in classification of scarce, difficult discrimination data, on the presence of ambiguity or high`noise levels. / A identificação de materiais em imagens vem sendo explorada por diversas áreas para aplicações muito interessantes. Neste trabalho utilizamos imagens multiespectrais ruidosas obtidas por tomografia computadorizada adquiridas com múltiplas energias no propósito de estudos de ciência do solo. Através das imagens foi possível desenvolver uma sistema de reconhecimento de padrões de forma a identificar os materiais do corpo imageado. Para esta tarefa foram utilizadas diversas técnicas de classificação. Os classificadores individuais: Parzen, k-vizinhos mais próximos, logístico e Bayesiano linear foram combinados de modo a estudar o comportamento de técnicas de combinação de classificadores. Foram utilizados os combinadores de regra fixa: votação por maioria, máximo, mínimo, mediana., soma e produto. Foi também proposto e utilizado um segundo estágio de combinação, utilizando a votação dos combinadores. O desempenho dos classificadores foi analisado através da estimação de erro pelo método da validação cruzada leave-one-out e pelo coeficiente Kappa. Foram demonstradas as vantagens da utilização de múltiplas energias nos problemas de identificação de imagens e estudados os comportamentos de cada método de combinação. Os resultados apontaram que a combinação de classificadores possibilita melhor capacidade de generalização e resultados mais estáveis que os classificadores individuais, aproveitando as informações fornecidas por todos os classificadores individuais, inclusive os mais fracos, sendo recomendada na classificação de dados escassos ou difíceis em que apresentam ambiguidade ou altos índices de ruído.
10

Uma arquitetura para combinação de classificadores otimizada por métodos de poda com aplicação em credit scoring

Silva Filho, Luiz Vieira e 17 February 2014 (has links)
Submitted by Lucelia Lucena (lucelia.lucena@ufpe.br) on 2015-03-09T19:29:39Z No. of bitstreams: 2 license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5) DISSERTAÇÃO Luíz Vieira e Silva Filho.pdf: 2176053 bytes, checksum: 4882a96e67804421bca22e07debc49da (MD5) / Made available in DSpace on 2015-03-09T19:29:39Z (GMT). No. of bitstreams: 2 license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5) DISSERTAÇÃO Luíz Vieira e Silva Filho.pdf: 2176053 bytes, checksum: 4882a96e67804421bca22e07debc49da (MD5) Previous issue date: 2014-02-17 / Sistemas de Múltiplos Classificadores (Multiple Classifiers Systems - MCS) se baseiam na ideia de que combinar a opinião de vários especialistas pode produzir melhores resultados do que quando se usa apenas um especialista. Diversas técnicas de MCS foram desenvolvidas, apresentando pontos fortes e fracos, a depender do contexto em que são aplicadas. Este trabalho propõe uma arquitetura para MCS que visa potencializar a complementaridade entre essas técnicas, possuindo dois objetivos principais: i) a combinação de métodos de amostragem tradicionais, visando a geração de classificadores de melhor desempenho que componham um pool de classificadores; ii) a aplicação de um algoritmo de poda para remover do pool aqueles classificadores incompetentes para lidar com o problema em questão, considerando os critérios de seleção adotados. A arquitetura proposta foi avaliada em uma aplicação de credit-scoring. Os métodos de amostragem usados foram o Bagging e o Random Subspace com classificadores-base sendo árvores-de-decisão, construídas com base no algoritmo CART. Para o processamento da poda foi usado o algoritmo Orientation Ordering, e para combinação das saídas dos classificadores do ensemble adotou-se o método Majority Vote. Os experimentos realizados mostraram que a arquitetura proposta alcançou taxas de acerto similares ou superiores às atingidas pelos métodos apresentados na literatura. Esses resultados ainda foram obtidos com ensembles cujos tamanhos eram da ordemde 20% dos pools originais gerados na fase de treinamento.

Page generated in 0.1235 seconds