• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 93
  • 80
  • 11
  • 11
  • 10
  • 4
  • 3
  • 3
  • 2
  • 2
  • 1
  • 1
  • 1
  • 1
  • 1
  • Tagged with
  • 253
  • 90
  • 78
  • 69
  • 60
  • 57
  • 53
  • 52
  • 47
  • 46
  • 44
  • 41
  • 38
  • 37
  • 36
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
51

Metody kontrukce klasifikátorů vhodných pro segmentaci zákazníků / Construction of classifiers suitable for segmentation of clients

Hricová, Jana January 2013 (has links)
Title: Construction of classifiers suitable for segmentation of clients Author: Bc. Jana Hricová Department: Department of Probability and Mathematical Statistics Supervisor: prof. RNDr. Jaromír Antoch, CSc., Department of Probability and Mathematical Statistics Abstract: The master thesis discusses methods that are a part of the data analy- sis, called classification. In the thesis are presented classification methods used to construct tree like classifiers suitable for customer segmentation. Core methodo- logy that is discussed in our thesis is CART (Classification and Regression Trees) and then methodologies around ensemble models that use historical data to cons- truct classification and regression forests, namely Bagging, Boosting, Arcing and Random Forest. Here described methods were applied to real data from the field of customer segmentation and also to simulated data, both processed with RStudio software. Keywords: classification, tree like classifiers, random forests
52

Detection of Fungal Infections of Different Durations in Canola, Wheat, and Barley and Different Concentrations of Ochratoxin A Contamination in Wheat and Barley using Near-Infrared (NIR) Hyperspectral Imaging

THIRUPPATHI, SENTHILKUMAR 01 1900 (has links)
Fungal infection and mycotoxin contamination in agricultural products are a serious food safety issue. The detection of fungal infection and mycotoxin contamination in food products should be in a rapid way. A Near-infrared (NIR) hyperspectral imaging system was used to detect fungal infection in 2013 crop year canola, wheat, and barley at different periods after inoculation and different concentration levels of ochratoxin A in wheat and barley. Artificially fungal infected (Fungi: Aspergillus glaucus, Penicillium spp.) kernels of canola, wheat and barley, were subjected to single kernel imaging after 2, 4, 6, 8, and 10 weeks post inoculation in the NIR region from 1000 to 1600 nm at 61 evenly distributed wavelengths at 10 nm intervals. The acquired image data were in the three-dimensional hypercube forms, and these were transformed into two-dimensional data. The two-dimensional data were subjected to principal component analysis to identify significant wavelengths based on the highest principal component factor loadings. Wavelengths 1100, 1130, 1250, and 1300 nm were identified as significant for detection of fungal infection in canola kernels, wavelengths 1280, 1300, and 1350 nm were identified as significant for detection of fungal infection in wheat kernels, and wavelengths 1260, 1310, and 1360 nm were identified as significant for detection of fungal infection in barley kernels. The linear, quadratic and Mahalanobis statistical discriminant classifiers differentiated healthy canola kernels with > 95% and fungal infected canola kernels with > 90% classification accuracy. All the three classifiers discriminated healthy wheat and barley kernels with > 90% and fungal infected wheat and barley kernels with > 80% classification accuracy. The wavelengths 1300, 1350, and 1480 nm were identified as significant for detection of ochratoxin A contaminated wheat kernels, and wavelengths 1310, 1360, 1480 nm were identified as significant for detection of ochratoxin A contaminated barley kernels. All the three statistical classifiers differentiated healthy wheat and barley kernels and ochratoxin A contaminated wheat and barley kernels with a classification accuracy of 100%. The classifiers were able to discriminate between different durations of fungal infections in canola, wheat, and barley kernels with classification accuracy of more than 80% at initial periods (2 weeks) of fungal infection and 100% at the later periods of fungal infection. Different concentration levels of ochratoxin A contamination in wheat and barley kernels were discriminated with a classification accuracy of > 98% at ochratoxin A concentration level of ≤ 72 ppb in wheat kernels and ≤ 140 ppb in barley kernels and with 100% classification accuracy at higher concentration levels. / May 2016
53

Evolutionary ensembles for imbalanced learning / Comitês evolucionários para aprendizado desbalanceado

Fernandes, Everlandio Rebouças Queiroz 13 August 2018 (has links)
In many real classification problems, the data set used for model induction is significantly imbalanced. This occurs when the number of examples of some classes is much lower than the other classes. Imbalanced datasets can compromise the performance of most classical classification algorithms. The classification models induced by such datasets usually present a strong bias towards the majority classes, tending to classify new instances as belonging to these classes. A commonly adopted strategy for dealing with this problem is to train the classifier on a balanced sample from the original dataset. However, this procedure can discard examples that could be important for a better class discrimination, reducing classifier efficiency. On the other hand, in recent years several studies have shown that in different scenarios the strategy of combining several classifiers into structures known as ensembles has proved to be quite effective. This strategy has led to a stable predictive accuracy and, in particular, to a greater generalization ability than the classifiers that make up the ensemble. This generalization power of classifier ensembles has been the focus of research in the imbalanced learning field in order to reduce the bias toward the majority classes, despite the complexity involved in generating efficient ensembles. Optimization meta-heuristics, such as evolutionary algorithms, have many applications for ensemble learning, although they are little used for this purpose. For example, evolutionary algorithms maintain a set of possible solutions and diversify these solutions, which helps to escape out of the local optimal. In this context, this thesis investigates and develops approaches to deal with imbalanced datasets, using ensemble of classifiers induced by samples taken from the original dataset. More specifically, this theses propose three solutions based on evolutionary ensemble learning and a fourth proposal that uses a pruning mechanism based on dominance ranking, a common concept in multiobjective evolutionary algorithms. Experiments showed the potential of the developed solutions. / Em muitos problemas reais de classificação, o conjunto de dados usado para a indução do modelo é significativamente desbalanceado. Isso ocorre quando a quantidade de exemplos de algumas classes é muito inferior às das outras classes. Conjuntos de dados desbalanceados podem comprometer o desempenho da maioria dos algoritmos clássicos de classificação. Os modelos de classificação induzidos por tais conjuntos de dados geralmente apresentam um forte viés para as classes majoritárias, tendendo classificar novas instâncias como pertencentes a essas classes. Uma estratégia comumente adotada para lidar com esse problema, é treinar o classificador sobre uma amostra balanceada do conjunto de dados original. Entretanto, esse procedimento pode descartar exemplos que poderiam ser importantes para uma melhor discriminação das classes, diminuindo a eficiência do classificador. Por outro lado, nos últimos anos, vários estudos têm mostrado que em diferentes cenários a estratégia de combinar vários classificadores em estruturas conhecidas como comitês tem se mostrado bastante eficaz. Tal estratégia tem levado a uma acurácia preditiva estável e principalmente a apresentar maior habilidade de generalização que os classificadores que compõe o comitê. Esse poder de generalização dos comitês de classificadores tem sido foco de pesquisas no campo de aprendizado desbalanceado, com o objetivo de diminuir o viés em direção as classes majoritárias, apesar da complexidade que envolve gerar comitês de classificadores eficientes. Meta-heurísticas de otimização, como os algoritmos evolutivos, têm muitas aplicações para o aprendizado de comitês, apesar de serem pouco usadas para este fim. Por exemplo, algoritmos evolutivos mantêm um conjunto de soluções possíveis e diversificam essas soluções, o que auxilia na fuga dos ótimos locais. Nesse contexto, esta tese investiga e desenvolve abordagens para lidar com conjuntos de dados desbalanceados, utilizando comitês de classificadores induzidos a partir de amostras do conjunto de dados original por meio de metaheurísticas. Mais especificamente, são propostas três soluções baseadas em aprendizado evolucionário de comitês e uma quarta proposta que utiliza um mecanismo de poda baseado em ranking de dominância, conceito comum em algoritmos evolutivos multiobjetivos. Experimentos realizados mostraram o potencial das soluções desenvolvidas.
54

Compostos na língua de sinais brasileira / Compounds in Brazilian sign language

Takahira, Aline Garcia Rodero 13 August 2015 (has links)
Composição é um fenômeno muito produtivo nas línguas de sinais. Estudos pioneiros na ASL (língua de sinais americana) identificaram compostos formados sequencialmente que se caracterizam por regras de redução fonológica e assimilação nos constituintes dos compostos (KLIMA; BELLUGI, 1979; LIDDELL; JOHNSON, 1986). Um estudo sobre compostos na BSL (língua de sinais britânica) mostra a possibilidade de realização simultânea de dois sinais, que são dois classificadores (CLs), em um composto (BRENNAN, 1990). Na libras (língua brasileira de sinais), há estudos que tratam de compostos realizados sequencialmente com dois ou três sinais (QUADROS; KARNOPP, 2004; FELIPE, 2006; FIGUEIREDO SILVA; SELL, 2009). No entanto, nenhum deles trata da possibilidade da ocorrência de CLs em compostos, tampouco da possibilidade da realização de compostos simultâneos. Se as línguas de sinais apresentam dois articuladores primários, as mãos, é natural pensarmos na possibilidade da ocorrência de sinais simultâneos. Sendo assim, o objetivo deste trabalho é descrever os tipos de compostos que ocorrem na libras e investigar a possibilidade de ocorrência de CLs e marcadores não-manuais em compostos, formando compostos simultâneos. Através do conjunto de dados levantado em dicionários, conversas espontâneas e gravações eliciadas por figuras, classificamos os compostos da libras em três grandes grupos, que são os compostos: i) sequenciais; ii) simultâneos e iii) simultâneo-sequenciais. Observamos que todos os compostos simultâneos apresentam um predicado CL sinalizado simultaneamente com mais um sinal CL, ou apresentam um sinal realizado pela boca, o que possibilita a simultaneidade com um sinal manual. O grupo de compostos simultâneos é o menos investigado nas línguas de sinais e será o objeto principal de nossa pesquisa. A descrição detalhada desses dados, bem como a investigação da natureza dos CLs e dos sinais boca, levarão a um maior conhecimento dos processos morfológicos nas línguas de sinais e viabilizarão a indicação de caminhos para uma proposta de análise formal para a composição na libras. A análise desenvolvida nesta tese segue os pressupostos teóricos da Morfologia Distribuída (HALLE; MARANTZ, 1993). / Compound formation is a very productive phenomenon in sign languages. Pioneering studies of ASL (American Sign Language) identified compounds formed sequentially, which are characterized by rules of phonological reduction and assimilation in the members of the compounds (KLIMA; BELLUGI, 1979; LIDDELL; JOHNSON, 1986). An investigation of compound formation in BSL (British Sign Language) shows the possibility of simultaneous realization of two signs, which are two classifiers (CLs), in a compound (BRENNAN, 1990). In libras (Brazilian Sign Language), there are studies that deal with compounds realized sequentially, with two or three signs (QUADROS; KARNOPP, 2004; FELIPE, 2006; FIGUEIREDO SILVA; SELL, 2009). However, none of them deals with the possibility of occurrence of CLs in compounds, nor with the possibility of signing simultaneous compounds. If sign languages have two primary articulators, that is, the hands, it is natural to think of the possibility of occurrence of simultaneous signs. Thus, the aim of this thesis is to describe the types of compounds that occur in libras, and investigate the possibility of occurrence of CLs and non-manual markers in compounds, forming simultaneous compounds. Drawing on data collected in dictionaries, spontaneous conversations and recordings elicited by figures, we classify the compounds in libras into three major groups, which are: i) sequential compounds; ii) simultaneous compounds and iii) simultaneoussequential compounds. We observed that all the simultaneous compounds exhibit a CL predicate simultaneously realized with another CL sign, or exhibit a sign realized by the mouth, which enables the simultaneity with a manual sign. The group of simultaneous compounds is the least investigated one in sign languages and it will be the main topic of our research. Both the detailed description of these data and the investigation of the nature of CLs and signs realized by the mouth will lead to a better understanding of the morphological processes in sign languages, paving the way for a formal analysis of the compound formation in libras. The analysis developed in this work follows the theoretical assumptions of the Distributed Morphology framework (HALLE; MARANTZ, 1993).
55

Combinação de Classificadores para Reconhecimento de Padrões / Not available

Prampero, Paulo Sérgio 16 March 1998 (has links)
O cérebro humano é formado por um conjunto de neurônios de diferentes tipos, cada um com sua especialidade. A combinação destes diferentes tipos de neurônios é um dos aspectos responsáveis pelo desempenho apresentado pelo cérebro na realização de várias tarefas. Redes Neurais Artificiais são técnicas computacionais que apresentam um modelo matemático inspirado no sistema nervoso e que adquirem conhecimento através da experiência. Uma alternativa para melhorar o desempenho das Redes Neurais Artificiais é a utilização de técnicas de Combinação de Classificadores. Estas técnicas de combinação exploram as diferenças e as semelhanças das redes para a obtenção de resultados melhores. Dentre as principais aplicações de Redes Neurais Artificiais está o Reconhecimento de Padrões. Neste trabalho, foram utilizadas técnicas de Combinação de Classificadores para a combinação de Redes Neurais Artificiais em problemas de Reconhecimento de Padrões. / The human brain is formed by neurons of different types, each one with its own speciality. The combination of theses different types of neurons is one of the main features responsible for the brain performance in severa! tasks. Artificial Neural Networks are computation technics whose mathematical model is based on the nervous system and learns new knowledge by experience. An alternative to improve the performance of Artificial Neural Networks is the employment of Classifiers Combination techniques. These techniques of combination explore the difference and the similarity of the networks to achieve better performance. The main application of Artificial Neural Networks is Pattern Recognition. In this work, Classifiers Combination techniques were utilized to combine Artificial Neural Networks to solve Pattern Recognition problems.
56

Insertion adaptative en stéganographie : application aux images numériques dans le domaine spatial / Adaptive Steganography : application to digital images in spatial domain

Kouider, Sarra 17 December 2013 (has links)
La stéganographie est l'art de la communication secrète. L'objectif est de dissimuler un message secret dans un médium anodin de sorte qu'il soit indétectable. De nos jours, avec la généralisation d'Internet et l'apparition des supports numériques (fichiers audio, vidéos ou images), plusieurs philosophies de conception de schéma stéganographique ont été proposées. Parmi les méthodes actuelles appliquées aux images numériques naturelles, nous trouvons les méthodes d'insertion adaptative, dont le principe repose sur la modification du médium de couverture avec une garantie d'avoir un certain niveau de sécurité. Ces méthodes représentent une véritable avancée en stéganographie.Dans ce manuscrit, après avoir rappelé les concepts récents de stéganographie adaptative, nous présentons une procédure automatique et complète pour l'insertion adaptative de données secrètes dans des images numériques naturelles. L'approche proposée est une « méta-méthode » basée « oracle », appelée ASO (Adaptive Steganography by Oracle), qui permet de préserver à la fois la distribution de l'image de couverture et la distribution de la base d'images utilisée par l'émetteur. Notre approche permet d'obtenir des résultats nettement supérieurs aux méthodes actuelles de l'état de l'art, et est donc l'une, si ce n'est la meilleure approche du moment. Par ailleurs, nous définissons également un nouveau paradigme en stéganographie qui est la stéganographie par base, ainsi qu'une nouvelle mesure de sélection pour les images stéganographiées, permettant d'améliorer encore plus les performances de notre schéma d'insertion. Les différentes expérimentations, que nous avons effectuées sur des images réelles, ont confirmé la pertinence de cette nouvelle approche. / Steganography is the art of secret communication. The goal is to hide a secret message in an unsuspicious object in such a way that no one can detect it. Nowadays, with the Internet spread and the emergence of digital supports (audio files, videos, or images), several philosophies of designing steganographic methods were proposed. One of the most usual embedding methods used with real digital images is the adaptive embedding algorithms, which is based on the modification of the cover image with a guarantee of a certain security level. These methods represent an important progress in steganography.In this Ph.D. Thesis, we present a fully automated procedure for the adaptive embedding of secret data in digital images. For this, after recalling the recent concepts of adaptive steganography, we first introduce a clear formalism to define a new "meta-method" steganographic approach based on "oracle", whichwe called ASO (Adaptive Steganography by Oracle). Then, we define a new steganographic paradigm called "the steganography by database paradigm", and propose a new selection criterion to further enhance the security of the transmission phase of ASO. Experimental results show that our embedding approach ASO provides the highest level of steganographic security. It is then currently the best or one of the best approaches of the state of the art.
57

Estimativa da sobrevivência de rebrotas em povoamento de Eucalyptus spp com uso de veículo aéreo não tripulado (VANT) /

Andrade, Joissy Mayara de Almeida January 2019 (has links)
Orientador: Gener Tadeu Pereira / Resumo: O manejo florestal é de grande valia para aprimorar o processo de condução de florestas plantadas. As tecnologias inovadoras podem ser utilizadas como apoio na melhoria de processos, como o uso de veículos aéreos não tripulados (VANTs), que vêm destacando-se por suas inúmeras aplicações. O objetivo deste trabalho foi avaliar a eficiência das imagens aéreas obtidas por sensores a bordo de VANT para a detecção e a estimativa da sobrevivência de rebrotas em povoamento de Eucalyptus spp e verificar a viabilidade do uso de VANT para obter a estimativa de rebrotas em povoamento de eucalipto, tendo como testemunha as técnicas tradicionais de levantamento em campo para a avaliação de sobrevivência de 90 até 110 dias após a colheita, quantificando o número de regenerações presentes nos talhões observados. O estudo foi conduzido em uma área com indivíduos de uma floresta plantada da cultura de Eucalyptus spp, localizada no município de Capão Bonito – SP. A técnica estatística utilizada foi o classificador de máxima verossimilhança implementado no Sistema de Informação Geográfica (SIG). Concluiu-se que o classificador de máxima verossimilhança apresenta precisão (confiabilidade nas informações retornadas). Assim o processo de classificação por sensor de VANT foi eficiente para aprimorar o manejo em campo. / Abstract: The forest management is of great value to improve the process of management in planted forests. Innovative technologies can be used as support in improving processes, such as the use of Unmanned Aerial Vehicle (UAV), that have been outstanding for their many applications. The objective of this work was to evaluate the efficiency of aerial images obtained by sensors aboard UAV for detecting and estimating the survival of sprouts in Eucalyptus spp. eucalyptus, bearing in mind the traditional techniques of field survey for survival evaluation from 90 to 110 days after harvest, quantifying the number of regenerations present in the fields observed. The study was conducted in an area with individuals from a planted forest of Eucalyptus spp, located in Capão Bonito - SP. The statistical technique used was the maximum likelihood classifier implemented in the Geographic Information System (GIS). It was concluded that the maximum likelihood classifier presents precision (reliability in the information returned). The process UAV sensor image classification process was efficient to improve field management. / Mestre
58

Compostos na língua de sinais brasileira / Compounds in Brazilian sign language

Aline Garcia Rodero Takahira 13 August 2015 (has links)
Composição é um fenômeno muito produtivo nas línguas de sinais. Estudos pioneiros na ASL (língua de sinais americana) identificaram compostos formados sequencialmente que se caracterizam por regras de redução fonológica e assimilação nos constituintes dos compostos (KLIMA; BELLUGI, 1979; LIDDELL; JOHNSON, 1986). Um estudo sobre compostos na BSL (língua de sinais britânica) mostra a possibilidade de realização simultânea de dois sinais, que são dois classificadores (CLs), em um composto (BRENNAN, 1990). Na libras (língua brasileira de sinais), há estudos que tratam de compostos realizados sequencialmente com dois ou três sinais (QUADROS; KARNOPP, 2004; FELIPE, 2006; FIGUEIREDO SILVA; SELL, 2009). No entanto, nenhum deles trata da possibilidade da ocorrência de CLs em compostos, tampouco da possibilidade da realização de compostos simultâneos. Se as línguas de sinais apresentam dois articuladores primários, as mãos, é natural pensarmos na possibilidade da ocorrência de sinais simultâneos. Sendo assim, o objetivo deste trabalho é descrever os tipos de compostos que ocorrem na libras e investigar a possibilidade de ocorrência de CLs e marcadores não-manuais em compostos, formando compostos simultâneos. Através do conjunto de dados levantado em dicionários, conversas espontâneas e gravações eliciadas por figuras, classificamos os compostos da libras em três grandes grupos, que são os compostos: i) sequenciais; ii) simultâneos e iii) simultâneo-sequenciais. Observamos que todos os compostos simultâneos apresentam um predicado CL sinalizado simultaneamente com mais um sinal CL, ou apresentam um sinal realizado pela boca, o que possibilita a simultaneidade com um sinal manual. O grupo de compostos simultâneos é o menos investigado nas línguas de sinais e será o objeto principal de nossa pesquisa. A descrição detalhada desses dados, bem como a investigação da natureza dos CLs e dos sinais boca, levarão a um maior conhecimento dos processos morfológicos nas línguas de sinais e viabilizarão a indicação de caminhos para uma proposta de análise formal para a composição na libras. A análise desenvolvida nesta tese segue os pressupostos teóricos da Morfologia Distribuída (HALLE; MARANTZ, 1993). / Compound formation is a very productive phenomenon in sign languages. Pioneering studies of ASL (American Sign Language) identified compounds formed sequentially, which are characterized by rules of phonological reduction and assimilation in the members of the compounds (KLIMA; BELLUGI, 1979; LIDDELL; JOHNSON, 1986). An investigation of compound formation in BSL (British Sign Language) shows the possibility of simultaneous realization of two signs, which are two classifiers (CLs), in a compound (BRENNAN, 1990). In libras (Brazilian Sign Language), there are studies that deal with compounds realized sequentially, with two or three signs (QUADROS; KARNOPP, 2004; FELIPE, 2006; FIGUEIREDO SILVA; SELL, 2009). However, none of them deals with the possibility of occurrence of CLs in compounds, nor with the possibility of signing simultaneous compounds. If sign languages have two primary articulators, that is, the hands, it is natural to think of the possibility of occurrence of simultaneous signs. Thus, the aim of this thesis is to describe the types of compounds that occur in libras, and investigate the possibility of occurrence of CLs and non-manual markers in compounds, forming simultaneous compounds. Drawing on data collected in dictionaries, spontaneous conversations and recordings elicited by figures, we classify the compounds in libras into three major groups, which are: i) sequential compounds; ii) simultaneous compounds and iii) simultaneoussequential compounds. We observed that all the simultaneous compounds exhibit a CL predicate simultaneously realized with another CL sign, or exhibit a sign realized by the mouth, which enables the simultaneity with a manual sign. The group of simultaneous compounds is the least investigated one in sign languages and it will be the main topic of our research. Both the detailed description of these data and the investigation of the nature of CLs and signs realized by the mouth will lead to a better understanding of the morphological processes in sign languages, paving the way for a formal analysis of the compound formation in libras. The analysis developed in this work follows the theoretical assumptions of the Distributed Morphology framework (HALLE; MARANTZ, 1993).
59

Evolutionary ensembles for imbalanced learning / Comitês evolucionários para aprendizado desbalanceado

Everlandio Rebouças Queiroz Fernandes 13 August 2018 (has links)
In many real classification problems, the data set used for model induction is significantly imbalanced. This occurs when the number of examples of some classes is much lower than the other classes. Imbalanced datasets can compromise the performance of most classical classification algorithms. The classification models induced by such datasets usually present a strong bias towards the majority classes, tending to classify new instances as belonging to these classes. A commonly adopted strategy for dealing with this problem is to train the classifier on a balanced sample from the original dataset. However, this procedure can discard examples that could be important for a better class discrimination, reducing classifier efficiency. On the other hand, in recent years several studies have shown that in different scenarios the strategy of combining several classifiers into structures known as ensembles has proved to be quite effective. This strategy has led to a stable predictive accuracy and, in particular, to a greater generalization ability than the classifiers that make up the ensemble. This generalization power of classifier ensembles has been the focus of research in the imbalanced learning field in order to reduce the bias toward the majority classes, despite the complexity involved in generating efficient ensembles. Optimization meta-heuristics, such as evolutionary algorithms, have many applications for ensemble learning, although they are little used for this purpose. For example, evolutionary algorithms maintain a set of possible solutions and diversify these solutions, which helps to escape out of the local optimal. In this context, this thesis investigates and develops approaches to deal with imbalanced datasets, using ensemble of classifiers induced by samples taken from the original dataset. More specifically, this theses propose three solutions based on evolutionary ensemble learning and a fourth proposal that uses a pruning mechanism based on dominance ranking, a common concept in multiobjective evolutionary algorithms. Experiments showed the potential of the developed solutions. / Em muitos problemas reais de classificação, o conjunto de dados usado para a indução do modelo é significativamente desbalanceado. Isso ocorre quando a quantidade de exemplos de algumas classes é muito inferior às das outras classes. Conjuntos de dados desbalanceados podem comprometer o desempenho da maioria dos algoritmos clássicos de classificação. Os modelos de classificação induzidos por tais conjuntos de dados geralmente apresentam um forte viés para as classes majoritárias, tendendo classificar novas instâncias como pertencentes a essas classes. Uma estratégia comumente adotada para lidar com esse problema, é treinar o classificador sobre uma amostra balanceada do conjunto de dados original. Entretanto, esse procedimento pode descartar exemplos que poderiam ser importantes para uma melhor discriminação das classes, diminuindo a eficiência do classificador. Por outro lado, nos últimos anos, vários estudos têm mostrado que em diferentes cenários a estratégia de combinar vários classificadores em estruturas conhecidas como comitês tem se mostrado bastante eficaz. Tal estratégia tem levado a uma acurácia preditiva estável e principalmente a apresentar maior habilidade de generalização que os classificadores que compõe o comitê. Esse poder de generalização dos comitês de classificadores tem sido foco de pesquisas no campo de aprendizado desbalanceado, com o objetivo de diminuir o viés em direção as classes majoritárias, apesar da complexidade que envolve gerar comitês de classificadores eficientes. Meta-heurísticas de otimização, como os algoritmos evolutivos, têm muitas aplicações para o aprendizado de comitês, apesar de serem pouco usadas para este fim. Por exemplo, algoritmos evolutivos mantêm um conjunto de soluções possíveis e diversificam essas soluções, o que auxilia na fuga dos ótimos locais. Nesse contexto, esta tese investiga e desenvolve abordagens para lidar com conjuntos de dados desbalanceados, utilizando comitês de classificadores induzidos a partir de amostras do conjunto de dados original por meio de metaheurísticas. Mais especificamente, são propostas três soluções baseadas em aprendizado evolucionário de comitês e uma quarta proposta que utiliza um mecanismo de poda baseado em ranking de dominância, conceito comum em algoritmos evolutivos multiobjetivos. Experimentos realizados mostraram o potencial das soluções desenvolvidas.
60

Análise do desempenho de classificadores para o mapeamento de cobertura do solo em regiões de floresta tropical: estudo de caso do município de Tefé - AM

Schwartzman, Luiz Fernando Guimarães January 2017 (has links)
A Amazônia é a maior floresta tropical do mundo e desempenha papel fundamental na regulação climática do continente sul-americano. A expansão de atividades antrópicas ocorridas na Amazônia nos últimos 70 anos provocou mudanças nos padrões de cobertura do solo na região que levaram ao surgimento de diversas políticas de conservação em nível nacional e internacional. Uma das principais técnicas para o monitoramento e acompanhamento do desenvolvimento dessas políticas são as técnicas fornecidas pelo sensoriamento remoto. Esse trabalho tem por objetivo avaliar o desempenho de três classificadores de imagens digitais (Mínima Distância Euclidiana, Máxima Verrosimilhança e Extration and Classification of Homogeneous Objects) na região central da Amazônia brasileira. Foram utilizadas duas abordagens para realizar as classificações, na primeira os classificadores foram aplicados sobre uma imagem do satélite Landsat - 8 que teve seus números digitais convertidos para valores de refletância e na segunda abordagem os classificadores foram aplicados sobre imagens fração resultantes da aplicação do modelo linear de mistura espectral na imagem do Landsat - 8. Para avaliar os desempenho dos classificadores e das abordagens propostas aplicou-se uma matriz de confusão e foi calculado o índice Kappa para cada um dos resultados obtidos. Os resultados mostraram que o Máxima verossimilhança apresentou o melhor desempenho nas duas abordagem seguido pelo ECHO com resultados próximos. O Mínima Distância teve o pior desempenho nas duas abordagem. Os resultados também indicaram que a redução da dimensionalidade dos dados provocadas pelo modelo linear de mistura espectral foi capaz de melhorar o desempenho apenas do ECHO. / The Amazon is the largest tropical forest in the world and plays a key role in the climate regulation in South America.In the last 70 years, the expansion of anthropogenic activities in this biome has led to changes in land´s cover patterns in that region which have led to the emergence of several conservation policies in national and international levels. One of the main techniques of monitoring the development of these policies is the technique provided by remote sensing. This theses aims to evaluate the performance of three digital image classifiers (Minimum Distance, Maximum Verification and Extraction and Classification of Homogeneous Objects) in the Brazilian’s Amazon central region. Two approaches were used to perform the classifications. To the first one the classifiers were applied on the satellite Landsat – 8’s image that had its digital numbers converted to values of reflectance. To the second approach the classifiers were applied on fraction images resulting from the application of the linear model of spectral mixing in the Landsat-8 image. To evaluate the performance of the proposed classifiers and approaches a confusion matrix the Kappa index was adopted to calculate each of the obtained results. The results showed that the maximum probability has presented the best performance in the two approaches followed by ECHO with close results. The Minimum Distance had the worst performance in both approaches. The results also indicated that the reduction of data dimensionality caused by the linear spectral mixing model was able to improve the performance of only ECHO.

Page generated in 0.0607 seconds