Spelling suggestions: "subject:"conhecimento dde padrões"" "subject:"conhecimento dee padrões""
41 |
Classificação ordinal com opção de rejeiçãoAlmeida, Ezilda Duarte January 2010 (has links)
Tese de mestrado integrado. Engenharia Informática e Computação. Faculdade de Engenharia. Universidade do Porto, INESC Porto. 2010
|
42 |
Investigação experimental de técnicas de reconhecimento de padrões em sistemas automáticosSilva, Tiago Granja da January 2010 (has links)
Tese de mestrado integrado. Engenharia Mecânica (Especialização Automação). Faculdade de Engenharia. Universidade do Porto. 2010
|
43 |
Quality assessment of manufactured ceramic work using digital signal processingSantos, Vasco Daniel Carvalho Ferreira dos January 2004 (has links)
Tese de mestrado. Engenharia Mecânica. Faculdade de Engenharia. Universidade do Porto. 1998
|
44 |
Free Associative Neurons - FAN : uma abordagem para reconhecimento de padrões /Raittz, Roberto Tadeu January 1997 (has links)
Dissertação (Mestrado) - Universidade Federal de Santa Catarina, Centro Tecnológico. / Made available in DSpace on 2012-10-17T02:37:45Z (GMT). No. of bitstreams: 0Bitstream added on 2016-01-08T22:31:56Z : No. of bitstreams: 1
138964.pdf: 1552749 bytes, checksum: 601dd4405424197392c2a231ffe85727 (MD5)
|
45 |
Um método para otimização de descritores multiescala em análise de formas / A method for multiscale descriptors optimization on shape analysisSouza, Marcelo Marques Simões de 29 July 2016 (has links)
SOUZA, Marcelo Marques Simões de. Um método para otimização de descritores multiescala em análise de formas. 2016. 77 f. Tese (Doutorado em Engenharia de Teleinformática)–Centro de Tecnologia, Universidade Federal do Ceará, Fortaleza, 2016. / Submitted by Hohana Sanders (hohanasanders@hotmail.com) on 2017-02-24T17:46:36Z
No. of bitstreams: 1
2016_tese_mmssouza.pdf: 10153522 bytes, checksum: 3cb712db412ebd1c20be3b84dada6f64 (MD5) / Rejected by Marlene Sousa (mmarlene@ufc.br), reason: Trocar arquivo a pedido do autor. on 2017-03-13T16:08:15Z (GMT) / Submitted by Hohana Sanders (hohanasanders@hotmail.com) on 2017-03-13T16:10:50Z
No. of bitstreams: 1
2016_tese_mmssouza.pdf: 10153582 bytes, checksum: c5cebf26482553d316bcaffc238db8bf (MD5) / Approved for entry into archive by Marlene Sousa (mmarlene@ufc.br) on 2017-06-01T19:15:02Z (GMT) No. of bitstreams: 1
2016_tese_mmssouza.pdf: 10153582 bytes, checksum: c5cebf26482553d316bcaffc238db8bf (MD5) / Made available in DSpace on 2017-06-01T19:15:02Z (GMT). No. of bitstreams: 1
2016_tese_mmssouza.pdf: 10153582 bytes, checksum: c5cebf26482553d316bcaffc238db8bf (MD5)
Previous issue date: 2016-07-29 / Shape is an important attribute of the primate visual system that has been widely explored in computer vision applications, such as object classification, recognition and content-based image retrieval. A computer vision system for object recognition performs shape analysis, which encompasses shape description or representation and shape similarity analysis. A relevant aspect in shape analysis is to adjust the descriptor to the pattern recognitio problem of interest, even though there is a lack of consistent methods for doing so. This work introduces an automatic method to setup multiscale shape descriptor through evolutionary optimization. The method was applied to adjust a multiscale shape descriptor to the problem of leaf-based plant specimen identification, where data visualization techniques, clustering quality metrics and shape classification and retrieval experiments were used to assess its performance. The visual exploratory data analysis techniques showed that the proposed methodology improved shape clustering and retrieval. Moreover, supervised and unsupervised classification experiments accomplished high precision and recall rates as well as Bulls-eye scores with the optimized parameters. Thus, taking as objective function clustering quality metrics, shape descriptors optimization leads to improvement in shapes representation in terms of intraclass coesion and inter-class separation, which reflects positively in shape classification experiments performance. / A forma é um importante atributo do sistema visual dos primatas que tem sido amplamente explorado em visão computacional em aplicações de classificação, reconhecimento e recuperação de imagens pelo conteúdo. Um sistema de visão computacional para o reconhecimento de objetos realiza a análise da forma, que consiste na descrição ou representação da mesma e na análise de similaridade entre formas. Um aspecto importante em análise de forma é a adequação do descritor ao problema de reconhecimento de padrões de interesse, porém há uma carência de métodos que sistematizem essa adequação. Este trabalho propõe um método automático para o ajuste dos parâmetros de descritores de formas com otimização evolutiva. A aplicabilidade do referido método é investigada na adequação de um descritor multiescala de forma ao problema de identificação das espécies de plantas a partir das suas folhas, sendo seu desempenho avaliado por técnicas de visualização de dados, medidas de avaliação de agrupamentos e experimentos de classificação e recuperação de formas pelo conteúdo. A análise visual exploratória dos agrupamentos mostrou que a metodologia de otimização melhora os resultados de agrupamento e recuperação de formas. Já os experimentos de classificação com os descritores otimizados alcançaram elevadas taxas de precisão e revocação, assim como da medida bulls-eye. Tendo como função objetivo métricas de qualidade de agrupamentos, a otimização de descritores de forma melhora a representação das formas nos aspectos de coesão intraclasse e separação entre classes, o que reflete positivamente no desempenho em experimentos de classificação e recuperação de formas.
|
46 |
Seleção de primitivas utilizando algoritmo subida de encosta otimizado em problemas de reconhecimento de caracteres / Carlos Magno Nunes ; orientador, Celso Antonio Alves Kaestner, co-orientadores, Alceu de Souza Britto Júnior e Robert SabourinNunes, Carlos Magno January 2004 (has links)
Dissertação (mestrado) - Pontifícia Universidade Católica do Paraná, Curitiba, 2004 / Inclui bibliografia / O desenvolvimento constante de técnicas de reconhecimento de padrões, de técnicas de extração de primitivas, implementações de algoritmos genéticos e a utilização de força bruta oferecida pela utilização de redes neurais permitem a resolução de problemas / The pattern recognition techniques, feature extraction techniques, genetic algorithms implementation and brute force offered by neural nets allows to solve classification tasks more complex. These facilities allow the use of more complex features groups.
|
47 |
Classificação de arritmias cardíacas em eletrocardiograma utilizando floresta de caminhos ótimos / ECG cardiac arrhythmia classification using optimum path forestNunes, Thiago Monteiro 01 August 2014 (has links)
NUNES. T. M. Classificação de arritmias cardíacas em eletrocardiograma utilizando floresta de caminhos ótimos. 2014. 67 f. Dissertação (Mestrado em Engenharia de Teleinformática) - Centro de Tecnologia, Universidade Federal do Ceará, Fortaleza, 2014. / Submitted by Marlene Sousa (mmarlene@ufc.br) on 2015-02-27T18:55:56Z
No. of bitstreams: 1
2014_dis_tmnunes.pdf: 1099645 bytes, checksum: 53b9d96b046d067406e2dc5d70914b4d (MD5) / Approved for entry into archive by Marlene Sousa(mmarlene@ufc.br) on 2015-03-04T16:53:33Z (GMT) No. of bitstreams: 1
2014_dis_tmnunes.pdf: 1099645 bytes, checksum: 53b9d96b046d067406e2dc5d70914b4d (MD5) / Made available in DSpace on 2015-03-04T16:53:33Z (GMT). No. of bitstreams: 1
2014_dis_tmnunes.pdf: 1099645 bytes, checksum: 53b9d96b046d067406e2dc5d70914b4d (MD5)
Previous issue date: 2014-08-01 / Currently in the world, millions of people die, victims of heart diseases, which in large part can be detected by analyzing signals of the electrocardiogram. This analysis involves the study of the signal corresponding to the arrhythmia studied and can be automated through machine learning. This work compares the Optimum Path Forest (OPF) classifier using 6 distance metrics, the Support Vector Machines classifier with radial basis function kernel (RBF-SVM) and the Bayesian classifier, applied to the problem of ECG arrhythmias classification. This is done using 6 feature extraction techniques and a methodology for separating sets, to avoid the interference of patient information in classification. The performance is evaluated in terms of accuracy, generalization, through specificity and sensitivity, and computational cost. Classification was done using 5 and 3 classes of arrhythmias. The OPF showed the best performance in terms of generalization, while the SVM-RBF had the highest accuracy rates. The training times of OPF were the lowest among the classifiers. In the test, the RBF-SVM classifier presented best computational cost. / Anualmente no mundo, milhões de pessoas morrem vítimas de cardiopatias que em grande parte, podem ser detectadas através de sinais em eletrocardiograma. Essa análise envolve o estudo do sinal, correspondendo às arritmias estudadas, processo que pode ser automatizado através do aprendizado de máquinas. Esse trabalho compara os classificadores Floresta de Caminhos Ótimos(OPF), utilizando 6 métricas de distâncias, Máquinas de Vetores de Suporte com núcleo de função de base radial (SVM-RBF) e Classificador Bayesiano aplicados problema da classificação de arritmias em eletrocardiogramas, usando 6 técnicas de extração de atributos e uma metodologia de separação de conjuntos para evitar a interferência das informações de pacientes na classificação. A base de dados utilizada foi a MIT-BIH Arrhythmia Database e foram avaliados desempenho em termos de taxa de acerto, generalização, através de sensibilidade e especificidade, e custo computacional. Foram consideradas classificações em 5 e 3 classes de arritmias. O OPF mostrou o melhor desempenho em termos de generalização, enquanto o SVM-RBF obteve as maiores taxas de acerto. Os tempos de treino do OPF foram os menores entre os classificadores. No teste, o SVM-RBF foi o classificador que apresentou o menor custo computacional.
|
48 |
Um Estudo sobre a extração de características e a classificação de imagens invariantes à rotação extraídas de um sensor industrial 3D / A Study on the extraction of characteristics and the classification of invariant images through the rotation of an 3D industrial sensorSilva, Rodrigo Dalvit Carvalho da 08 May 2014 (has links)
SILVA. R. D. C. Um Estudo sobre a extração de características e a classificação de imagens invariantes à rotação extraídas de um sensor industrial 3D. 2014. 79 f. Dissertação (Mestrado em Engenharia de Teleinformática) - Centro de Tecnologia, Universidade Federal do Ceará, Fortaleza, 2014. / Submitted by Marlene Sousa (mmarlene@ufc.br) on 2015-02-27T18:34:34Z
No. of bitstreams: 1
2014_dis_rdcsilva.pdf: 2254363 bytes, checksum: 020dab0cb946a2cc5aeba421d119924a (MD5) / Approved for entry into archive by Marlene Sousa(mmarlene@ufc.br) on 2015-03-04T17:08:40Z (GMT) No. of bitstreams: 1
2014_dis_rdcsilva.pdf: 2254363 bytes, checksum: 020dab0cb946a2cc5aeba421d119924a (MD5) / Made available in DSpace on 2015-03-04T17:08:40Z (GMT). No. of bitstreams: 1
2014_dis_rdcsilva.pdf: 2254363 bytes, checksum: 020dab0cb946a2cc5aeba421d119924a (MD5)
Previous issue date: 2014-05-08 / In this work, the problem of recognition of objects using images extracted from a 3D industrial sensor is discussed. We focus in 9 feature extractors (where seven are based on invariant moments -Hu, Zernike, Legendre, Fourier-Mellin, Tchebichef, Bessel–Fourier and Gaussian-Hermite-, another is based on the Hough transform and the last one on independent component analysis), and 4 classifiers (Naive Bayes, k-Nearest Neighbor, Support Vector machines and Artificial Neural Network-Multi-Layer Perceptron). To choose the best feature extractor, their performance was compared in terms of classification accuracy rate and extraction time by the k-nearest neighbors classifier using euclidean distance. The feature extractor based on Zernike moments, got the best hit rates, 98.00 %, and relatively low time feature extraction, 0.3910 seconds. The data generated from this, were presented to different heuristic classification. Among the tested classifiers, the k-nearest neighbors classifier achieved the highest average hit rate, 98.00%, and average time of relatively low rank, 0.0040 seconds, thus making it the most suitable classifier for the implementation of this study. / Neste trabalho, é discutido o problema de reconhecimento de objetos utilizando imagens extraídas de um sensor industrial 3D. Nós nos concentramos em 9 extratores de características, dos quais 7 são baseados nos momentos invariantes (Hu, Zernike, Legendre, Fourier-Mellin, Tchebichef, Bessel-Fourier e Gaussian-Hermite), um outro é baseado na Transformada de Hough e o último na análise de componentes independentes, e, 4 classificadores, Naive Bayes, k-Vizinhos mais Próximos, Máquina de Vetor de Suporte e Rede Neural Artificial-Perceptron Multi-Camadas. Para a escolha do melhor extrator de características, foram comparados os seus desempenhos de classificação em termos de taxa de acerto e de tempo de extração, através do classificador k-Vizinhos mais Próximos utilizando distância euclidiana. O extrator de características baseado nos momentos de Zernike obteve as melhores taxas de acerto, 98.00%, e tempo relativamente baixo de extração de características, 0.3910 segundos. Os dados gerados a partir deste, foram apresentados a diferentes heurísticas de classificação. Dentre os classificadores testados, o classificador k-Vizinhos mais Próximos, obteve a melhor taxa média de acerto, 98.00% e, tempo médio de classificação relativamente baixo, 0.0040 segundos, tornando-se o classificador mais adequado para a aplicação deste estudo.
|
49 |
Reconhecimento de padrões através de análises estatísticas e fractais aplicadas a dados de ensaios não-destrutivosSilva, Francisco Estênio da 12 1900 (has links)
SILVA, F. E. da. Reconhecimento de padrões através de análises estatísticas e fractais aplicadas a dados de ensaios não-destrutivos. 2011. 120 f. Tese (Doutorado em Engenharia e Ciência de Materiais) - Centro de Tecnologia, Universidade Federal do Ceará, Fortaleza, 2011. / Submitted by Marlene Sousa (mmarlene@ufc.br) on 2012-05-07T18:19:04Z
No. of bitstreams: 1
2011_tese_fesilva.pdf: 6679504 bytes, checksum: 6d70aae5b438e3ce7eadd57eed3134b7 (MD5) / Approved for entry into archive by Marlene Sousa(mmarlene@ufc.br) on 2012-05-07T18:21:07Z (GMT) No. of bitstreams: 1
2011_tese_fesilva.pdf: 6679504 bytes, checksum: 6d70aae5b438e3ce7eadd57eed3134b7 (MD5) / Made available in DSpace on 2012-05-07T18:21:07Z (GMT). No. of bitstreams: 1
2011_tese_fesilva.pdf: 6679504 bytes, checksum: 6d70aae5b438e3ce7eadd57eed3134b7 (MD5)
Previous issue date: 2011-12 / In this work a procedure is studied for pattern classification related to different types of data,
namely: (1) signals obtained from ultrasonic testing ( pulse-echo technique) and magnetic
signals obtained from Barkhäusen noise in samples of ferritic-pearlitic carbon steel tubes
which, due to temperature effects, have shown microstructural changes as consequence of the
total or partial transformation of the pearlite into spherodite; (2) images built from TOFD
ultrasonic testing and 8 bit digital radiographic images obtained from carbon steel 1020
sheets, with different welding defects. From the data obtained, images have been considered
with the defects as lack of fusion, lack of penetration, porosity and images without defect. For
this aim, non-conventional mathematical techniques have been used for the preprocessing of
the data, namely, the statistical analyses, Hurst analysis (RSA) and detrended fluctuation
analysis (DFA), and fractal analyses, box counting analysis (BCA) and minimal cover
analysis (MCA). The curves obtained with the initial mathematical treatment, discrete
functions of the temporal window width, have been handled with the supervised and nonsupervised
pattern recognition techniques known as principal component analysis and
Karhunen-Loève (KL) transformation analysis respectively. With respect to the magnetic
signals, the KL classifier has been shown to be very efficient when applied to DFA obtained
from the magnetic flux, with a success rate around 94%. On the other hand, for the magnetic
noise signals we have not obtained an acceptable success rate independently of the preprocessing
used. However, when were considered the curves obtained by concatenating all
curves of the pre-processing was obtained a consistent average success rate of 85%. As far as
the rate of success of the PCA classifier is concerned, an excellent success of 96% has been
reached for concatenated curves of selected data of magnetic noise only. As far as the
analyses of the backscattered ultrasonic signals is concerned, it was not possible to classify
the different stages of the microstructural degradation by using KL or PCA independently of
the pre-processing used. As far as the analyses of the D-scan images are concerned, by
applying PCA a rate of success of 81% has been obtained with MCA data, 73% has been
obtained by concatenating all curves from the different fractal and statistical analyses and
around 85% when concatenating the best individual results (DFA and MCA). On the other
hand, considering the KL classifier, high success rates have been verified for the training stage, between 96% and 99%, and a maximum success rate (100%), when concatenating all
analyses. With respect to the testing results, the best success rate which has been reached was
approximately 77%, when concatenating all the curves obtained from the statistical and fractal
pre-processing. For the digitalized radiographic images, relevant individual rates of success
(between 70% and 90%) for the training set (consisting of all data) have been obtained for
the classifier KL only, and a 100% success rate, when concatenating all the curves obtained
from the pre-processing of the images. / Neste trabalho estudou-se uma metodologia de classificação de padrões relacionados a dois
tipos de dados: (1) sinais obtidos através dos ensaios ultrassônicos (técnica pulso-eco) e sinais
magnéticos obtidos através de ruído Barkhausen realizados em amostras de tubos de aço
carbono ferrítico-perlítico que devido aos efeitos da temperatura de trabalho apresentaram
mudanças microestruturais decorrentes da transformação parcial ou total da perlita em
esferoiditas; e (2) imagens construídas a partir de ensaios ultrassônicos (técnica TOFD) e
imagens radiográficas digitais de chapas de aço carbono 1020 soldadas, obtidas com
resolução de 8bits, nas quais foram inseridos diversos tipos de defeitos de soldagem. Dos
dados gerados, foram estudadas as imagens com os defeitos de falta de fusão (FF), falta de
penetração (FP), porosidade (PO) e uma classe designada como sem defeito (SD). Para tanto,
utilizaram-se de técnicas matemáticas não convencionais no pré-processamentos dos dados
conhecidas como análises estatísticas de Hurst (RSA) e flutuação sem tendência (DFA) e as
análises fractais de contagem de caixas (BCA) e de mínima cobertura (MCA). Em seguida as
curvas obtidas desse tratamento matemático inicial, funções discretas da largura da janela
temporal, foram utilizadas na alimentação das técnicas de reconhecimento de padrões não
supervisionada e supervisionada conhecidas, respectivamente, como análise de componentes
principais (PCA) e análise da transformação de Karhunen-Loève (KL). Em relação aos
estudos dos sinais magnéticos, o classificador KL mostrou-se eficiente quando aplicado às
DFA do fluxo magnético, com uma taxa de sucesso em torno de 94%. Já para os sinais do
ruído magnético não se obteve uma taxa de sucesso aceitável, independente do préprocessamento
utilizado. Entretanto quando todas as curvas de todas as análises, dos dois
tipos de sinais magnéticos (ruído e fluxo), foram concatenadas, obteve-se uma taxa média de
sucesso consistente de aproximadamente 85%. No tocante às taxas de sucesso do classificador
PCA, somente para o ruído magnético e considerando todas as curvas concatenadas para um
grupo de dados selecionados, conseguiu-se uma taxa de sucesso de 96%. A respeito das
análises dos sinais ultrassônicos retroespalhados, também não foi possível classificar, nem
com a KL e nem com a PCA, os diferentes estágios de degradação microestrutural,
independemente do pré-processamento utilizado. No tocante às analises das imagens D-scan,
obteve-se com a PCA, taxas de sucesso de 81% considerando apenas os dados das MCA, 73% quando as curvas de todas as análises estatísticas e fractais foram concatenadas, e em torno de
85%, quando apenas as curvas das melhores análises (DFA e MCA) foram concatenadas. Já
considerando o classificador KL, verificaram-se taxas de sucesso na etapa de treinamento,
entre 96% e 99%, e máxima taxa de sucesso (100%) no caso dos vetores de todas as análises
concatenados. Em relação aos resultados dos testes, a melhor taxa de sucesso alcançada foi
aproximadamente de 77% quando se concatenaram todas as curvas oriundas dos préprocessamentos
estatísticos e fractais. Com respeito às imagens radiográficas digitalizadas
somente com o classificador KL (na etapa de treinamento, com 100% dos vetores) obtiveramse
taxas de sucesso individuais entre 70 e 90% de acertos e 100% de sucesso na classificação
quando se concatenaram as curvas de todos os pré-processamentos das imagens.
|
50 |
Classificação da doença de Alzheimer usando algoritmos baseados em distância / Alzheimer's disease classification using distancebased algorithmsRodrigues, Yuri Elias January 2016 (has links)
A doen¸ca de Alzheimer ´e a mais comum das patologias neurodegenerativas afetando principalmente pessoas idosas e causando consider´avel impacto econˆomico em todos os pa´ıses. Atualmente n˜ao h´a cura para cessar seus efeitos na mem´oria fazendo do diagn´ostico precoce fundamental para eventuais interven¸c˜oes terapˆeuticas. Para tal, t´ecnicas de reconhecimento de padr˜oes podem ser utilizadas para diferenciar indiv´ıduos com o mal Alzheimer de indiv´ıduos saud´aveis. No entanto, aumentando o n´umero de diagn´osticos (classes) que definem est´agios intermedi ´arios da doen¸ca a capacidade de diferenciar classes de tais t´ecnicas ´e comprometida. Isto ocorre devido ao fato de que as medidas biol´ogicas, ou os biomarcadores, n˜ao s˜ao discriminantes o suficiente para lidar com classes al´em do caso extremo, de forma bin´aria, Alzheimer versus controle normal. Outro fator que dificulta o diagn´ostico ´e a distribui¸c˜ao de probabilidade das classes intermedi´arias serem altamente sobrepostas e com probabilidade a priori representando 60% dos dados. Neste trabalho vamos demonstrar a capacidade de melhorar a precis ˜ao do diagn´ostico utilizando classificadores e t´ecnicas de amostragem baseados em fun¸c˜oes de distˆancia. Abordagens bin´arias ou abordagens bin´arias adaptadas a problemas multiclasse s˜ao a regra na literatura de diferencia¸c˜ao das classes da doen¸ca de Alzheimer No presente momento existe apenas um ´unico artigo demonstrando a possibilidade de melhora nas medidas de classifica¸c˜ao com um tratamento de reamostragem das probabilidades a priori das classes de Alzheimer. Diferentemente do artigo citado que trabalha com classifica¸c˜ao bin´aria, aqui vamos usar uma abordagem de classifica¸c˜ao todos-contra-todos na avalia¸c˜ao de um problema multiclasse da doen¸ca de Alzheimer. Demonstramos que a taxa de classifica¸c˜ao do nosso classificador utilizando classes balanceadas e uma fun¸c˜ao de distˆancia apropriada ´e superior a classificadores populares. Este trabalho apresenta tamb´em duas novas estrat´egias de ajuste do desequil´ıbrio tendo como medida de similaridade a distˆancia entre os padr˜oes. A de subamostragem, denominada Nearmiss 4, que obteve maior redu¸c˜ao de sobreposi¸c˜ao entre as classes nas compara¸c˜oes entre algoritmos de amostragem, e outra de sobreamostragem, denominada SMOTE-borderline 3, uma vers˜ao multiclasse para a fam´ılia de algoritmos SMOTE que se destaca por ser naturalmente multiclasse ao contr´ario das abordagens bin´arias adaptadas para multiclasse tratadas neste texto. Finalmente, s˜ao comparadas t´ecnicas de sele¸c˜ao de caracter´ısticas para avaliar o poder discriminativo entre biomarcadores do mal de Alzheimer visando encontrar o subconjunto de biomarcadores que fornece a melhor taxa de classifica¸c˜ao. Usando tal abordagem foi poss´ıvel encontrar o biomarcador com maior capacidade discriminativa em um dado conjunto de biomarcadores. / Alzheimer’s disease is the most common neurodegenerative disorder affecting mainly elderly people and causing considerable economic impact in all countries. Currently, there is no cure to cease its effects in memory making early diagnosis fundamental for any therapeutic interventions. To this end, pattern recognition techniques can be used to differentiate individuals with Alzheimer’s from healthy individuals. However, increasing the number of diagnoses (classes) which define disease’s intermediate stages (e.g. mild cognitive impairment) the classes differentiation for such techniques is compromised. This is due to the fact that biological measures, or biomarkers, are not discriminant enough to deal with classes beyond the binary extreme case, Alzheimer’s versus normal control. Another factor that makes diagnosis difficult is the probability distribution of the intermediate classes being highly overlapping and with a priori probability representing 60 % of the data. In this work, we will demonstrate the ability to improve diagnostic accuracy using classifiers and sampling techniques based on distance functions. Binary approaches or binary approaches adapted to multiclass problems are ubiquitous in the literature of differentiating the classes of Alzheimer’s disease At present, there is only one article demonstrating the possibility of improvement in the classification measures using a sampling treatment to change a priori probabilities of the Alzheimer’s classes. Differently from the cited article working with binary classification, here we will use an all-versus-all classification approach to evaluating an Alzheimer’s disease multiclass problem. Also, is shown that classification rate of our classifier using balanced classes and an appropriate distance function is able to overcome popular classifiers choices. This work also presents two new strategies of imbalance adjustment, taking as a measure of similarity the distance between the patterns. The undersampling, called Nearmiss 4, obtained the greatest reduction in class overlapping comparing the sampling algorithms discussed, and another contribution is an oversampling, called SMOTE-borderline 3, a multiclass version for the family of SMOTE algorithms that stands out for being naturally multiclass unlike the binary approaches adapted for multiclass treated in this text. Finally, feature selection techniques are compared to evaluate the discriminative power between Alzheimer’s disease biomarkers in order to find the subset of biomarkers which provides the best classification rate. Using this approach it was possible to find the biomarker with the highest discriminative capacity in a given set of biomarkers.
|
Page generated in 0.1083 seconds