Spelling suggestions: "subject:"análise discriminant linear"" "subject:"aanálise discriminant linear""
1 |
A abordagem de cadastro duplo (Dual Frame): estimação assistida por modelos Lineares com aplicação em pesquisas agropecuáriasFernandes Campos Coêlho, Hémilio January 2007 (has links)
Made available in DSpace on 2014-06-12T18:03:36Z (GMT). No. of bitstreams: 2
arquivo7185_1.pdf: 1443935 bytes, checksum: 80e498e192d4886d4ef912d3c8bb8cb4 (MD5)
license.txt: 1748 bytes, checksum: 8a4605be74aa9ea9d79846c1fba20a33 (MD5)
Previous issue date: 2007 / Conselho Nacional de Desenvolvimento Científico e Tecnológico / Desde que tecnologia da informação tornou-se essencial para muitas atividades da vida moderna e grandes conjuntos de dados surgiram junto com ela, mineração de dados tornou-se uma das mais importantes áreas de pesquisa na ciência estatística. Apesar de existirem muitos campos relacionados a mineração de dados, a tarefa de classificação ainda figura como uma das mais comuns na literatura estatística. Esta dissertação faz uma revisão de dois métodos clássicos de classificação, análise discriminante linear e quadrática, e um método não-paramétrico, a análise discriminante de núcleo. Experimentos de simulação e conjuntos de dados reais são utilizados para avaliar e comparar os três métodos de classificação. Também apresenta algumas contribuições relacionadas aos métodos boosting e bootstrap no contexto de classificação. A primeira contribuição trata-se de uma nova formulação para o método boosting em análise discriminante linear. Os resultados numéricos mostram que esta nova formulação tem desempenho similar à formulação usual. Entretanto, a nova formulação do método boosting é conceitualmente mais adequada. Dois métodos bootstrap para problemas de classificação são introduzidos e avaliados. O primeiro método bootstrap é utilizado para obter uma fronteira de classificação. O conceito de fronteira de classificação pode ser entendido como uma região onde é difícil alocar uma observação para uma das populações existentes. O segundo método bootstrap é um intervalo de confiança para a taxa de erro de classificação. Intervalos de confiança podem ser utilizados para comparar dois ou mais métodos de classificação na estrutura de inferência
|
2 |
Métodos de discriminação entre grupos: aplicação ao problema da concessão de créditoBarth, Nelson Lerner 04 February 2002 (has links)
Made available in DSpace on 2010-04-20T20:15:19Z (GMT). No. of bitstreams: 0
Previous issue date: 2002-02-04T00:00:00Z / Apresenta métodos quantitativos próprios para a discriminação entre grupos, baseados em Análise Discriminante Linear, Regressão Logística, Redes Neurais e Algoritmos Genéticos, dentro do contexto do problema da análise de crédito.
|
3 |
Avaliação da gravidade da malária utilizando técnicas de extração de características e redes neurais artificiaisAlmeida, Larissa Medeiros de 17 April 2015 (has links)
Submitted by Kamila Costa (kamilavasconceloscosta@gmail.com) on 2015-06-15T21:53:52Z
No. of bitstreams: 1
Dissertação-Larissa M de Almeida.pdf: 5516102 bytes, checksum: e49d2bccd21168f811140c6accd54e8f (MD5) / Approved for entry into archive by Divisão de Documentação/BC Biblioteca Central (ddbc@ufam.edu.br) on 2015-06-16T15:05:39Z (GMT) No. of bitstreams: 1
Dissertação-Larissa M de Almeida.pdf: 5516102 bytes, checksum: e49d2bccd21168f811140c6accd54e8f (MD5) / Approved for entry into archive by Divisão de Documentação/BC Biblioteca Central (ddbc@ufam.edu.br) on 2015-06-16T15:07:25Z (GMT) No. of bitstreams: 1
Dissertação-Larissa M de Almeida.pdf: 5516102 bytes, checksum: e49d2bccd21168f811140c6accd54e8f (MD5) / Made available in DSpace on 2015-06-16T15:07:25Z (GMT). No. of bitstreams: 1
Dissertação-Larissa M de Almeida.pdf: 5516102 bytes, checksum: e49d2bccd21168f811140c6accd54e8f (MD5)
Previous issue date: 2015-04-17 / Não Informada / About half the world's population lives in malaria risk areas. Moreover, given the
globalization of travel, these diseases that were once considered exotic and mostly tropical are
increasingly found in hospital emergency rooms around the world. And often when it comes
to experience in tropical diseases, expert opinion most of the time is not available or not
accessible in a timely manner. The task of an accurate and efficient diagnosis of malaria,
essential in medical practice, can become complex. And the complexity of this process
increases as patients have non-specific symptoms with a large amount of data and inaccurate
information involved. In this approach, Uzoka and colleagues (2011a), from clinical
information of 30 Nigerian patients with confirmed malaria, used the Analytic Hierarchy
Process method (AHP) and Fuzzy methodology to conduct the evaluation of the severity of
malaria. The results obtained were compared with the diagnosis of medical experts. This
paper develops a new methodology to evaluate the severity of malaria and compare with the
techniques used by Uzoka and colleagues (2011a). For this purpose the data set used is the
same of that study. The technique used is the Artificial Neural Networks (ANN). Are
evaluated three architectures with different numbers of neurons in the hidden layer, two
training methodologies (leave-one-out and 10-fold cross-validation) and three stopping
criteria, namely: the root mean square error, early stop and regularization. In the first phase,
we use the full database. Subsequently, the feature extraction methods are used: in the second
stage, the Principal Component Analysis (PCA) and in the third stage, the Linear
Discriminant Analysis (LDA). The best result obtained in the three phases, it was with the full
database, using the criterion of regularization associated with the leave-one-out method, of
83.3%. And the best result obtained in (Uzoka, Osuji and Obot, 2011) was with the fuzzy
network which revealed 80% accuracy / Cerca de metade da população mundial vive em áreas de risco da malária. Além disso, dada a
globalização das viagens, essas doenças que antes eram consideradas exóticas e
principalmente tropicais são cada vez mais encontradas em salas de emergência de hospitais
no mundo todo. E frequentemente quando se trata de experiência em doenças tropicais, a
opinião de especialistas na maioria das vezes está indisponível ou não acessível em tempo
hábil. A tarefa de chegar a um diagnóstico da malária preciso e eficaz, fundamental na prática
médica, pode tornar-se complexa. E a complexidade desse processo aumenta à medida que os
pacientes apresentam sintomas não específicos com uma grande quantidade de dados e
informação imprecisa envolvida. Nesse sentido, Uzoka e colaboradores (2011a), a partir de
informações clínicas de 30 pacientes nigerianos com diagnóstico confirmado de malária,
utilizaram a metodologia Analytic Hierarchy Process (AHP) e metodologia Fuzzy para
realizar a avaliação da gravidade da malária. Os resultados obtidos foram comparados com o
diagnóstico de médicos especialistas. Esta dissertação desenvolve uma nova metodologia para
avaliação da gravidade da malária e a compara com as técnicas utilizadas por Uzoka e
colaboradores (2011a). Para tal o conjunto de dados utilizados é o mesmo do referido estudo.
A técnica utilizada é a de Redes Neurais Artificiais (RNA). São avaliadas três arquiteturas
com diferentes números de neurônios na camada escondida, duas metodologias de
treinamento (leave-one-out e 10-fold cross-validation) e três critérios de parada, a saber: o
erro médio quadrático, parada antecipada e regularização. Na primeira fase, é utilizado o
banco de dados completo. Posteriormente, são utilizados os métodos de extração de
características: na segunda fase, a Análise dos Componentes Principais (do inglês, Principal
Component Analysis - PCA) e na terceira fase, a Análise Discriminante Linear (do inglês,
Linear Discriminant Analysis – LDA). O melhor resultado obtido nas três fases, foi com o
banco de dados completo, utilizando o critério de regularização, associado ao leave-one-out,
de 83.3%. Já o melhor resultado obtido em (Uzoka, Osuji e Obot, 2011) foi com a rede fuzzy
onde obteve 80% de acurácia.
|
4 |
Classificação de alfaces e barras de cereais a partir da espectroscopia NIR e análise discriminante linear / Classification of lettuce and cereal bars as from the NIR spectroscopy and Linear Discriminate AnalysisBrito, Anna Luiza Bizerra de 03 February 2014 (has links)
Made available in DSpace on 2015-05-14T13:21:32Z (GMT). No. of bitstreams: 1
arquivototal.pdf: 15006665 bytes, checksum: 541b3c9095c1006563486163e559d5fd (MD5)
Previous issue date: 2014-02-03 / Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - CAPES / The search for a better quality of life has led to increased consumption of
foods with fewer calories, high in fiber and vitamins, and obtained from
different forms of cultivation.
Amid these foods, there are cereal bars and lettuce, foods that are easily
accessible, widely consumed and have high nutritional values. Like any
other food, require efficient methods that can ensure its quality. Thus, the
need for rapid, accurate analytical methods and low cost, which can help
to identify and classify these foods safely arises. Within this perspective,
this paper makes use of Near Infrared Spectroscopy (NIR) combined with
Linear Discriminant Analysis (LDA) to classify samples of cereal bars and
lettuce. A total of 121 samples of cereal bars, three distinct types
(conventional, diet and light) and 104 samples of three different types of
lettuce cultivation (conventional, organic and hydroponic) was used. The
acquisition of the spectra was made on equipment Spectrum 400 (Perkin
Elmer) with accessory NIRA (Near Infrared Reflectance Acessory) in the
range 10000 - 4000 cm-1. Classification models were constructed by
combining the LDA algorithms and variable selection: Stepwise (SW),
Successive Projections Algorithm (SPA) and Genetic Algorithm (GA).
Strategies for pre - processing data were evaluated and the efficiency of
the models was determined from the of correct classification rate (CCR)
for the full set of samples and the test set. For both matrices the model
that generated a better CCR was the GA-LDA valued 95% to matrix of the
cereal bars and 97.1 % for array of lettuces, both based on the total set of
samples (training, validation and testing). Regarding the set of test
models presented results of CCR with performance of 90.3 % and 95.4 %
for matrices of cereal bars and lettuce respectively. / A busca por uma melhor qualidade de vida tem levado ao aumento do
consumo de alimentos com menos calorias, ricos em fibras e vitaminas, e
obtidos de formas de cultivo diferenciadas. Em meio a esses alimentos,
encontram-se as barras de cereais e as alfaces, que são alimentos de fácil
acesso, muito consumidos e que possuem altos valores nutricionais. Como
qualquer outro alimento, necessitam de métodos eficientes que possam
assegurar sua qualidade. Assim, surge a necessidade de métodos
analíticos rápidos, precisos e de baixo custo, que possam ajudar a
identificar e classificar com segurança a esses alimentos. Dentro desta
perspectiva, este trabalho faz uso da Espectroscopia no Infravermelho
Próximo (NIR) aliada a Análise Discriminante Linear (LDA) para classificar
amostras de barras de cereais e alfaces. Um total de 121 amostras de
barras de cereais, de três tipos distintos (convencional, diet e light) e 104
amostras de alface de três diferentes tipos de cultivo (convencional,
orgânico e hidropônico) foi utilizado. A aquisição dos espectros foi feita no
equipamento Spectrum 400 (Perkin Elmer) com acessório NIRA (Near
Infrared Reflectance Acessory) na faixa de 10.000 a 4.000 cm-1. Modelos
de classificação foram construídos através da associação da LDA e
algoritmos de seleção de variáveis: Stepwise (SW), Algoritmo das
Projeções Sucessivas (SPA) e Algoritmo Genético (GA). Estratégias de
pré-processamento de dados foram avaliadas e a eficiência dos modelos
foi determinada em relação à taxa de classificação correta (TCC), para o
conjunto total das amostras e para o conjunto de teste. Para as duas
matrizes o modelo que gerou um melhor TCC foi o GA-LDA com valor de
95% para matriz das barras de cereais e 97,1% para matriz das alfaces,
ambos baseados no conjunto total das amostras (treinamento, validação e
teste). Em relação ao conjunto de teste os modelos apresentaram
resultados de TCC com desempenho de 90,3% e 95,4% para as matrizes
das barras de cereais e alfaces respectivamente.
|
5 |
Classificação de óleos vegetais comestíveis usando imagens digitais e técnicas de reconhecimento de padrões / Classification of edible vegetable oil using digital image data and pattern recognition techniquesMilanez, Karla Danielle Tavares de Melo 26 August 2013 (has links)
Made available in DSpace on 2015-05-14T13:21:42Z (GMT). No. of bitstreams: 1
arquivototal.pdf: 3270377 bytes, checksum: f7faeeb5a1fdf2284d994edc54a6a265 (MD5)
Previous issue date: 2013-08-26 / Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - CAPES / This work presents a simple and non-expensive based on digital image and pattern recognition techniques for the classification of edible vegetable oils with respect to the type (soybean, canola, sunflower and corn) and the conservation state (expired and non-expired period of validity). For this, images of the sample oils were obtained from a webcam, and then, they were decomposed into histograms containing the distribution of color levels allowed for a pixel. Three representations for the color of a pixel were used: red-green-blue (RGB), hue-saturation-intensity (HSI) and grayscale. Linear discriminant analysis (LDA) was employed in order to build classification models on the basis of a reduced subset of variables. For the purpose of variable selection, two techniques were utilized, namely the successive projections algorithm (SPA) and stepwise (SW) formulation. Models based on partial least squares-discriminant analysis and (PLS-DA) applied to full histograms (without variable selection) were also employed for the purpose of comparison. For the study evolving the classification with respect to oil type, LDA/SPA, LDA /SW and PLS-DA models achieved a correct classification rate (CCR) of 95%, 90% and 95%, respectively. For the identification of expired non-expired samples, LDA / SPA models were found to the best method for classifying sunflower, soybean and canola oils, achieving a TCC of 97%, 94% and 93%, respectively, while the model LDA/SW correctly classified 100% of corn oil samples. These results suggest that the proposed method is a promising alternative for inspection of authenticity and the conservation state of edible vegetable oils. As advantages, the method does not use reagents to carry out the analysis and laborious procedures for chemical characterization of the samples are not required / Este trabalho apresenta um método simples e de baixo custo, baseado na utilização de imagens digitais e técnicas de reconhecimento de padrões, para a classificação de óleos vegetais comestíveis com relação ao tipo (soja, canola, girassol e milho) e ao estado de conservação (prazo de validade expirado e não expirado). Para isso, imagens das amostras de óleos vegetais foram obtidas a partir de uma webcam e, em seguida, as mesmas foram decompostas em histogramas contendo as distribuições dos níveis de cores permitidos a um pixel. Três modelos para a cor de um pixel foram utilizados: vermelho-verde-azul (RGB), matiz-saturação-intensidade (HSI) e tons de cinza. A análise discriminante linear (LDA) foi utilizada para o desenvolvimento de modelos de classificação com base em um subconjunto reduzido de variáveis. Para fins de seleção de variáveis, duas técnicas foram utilizadas: o algoritmo das projeções sucessivas (SPA) e o stepwise (SW). Modelos baseados na análise discriminante por mínimos quadrados parciais (PLS-DA) aplicados aos histogramas completos (sem seleção de variáveis) também foram utilizados com o propósito de comparação. No estudo envolvendo a classificação com respeito ao tipo, modelos LDA/SPA, LDA/SW e PLS-DA atingiram uma taxa de classificação correta (TCC) de 95%, 90% e 95%, respectivamente. Na identificação de amostras expiradas e não expiradas, o modelo LDA/SPA foi considerado o melhor método para a classificação das amostras de óleos de girassol, soja e canola, atingindo uma TCC de 97%, 94% e 93%, respectivamente, enquanto que o modelo LDA/SW classificou corretamente 100% das amostras de milho. Estes resultados sugerem que o método proposto é uma alternativa promissora para a inspeção de autenticidade e estado de conservação de óleos vegetais comestíveis. Como vantagem, a metodologia não utiliza reagentes, a análise é rápida e procedimentos laboriosos para a caracterização química das amostras não são necessários
|
6 |
Algoritmo evolutivo multi-objetivo em tabelas para seleção de variáveis em classificação multivariada / Multi-objective evolutionary algorithm on tables for variable selection in multivariate classificationRibeiro, Lucas de Almeida 29 October 2014 (has links)
Submitted by Luanna Matias (lua_matias@yahoo.com.br) on 2015-04-01T14:19:27Z
No. of bitstreams: 2
Dissertação - Lucas de Almeida Ribeiro - 2014.pdf: 6237054 bytes, checksum: 085446421b01a7e7b9174daf3da9b192 (MD5)
license_rdf: 23148 bytes, checksum: 9da0b6dfac957114c6a7714714b86306 (MD5) / Approved for entry into archive by Luanna Matias (lua_matias@yahoo.com.br) on 2015-04-01T15:19:35Z (GMT) No. of bitstreams: 2
Dissertação - Lucas de Almeida Ribeiro - 2014.pdf: 6237054 bytes, checksum: 085446421b01a7e7b9174daf3da9b192 (MD5)
license_rdf: 23148 bytes, checksum: 9da0b6dfac957114c6a7714714b86306 (MD5) / Made available in DSpace on 2015-04-01T15:19:35Z (GMT). No. of bitstreams: 2
Dissertação - Lucas de Almeida Ribeiro - 2014.pdf: 6237054 bytes, checksum: 085446421b01a7e7b9174daf3da9b192 (MD5)
license_rdf: 23148 bytes, checksum: 9da0b6dfac957114c6a7714714b86306 (MD5)
Previous issue date: 2014-10-29 / Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - CAPES / This work proposes the use of multi-objective evolutionary algorithm on tables (AEMT)
for variable selection in classification problems, using linear discriminant analysis. The
proposed algorithm aims to find minimal subsets of the original variables, robust classifiers
that model without significant loss in classification ability. The results of the classifiers
modeled by the solutions found by this algorithm are compared in this work to
those found by mono-objective formulations (such as PLS, APS and own implementations
of a Simple Genetic Algorithm) and multi-objective formulations (such as the simple
genetic algorithm multi -objective - MULTI-GA - and the NSGA II). As a case study,
the algorithm was applied in the selection of spectral variables for classification by linear
discriminant analysis (LDA) of samples of biodiesel / diesel. The results showed that the
evolutionary formulations are solutions with a smaller number of variables (on average)
and a better error rate (average) and compared to the PLS APS. The formulation of the
AEMT proposal with the fitness functions: medium risk classification, number of selected
variables and number of correlated variables in the model, found solutions with a lower
average errors found by the NSGA II and the MULTI-GA, and also a smaller number of
variables compared to the multi-GA. Regarding the sensitivity to noise the solution found
by AEMT was less sensitive than other formulations compared, showing that the AEMT
is more robust classifiers. Finally shows the separation regions of classes, based on the
dispersion of samples, depending on the selected one of the solutions AEMT, it is noted
that it is possible to determine variables of regions split from the selected variables. / Este trabalho propõe o uso do algoritmo evolutivo multi-objetivo em tabelas (AEMT)
para a seleção de variáveis em problemas de classificação, por meio de análise discriminante
linear. O algoritmo proposto busca encontrar subconjuntos mínimos, das variáveis
originais, que modelem classificadores robustos, sem perda significativa na capacidade
de classificação. Os resultados dos classificadores modelados pelas soluções encontradas
por este algoritmo são comparadas, neste trabalho, às encontradas por formulações
mono-objetivo (como o PLS, o APS e implementações próprias de um Algoritmo Genético
Simples) e formulações multi-objetivos (como algoritmo genético multi-objetivo
simples - MULTI-GA - e o NSGA II). Como estudo de caso, o algoritmo foi aplicado na
seleção de variáveis espectrais, para a classificação por análise discriminante linear (LDA
- Linear Discriminant Analysis), de amostras de biodiesel/diesel. Os resultados obtidos
mostraram que as formulações evolutivas encontram soluções com um menor número de
variáveis (em média) e uma melhor taxa de erros (média) se comparadas ao PLS e o APS.
A formulação do AEMT proposta com as funções de aptidão: risco médio de classificação,
número de variáveis selecionadas e quantidade de variáveis correlacionadas presentes no
modelo, encontrou soluções com uma média de erros inferior as encontradas pelo NSGA
II e pelo MULTI-GA, e também uma menor quantidade de variáveis se comparado ao
MULTI-GA. Em relação à sensibilidade a ruídos a solução encontrada pelo AEMT se
mostrou menos sensível que as outras formulações comparadas, mostrando assim que o
AEMT encontra classificadores mais robustos. Por fim, são apresentadas as regiões de
separação das classes, com base na dispersão das amostras, em função das variáveis selecionadas
por uma das soluções do AEMT, nota-se que é possível determinar regiões de
separação a partir das variáveis selecionadas.
|
7 |
Análise hiperespectral de folhas de Brachiaria brizantha cv. Marandú submetidas a doses crescentes de nitrogênio / Hyperspectral analysis of Brachiaria brizantha cv. Marandú leaves under contrasting nitrogen levelsTakushi, Mitsuhiko Reinaldo Hashioka 14 February 2019 (has links)
O sensoriamento remoto é uma estratégia que pode ajudar no monitoramento da qualidade das pastagens. Objetivou-se com esse estudo analisar a resposta espectral das folhas de Brachiaria brizantha cv. Marandú, adubada com doses crescentes de ureia, para diferenciar e predizer teores foliares de nitrogênio (TFN). Os tratamentos foram distribuídos em blocos ao acaso (DBC), composto por quatro blocos e quatro tratamentos, totalizando 16 parcelas. Foram utilizadas doses crescentes de adubação com ureia: 0, 25, 50, 75 kg de N/ha/corte. Ao longo do experimento foram realizadas 7 coletas, sendo coletadas 8 folhas por parcela. Essas folhas foram submetidas à análise hiperespectral e posterior análise química do teor de nitrogênio. Ao analisar a resposta espectral das folhas, observou-se diferenças estatísticas entre os tratamentos na região do visível em todas as coletas, com ênfase na região de 550 nm (verde). Por meio de análise discriminante linear (LDA) realizada para cada coleta, os centróides gerados por todos os tratamentos apresentaram diferenças significativas, com exceção do LD1 nas coletas 6 e 7 que não apresentou distinção entre os tratamentos de 50 e 75 kg de N/ha/corte, e LD2 na coleta 5 que não apresentou distinção entre os tratamentos de 0 e 50 kg de N/ha/corte. As equações de regressão multivariada obtidas pelo método de quadrados mínimos parciais (PLSR), geraram valores razoáveis a bons de R2 (0,53 a 0,83) na predição dos TFN, onde os comprimentos de onda com maior peso nessas regressões estão na região do red edge (715 a 720 nm). Por fim, ao testar a performance de alguns Índices de Vegetação da literatura, as coletas 4, 6 e 7 apresentaram bons coeficientes de determinação (R2) que variaram de 0,65 a 0,73; uma característica em comum nos índices que melhor estimaram os TFN é a presença de comprimentos de ondas que fazem parte da região do red edge. / Remote sensing is a set of techniques that can help to monitor pasture quality. The object of this study is to analyze the spectral response from Brachiaria brizantha cv. Marandú leaves, under contrasting nitrogen levels, to differentiate and predict leaf nitrogen content. The treatments were set in a Randomized Block Design, composed of four blocks and four treatments, totaling 16 plots. Increasing doses of urea fertilization were used: 0, 25, 50, 75 kg N/ha/mowing. During the experiment, 7 data collections were performed, and 8 leaves per plot were extracted for each data collection. These leaves were submitted to hyperspectral data extraction and subsequent chemical analysis to quantify the nitrogen content. When analyzing the spectral pattern of the leaves, statistical differences among samples with different nitrogen levels were noticeable in the visible range of the spectrum in all the collections, with emphasis on the 550 nm region (green). Through linear discriminant analysis (LDA), performed for each collection, the generated centroids by the samples of each nitrogen level presented significant differences, except for LD1 in collections 6 and 7, which did not present a distinction between treatments of 50 and 75 kg of N/ha/mowing, and LD2 in collection 5 that did not distinguish between treatments of 0 and 50 kg of N/ha/mowing. The partial least square regression (PLSR) method generated reasonable to good values of R2 (0.53 to 0.83) for the prediction of leaf nitrogen content, where the wavelengths with the highest coefficient in these models are in the red edge region of the spectrum (715 to 720 nm). Finally, when testing the performance of some Vegetation Indexes from literature, collections 4, 6 and 7 presented good determination coefficients (R2) ranging from 0.65 to 0.73; a common feature in the indexes that best estimate the nitrogen content is the presence of wavelengths from the red edge region of the spectrum.
|
8 |
Classificação de lesões em mamografias por análise de componentes independentes, análise discriminante linear e máquina de vetor de suporte / Classification of injuries in the Mamogram by Components of Independent Review, Analysis Discriminant Linear and Vector Machine, SupportDUARTE, Daniel Duarte 25 February 2008 (has links)
Submitted by Rosivalda Pereira (mrs.pereira@ufma.br) on 2017-08-14T18:15:08Z
No. of bitstreams: 1
DanielCosta.pdf: 1087754 bytes, checksum: ada5f863f42efd8298fff788c37bded3 (MD5) / Made available in DSpace on 2017-08-14T18:15:08Z (GMT). No. of bitstreams: 1
DanielCosta.pdf: 1087754 bytes, checksum: ada5f863f42efd8298fff788c37bded3 (MD5)
Previous issue date: 2008-02-25 / Female breast cancer is the major cause of death in western countries. Efforts in Computer Vision have been made in order to add improve the diagnostic accuracy by radiologists. In this work, we present a methodology that uses independent component analysis (ICA) along with support vector machine (SVM) and linear discriminant analysis (LDA) to distinguish between mass or non-mass and benign or malign tissues from mammograms. As a result, it was found that: LDA reaches 90,11% of accuracy to discriminante between mass or non-mass and 95,38% to discriminate between benign or malignant tissues in DDSM database and in mini-MIAS database we obtained 85% to discriminate between mass or non-mass and 92% of accuracy to discriminate between benign or malignant tissues; SVM reaches 99,55% of accuracy to discriminate between mass or non-mass and the same percentage to discriminate between benign or malignat tissues in DDSM database whereas, and in MIAS database it was obtained 98% to discriminate between mass or non-mass and 100% to discriminate between benign or malignant tissues. / Câncer de mama feminino é o câncer que mais causa morte nos países ocidentais. Esforços em processamento de imagens foram feitos para melhorar a precisão dos diagnósticos por radiologistas. Neste trabalho, nós apresentamos uma metodologia que usa análise de componentes independentes (ICA) junto com análise discriminante linear (LDA) e máquina de vetor de suporte (SVM) para distinguir as imagens entre nódulos ou não-nódulos e os tecidos em benignos ou malignos. Como resultado, obteve-se com LDA 90,11% de acurácia na discriminação entre nódulo ou não-nódulo e 95,38% na discriminação de tecidos benignos ou malignos na base de dados DDSM. Na base de dados mini- MIAS, obteve-se 85% e 92% na discriminação entre nódulos ou não-nódulos e tecidos benignos ou malignos respectivamente. Com SVM, alcançou-se uma taxa de até 99,55% na discriminação de nódulos ou não-nódulos e a mesma porcentagem na discriminação entre tecidos benignos ou malignos na base de dados DDSM enquanto que na base de dados mini-MIAS, obteve-se 98% e até 100% na discriminação de nódulos ou não-nódulos e tecidos benignos ou malignos, respectivamente.
|
9 |
Identificação de faces humanas através de PCA-LDA e redes neurais SOM / Identification of human faces based on PCA - LDA and SOM neural networksSantos, Anderson Rodrigo dos 29 September 2005 (has links)
O uso de dados biométricos da face para verificação automática de identidade é um dos maiores desafios em sistemas de controle de acesso seguro. O processo é extremamente complexo e influenciado por muitos fatores relacionados à forma, posição, iluminação, rotação, translação, disfarce e oclusão de características faciais. Hoje existem muitas técnicas para se reconhecer uma face. Esse trabalho apresenta uma investigação buscando identificar uma face no banco de dados ORL com diferentes grupos de treinamento. É proposto um algoritmo para o reconhecimento de faces baseado na técnica de subespaço LDA (PCA + LDA) utilizando uma rede neural SOM para representar cada classe (face) na etapa de classificação/identificação. Aplicando o método do subespaço LDA busca-se extrair as características mais importantes na identificação das faces previamente conhecidas e presentes no banco de dados, criando um espaço dimensional menor e discriminante com relação ao espaço original. As redes SOM são responsáveis pela memorização das características de cada classe. O algoritmo oferece maior desempenho (taxas de reconhecimento entre 97% e 98%) com relação às adversidades e fontes de erros que prejudicam os métodos de reconhecimento de faces tradicionais. / The use of biometric technique for automatic personal identification is one of the biggest challenges in the security field. The process is complex because it is influenced by many factors related to the form, position, illumination, rotation, translation, disguise and occlusion of face characteristics. Now a days, there are many face recognition techniques. This work presents a methodology for searching a face in the ORL database with some different training sets. The algorithm for face recognition was based on sub-space LDA (PCA + LDA) technique using a SOM neural net to represent each class (face) in the stage of classification/identification. By applying the sub-space LDA method, we extract the most important characteristics in the identification of previously known faces that belong to the database, creating a reduced and more discriminated dimensional space than the original space. The SOM nets are responsible for the memorization of each class characteristic. The algorithm offers great performance (recognition rates between 97% and 98%) considering the adversities and sources of errors inherent to the traditional methods of face recognition.
|
10 |
Identificação de faces humanas através de PCA-LDA e redes neurais SOM / Identification of human faces based on PCA - LDA and SOM neural networksAnderson Rodrigo dos Santos 29 September 2005 (has links)
O uso de dados biométricos da face para verificação automática de identidade é um dos maiores desafios em sistemas de controle de acesso seguro. O processo é extremamente complexo e influenciado por muitos fatores relacionados à forma, posição, iluminação, rotação, translação, disfarce e oclusão de características faciais. Hoje existem muitas técnicas para se reconhecer uma face. Esse trabalho apresenta uma investigação buscando identificar uma face no banco de dados ORL com diferentes grupos de treinamento. É proposto um algoritmo para o reconhecimento de faces baseado na técnica de subespaço LDA (PCA + LDA) utilizando uma rede neural SOM para representar cada classe (face) na etapa de classificação/identificação. Aplicando o método do subespaço LDA busca-se extrair as características mais importantes na identificação das faces previamente conhecidas e presentes no banco de dados, criando um espaço dimensional menor e discriminante com relação ao espaço original. As redes SOM são responsáveis pela memorização das características de cada classe. O algoritmo oferece maior desempenho (taxas de reconhecimento entre 97% e 98%) com relação às adversidades e fontes de erros que prejudicam os métodos de reconhecimento de faces tradicionais. / The use of biometric technique for automatic personal identification is one of the biggest challenges in the security field. The process is complex because it is influenced by many factors related to the form, position, illumination, rotation, translation, disguise and occlusion of face characteristics. Now a days, there are many face recognition techniques. This work presents a methodology for searching a face in the ORL database with some different training sets. The algorithm for face recognition was based on sub-space LDA (PCA + LDA) technique using a SOM neural net to represent each class (face) in the stage of classification/identification. By applying the sub-space LDA method, we extract the most important characteristics in the identification of previously known faces that belong to the database, creating a reduced and more discriminated dimensional space than the original space. The SOM nets are responsible for the memorization of each class characteristic. The algorithm offers great performance (recognition rates between 97% and 98%) considering the adversities and sources of errors inherent to the traditional methods of face recognition.
|
Page generated in 0.0734 seconds