Spelling suggestions: "subject:"classificados"" "subject:"classificador""
91 |
[en] MACHINE LEARNING FOR SENTIMENT CLASSIFICATION / [pt] APRENDIZADO DE MÁQUINA PARA O PROBLEMA DE SENTIMENT CLASSIFICATIONPEDRO OGURI 18 May 2007 (has links)
[pt] Sentiment Analysis é um problema de categorização de texto
no qual deseja-se identificar opiniões favoráveis e
desfavoráveis com relação a um tópico.
Um exemplo destes tópicos de interesse são organizações e
seus produtos. Neste problema, documentos são
classificados pelo sentimento, conotação,
atitudes e opiniões ao invés de se restringir aos fatos
descritos neste. O principal desafio em Sentiment
Classification é identificar como sentimentos são
expressados em textos e se tais sentimentos indicam uma
opinião positiva (favorável) ou negativa (desfavorável)
com relação a um tópico. Devido ao crescente volume de
dados disponível na Web, onde todos tendem
a ser geradores de conteúdo e expressarem opiniões sobre
os mais variados assuntos, técnicas de Aprendizado de
Máquina vem se tornando cada vez mais atraentes.
Nesta dissertação investigamos métodos de Aprendizado de
Máquina para Sentiment Analysis. Apresentamos alguns
modelos de representação de documentos como saco de
palavras e N-grama. Testamos os classificadores
SVM (Máquina de Vetores Suporte) e Naive Bayes com
diferentes modelos de representação textual e comparamos
seus desempenhos. / [en] Sentiment Analysis is a text categorization problem in
which we want to
identify favorable and unfavorable opinions towards a
given topic. Examples
of such topics are organizations and its products. In this
problem, docu-
ments are classifed according to their sentiment,
connotation, attitudes and
opinions instead of being limited to the facts described
in it.
The main challenge in Sentiment Classification is
identifying how sentiments
are expressed in texts and whether they indicate a
positive (favorable) or
negative (unfavorable) opinion towards a topic. Due to the
growing volume
of information available online in an environment where we
all tend to be
content generators and express opinions on a variety of
subjects, Machine
Learning techniques have become more and more attractive.
In this dissertation, we investigate Machine Learning
methods applied to
Sentiment Analysis. We present document representation
models such as
bag-of-words and N-grams.We compare the performance of the
Naive Bayes
and the Support Vector Machine classifiers for each
proposed model
|
92 |
[en] AN EVALUATION OF BIMODAL RECOGNITION SYSTEMS BASED ON VOICE AND FACIAL IMAGES / [pt] UMA AVALIAÇÃO DE MÉTODOS DE FUSÃO PARA SISTEMAS BIMODAIS DE RECONHECIMENTO BASEADOS EM VOZ E IMAGENS FACIAISABEL SEBASTIÁN SANTAMARINA MACIÁ 07 March 2017 (has links)
[pt] Esta dissertação tem como objetivo avaliar os métodos de fusão de escores mais importantes na combinação de dois sistemas uni-modais de reconhecimento em voz e imagens faciais. Para cada sistema uni-modal foram implementadas duas técnicas de classificação: o GMM/UBM e o I-Vetor/GPLDA para voz e o GMM/UBM e um classificador baseado em LBP para imagens faciais. Estes sistemas foram combinados entre eles, sendo 4 combinações testadas. Os métodos de fusão de escores escolhidos se dividem em três grupos: Fusão baseada em densidade, fusão baseada em transformação e fusão baseada em classificadores, e foram testadas algumas variantes para cada grupo. Os métodos foram avaliados em modo de verificação, usando duas bases de dados, uma base virtual formada por duas bases uni-modais e outra base bimodal. O resultado de cada técnica bimodal empregada foi comparado com os resultados das técnicas uni-modais, percebendo-se ganhos significativos na acurácia de reconhecimento. As técnicas de fusão baseadas em densidade mostraram os melhores resultados entre todas as outras técnicas, mais apresentaram uma maior complexidade computacional por causa do processo de estimação da densidade. / [en] The main objective of this dissertation is to compare the most important approaches for score-level fusion of two unimodal systems consisting of facial and independent speaker recognition systems. Two classification methods for each biometric modality were implemented: a GMM/UBM and an I-Vector/GPLDA classifiers for speaker independent recognition and a GMM/UBM and LBP-based classifiers for facial recognition, resulting in four different multimodal combination of fusion explored. The score-level fusion methods investigated are divided in Density-based, Transformation-based and Classifier-based groups and few variants on each group are tested. The fusion methods were tested in verification mode, using two different databases, one virtual database and a bimodal database. The results of each bimodal fusion technique implemented were compared with the unimodal systems, which showed significant recognition performance gains. Density-based techniques of fusion presented the best results among all fusion approaches, at the expense of higher computational complexity due to the density estimation process.
|
93 |
Construções de comitês de classificadores multirrótulos no aprendizado semissupervisionado multidescriçãoSilva, Wilamis Kleiton Nunes da 18 August 2017 (has links)
Submitted by Lara Oliveira (lara@ufersa.edu.br) on 2017-09-19T21:25:54Z
No. of bitstreams: 1
WilamisKNS_DISSERT.pdf: 2959360 bytes, checksum: f4e2b25f85638d49d61b7b5e7415d3fc (MD5) / Approved for entry into archive by Vanessa Christiane (referencia@ufersa.edu.br) on 2017-10-27T13:05:12Z (GMT) No. of bitstreams: 1
WilamisKNS_DISSERT.pdf: 2959360 bytes, checksum: f4e2b25f85638d49d61b7b5e7415d3fc (MD5) / Approved for entry into archive by Vanessa Christiane (referencia@ufersa.edu.br) on 2017-10-27T13:08:52Z (GMT) No. of bitstreams: 1
WilamisKNS_DISSERT.pdf: 2959360 bytes, checksum: f4e2b25f85638d49d61b7b5e7415d3fc (MD5) / Made available in DSpace on 2017-10-27T13:09:10Z (GMT). No. of bitstreams: 1
WilamisKNS_DISSERT.pdf: 2959360 bytes, checksum: f4e2b25f85638d49d61b7b5e7415d3fc (MD5)
Previous issue date: 2017-08-18 / Multi-label problems have become increasingly common, for a label can be attributed to more than one instance, being called multi-label classification problems. Among the di_erent multilabel classification methods we can mention: BR (Binary Relevance), LP (Label Powerset) And RAkEL (RAndom k labELsets). Such methods have been recognized as methods for transforming the Problem, since they consist of turning the multi-label problem into several problems of traditional classification (mono label). However, the adoption of Classificatory committees in multi-label classification problems has still been new-found so far, With a great field to be explored for conducting researches as well. This work aims of doing a study on the construction of multilabel classifiers committees Built through the application of multi- description semisupervised learning techniques, in order to verify if application of this type of learning in the construction of committees results in improvements linked to the results. The committees of classifiers used in the experiments were Bagging, Boosting and Stacking as methods of transformation of the problems used were the BR, LP and Rakel methods and for classification multi-label multi-label semi-supervised multi-description was used Co-Training. At the end of the experimental analyzes, it was verified that the use of the semi-supervised approach presented satisfactory results, since the two approaches presented similar results / São cada vez mais comum problemas multirrótulos onde um rótulo pode ser atribuído a mais de uma instância, sendo chamados de problemas de classificação multirrótulo. Dentre os diferentes métodos de classificação multirrótulo, podemos citar os métodos BR (Binary Relevance), LP (Label Powerset) e RAkEL (RAndom k-labELsets). Tais métodos são ditos métodos de transformação do problema, pois consistem em transformar o problema multirrótulo em vários problemas de classificação tradicional (monorrótulo).A adoção de comitês de classificadores em problemas de classificação multirrótulo ainda é algo muito recente, com muito a ser explorado para a realização de pesquisas. O objetivo deste trabalho é realizar um estudo sobre a construção de comitês de classificadores multirrótulos construídos através da aplicação das técnicas de aprendizado semissupervisionado multidescrição, a fim de verificar se aplicação desse tipo de aprendizado na construção de comitês acarreta melhorias nos resultados. Os comitês de classificadores utilizados nos experimentos foram o Bagging, Boosting e Stacking como métodos de transformação do problemas foram utilizados os métodos BR, LP e Rakel e para a classificação multirrótulo semissupervisionada multidescrição foi utilizado o Co-Training. Ao fim das análises experimentais verificou-se que a utilização da abordagem semissupervisionado apresentou resultados satisfatórios, uma vez que as duas abordagens supervisionada e semissupervisionada utilizadas no trabalho apresentaram resultados semelhantes / 2017-09-19
|
94 |
Detecção de falhas em circuitos eletrônicos lineares baseados em classificadores de classe única. / Fault detection in electronics linear circuits based in one class classifiers.Alvaro Cesar Otoni Lombardi 05 August 2011 (has links)
Esse trabalho está baseado na investigação dos detectores de falhas aplicando classificadores de classe única. As falhas a serem detectadas são relativas ao estado de funcionamento de cada componente do circuito, especificamente de suas tolerâncias (falha paramétrica). Usando a função de transferência de cada um dos circuitos são gerados e analisados os sinais de saída com os componentes dentro e fora da tolerância. Uma função degrau é aplicada à entrada do circuito, o sinal de saída desse circuito passa por uma função diferenciadora e um filtro. O sinal de saída do filtro passa por um processo de redução de atributos e finalmente, o sinal segue simultaneamente para os classificadores multiclasse e classe única. Na análise são empregados ferramentas de reconhecimento de padrões e de classificação de classe única. Os classficadores multiclasse são capazes de classificar o sinal de saída do circuito em uma das classes de falha para o qual foram treinados. Eles apresentam um bom desempenho quando as classes de falha não possuem superposição e quando eles não são apresentados a classes de falhas para os quais não foram treinados. Comitê de classificadores de classe única podem classificar o sinal de saída em uma ou mais classes de falha e também podem classificá-lo em nenhuma classe. Eles apresentam desempenho comparável ao classificador multiclasse, mas também são capazes detectar casos de sobreposição de classes de falhas e indicar situações de falhas para os quais não foram treinados (falhas desconhecidas). Os resultados obtidos nesse trabalho mostraram que os classificadores de classe única, além de ser compatível com o desempenho do classificador multiclasse quando não há sobreposição, também detectou todas as sobreposições existentes sugerindo as possíveis falhas. / This work deals with the application of one class classifiers in fault detection. The faults to be detected are related parametric faults. The transfer function of each circuit was generated and the outputs signals with the components in and out of tolerance were analyzed. Pattern recognition and one class classifications tools are employed to perform the analysis. The multiclass classifiers are able to classify the circuit output signal in one of the trained classes. They present a good performance when the fault classes do not overlap or when they are not presented to fault classes that were not presented in the training. The one class classifier committee may classify the output signal in one or more fault classes and may also classify them in none of the trained class faults. They present comparable performance to multiclass classifiers, but also are able to detect overlapping fault classes and show fault situations that were no present in the training (unknown faults).
|
95 |
Aplicando princípios de aprendizado de máquina na construção de um biocurador automático para o Gene Ontology (GO)Amaral, Laurence Rodrigues do 08 October 2013 (has links)
Made available in DSpace on 2016-06-02T19:03:58Z (GMT). No. of bitstreams: 1
6030.pdf: 2345815 bytes, checksum: 385c6d8c1bda1d4afe540c01668338fa (MD5)
Previous issue date: 2013-10-08 / Nowadays, the amount of biological data available by universities, hospitals and research centers has increased exponentially due the use of bioinformatics, with the development of methods and advanced computational tools, and high-throughput techniques. Due to this significant increase in the amount of available data, new strategies for capture, storage and analysis of data are necessary. In this scenario, a new research area is developing, called biocuration. The biocuration is becoming a fundamental part in the biological and biomedical research, and the main function is related with the structuration and organization of the biological information, making it readable and accessible to mens and computers. Seeking to support a fast and reliable understanding of new domains, different initiatives are being proposed, and the Gene Ontology (GO) is one of the main examples. The GO is one the main initiatives in bioinformatics, whose main goal is to standardize the representation of genes and their products, providing interconnections between species and databases. Thus, the main objective of this research is to propose a computational architecture that uses principles of never-ending learning to help biocurators in new GO classifications. Nowadays, this classification task is totally manual. The proposed architecture uses semi-supervised learning combining different classifiers used in the classification of new GO samples. In addition, this research also aims to build high-level knowledge in the form of simple IF-THEN rules and decision trees. The generated knowledge can be used by the GO biocurators in the search for important patterns present in the biological data, revealing concise and relevant information about the application domain. / Nos dias atuais, a quantidade de dados biológicos disponibilizados por universidades, hospitais e centros de pesquisa tem aumentado de forma exponencial, devido ao emprego da bio-informática, através do desenvolvimento de métodos e técnicas computacionais avançados, e de técnicas de high-throughput. Devido a esse significativo aumento na quantidade de dados disponibilizados, gerou-se a necessidade da criação de novas estratégias para captura, armazenamento e principalmente analise desses dados. Devido a esse cenário, um novo campo de trabalho e pesquisa vem surgindo, chamado biocuragem. A biocuragem está se tornando parte fundamental na pesquisa biomédica e biológica, e tem por principal função estruturar e organizar a informação biológica, tornando-a legível e acessível a homens e computadores. Buscando prover um rápido e confiável entendimento de novos domínios, diferentes iniciativas estão sendo propostas, tendo no Gene Ontology (GO) um dos seus principais exemplos. O GO se destaca mundialmente sendo uma das principais iniciativas em bioinformática, cuja principal meta e padronizar a representação dos genes e seus produtos, provendo interconexões entre espécies e bancos de dados. Dessa forma, objetiva-se com essa pesquisa propor uma arquitetura computacional que utiliza princípios de aprendizado de maquina sem-fim para auxiliar biocuradores do GO na tarefa de classificação de novos termos, tarefa essa, totalmente manual. A arquitetura proposta utiliza aprendizado semi-supervisionado combinando diferentes classificadores na rotulação de novas instâncias do GO. Além disso, essa pesquisa também tem por objetivo a construção de conhecimento de alto-nível na forma de simples regras SE-ENTÃO e árvores de decisão. Esse conhecimento gerado pode ser utilizado pelos biocuradores do GO na busca por padrões importantes presentes nos dados biológicos, revelando informações concisas e relevantes sobre o domínio da aplicação.
|
96 |
Combinação de múltiplos classificadores para reconhecimento de face humanaSalvadeo, Denis Henrique Pinheiro 24 July 2009 (has links)
Made available in DSpace on 2016-06-02T19:05:35Z (GMT). No. of bitstreams: 1
2559.pdf: 3778790 bytes, checksum: 6c638e612ae760d51fad8def01969ed1 (MD5)
Previous issue date: 2009-07-24 / Universidade Federal de Sao Carlos / Lately, the human face object has been exploited by the advent of systems involving biometrics, especially for applications in security. One of the most challenging applications is the problem of human face recognition, which consists of determining the correspondence between an input face and an individual from a database of known persons. The process of face recognition consists of two steps: feature extraction and classification. In the literature of face recognition, different techniques have been used, and they can be divided into holistic techniques (implicit feature extraction), feature-based techniques (explicit feature extraction) and hybrid techniques (involving the two previous). In many articles, holistic techniques have proved to be most efficient and generally they involve methods of statistical pattern recognition as Principal Component Analysis (PCA), Independent Component Analysis (ICA), Linear Discriminant Analysis (LDA), Support Vector Machines (SVM), and Neural Networks. For problems such as human face recognition in digital images, a crucial point is the ability to generalize. The solution for this problem is complex due to the high dimensionality of data and the small number of samples per person. Using a single classifier would reduce the ability of recognition, since it is difficult to design a single classifier in these conditions that capture all variability that span the human faces spaces. Thus, this work proposes to investigate the combination of multiple classifiers applied to the problem of face recognition, defining a new scheme to resolve this problem, varying the feature extraction with PCA and some its variants and LDA, K-Nearest Neighbor (K-NN) and Maximum Likelihood (MaxLike) classifiers and several trainable or not trainable methods for combining classifiers. Still, to mitigate the problem of small sample size (SSS), a technique for regularizing the covariance matrix was used. Finally, to assess the classification performance, Holdout and Resubstitution methods were used to partition the data set and the Kappa coefficient and Z and T statistics were used to measure the performance of the proposed scheme. From the experiments it was concluded that the best sub-schemes were the RBPCA/MaxLike-PCA/NN-KL5/NN classifiers combined by the Majorite Vote Rule for the ORL database and the RLDA+RPCA/MaxLike-KL4/NNKL5/ NN classifiers combined by the Sum Rule for the AR database, obtaining Kappa coefficients of 0.956 (mean) and 0.839, respectively. Besides that, it has been determined that these sub-schemes are robust to pose (ORL database), illumination and small change of the facial expression, but they were affected by occlusions (AR database). / Nas últimas décadas, o objeto face humana tem sido muito explorado graças ao advento dos sistemas envolvendo biometria, especialmente para aplicações nas áreas de segurança. Uma das aplicações mais desafiadoras é o problema de reconhecimento de face humana, que consiste em determinar a qual indivíduo em um banco de dados de pessoas conhecidas uma imagem de face corresponde. O processo de reconhecimento de face consiste basicamente em duas etapas: extração de atributos e classificação. Na literatura de reconhecimento de faces, diversas técnicas foram utilizadas, podendo ser divididas em técnicas holísticas (extração de atributos implícita), técnicas baseadas em características (extração de atributos explícita) e técnicas híbridas (envolvem as duas anteriores). Em maior número na literatura, as técnicas holísticas demonstraram ser mais eficientes e envolvem em geral, métodos de reconhecimento de padrões estatísticos como Principal Component Analysis (PCA), Independent Component Analysis (ICA), Linear Discriminant Analysis (LDA), Support Vector Machines (SVM), além de Redes Neurais. Para problemas como o reconhecimento de face humana em imagens digitais, um ponto determinante é a capacidade de generalização. Por esse problema ser complexo de ser resolvido, devido à alta dimensionalidade dos dados e ao número pequeno de amostras por pessoa, utilizar um único classificador tornaria reduzida a capacidade de reconhecimento, já que é difícil projetar um único classificador nestas condições que capture todas as variações que formam o espaço de faces humanas. Dessa forma, este trabalho se propôs à investigação de combinação de múltiplos classificadores aplicados ao problema do reconhecimento de face, obtendo um novo esquema para solução do mesmo, variando a extração de atributos com PCA e algumas variantes e LDA, classificadores K Vizinhos Mais Próximos e Máxima Verossimilhança e diversos combinadores treináveis ou não. Ainda, para amenizar o problema de poucas amostras, uma técnica de regularização de matrizes de covariância foi utilizada. Finalmente, para avaliação de desempenho utilizou-se Holdout e Resubstitution para particionar o conjunto de dados, assim como o coeficiente Kappa e testes de significância Z e T foram utilizados para medir o desempenho do esquema proposto. Dos experimentos concluiu-se que os melhores subesquemas foram o RBPCA/MaxVer-PCA/NN-KL5/NN → Votação por Maioria para o banco de dados ORL e o RLDA+RPCA/MaxVer-KL4/NN-KL5/NN → Soma para o banco de dados AR com coeficientes Kappa 0,956 (médio) e 0,839, respectivamente. Além disso, foi determinado que estes subesquemas são robustos à pose (ORL), iluminação e à pequenas variações de expressão facial, mas sofreram influência de oclusões (AR).
|
97 |
Uma nova arquitetura para combinação de aglomerados espaciais e aplicação em epidemiologiaHolmes, Danielly Cristina de Souza Costa. 16 December 2015 (has links)
Submitted by Viviane Lima da Cunha (viviane@biblioteca.ufpb.br) on 2017-06-22T17:21:30Z
No. of bitstreams: 1
arquivototal.pdf: 2646336 bytes, checksum: 8fa6ece0a05a4f7bffc899ff5ba5e9b7 (MD5) / Made available in DSpace on 2017-06-22T17:21:30Z (GMT). No. of bitstreams: 1
arquivototal.pdf: 2646336 bytes, checksum: 8fa6ece0a05a4f7bffc899ff5ba5e9b7 (MD5)
Previous issue date: 2015-12-16 / Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - CAPES / The combination of classifiers aims to produce more accurate results to the decision-making
process. Therefore, this study had the objective of proposing a new architecture based on a
combination of spatial clustering methods and a more detailed voting map on the amount of
votes that each geo-object received, applied to epidemiology. The methods of spatial
clustering, in general, aim to identify the significant and not significant spatial clusters
according to the study area. They are combined by combination of rules. In this work, the
following rules were used: majority voting and neural networks. The new proposed
architecture was applied to dengue data in the state of Paraiba, in the period from 2009 to
2011. According to the World Health Organization, dengue is a disease that annually records
an average of 50 to 100 million cases worldwide, generating large financial burden on the
health sector. A new architecture is proposed for the combination of the methods of spatial
clustering. The combination of spatial clustering methods was applied in three case studies. In
all three case studies, the new architecture identified more precisely the priority and nonpriority
municipalities in Paraiba with regards to the dengue. In the case study 1, the
combination rule was majority voting, in case study 2 the combination rule was neural
networks and in case study 3 a new detailed voting map was proposed, identifying the amount
of votes that each municipality had received. Analyzing the results from a spatial point of
view, it was observed that the mesoregion called Sertão in the state of Paraiba had a greater
number of priority municipalities; and the mesoregion of the Coast in Paraiba, the lowest
number of priority municipalities. Regarding the research from the epidemiological point of
view, it was observed that from the results of diagnostic tests (sensitivity, specificity, positive
predictive value and negative predictive value) and the Kappa statistic, the combination of
models produced satisfactory results. Concluding the analysis from the point of view of the
combination of spatial clustering methods, it was observed that the new architecture presented
satisfactory results by using the combination of the combination of rules. These results, from
the epidemiological point of view, can assist managers in the decision-making process by
verifying more precisely the regions that deserve special attention in combating the disease. / A combinação de classificadores tem por objetivo produzir resultados mais precisos para o
processo de tomada de decisão. Com isso, este estudo teve por objetivo propor uma nova
arquitetura baseada na combinação dos métodos de aglomeração espacial e um mapa de
votação mais detalhado sobre a quantidade de votos que cada geo-objeto recebeu, aplicados à
epidemiologia. Os métodos de aglomerados espaciais, de forma geral, tem por objetivo a
identificação dos conglomerados espaciais significativos e não significativos de acordo com a
região de estudo. Eles são combinados por regras de combinação. Neste trabalho foram
utilizadas as seguintes regras: votação por maioria e redes neurais. A nova arquitetura
proposta foi aplicada a dados do dengue no estado da Paraíba, no período de 2009 a 2011.
Segundo a Organização Mundial da Saúde, o dengue é uma doença que registra anualmente
uma média de 50 a 100 milhões de casos em todo o mundo, gerando grandes encargos
financeiros para o setor da saúde. proposta uma nova arquitetura para a combinação dos
métodos de aglomerados espaciais. A combinação dos métodos de aglomeração espacial, foi
aplicados em três estudos de casos. Em todos os três estudos de casos a nova arquitetura
identificou com maior precisão os municípios prioritários e não prioritários do dengue na
Paraíba. No estudo de caso 1 a regra de combinação foi a votação por maioria, no estudo de
caso 2 a regra de combinação foi das redes neurais e no estudo de caso 3 foi proposto uma
novo mapa de votação detalhado identificando a quantidade de votos que cada município
recebeu. Analisando os resultados do ponto de vista espacial, observou-se que a mesorregião
do Sertão Paraibano apresentou uma maior quantidade de municípios prioritários; e a
mesorregião do Litoral Paraibano, o menor número de municípios prioritários. Em relação, a
pesquisa do ponto de vista epidemiológico foi possível verificar que a partir dos resultados
dos testes diagnósticos (sensibilidade, especificidade, valores preditivos positivos e valores
preditivos negativos) e a estatística Kappa os modelos de combinação produziram resultados
satisfatórios. Finalizando a análise do ponto de vista da combinação dos métodos de
aglomerados espaciais, foi possível observar que a nova arquitetura, apresentou resultados
satisfatórios, a partir da combinação das regras de combinação. Estes resultados do ponto de
vista epidemiológico, podem auxiliar os gestores no processo de tomada de decisão
verificando com mais precisão as regiões que realmente merecem atenção especial no
combate à doença.
|
98 |
Comit?s de Classificadores para o Reconhecimento Multibiom?trico em Dados Biom?tricos Revog?veisPintro, Fernando 24 May 2013 (has links)
Made available in DSpace on 2015-03-03T15:48:40Z (GMT). No. of bitstreams: 1
FernandoP_TESE.pdf: 2701691 bytes, checksum: 2a3af30ede2c717ab23b1c7dc03a128a (MD5)
Previous issue date: 2013-05-24 / This work discusses the application of techniques of ensembles in multimodal recognition
systems development in revocable biometrics. Biometric systems are the future
identification techniques and user access control and a proof of this is the constant increases
of such systems in current society. However, there is still much advancement to
be developed, mainly with regard to the accuracy, security and processing time of such
systems. In the search for developing more efficient techniques, the multimodal systems
and the use of revocable biometrics are promising, and can model many of the problems
involved in traditional biometric recognition. A multimodal system is characterized by
combining different techniques of biometric security and overcome many limitations, how:
failures in the extraction or processing the dataset. Among the various possibilities to
develop a multimodal system, the use of ensembles is a subject quite promising, motivated
by performance and flexibility that they are demonstrating over the years, in its many
applications. Givin emphasis in relation to safety, one of the biggest problems found is
that the biometrics is permanently related with the user and the fact of cannot be changed
if compromised. However, this problem has been solved by techniques known as revocable
biometrics, which consists of applying a transformation on the biometric data in order to
protect the unique characteristics, making its cancellation and replacement. In order to
contribute to this important subject, this work compares the performance of individual
classifiers methods, as well as the set of classifiers, in the context of the original data and
the biometric space transformed by different functions. Another factor to be highlighted
is the use of Genetic Algorithms (GA) in different parts of the systems, seeking to further
maximize their eficiency. One of the motivations of this development is to evaluate the
gain that maximized ensembles systems by different GA can bring to the data in the transformed
space. Another relevant factor is to generate revocable systems even more eficient
by combining two or more functions of transformations, demonstrating that is possible to
extract information of a similar standard through applying different transformation functions.
With all this, it is clear the importance of revocable biometrics, ensembles and
GA in the development of more eficient biometric systems, something that is increasingly
important in the present day / O presente trabalho aborda a aplica??o de t?cnicas de comit?s de classificadores no
desenvolvimento de sistemas de reconhecimento multimodais em biometrias revog?veis.
Sistemas biom?tricos s?o o futuro das t?cnicas de identifica??o e controle de acesso de
usu?rios, prova disso, s?o os aumentos constantes de tais sistemas na sociedade atual.
Por?m, ainda existem muitos avan?os a serem desenvolvidos, principalmente no que se
refere ? acur?cia, seguran?a e tempo de processamento de tais sistemas. Na busca por
desenvolver t?cnicas mais eficientes, os sistemas multimodais e a utiliza??o de biometrias
revog?veis mostram-se promissores, podendo contornar muitos dos problemas envolvidos
no reconhecimento biom?trico tradicional. Um sistema multimodal ? caracterizado por
combinar diferentes t?cnicas de seguran?a biom?trica e com isso, superar muitas limita-
??es, como: falhas de extra??o ou processamento dos dados. Dentre as v?rias possibilidades
de se desenvolver um sistema multimodal, a utiliza??o de comit?s de classificadores ? um
assunto bastante promissor, motivado pelo desempenho e flexibilidade que os mesmos v?m
demonstrando ao longo dos anos, em suas in?meras aplica??es. Dando ?nfase em rela-
??o ? seguran?a, um dos maiores problemas encontrados se deve as biometrias estarem
relacionadas permanentemente com o usu?rio e o fato de n?o poderem ser alteradas caso
comprometidas. No entanto, esse problema vem sendo solucionado por t?cnicas conhecidas
como biometrias revog?veis, as quais consistem em aplicar uma transforma??o sobre
os dados biom?tricos de forma a proteger as caracter?sticas originais, possibilitando seu
cancelamento e substitui??o. Com o objetivo de contribuir com esse importante tema,
esse trabalho compara o desempenho de m?todos de classifica??es individuais, bem como
conjunto de classificadores, no contexto dos dados originais e no espa?o biom?trico transformado
por diferentes fun??es. Outro fator a se destacar, ? o uso de Algoritmos Gen?ticos
(AGs) em diferentes partes dos sistemas, buscando maximizar ainda mais a efici?ncia dos
mesmos. Uma das motiva??es desse desenvolvimento ? avaliar o ganho que os sistemas de
comit?s maximizados por diferentes AGs podem trazer aos dados no espa?o transformado.
Tamb?m busca-se gerar sistemas revog?veis ainda mais eficientes, atrav?s da combina??o
de duas ou mais fun??es de transforma??o revog?veis, demonstrando que ? poss?vel extrair
informa??es complementares de um mesmo padr?o atrav?s de tais procedimentos. Com
tudo isso, fica claro a import?ncia das biometrias revog?veis, comit?s de classificadores e
AGs, no desenvolvimento de sistemas biom?tricos mais eficientes, algo que se mostra cada
vez mais importante nos dias atuais
|
99 |
Classifica??o de imagens de ambientes coralinos: uma abordagem empregando uma combina??o de classificadores e m?quina de vetor de suporteHenriques, Ant?nio de P?dua de Miranda 08 August 2008 (has links)
Made available in DSpace on 2014-12-17T14:54:48Z (GMT). No. of bitstreams: 1
AntonioPMH.pdf: 3481703 bytes, checksum: 60ec6cc8df48e68b6c13c12104d289d6 (MD5)
Previous issue date: 2008-08-08 / Coordena??o de Aperfei?oamento de Pessoal de N?vel Superior / The use of the maps obtained from remote sensing orbital images submitted to digital processing became fundamental to optimize conservation and monitoring actions of the coral reefs. However, the accuracy reached in the mapping of submerged areas is limited by variation of the water column that degrades the signal received by the orbital sensor and introduces errors in the final result of the classification. The limited capacity of the traditional methods based on conventional statistical techniques to solve the problems related to the inter-classes took the search of alternative strategies in the area of the Computational Intelligence. In this work an ensemble classifiers was built based on the combination of Support
Vector Machines and Minimum Distance Classifier with the objective of classifying remotely sensed images of coral reefs ecosystem. The system is composed by three stages, through which the progressive refinement of the classification process happens. The patterns that received an ambiguous classification in a certain stage of the process were revalued in the subsequent stage. The prediction non ambiguous for all the data happened through the reduction
or elimination of the false positive. The images were classified into five bottom-types: deep water; under-water corals; inter-tidal corals; algal and sandy bottom. The highest overall accuracy (89%) was obtained from SVM with polynomial kernel. The accuracy of the classified image was compared through the use of error matrix to the results obtained by the application of other classification methods based on a single classifier (neural network and the k-means algorithm). In the final, the comparison of results achieved demonstrated the potential of the ensemble classifiers as a tool of classification of images from submerged areas subject to the noise caused by atmospheric effects and the water column / A utiliza??o de mapas, derivados da classifica??o de imagens de sensores remotos orbitais, tornou-se de fundamental import?ncia para viabilizar a??es de conserva??o e monitoramento de recifes de corais. Entretanto, a acur?cia atingida no mapeamento dessas ?reas ? limitada pelo efeito da varia??o da coluna d ?gua, que degrada o sinal recebido pelo sensor orbital e introduz erros no resultado final do processo de classifica??o. A limitada capacidade dos m?todos tradicionais, baseados em t?cnicas estat?sticas convencionais, para resolver este tipo de problema determinou a investiga??o de uma estrat?gia ligada ? ?rea da Intelig?ncia Computacional. Neste trabalho foi constru?do um conjunto de classificadores baseados em M?quinas de Vetor de Suporte e classificador de Dist?ncia M?nima, com o objetivo de classificar imagens de sensoriamento remoto de ecossistema de recifes de corais. O sistema ? composto por tr?s est?gios, atrav?s dos quais acontece o refinamento progressivo do processo de
classifica??o. Os padr?es que receberam uma classifica??o amb?gua em uma determinada etapa do processo s?o reavaliados na etapa posterior. A predi??o n?o amb?gua para todos os dados aconteceu atrav?s da redu??o ou elimina??o dos falsos positivos. As imagens foram classificadas em cinco tipos de fundos: ?guas profundas, corais submersos, corais intermar?s, algas e fundo arenoso. A melhor acur?cia geral (89%) foi obtida quando foram utilizadas M?quinas de Vetor de Suporte com kernel polinomial. A acur?cia das imagens classificadas foi comparada, atrav?s da utiliza??o de matriz de erro, aos resultados alcan?ados pela aplica??o de outros m?todos de classifica??o baseados em um ?nico classificador (redes neurais e o algoritmo k-means). Ao final, a compara??o dos resultados alcan?ados demonstrou o potencial do conjunto de classificadores como instrumento de classifica??o de imagens de ?reas submersas, sujeitas aos ru?dos provocados pelos efeitos atmosf?ricos e da coluna d ?gua
|
100 |
Meta-heur?sticas de otimiza??o tradicionais e h?bridas utilizadas para constru??o de comit?s de classifica??oFeitosa Neto, Antonino Alves 09 December 2016 (has links)
Submitted by Automa??o e Estat?stica (sst@bczm.ufrn.br) on 2017-04-17T21:35:20Z
No. of bitstreams: 1
AntoninoAlvesFeitosaNeto_TESE.pdf: 1592913 bytes, checksum: abef6d747d95842e55a8f4f5a5d73859 (MD5) / Approved for entry into archive by Arlan Eloi Leite Silva (eloihistoriador@yahoo.com.br) on 2017-04-18T22:17:06Z (GMT) No. of bitstreams: 1
AntoninoAlvesFeitosaNeto_TESE.pdf: 1592913 bytes, checksum: abef6d747d95842e55a8f4f5a5d73859 (MD5) / Made available in DSpace on 2017-04-18T22:17:06Z (GMT). No. of bitstreams: 1
AntoninoAlvesFeitosaNeto_TESE.pdf: 1592913 bytes, checksum: abef6d747d95842e55a8f4f5a5d73859 (MD5)
Previous issue date: 2016-12-09 / Este trabalho aborda a constru??o de comit?s de classifica??o atrav?s t?cnicas metaheur?sticas
de otimiza??o tradicionais de h?bridas. O problema de classifica??o de padr?es ?
tratado como um problema de otimiza??o procurando encontrar o subconjunto de atributos
e classificadores do problema que minimize o erro de classifica??o do comit?. Os comit?s
s?o gerados a partir da combina??o das t?cnicas de k-NN, ?rvore de Decis?o e Naive Bayes
utilizando o voto majorit?rio. Os atributos dos classificadores base s?o modificados pelas
metaheur?sticas de algoritmos gen?ticos, algoritmos mem?ticos, PSO, ACO, M?ltiplos
Rein?cios, GRASP, Simulated Annealing, Busca Tabu, ILS e VNS. Tamb?m s?o aplicados
algoritmos provenientes da arquiteturas de metaheur?sticas h?bridas AMHM e MAGMA.
S?o desenvolvidos algoritmos dessas metaheur?sticas nas vers?es mono e multi-objetivo.
S?o realizados experimentos em diferentes cen?rios mono e multiobjetivo otimizando o erro
de classifica??o e as medidas de boa e m? diversidade. O objetivo ? verificar se adicionar
as medidas de diversidade como objetivos de otimiza??o resulta em comit?s mais acurados.
Assim, a contribui??o desse trabalho ? determinar se as medidas de boa e m? diversidade
podem ser utilizadas em t?cnicas de otimiza??o mono e multiobjetivo como objetivos
de otimiza??o para constru??o de comit?s de classificadores mais acurados que aqueles
constru?dos pelo mesmo processo, por?m utilizando somente a acur?cia de classifica??o
como objetivo de otimiza??o. Verificamos que as metaheur?sticas desenvolvidas apresentam
melhores resultados que as t?cnicas cl?ssicas de gera??o de comit?s, isto ?, Bagging,
Boosting e Sele??o Rand?mica. Verificamos tamb?m que na maioria das metaheur?sticas o
uso das medidas de diversidade como objetivos de otimiza??o n?o auxilia na gera??o de
comit?s mais acurados que quando utilizado somente o erro de classifica??o como objetivo
de otimiza??o obtendo nos melhores cen?rios resultados n?o estatisticamente diferentes. / This work deals with the construction of classification committees using traditional and
hybrid meta-heuristics of optimization techniques. The problem of pattenr classification is
treated as an optimization problem, trying to find the subset of attributes and classifiers
of the problem that minimizes the classification error of the committee. Committees are
generated by combining the techniques of k-NN, Decision Tree and Naive Bayes using the
majority vote. The attributes of the base classifiers are modified by the metaheuristics
of genetic algorithms, memetic algorithms, PSO, ACO, Multi Start, GRASP, Simulated
Annealing, Tabu Search, ILS and VNS. We also apply algorithms from AMHM and
MAGMA hybrid metaheuristics architectures. Algorithms of these metaheuristics are
developed in mono and multi-objective versions. Experiments are performed in different
mono and multiobjective scenarios optimizing classification error and measures of good and
bad diversity. The goal is to verify that adding diversity measures as optimization goals
results in more accurate committees. Thus, the contribution of this work is to determine
if the measures of good and bad diversity can be used in mono and multiobjective
optimization techniques as objectives of optimization for the construction of committees
of classifiers more accurate than those constructed by the same process, but using only the
accuracy classification as an optimization objective. We have verified that the developed
metaheuristics present better results than the classic generation techniques of committees,
ie, Bagging, Boosting and Random Selection. We also verified that in the majority of
metaheuristics the use of diversity measures as optimization objectives does not help to
generate more accurate committees than when only the classification error, obtaining in
the best scenarios non statistically different results.
|
Page generated in 0.1277 seconds