• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 533
  • 48
  • 40
  • 40
  • 40
  • 25
  • 25
  • 25
  • 25
  • 25
  • 15
  • 6
  • Tagged with
  • 587
  • 587
  • 298
  • 282
  • 209
  • 180
  • 129
  • 120
  • 114
  • 100
  • 87
  • 84
  • 80
  • 80
  • 74
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
181

Redes complexas em visão computacional com aplicações em bioinformática / Complex networks in computer vision, with applications in bioinformatics

Casanova, Dalcimar 01 July 2013 (has links)
Redes complexas é uma área de estudo relativamente recente, que tem chamado a atenção da comunidade científica e vem sendo aplicada com êxito em diferentes áreas de atuação tais como redes de computadores, sociologia, medicina, física, matemática entre outras. Entretanto a literatura demonstra que poucos são os trabalhos que empregam redes complexas na extração de características de imagens para posterior analise ou classificação. Dada uma imagem é possível modela-la como uma rede, extrair características topológicas e, utilizando-se dessas medidas, construir o classificador desejado. Esse trabalho objetiva, portanto, investigar mais a fundo esse tipo de aplicação, analisando novas formas de modelar uma imagem como uma rede complexa e investigar diferentes características topológicas na caracterização de imagens. Como forma de analisar o potencial das técnicas desenvolvidas, selecionamos um grande desafio na área de visão computacional: identificação vegetal por meio de análise foliar. A identificação vegetal é uma importante tarefa em vários campos de pesquisa como biodiversidade, ecologia, botânica, farmacologia entre outros. / Complex networks is a relatively recent field of study, that has called the attention of the scientific community and has been successfully applied in different areas such as computer networking, sociology, medicine, physics, mathematics and others. However the literature shows that there are few works that employ complex networks in feature extraction of images for later analysis or classification. Given an image, it can be modeled as a network, extract topological features and, using these measures, build the classifier desired. This work aims, therefore, investigate this type of application, analyzing new forms of modeling an image as a complex network and investigate some topological features to characterize images. In order to analyze the potential of the techniques developed, we selected a major challenge in the field of computer vision: plant identification by leaf analysis. The plant identification is an important task in many research fields such as biodiversity, ecology, botany, pharmacology and others.
182

Detecção automática de lesões não palpáveis da mama utilizando atributos de textura / not available

Pereira Junior, Roberto Rodrigues 21 January 2004 (has links)
Neste trabalho é proposto um sistema de auxílio ao diagnóstico do câncer de mama para detecção de lesões não palpáveis de mama através da utilização de atributos de textura. O trabalho é composto de 3 etapas: segmentação, caracterização e detecção. Na etapa de segmentação foi realizado a segmentação da região mamária de todo o mamograma utilizando técnicas de morfologia matemática. Na etapa de caracterização foram extraídos 19 medidas de textura, 13 atributos de Haralick e 6 baseados na Transformada Wavelet, calculadas a partir de regiões de interesse contendo lesões mamárias e regiões normais. Foram selecionados os melhores atributos utilizando a distância Jeffries Matusita e classificados utilizando um classificador K-NN. Na etapa de detecção foi aplicado o algoritmo desenvolvido a uma base de imagens de lesões não palpáveis de mama. Por fim, os resultados obtidos são apresentados e discutidos a partir de tabelas e curvas ROC e FROC. Os resultados obtidos na detecção das lesões não palpáveis foram de 80% de sensibilidade e 1.47 FP/imagem utilizando os atributos de Haralick e 70% de sensibilidade e 1.96 FP/imagem utilizando os atributos baseados na Transformada Wavelet. / In the present work, a computer aided diagnosis system based on texture features has been proposed to aid in the diagnosis of non palpable breast lesions. The work is composed of 3 main stages: segmentation, characterization and detection. In the segmentation stage, the breast region is segmented from the whole mamogram using mathematical morphology techniques. In the characterization stage were extracted 19 textures measures, 13 from Haralick\'s features and 6 based from Wavelet Transform. These features were calculated from regions of interest containing breast lesions and normal breast regions. Were selected the best features using Jeffries Matusita distance. The images were classiffied using K-NN classifier. In the detection stage the algorithm developed was applied to a image database containing non palpable breast lesions. At the end, the results were presented and discussion was made upon tables and ROC-FROC curves. The results obtained were sensitivity = 80% with 1.47 FP/image with Haralick\'s features and sensitivity = 70% and 1.96 FP/image with features based on Wavelet Transform.
183

Reconhecimento e predição de promotores procarióticos: investigação de uma metodologia in silico baseada em HMMs

Reis, Adriana Neves dos 03 March 2005 (has links)
Made available in DSpace on 2015-03-05T13:53:45Z (GMT). No. of bitstreams: 0 Previous issue date: 3 / Universidade do Vale do Rio dos Sinos / A expressão dos genes em procariotos é desencadeada quando a enzima RNApolimerase interage com uma região adjacente ao gene, chamada de promotor, onde se encontram os principais elementos regulatórios do processo de transcrição. Apesar do crescente avanço das técnicas experimentais em biologia molecular, caracterizar e identificar um número significante de promotores, presentes em um dado genoma, continua sendo uma tarefa demorada e cara. Abordagens in silico são bastante utilizadas para reconhecer essas regiões em procariotos. Entretanto, além do alto número de falsos positivos obtidos, elas enfrentam a inexistência de um número adequado de promotores conhecidos para identificar padrões conservados entre as espécies. Logo, um método criterioso e confiável para predizêlos em qualquer organismo procariótico ainda é um desafio. Esta dissertação propõe um protocolo de uso de hidden Markov models (HMMs) que emprega Estimação de Limiar de Decisão (ELD) e Análise de Discriminação (AD) neste problema. Quatro espécie / Gene expression on prokaryotes initiates when the RNA-polymerase enzyme interacts with DNA regions called promoters. In these regions are located the main regulatory elements of the transcription process. Despite the improvement of in vitro techniques for molecular biology analysis, characterizing and identifying a great number of promoters on a genome is a complex task. In silico approaches are usually employed to recognize theses regions on prokaryotes. Nevertheless, the main drawback is the absence of a large set of promoters to identify conserved patterns among the species. Hence, a in silico method to predict them on any species is a challenge. This work proposes a protocol to use hidden Markov models (HMMs) methodology with Decision Threshold Estimation and Discrimination Analysis on this problem. Four prokaryotic species are investigated (Escherichia coli, Bacillus subtilis, Helicobacter pylori e Helicobacter hepaticus). The influence of different aspects in the recognition and prediction are examined:
184

Aplicação de técnicas de reconhecimento de padrões em dados quantitativos de neuroimagens por ressonância magnética em pacientes de esclerose múltipla / Application of pattern recognition techniques for quantitative data from neuroimaging MRI in multiple sclerosis patients

Pessini, Rodrigo Antonio 17 June 2016 (has links)
Na última década diferentes modalidades e técnicas quantitativas de neuroimagens aplicadas ao estudo de doenças neuro-degenerativas vêm fornecendo um volume cada vez maior de dados, tornando sua utilização uma tarefa complexa. Paralelamente, técnicas computacionais de reconhecimento de padrões vêm sendo desenvolvidas para apoiar a tomada de decisão humana. O propósito geral do presente estudo é aplicar técnicas de reconhecimento de padrões em dados quantitativos de neuroimagens adquiridas por ressonância magnética (RM) em pacientes com Esclerose Múltipla (EM). Especificamente foram avaliados dados retrospectivos de um grupo de 203 sujeitos controle sem doenças neurológicas e um grupo de 144 pacientes portadores de Esclerose Múltipla. Os dados usados foram provenientes da combinação de ferramentas computacionais de processamento de imagens e neuroimagens adquiridas em um aparelho de RM de 3 Tesla usando diferentes técnicas quantitativas: Difusão, Relaxometria, Taxa de Transferência de Magnetização (MTR) e Volumetria. Os dados das diferentes técnicas quantitativas em 126 regiões cerebrais não excludentes foram processados no programa de mineração de dados WEKA. Os algoritmos: k-nearest-neighbor (KNN) com diferentes números de vizinhos e Support vector machine (SVM) foram utilizados para a classificação e agrupamento desses dados. As regiões com maior contribuição na separação de ambos os grupos foram encontradas na substância branca (SB) nas seguintes estruturas: corpo caloso, precúneo, cerebelo e fusiforme esquerdos. Outro atributo significante foi o de hipo-intensidades que pode ser associado à presença de lesões, também na substância branca. Dentre as técnicas, a mais relevante foi a MTR com 92,9% de valor médio de área sob a curva ROC (Receiver Operating Characteristic), considerando os diferentes algoritmos de classificação e métodos de seleção de atributos, porém uma análise global incluindo os dados de todas as técnicas elevou esta área para 96,2%. O algoritmo KNN com 5 vizinhos foi considerado o melhor classificador geral para o conjunto de dados e tarefas aqui explorados resultando em 91,7% de valor médio de área sob a curva ROC, seguido por KNN3 com 90,8%, KNN1 com 87,1% e SVM com 85,8%. Uma classificação restrita, com áreas reconhecidamente afetadas pela EM e com KNN5 trouxe resultados de classificação 2,1% de valor médio de área sob a curva ROC inferiores à classificação principal sem restrições. O uso de técnicas de reconhecimento de padrões a partir dos dados de técnicas quantitativas de neuroimagem aplicadas à amostra estudada, demonstrou que a substância branca do cérebro é a mais afetada pela EM seguindo um padrão global com maior envolvimento no hemisfério esquerdo. A estratégia sugerida neste problema de classificação seria o uso dos dados de todas as técnicas quantitativas aqui discutidas provenientes das regiões envolvidas na classificação restrita conjuntamente com o precuneus e o fusiform, aplicando o KNN5 com seleção de melhores atributos. / In the last decade different modalities and quantitative neuroimaging techniques applied to the study of neurodegenerative diseases have been providing an increasing volume of data, making use of such a complex task. At the same time, computational techniques of pattern recognition have been developed to favor the human performance. The purpose of this study is to apply techniques of pattern recognition in quantitative data of neuroimaging acquired by magnetic resonance (MR) in patients of multiple sclerosis (MS). There were evaluated retrospective data from a control group of 203 people without neurological diseases and a group of 144 patients with MS. The data used were from the combination of computational tools of image processing and neuroimaging acquired in an MR apparatus of 3 Tesla using different quantitative techniques: diffusion, relaxometry, magnetization transfer rate (MTR) and volumetry. The data of the different quantitative techniques in 126 regions of the brain not mutually excludent were processed in the software WEKA of data mining. The algorithms: k-nearest-neighbor (KNN) with different numbers of neighbors and support vector machine (SVM) were used for the classification and grouping of the data. The regions with the highest contribution to the separation of both groups were found in the white matter of the following structures: corpus callosum, precuneus, cerebellum and left spindle. Another significant attribute was the hypo-intensities that can be associated to the presence of lesions in the white matter also. The most relevant technique was the MTR with 92.9% of average area under ROC, considering the different algorithms of classification and methods of feature selection, however a global analysis including data from all techniques increased this area under ROC to 96.2%. The KNN algorithm for k = 5 is considered the best overall classifier for the dataset resulting in 91.7% average area under ROC, followed by KNN for k = 3 with 90.8%, KNN for k = 1 with 87.1%, and SVM with 85.8%. A restricted classification with known affected areas by MS and KNN for k = 5 brought results of classification of average area under ROC of 2.1% inferior to the main classification without restrictions. The use of techniques of pattern recognition from the data of quantitative techniques of neuroimaging showed that the white matter of the brain is the most affected by MS following a global pattern with higher involvement in the left hemisphere. The strategy suggested in this classification issue would be the use of data from all quantitative techniques discussed from the regions involved in restricted classification jointly with precuneus and fusiform, applying KNN for k = 5 with selection of best features.
185

Descritores fractais aplicados à análise de texturas / Fractal descriptors applied to texture analysis

Florindo, João Batista 26 February 2013 (has links)
Este projeto descreve o desenvolvimento, estudo e aplicação de descritores fractais em análise de texturas. Nos últimos anos, a literatura vem apresentando a geometria fractal como uma ferramenta poderosa para a análise de imagens, com aplicações em variados campos da ciência. A maior parte destes trabalhos faz uso direto da dimensão fractal como um descritor do objeto representado na imagem. Entretanto, em função da complexidade de muitos problemas nesta área, algumas soluções foram propostas para melhorar essa análise, usando não apenas o valor da dimensão fractal, mas um conjunto de medidas que pudessem ser extraídas pela geometria fractal e que descrevessem as texturas com maior riqueza e precisão. Entre essas técnicas, destacam-se a metodologia de multifractais, de dimensão fractal multiescala e, mais recentemente, os descritores fractais. Esta última técnica tem se mostrado eficiente na solução de problemas relacionados à discriminação de imagens de texturas e formas, uma vez que os descritores gerados fornecem uma representação direta do padrão de complexidade (distribuição dos detalhes ao longo das escalas de observação) da imagem. Assim, essa solução permite que se tenha uma descrição rica da imagem estudada pela análise da distribuição espacial e/ou espectral dos pixels e intensidade de cores/tons de cinza, com uma modelagem que pode se aproximar da percepção visual humana para a geração de um método automático e preciso. Ocorre, entretanto, que os trabalhos apresentados até o momento sobre descritores fractais focam em métodos de estimativa de dimensão fractal mais conhecidos como Bouligand-Minkowski e Box-counting. Este projeto visa estudar mais a fundo o conceito, generalizando para outras abordagens de dimensão fractal, bem como explorando diferentes formas de se extraírem os descritores a partir da curva logarítmica associada à dimensão. Os métodos desenvolvidos são aplicados à análise de texturas, em problemas de classificação de bases públicas, cujos resultados podem ser comparados com métodos da literatura, bem como a segmentação de imagens de satélite e à identificação automática de amostras obtidas em estudos de nanotecnologia. Os resultados alcançados demonstram o potencial da metodologia desenvolvida para a solução destes problemas, mostrando tratar-se de uma nova fronteira a ser usada e explorada em análise de imagens e visão computacional como um todo. / This project describes the development, study and application of fractal descriptors to texture analysis. Recently, the literature has shown fractal geometry as a powerful tool for image analysis, with applications to several areas of science. Most of these works use fractal dimension as a descriptor of the object depicted in the image. However, due to the complexity of many problems in this context, some solutions have been proposed to improve this analysis. These proposed methods use not only the value of fractal dimension, but a set of measures which could be extracted by fractal geometry to describe the textures with greater richness and accuracy. Among such techniques, we emphasize the multifractal methodology, multiscale fractal dimension and, more recently, fractal descriptors. This latter technique has demonstrated to be efficient in solving problems related to the discrimination of texture and shape images. This is possible as the extracted descriptors provide a direct representation of the complexity (the details distribution along the scales of observation) in the image. Thus, this solution allows for a rich description of the image studied by analyzing the spatial/spectral distribution of pixels and intensity of colors/gray-levels, with a model which can approximate the human visual perception, generating an automatic and precise method. However, the works about fractal descriptors presented in the literature focus on classical methods to estimate fractal dimension, such as Bouligand-Minkowski and Box-counting. This project aims at studying more deeply the concept, generalizing to other approaches in fractal dimension, as well as exploring different ways of extracting the key features from the logarithmic curve associated with the dimension. The developed methods are applied to texture analysis, in classification problems over public databases, whose results can be compared with literature methods, as well as to the segmentation of satellite images and automatically identifying samples obtained from studies on nanotechnology. The results demonstrate the potential of the methodology developed to solve such problems, showing that this is a new frontier to be explored and used in image analysis and computer vision at all.
186

Adaptação dos Modelos de Markov para um Sistema de Segmentação e Classificação de Sinais de Eletrocardiograma

Müller, Sandra Mara Torres 03 April 2006 (has links)
Made available in DSpace on 2016-12-23T14:07:25Z (GMT). No. of bitstreams: 1 Sandra Mara Torres Muller.pdf: 1594751 bytes, checksum: b3abd1c42aa0001991d29eefe9754019 (MD5) Previous issue date: 2006-04-03 / Conselho Nacional de Desenvolvimento Científico e Tecnológico / In this work three incremental adaptation methods for the hidden Markov models (HMM) are studied and implemented, which are based on the Expectation-Maximization (EM), Segmental k-Means and Maximum a Posteriori (MAP) algorithms. These methods, already used in the speech recognition field, are applied here in the electrocardiogram (ECG) segmentation problem. For that, it was used an ECG analysis system able to segment and classify cardiac diseases, like premature ventricular contraction (PVC) and ischemia. The use of these methods allow us to adjust the models to the signal fluctuations commonly met during ambulatory recording. The methods can also be implemented for other kinds of biomedical signals, like electroencephalogram (EEG). / Neste trabalho foram estudadas e implementadas tr^es t¶ecnicas incrementais de adapta»c~ ao de modelos ocultos de Markov (HMM - Hidden Markov Model) baseadas nos algoritmos de treinamento, que s~ ao a esperan»ca da maximiza»c~ ao (expectation maximization - EM), a k-means segmental (segmental k-means) e a m¶aximo a posteriori (Maximum a Posteri- ori -MAP). Essas t¶ecnicas, muito utilizadas em reconhecimento de voz, s~ ao aqui usadas para sinais biom¶edicos, mais precisamente para sinal de eletrocardiograma (ECG). Para tal objetivo, utilizou-se uma plataforma, j¶ a desenvolvida, de segmenta» c~ ao e classi¯ca» c~ ao de ECG, al¶em de detec»c~ oes de anomalias card¶³acas como extra-s¶³stole ventricular (ESV) e isquemia do mioc¶ ardio. Nessa plataforma, os modelos de Markov são empregados na etapa de segmenta»c~ ao do sinal de ECG, tendo em vista a identi¯ca» c~ ao das formas de onda elementares que comp~oem um ciclo card¶³aco. O desenvolvimento dessas t¶ecnicas permite, uma vez que a plataforma esteja funcionando como sistema real, um ajuste aut^ onomo dos modelos µas varia» c~ oes do sinal de ECG ao longo do tempo, assim como a outras varia» c~ oes presentes em um sistema real. As t¶ecnicas foram avaliadas a partir de experimentos usando duas bases de sinais de ECG: QT database e European ST-T database. Os resultados con¯rmam o ganho de desempenho obtido com a adapta»c~ ao, permitindo uma modelagem do sinal ao longo do tempo mais apropriada. As t¶ecnicas desenvolvidas s~ ao indicadas tamb¶em para outros tipos de sinais biom¶edicos, como o sinal de eletroencefalograma (EEG), por exemplo.
187

Aplicação de técnicas de reconhecimento de padrões em dados quantitativos de neuroimagens por ressonância magnética em pacientes de esclerose múltipla / Application of pattern recognition techniques for quantitative data from neuroimaging MRI in multiple sclerosis patients

Rodrigo Antonio Pessini 17 June 2016 (has links)
Na última década diferentes modalidades e técnicas quantitativas de neuroimagens aplicadas ao estudo de doenças neuro-degenerativas vêm fornecendo um volume cada vez maior de dados, tornando sua utilização uma tarefa complexa. Paralelamente, técnicas computacionais de reconhecimento de padrões vêm sendo desenvolvidas para apoiar a tomada de decisão humana. O propósito geral do presente estudo é aplicar técnicas de reconhecimento de padrões em dados quantitativos de neuroimagens adquiridas por ressonância magnética (RM) em pacientes com Esclerose Múltipla (EM). Especificamente foram avaliados dados retrospectivos de um grupo de 203 sujeitos controle sem doenças neurológicas e um grupo de 144 pacientes portadores de Esclerose Múltipla. Os dados usados foram provenientes da combinação de ferramentas computacionais de processamento de imagens e neuroimagens adquiridas em um aparelho de RM de 3 Tesla usando diferentes técnicas quantitativas: Difusão, Relaxometria, Taxa de Transferência de Magnetização (MTR) e Volumetria. Os dados das diferentes técnicas quantitativas em 126 regiões cerebrais não excludentes foram processados no programa de mineração de dados WEKA. Os algoritmos: k-nearest-neighbor (KNN) com diferentes números de vizinhos e Support vector machine (SVM) foram utilizados para a classificação e agrupamento desses dados. As regiões com maior contribuição na separação de ambos os grupos foram encontradas na substância branca (SB) nas seguintes estruturas: corpo caloso, precúneo, cerebelo e fusiforme esquerdos. Outro atributo significante foi o de hipo-intensidades que pode ser associado à presença de lesões, também na substância branca. Dentre as técnicas, a mais relevante foi a MTR com 92,9% de valor médio de área sob a curva ROC (Receiver Operating Characteristic), considerando os diferentes algoritmos de classificação e métodos de seleção de atributos, porém uma análise global incluindo os dados de todas as técnicas elevou esta área para 96,2%. O algoritmo KNN com 5 vizinhos foi considerado o melhor classificador geral para o conjunto de dados e tarefas aqui explorados resultando em 91,7% de valor médio de área sob a curva ROC, seguido por KNN3 com 90,8%, KNN1 com 87,1% e SVM com 85,8%. Uma classificação restrita, com áreas reconhecidamente afetadas pela EM e com KNN5 trouxe resultados de classificação 2,1% de valor médio de área sob a curva ROC inferiores à classificação principal sem restrições. O uso de técnicas de reconhecimento de padrões a partir dos dados de técnicas quantitativas de neuroimagem aplicadas à amostra estudada, demonstrou que a substância branca do cérebro é a mais afetada pela EM seguindo um padrão global com maior envolvimento no hemisfério esquerdo. A estratégia sugerida neste problema de classificação seria o uso dos dados de todas as técnicas quantitativas aqui discutidas provenientes das regiões envolvidas na classificação restrita conjuntamente com o precuneus e o fusiform, aplicando o KNN5 com seleção de melhores atributos. / In the last decade different modalities and quantitative neuroimaging techniques applied to the study of neurodegenerative diseases have been providing an increasing volume of data, making use of such a complex task. At the same time, computational techniques of pattern recognition have been developed to favor the human performance. The purpose of this study is to apply techniques of pattern recognition in quantitative data of neuroimaging acquired by magnetic resonance (MR) in patients of multiple sclerosis (MS). There were evaluated retrospective data from a control group of 203 people without neurological diseases and a group of 144 patients with MS. The data used were from the combination of computational tools of image processing and neuroimaging acquired in an MR apparatus of 3 Tesla using different quantitative techniques: diffusion, relaxometry, magnetization transfer rate (MTR) and volumetry. The data of the different quantitative techniques in 126 regions of the brain not mutually excludent were processed in the software WEKA of data mining. The algorithms: k-nearest-neighbor (KNN) with different numbers of neighbors and support vector machine (SVM) were used for the classification and grouping of the data. The regions with the highest contribution to the separation of both groups were found in the white matter of the following structures: corpus callosum, precuneus, cerebellum and left spindle. Another significant attribute was the hypo-intensities that can be associated to the presence of lesions in the white matter also. The most relevant technique was the MTR with 92.9% of average area under ROC, considering the different algorithms of classification and methods of feature selection, however a global analysis including data from all techniques increased this area under ROC to 96.2%. The KNN algorithm for k = 5 is considered the best overall classifier for the dataset resulting in 91.7% average area under ROC, followed by KNN for k = 3 with 90.8%, KNN for k = 1 with 87.1%, and SVM with 85.8%. A restricted classification with known affected areas by MS and KNN for k = 5 brought results of classification of average area under ROC of 2.1% inferior to the main classification without restrictions. The use of techniques of pattern recognition from the data of quantitative techniques of neuroimaging showed that the white matter of the brain is the most affected by MS following a global pattern with higher involvement in the left hemisphere. The strategy suggested in this classification issue would be the use of data from all quantitative techniques discussed from the regions involved in restricted classification jointly with precuneus and fusiform, applying KNN for k = 5 with selection of best features.
188

Método para segmentação de pele humana em imagens faciais baseado em informações de cor e textura / A method for human skin segmentation in facial images based on color and texture features

João Paulo Brognoni Casati 10 December 2013 (has links)
A segmentação de pele em imagens é um importante processo para uma vasta gama de aplicações, como detecção e rastreamento de faces, reconhecimento de gestos, computação forense, entre outros. Um dos maiores problemas encontrados neste tipo de aplicação é a presença de objetos que possuem cor de pele nas imagens, mas não fazem parte de segmentos reais de pele, sendo muitas vezes erroneamente classificados como pele. A fim de reduzir a frequência destes falsos positivos, é apresentado neste trabalho um método de segmentação de pele humana em imagens faciais que possui duas diferentes etapas que reduzem a quantidade de falsos positivos do processo sem que se percam quantidades significantes de verdadeiros positivos. Estas duas etapas são chamadas de FPAR (False Positive Area Reduction) e aplicação de textura. A primeira visa remover segmentos não contínuos classificados como pele e a segunda aborda a aplicação de textura nas imagens, removendo áreas em que a textura não se assemelha à textura de pele humana. Para isto, foi desenvolvido o banco de imagens SFA (Skin of FERET and AR), constituído de imagens originais dos bancos de faces FERET e AR, seus respectivos ground truths de segmentação de pele e amostras de pele e não pele extraídas das imagens originais. O método apresentado neste trabalho apresenta resultados promissores atingindo até 46,9% de redução de falsos positivos sem que a acurácia aferida tenha redução significante (apenas 1,8%). Este trabalho tem como contribuições o método desenvolvido e o banco de imagens SFA que fica disponível online para download pela comunidade científica. / Skin segmentation is an important process for many kinds of application like face detection, face tracking, gesture recognition, forensic computing and others. One of the main problems found in this kind of application is the presence of objects which have skin color but are not part of actual skin segments, being wrongly classified as skin. Aiming to reduce the frequency of these false positives, this work presents a method of human skin segmentation in facial images which has two different steps that reduces the false positives without losing significant areas of true positives. These two steps are called FPAR (False Positive Area Reduction) and texture application. The first one removes segments classified as skin which are not continuous and the second one is an analysis of the image texture, removing areas which the texture is not alike human skin texture. To achieve this, the SFA (Skin of FERET and AR) image database was developed, constituted of original images retrieved from AR and FERET face databases, their respective ground truths of skin segmentation and skin and non-skin samples retrieved from the original images. The method presented in this work shows promising results, reaching up to 46.9% of false positive reduction without significant reduction of the accuracy (1.8%). This work has as contributions the developed method and the SFA database, which is available for download for scientific community.
189

Classificação automática de texto por meio de similaridade de palavras: um algoritmo mais eficiente. / Automatic text classification using word similarities: a more efficient algorithm.

Fabricio Shigueru Catae 08 January 2013 (has links)
A análise da semântica latente é uma técnica de processamento de linguagem natural, que busca simplificar a tarefa de encontrar palavras e sentenças por similaridade. Através da representação de texto em um espaço multidimensional, selecionam-se os valores mais significativos para sua reconstrução em uma dimensão reduzida. Essa simplificação lhe confere a capacidade de generalizar modelos, movendo as palavras e os textos para uma representação semântica. Dessa forma, essa técnica identifica um conjunto de significados ou conceitos ocultos sem a necessidade do conhecimento prévio da gramática. O objetivo desse trabalho foi determinar a dimensionalidade ideal do espaço semântico em uma tarefa de classificação de texto. A solução proposta corresponde a um algoritmo semi-supervisionado que, a partir de exemplos conhecidos, aplica o método de classificação pelo vizinho mais próximo e determina uma curva estimada da taxa de acerto. Como esse processamento é demorado, os vetores são projetados em um espaço no qual o cálculo se torna incremental. Devido à isometria dos espaços, a similaridade entre documentos se mantém equivalente. Esta proposta permite determinar a dimensão ideal do espaço semântico com pouco esforço além do tempo requerido pela análise da semântica latente tradicional. Os resultados mostraram ganhos significativos em adotar o número correto de dimensões. / The latent semantic analysis is a technique in natural language processing, which aims to simplify the task of finding words and sentences similarity. Using a vector space model for the text representation, it selects the most significant values for the space reconstruction into a smaller dimension. This simplification allows it to generalize models, moving words and texts towards a semantic representation. Thus, it identifies a set of underlying meanings or hidden concepts without prior knowledge of grammar. The goal of this study was to determine the optimal dimensionality of the semantic space in a text classification task. The proposed solution corresponds to a semi-supervised algorithm that applies the method of the nearest neighbor classification on known examples, and plots the estimated accuracy on a graph. Because it is a very time consuming process, the vectors are projected on a space in such a way the calculation becomes incremental. Since the spaces are isometric, the similarity between documents remains equivalent. This proposal determines the optimal dimension of the semantic space with little effort, not much beyond the time required by traditional latent semantic analysis. The results showed significant gains in adopting the correct number of dimensions.
190

Aplicação da Lógica Fuzzy kNN e análises estatísticas para seleção de características e classificação de abelhas. / Application of Fuzzy kNN and statistical analysis for features selection and classification of bees.

Bruna Elisa Zanchetta Buani 07 October 2010 (has links)
Este trabalho propõe uma alternativa para o problema de classificação de espécies de abelhas a partir da implementação de um algoritmo com base na Morfométria Geométrica e estudo das Formas dos marcos anatômicos das imagens obtidas pelas asas das abelhas. O algoritmo implementado para este propósito se baseia no algoritmo dos k-Vizinho mais Próximos (do inglês, kNN) e na Lógica Fuzzy kNN (Fuzzy k-Nearest Neighbor) aplicados a dados analisados e selecionados de pontos bidimensionais referentes as características geradas por marcos anatômicos. O estudo apresentado envolve métodos de seleção e ordenação de marcos anatômicos para a utilização no algoritmo por meio da implementação de um método matemático que utiliza o calculo dos marcos anatômicos mais significativos (que são representados por marcos matemáticos) e a formulação da Ordem de Significância onde cada elemento representa variáveis de entrada para a Fuzzy kNN. O conhecimento envolvido neste trabalho inclui uma perspectiva sobre a seleção de características não supervisionada como agrupamentos e mineração de dados, analise de pré-processamento dos dados, abordagens estatísticas para estimação e predição, estudo da Forma, Analise de Procrustes e Morfométria Geométrica sobre os dados e o tópico principal que envolve uma modificação do algoritmo dos k- Vizinhos mais Próximos e a aplicação da Fuzzy kNN para o problema. Os resultados mostram que a classificação entre amostras de abelhas no seu próprio grupo apresentam acuracia de 90%, dependendo da espécie. As classificações realizadas entre as espécies de abelhas alcançaram acuracia de 97%. / This work presents a proposal to solve the bees classification problem by implementing an algorithm based on Geometrics Morphometrics and the Shape analysis of landmarks generated from bees wings images. The algorithm is based on the K-Nearest Neighbor (K-Nearest Neighbor) algorithm and Fuzzy Logic KNN applied to the analysis and selection of two-dimensional data points relating to landmarks. This work is part of the Architecture Reference Model for Automatic identification and Taxonomic Classification System of Stingless Bee using the Wing Morphometry. The study includes selection and ordering methods for landmarks used in the algorithm by developing a mathematical model to represent the significance order, generating the most significant mathematical landmarks as input variables for Fuzzy Logic kNN. The main objective of this work is to develop a classification system for bee species. The knowledge involved in the development of this work include an overview of feature selection, unsupervised clustering and data mining, analysis of data pre-processing, statistical approaches for estimation and prediction, study of Shape, Procrustes Analysis on data that comes from Geometric Morphometry and the modification of the k-Nearest Neighbors algorithm and the Fuzzy Logic kNN. The results show that the classification in bee samples of the same species presents a accuracy above 90%, depending on the specie in analysis. The classification done between the bees species reach accuracies of 97%.

Page generated in 0.1041 seconds