231 |
Extração e reconhecimento de caracteres ópticos a partir do co-projeto de hardware e software sobre plataforma reconfigurável / Extraction and recognition of optical characters based on hardware and software co-design over reconfigurable platformDessbesell, Gustavo Fernando 07 March 2008 (has links)
Conselho Nacional de Desenvolvimento Científico e Tecnológico / This work presents the implementation and analysis of a system devoted to the extraction and recognition of optical characters which is based on the hardware and software co-design methodology and built over a reconfigurable platform. Since vision is a very important sense, the research in the field of artificial vision systems has been carried out since the very beginning of the digital era, in the early 60 s. Taking into account the recent evolution experienced by the configurable computing area, a new tendency of research and
development of heterogeneous artificial vision systems emerges. Among the main benefits provided by the so called systems on chip are the reduction of power dissipation, financial costs and physical area. In this sense, taking a License Plate Recognition System (LPRS) as a case study, the focus of this work is the implementation of the character localization and recognition steps, while the partitioning of hardware and software resources is based in costbenefit heuristics. Initially, a software-only version of the system is build over an x86 platform. More than to allow the evaluation of several character localization related methods, this software-only version is also intended to be used as parameter of comparison for the embedded version of the system. Regarding the character recognition step, it is performed by the means of an Artificial Neural Network. Based on the results provided by the software-only evaluation system, the implementation of the embedded version is performed, considering an FPGA as platform. In this embedded version, the character localization step consists of a
dedicated hardware block, while the character recognition step comprises a piece of software executed in a microprocessor that is physically implemented inside the FPGA. Taking into account a 10 times higher frequency of operation for the processor of the x86 platform, as
well as the fact that most of the embedded hardware block employs a clock frequency smaller or equal to 25 MHz, the most noticeable result is the 2.25 times faster speed of processing achieved by the embedded version. Regarding the plate recognition capability, both systems have the same performance, being able to successfully recognize plates in 51.62 % of the cases (considering the best case). Beyond LPRSs, the system developed here could also be
employed to build other applications that require optical character recognition features, such as automatic traffic signs recognition and serial number reading of items in a production line. / Este trabalho apresenta a implementação e análise de um sistema voltado à extração e reconhecimento de caracteres ópticos a partir do co-projeto de hardware e software sobre uma plataforma reconfigurável. Por conta da importância atribuída ao sentido da visão, sistemas artificiais capazes de emular as tarefas envolvidas neste processo biológico têm sido alvo de pesquisas desde o surgimento dos primeiros computadores digitais, na década de 60. Tendo em vista a recente evolução experimentada na área da computação configurável, surge uma tendência natural à pesquisa e desenvolvimento de sistemas heterogêneos (compostos por uma combinação de blocos de hardware e software) de visão artificial baseados em tal plataforma. Dentre os principais benefícios proporcionados por sistemas em chip podem ser citados a redução no consumo de potência, custos financeiros e área física. Neste sentido, tomando
como estudo de caso um Sistema de Reconhecimento de Placas de Licenciamento Veicular (SRPLV), o foco do trabalho está situado na implementação das etapas de localização e
reconhecimento de caracteres, sendo o particionamento dos blocos de hardware e software baseado em heurísticas de custo-benefício. Inicialmente é realizada a implementação de uma versão totalmente em software do sistema aqui proposto, sobre plataforma x86, no intuito de avaliar os diversos métodos passíveis de implementação, bem como o de possibilitar um parâmetro de comparação com a versão embarcada do sistema. Os métodos avaliados dizem
respeito à etapa de localização de caracteres, haja vista a definição à priori do emprego de Redes Neurais Artificiais no reconhecimento dos mesmos. A partir dos resultados obtidos por esta avaliação é realizada a implementação da versão embarcada do sistema, tendo como plataforma um FPGA. Nesta versão, a etapa de localização de caracteres é implementada como um bloco dedicado de hardware, enquanto a de reconhecimento constitui-se num
software executado sobre um microprocessador fisicamente embutido no interior do FPGA. Considerando uma freqüência de operação 10 vezes superior para o processador da
plataforma x86, bem como o fato da maior parte do hardware embarcado utilizar um clock menor ou igual a 25 MHz, o principal resultado consiste no ganho de 2,25 vezes no tempo de execução obtido na segunda versão do sistema. No tocante à capacidade de reconhecimento de placas, os sistemas são equivalentes, sendo capazes de reconhecê-las corretamente em 51,62% das vezes, no melhor caso. Além de SRPLVs, o sistema aqui desenvolvido pode ser empregado na criação de outras aplicações que envolvam a problemática do reconhecimento de caracteres óticos, como reconhecimento automático de placas de trânsito e do número de série de itens numa linha de produção.
|
232 |
Desenvolvimento de um sistema de captura e análise de movimentos baseado em técnicas de visão computacional / Developing of a motion capture system based on computer vision techniquesPinheiro, Alan Petrônio 30 April 2008 (has links)
The purpose of this study was investigate the measurement techniques of human
movement and to develop a system capable of capturing and reconstructing the movement
trajectory on real world. The devised system uses video cameras to record the movement
and a computer program to process video footage assessing the movement trajectory and
calculating its kinematical variables. Those data are showed by the program as graphics or
animation which simulates the reconstructed movement. To reach these objectives, the
system used techniques from image processing, computer vision and anthropometric
models. In the end of this work, it is exhibited an experimental evaluation of the precision
and accuracy of the system and some case studies to show its potential. / O propósito deste estudo foi pesquisar as técnicas de medição do movimento humano e
desenvolver um sistema capaz de capturar e reconstruir a trajetória do movimento no
espaço. O sistema desenvolvido utiliza câmeras de vídeo para registrar o movimento e um
programa de computador capaz de processar as imagens extraídas dos vídeos de forma a
estimar a trajetória do movimento e calcular as suas variáveis cinemáticas. Estes dados são
exibidos pelo programa na forma de gráficos ou animações que reconstroem o movimento
capturado. Para alcançar estes objetivos, o sistema utilizou técnicas de processamento de
imagens, visão computacional, cálculos numéricos e modelos antropométricos do corpo
humano. Ao final desta dissertação é feita uma avaliação experimental da precisão e
exatidão do sistema proposto e alguns estudos de casos que tiveram como objetivo
demonstrar o potencial deste sistema. / Mestre em Ciências
|
233 |
Aplicação da geocomputação a estudos de susceptibilidade de deslizamentos de terra / Geocomputation application to studies of landslides susceptibilityAlessandra Martins Coelho 13 March 2012 (has links)
Esta tese propôs uma metodologia para detecção de áreas susceptíveis a deslizamentos
de terra a partir de imagens aéreas, culminando no desenvolvimento de uma ferramenta
computacional, denominada SASD/T, para testar a metodologia. Para justificar esta pesquisa,
um levantamento sobre os desastres naturais da história brasileira relacionada a deslizamentos
de terra e as metodologias utilizadas para a detecção e análise de áreas susceptíveis a
deslizamentos de terra foi realizado. Estudos preliminares de visualização 3D e conceitos
relacionados ao mapeamento 3D foram realizados. Estereoscopia foi implementada para
visualizar tridimensionalmente a região selecionada. As altitudes foram encontradas através
de paralaxe, a partir dos pontos homólogos encontrados pelo algoritmo SIFT. Os
experimentos foram realizados com imagens da cidade de Nova Friburgo. O experimento
inicial mostrou que o resultado obtido utilizando SIFT em conjunto com o filtro proposto, foi
bastante significativo ao ser comparado com os resultados de Fernandes (2008) e Carmo
(2010), devido ao número de pontos homólogos encontrados e da superfície gerada. Para
detectar os locais susceptíveis a deslizamentos, informações como altitude, declividade,
orientação e curvatura foram extraídas dos pares estéreos e, em conjunto com as variáveis
inseridas pelo usuário, forneceram uma análise de quão uma determinada área é susceptível a
deslizamentos. A metodologia proposta pode ser estendida para a avaliação e previsão de
riscos de deslizamento de terra de qualquer outra região, uma vez que permite a interação com
o usuário, de modo que este especifique as características, os itens e as ponderações
necessárias à análise em questão. / The purpose of this thesis is a methodology to detect locations susceptible to
landslides from the aerial images, culminating in the development of software, denominated
SASD/T, to testing the methodology. To justify this research, a survey about natural disasters
in Brazilian history related to landslides and methodologies used for detection and analysis of
areas susceptible to landslides was realized. Preliminaries studies of the 3D visualization and
concepts related to 3D mapping of an area were carried out. The stereoscopy technique was
implemented to visualize three-dimensionally the selected region. Altitudes were found via
parallax, from the homologous points found by the SIFT algorithm. The experiments were
performed with Nova Friburgo city images. The initial experiment showed that the results
obtained using the SIFT algorithm together with the proposed filter was highly significant
when compared with the results of Fernandes (2008) and Carmo (2010), due to the number of
homologous points found and the generated surface. To detect locations susceptible to
landslides, information such as altitude, slope, aspect and curvature areas was extracted from
the stereo pairs and, together with the variables entered by the user, was provided an analysis
of how a particular area is susceptible to landslides. The proposed methodology can be
extended to the evaluation and prediction of landslide risks in any other region, since it allows
interaction with the user, so that it specifies the characteristics, the items and the weights
needed for the analysis in question.
|
234 |
Revendo o problema da detecção de retas através dos olhos da aranha. / Straight Line detection revisited: Through the eyes of the spider.Felipe Miney Gonçalves da Costa 06 July 1999 (has links)
Visão é um processo que envolve uma grande quantidade de informações, as quais precisam ser otimizadas de alguma forma para propiciar um processamento eficiente. Grande parte das informações visuais estão contidas nos contornos de uma imagem e uma grande redução no volume dos dados pode ser conseguida com a análise dos contornos. Além dos contornos, a detecção de segmentos de reta é o próximo passo na compressão das informações visuais. A detecção de retas ocorre no sistema visual humano, e também no de outros seres vivos. Entre os invertebrados terrestres, o melhor sistema de visão é o das aranhas da família Salticidae e este apresenta características que facilitam a detecção de retas. Este trabalho propõe um novo método de detecção de retas, baseado no sistema visual das aranhas saltadoras, que aborda este problema através de um enfoque inédito, por otimização. O método realiza a busca por retas através de janelas lineares. Para isso, a detecção de retas será feita em um espaço de parâmetros, com a utilização do algoritmo de maximização de funções \"Downhill Simplex\". O método desenvolvido leva em consideração a natureza discreta da imagem e do espaço de parâmetros utilizado, e este trabalho inclui um estudo detalhado destes espaços discretos. O método incorpora, para lidar adequadamente com as peculiaridades do problema, características como \"Simulated Annealing\" e largura adaptativa. O desempenho do método depende de um conjunto de parâmetros cujo comportamento é de difícil previsão, e a escolha de um conjunto foi realizada através de um algoritmo genético. O trabalho envolve também a construção de um protótipo para a realização de testes utilizando o método desenvolvido. Os resultados foram analisados quanto a precisão na detecção de retas, ao tempo de processamento e a movimentação das janelas lineares, relacionada aos esforços na busca por retas. / Vision is a process that involves a large amount of information that need to be somehow optimized to allow efficient processing. Most of the visual information is contained in the contours of an image and a considerable reduction in the amount of data can be achieved by fmding and processing these contours. The next step to further compress the visual data is to fmd straight segments, and represent the contours in terms of these entities. Straight-line segment detection is performed by the human visual system, as well as by other creatures. Among terrestrial invertebrates, the best visual system is that of the Salticidae family of spiders, also known as jumping spiders. This visual system presents some characteristics that facilitate the detection of straight-lines. The present work proposes a new method for straight-line detection, based on the visual system of the jumping spiders, using linear windows. This method approach the straight-line detection problem through an optimization point of view yet unexplored in literature. The detection will be accomplished in a parameter space, using the \"Downhill Simplex\" maximization algorithm. The method considers the discrete nature of both the image and the parameter spaces, and this work includes a detailed analysis of these discrete spaces. The method also incorporates, to adequately deal with the specific characteristics of the problem, resources such as \"Simulated Annealing\" and adaptive width of the linear windows. The performance of the method depends on a set of parameters, which behavior is hard to predict, and the choice of an adequate set was made using a genetic algorithm. The work also involves the project and construction of a prototype, to evaluate the proposed method. Results were analyzed regarding their precision, processing time and the movements of the linear windows, related to the effort made to detect the straight lines.
|
235 |
Metodologia para análise de imagens de baixa resolução, para definição de MUB (Mapa Urbano Básico) para apoio às concessionárias de distribuição / Methodology for low resolution image analysis, for the definition Urban Basic Map to support power distribution companySantos, Paulo Victor dos 03 May 2018 (has links)
Submitted by Luciana Ferreira (lucgeral@gmail.com) on 2018-06-06T10:43:36Z
No. of bitstreams: 2
Dissertação - Paulo Victor dos Santos - 2018.pdf: 13085792 bytes, checksum: 85f53ae260abe05ea15c17480a4cdebf (MD5)
license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) / Approved for entry into archive by Luciana Ferreira (lucgeral@gmail.com) on 2018-06-06T10:45:45Z (GMT) No. of bitstreams: 2
Dissertação - Paulo Victor dos Santos - 2018.pdf: 13085792 bytes, checksum: 85f53ae260abe05ea15c17480a4cdebf (MD5)
license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) / Made available in DSpace on 2018-06-06T10:45:45Z (GMT). No. of bitstreams: 2
Dissertação - Paulo Victor dos Santos - 2018.pdf: 13085792 bytes, checksum: 85f53ae260abe05ea15c17480a4cdebf (MD5)
license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5)
Previous issue date: 2018-05-03 / The high cost of geo-referenced technologies capable of keeping up-to-date geographic information system data from a power distribution company, which has the basic urban map as the primary data layer, may result in non-purchase of this product, making information outdated or incomplete, generating in addition to losses, rework and confusion when there is a need to do verifications and validations that could be performed remotely. This proposal to support energy distribution concessionaires will use Computational Vision (VC) and Digital Image Processing (PDI) methods, allowing a low cost and efficient maintenance in layers of buildings present in basic urban maps of distributors. This findings might result in possible savings, without any need of displacement in the field to observe a situation that can be evidenced remotely. / O alto custo de tecnologias georreferenciadas capazes de manter atualizados os dados do sistema de informação geográfico de uma concessionária de distribuição, que tenha o mapa urbano básico como a principal camada de dados, pode implicar na não aquisição deste produto, fazendo com que estas informações estejam desatualizadas ou incompletas, gerando além de perdas, retrabalho e confusão quando há a necessidade de se fazer verificações e validações que poderiam ser executadas remotamente. Esta proposta para apoio às concessionárias de distribuição de energia, utilizará métodos de Visão Computacional (VC) e Processamento Digital de Imagens (PDI), possibilitando uma manutenção de baixo custo e eficiente nas camadas de edificações presentes nos mapas urbanos básicos das distribuidoras. Os resultados podem gerar economias, sem a necessidade de deslocamento em campo para observação de uma situação que poderá ser evidenciada remotamente.
|
236 |
SiameseVO-Depth: odometria visual através de redes neurais convolucionais siamesas / SiameseVO-Depth: visual odometry through siamese neural networksSantos, Vinícius Araújo 11 October 2018 (has links)
Submitted by Luciana Ferreira (lucgeral@gmail.com) on 2018-11-21T11:05:44Z
No. of bitstreams: 2
Dissertação - Vinícius Araújo Santos - 2018.pdf: 14601054 bytes, checksum: e02a8bcd3cdc93bf2bf202c3933b3f27 (MD5)
license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) / Approved for entry into archive by Luciana Ferreira (lucgeral@gmail.com) on 2018-11-21T11:06:26Z (GMT) No. of bitstreams: 2
Dissertação - Vinícius Araújo Santos - 2018.pdf: 14601054 bytes, checksum: e02a8bcd3cdc93bf2bf202c3933b3f27 (MD5)
license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) / Made available in DSpace on 2018-11-21T11:06:26Z (GMT). No. of bitstreams: 2
Dissertação - Vinícius Araújo Santos - 2018.pdf: 14601054 bytes, checksum: e02a8bcd3cdc93bf2bf202c3933b3f27 (MD5)
license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5)
Previous issue date: 2018-10-11 / Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - CAPES / Visual Odometry is an important process in image based navigation of robots. The
standard methods of this field rely on the good feature matching between frames where
feature detection on images stands as a well adressed problem within Computer Vision.
Such techniques are subject to illumination problems, noise and poor feature localization
accuracy. Thus, 3D information on a scene may mitigate the uncertainty of the features
on images. Deep Learning techniques show great results when dealing with common
difficulties of VO such as low illumination conditions and bad feature selection. While
Visual Odometry and Deep Learning have been connected previously, no techniques
applying Siamese Convolutional Networks on depth infomation given by disparity maps
have been acknowledged as far as this work’s researches went. This work aims to fill
this gap by applying Deep Learning to estimate egomotion through disparity maps on
an Siamese architeture. The SiameseVO-Depth architeture is compared to state of the art
techniques on OV by using the KITTI Vision Benchmark Suite. The results reveal that the
chosen methodology succeeded on the estimation of Visual Odometry although it doesn’t
outperform the state-of-the-art techniques. This work presents fewer steps in relation to
standard VO techniques for it consists of an end-to-end solution and demonstrates a new
approach of Deep Learning applied to Visual Odometry. / Odometria Visual é um importante processo na navegação de robôs baseada em imagens.
Os métodos clássicos deste tema dependem de boas correspondências de características
feitas entre imagens sendo que a detecção de características em imagens é um tema amplamente
discutido no campo de Visão Computacional. Estas técnicas estão sujeitas a problemas
de iluminação, presença de ruído e baixa de acurácia de localização. Nesse contexto,
a informação tridimensional de uma cena pode ser uma forma de mitigar as incertezas
sobre as características em imagens. Técnicas de Deep Learning têm demonstrado bons
resultados lidando com problemas comuns em técnicas de OV como insuficiente iluminação
e erros na seleção de características. Ainda que já existam trabalhos que relacionam
Odometria Visual e Deep Learning, não foram encontradas técnicas que utilizem Redes
Convolucionais Siamesas com sucesso utilizando informações de profundidade de mapas
de disparidade durante esta pesquisa. Este trabalho visa preencher esta lacuna aplicando
Deep Learning na estimativa do movimento por de mapas de disparidade em uma arquitetura
Siamesa. A arquitetura SiameseVO-Depth proposta neste trabalho é comparada
à técnicas do estado da arte em OV utilizando a base de dados KITTI Vision Benchmark
Suite. Os resultados demonstram que através da metodologia proposta é possível a estimativa
dos valores de uma Odometria Visual ainda que o desempenho não supere técnicas
consideradas estado da arte. O trabalho proposto possui menos etapas em comparação
com técnicas clássicas de OV por apresentar-se como uma solução fim-a-fim e apresenta
nova abordagem no campo de Deep Learning aplicado à Odometria Visual.
|
237 |
Segmentação e quantificação de tecidos em imagens coloridas de úlceras de perna. / Segmentation and quantification of tissues in leg ulcers color imagesAndres Anobile Perez 31 August 2001 (has links)
Neste trabalho foi desenvolvida uma metodologia de avaliação e monitoramento de pacientes com úlceras de perna baseada nas características dos tecidos internos dessas feridas. Os tecidos internos podem ser classificados como granulado, fibrina e necrosado, e a avaliação da área de cada um desses tecidos fornece para o clínico dados referentes ao estado da úlcera.A metodologia extrai essas informações a partir de imagens digitalizadas das lesões. Para tanto, a área referente à úlcera é segmentada e em seguida a área interna processada por uma rede neural, que tem o propósito de classificar cada ponto para um dos tecidos analisados. Os algoritmos desenvolvidos operam sobre imagens coloridas, já que cada tecido em uma imagem só pode ser identificado por sua cor. Este trabalho propõe ainda uma metodologia de extração de características das lesões através de uma forma não invasiva utilizando, para tanto, algoritmos de visão computacional. / The aim of this work was the development of a monitoring and evaluation methodology of leg ulcers patients based on the features of the inner tissues of these wounds. The internal tissues can be classified as granulation, slough and necrotic, and the evaluation of the area of each one of these tissues can be used by the specialist to help with the patient''s diagnosis. The methodology extracts these information from the wound digitized images. For this, the wound area is segmented and the inner region or the segmented area is processed by a neural network that classifies each point of the analyzed tissues. The developed algorithms operate on color images since each tissue in an image can only be analyzed by its colors. In this work has also proposed a feature extraction methodology of the wounds through a non-invasive way using computer vision algorithms.
|
238 |
Estimativa da idade óssea através da análise carpal baseada na simplificação do método de Eklof & Ringertz / Estimative of the skeletal age through of carpal analysis based on the simplification of Eklof & Ringertz methodCelso Olivete Júnior 07 April 2005 (has links)
Este trabalho apresenta uma metodologia semi-automática e simplificada para estimação da idade óssea baseada no método de Eklof & Ringertz. Fundamenta-se no processamento e extração de informações de imagens radiográficas da mão, mostrando a real influência do efeito Heel nesse tipo de imagem. Apresenta resultados obtidos com a aplicação de algoritmos de thresholding, com e sem a correção do efeito Heel,e propõe uma metodologia para isolar os ossos do tecido da mão para obtenção de dimensões dos mesmos. Essas dimensões foram usadas como informações para a estimação da idade óssea de seres humanos em fase de crescimento, buscando uma simplificação do método de Eklof & Ringertz. / This research presents a semi-automatic and simplified methodology to estimate skeletal age by using the Eklof & Ringertz method. The method is based on processing and extraction of hand radiographic images information, showing the Heel effect real influence in this type of image. The results obtained with application of thresholding algorithms, with and without Heel effect correction are presented and a methodology to isolate bone from hands tissue for dimension measurements is proposed. These dimensions were used as the information for skeletal age estimation of humans in the growth phase, on order to simplify the Eklof & Ringertz method.
|
239 |
Sistema de reconhecimento de padrões visuais invariante a transformações geométricas utilizando redes neurais artificiais de múltiplas camadas / not availableJosé Alfredo Ferreira Costa 15 January 1996 (has links)
As áreas de visão computacional e redes neurais artificiais (RNAs) e suas aplicações, tiveram um enorme progresso em pesquisa e aplicações práticas nos últimos anos. Sistemas de inspeção visual automática têm despertado muita atenção na indústria pois provêem meios econômicos, eficientes e precisos de obtenção de controle de qualidade. Porém, apesar do grande avanço tecnológico, a maioria dos sistemas existentes, com exceção de alguns poucos experimentais, são especializados e foram projetados para inspecionar um único objeto ou peça, de tipo previamente conhecido, e em posição, orientação e distância em relação à câmara altamente restritas. Este trabalho descreve um sistema de reconhecimento de imagens contendo múltiplos objetos de classes aleatórias e tolerante a ruído. Um estágio de pré-processamento filtra parte do ruído e segmenta regiões conectadas da imagem (RCI). A classificação dos padrões é feita com redes neurais de múltiplas camadas a partir de atributos invariantes calculados sobre as RCis. No final do processo temos uma listagem dos objetos contidos na cena, suas posições e orientações, os quais podem servir de entrada a um sistema de entendimento da cena, de mais alto nível, ou para outras máquinas, como um manipulador automático. Outros parâmetros podem ser utilizados para normalizar, em escala, orientação e posição, os padrões contidos na imagem, para efeito de comparações com imagens e parâmetros dos objetos previamente armazenados em bancos de dados. Dois métodos de treinamento de RNAs foram testados, o gradiente conjugado e o Levenberg-Marquardt, em conjunção com simulated annealing, para diferentes condições de erro e conjuntos de atributos. Imagens reais e sintéticas foram utilizadas para efeitos de testes de classificação correta e rejeição de padrões espúrios. Resultados são apresentados e comentados, destacando a capacidade de generalização do sistema mesmo com elevada degradação da imagem pelo ruído. Uma das vantagens do tipo de RNA empregado é a velocidade de execução, que permite ao sistema ser integrado a uma linha de montagem industrial. O sistema foi projetado com a utilização de recursos acessíveis e de baixo custo, sendo executado em computadores pessoais, e podendo ser facilmente adaptado para o uso em pequenas e médias empresas. / Computer vision (CV) and artificial neural networks (ANN) are important research fields of artificial intelligence. Visual pattern recognition (VPR) and object recognition (2 or 3-D) are central tasks in a high level computer vision system. Despite the great development in the recent years, most of the current automatic visual inspection systems work with only one kind of pattern at time which has pose highly restricted. This dissertation describes a system designed to recognize patterns and objects in a digital image which have unknown number object types and poses. Such image, which is also degraded by noise, serve as input for the system. After gray level change and filtering, the pixel connected regions (CR) are codified, and the remained noise is eliminated. lnvariant features, i.e., moment invariants, serve as inputs for artificial neural networks that perform pattern classification. An interpretation module decode the net\'s outputs and increases the correct assignment by testing the net\'s higher outputs values. After all identified patterns were classified, we have an object listing of the scene, their positions and other information, which can be the input for a higher level scene understanding system, that may check for objects relations and could send information for humans or for other machines. Two ANN learning methods were adopted for training the networks, the conjugate gradient and the Levenberg-Marquardt Algoritms, both in conjuction with siumlated annealing, for different error conditions and feature sets. Sinthetic and real images were utilized for testing the net\'s correct class assignments and rejections. Results are presented as well as comments focusing the system\'s generalization capability despite noise, geometrical transformations, object shadows and other degradations over the images. One of the advantages of the ANN employed is the low execution time allowing the system to be integrated to an assembly industry line. The system runs on low cost personal computers, therefore it can be easily adapted for the Brazilian reality and can even be used by little companies and industries.
|
240 |
Sistema de Rastreamento da MÃo Humana Utilizando VisÃo Artificial para AplicaÃÃes Embarcadas / Human Hand Tracking System Using Computer Vision for Embedded ApplicationsRodrigo Fernandes Freitas 25 February 2011 (has links)
CoordenaÃÃo de AperfeiÃoamento de NÃvel Superior / Nos Ãltimos anos a capacidade de processamento dos dispositivos portÃteis tÃm aumentado muito, permitindo-lhes processar aplicaÃÃes, tais como jogos, antes somente possÃveis em plataformas de maior poder computacional. PorÃm, a interface com o usuÃrio nÃo tem acompanhado essa evoluÃÃo do poder computacional, sendo realizada ainda por meio de teclados nÃo ergonÃmicos. Esta dissertaÃÃo propÃe um sistema de interaÃÃo para dispositivos portÃteis baseado em VisÃo Computacional. Este sistema rastreia a mÃo do usuÃrio e reconhece seis possÃveis gestos: apontamento, zoom in, zoom out, rotaÃÃo horÃria, rotaÃÃo anti-horÃria e arrastar. Inicialmente o sistema captura imagens da mÃo do usuÃrio, aplica filtros de prÃ-processamento sobre estas e segmenta a regiÃo da pele atravÃs de limiarizaÃÃo. Feito isto, o contorno da mÃo à extraÃdo e representado em um vetor pelo algoritmo do cÃdigo em cadeia. As pontas dos dedos sÃo localizadas a partir do contorno representado e, atravÃs de um conjunto de regras, o gesto realizado pelo usuÃrio à reconhecido. O sistema proposto à simulado utilizando a plataforma Simulink e implementado em linguagem C ANSI. AlÃm disto, este sistema à comparado com trÃs outros sistemas descritos na literatura com base em quatro critÃrios de avaliaÃÃo: custo computacional, invariÃncia à rotaÃÃo para o gesto de apontamento, robustez à presenÃa de regiÃes no fundo da imagem com cor prÃxima à da pele e robustez à oclusÃo com regiÃes de cor prÃxima à da pele. Os resultados indicam que este sistema atende os requisitos dos critÃrios de avaliaÃÃo, portanto, sendo possÃvel sua utilizaÃÃo em dispositivos portÃteis.
|
Page generated in 0.0825 seconds