• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 138
  • 18
  • 12
  • 12
  • 12
  • 9
  • 8
  • 8
  • 8
  • 6
  • 3
  • 1
  • Tagged with
  • 160
  • 160
  • 160
  • 92
  • 89
  • 68
  • 62
  • 40
  • 39
  • 35
  • 34
  • 33
  • 31
  • 28
  • 28
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
151

Desenvolvimento de software e hardware para diagnóstico e acompanhamento de lesões dermatológicas suspeitas para câncer de pele

Oselame, Gleidson Brandão 28 August 2014 (has links)
O câncer é responsável por cerca de 7 milhões de óbitos anuais em todo o mundo. Estima-se que 25% de todos os cânceres são de pele, sendo no Brasil o tipo mais incidente em todas as regiões geográficas. Entre eles, o tipo melanoma, responsável por 4% dos cânceres de pele, cuja incidência dobrou mundialmente nos últimos dez anos. Entre os métodos diagnósticos empregados, cita-se a regra ABCD, que leva em consideração assimetria (A), bordas (B), cor (C) e diâmetro (D) de manchas ou nevos. O processamento digital de imagens tem mostrado um bom potencial para auxiliar no diagnóstico precoce de melanomas. Neste sentido, o objetivo do presente estudo foi desenvolver um software, na plataforma MATLAB®, associado a um hardware para padronizar a aquisição de imagens, visando realizar o diagnóstico e acompanhamento de lesões cutâneas suspeitas de malignidade (melanoma). Utilizou-se como norteador a regra ABCD para o desenvolvimento de métodos de análise computacional. Empregou-se o MATLAB como ambiente de programação para o desenvolvimento de um software para o processamento digital de imagens. As imagens utilizadas foram adquiridas de dois bancos de imagens de acesso livre. Foram inclusas imagens de melanomas (n=15) e imagens nevos (não câncer) (n=15). Utilizaram-se imagens no canal de cor RGB, as quais foram convertidas para escala de cinza, aplicação de filtro de mediana 8x8 e técnica de aproximação por vizinhança 3x3. Após, procedeu-se a binarização e inversão de preto e branco para posterior extração das características do contorno da lesão. Para a aquisição padronizada de imagens foi desenvolvido um protótipo de hardware, o qual não foi empregado neste estudo (que utilizou imagens com diagnóstico fechado, de bancos de imagem), mas foi validado para a avaliação do diâmetro das lesões (D). Utilizou-se a estatística descritiva onde os grupos foram submetidos ao teste não paramétrico para duas amostras independentes de Mann-Whitney U. Ainda, para avaliar a sensibilidade (SE) e especificidade (SP) de cada variável, empregou-se a curva ROC. O classificador utilizado foi uma rede neural artificial de base radial, obtendo acerto diagnóstico para as imagens melanomas de 100% e para imagens não câncer de 90,9%. Desta forma, o acerto global para predição diagnóstica foi de 95,5%. Em relação a SE e SP do método proposto, obteve uma área sob a curva ROC de 0,967, o que sugere uma excelente capacidade de predição diagnóstica, sobretudo, com baixo custo de utilização, visto que o software pode ser executado na grande maioria dos sistemas operacionais hoje utilizados. / Cancer is responsible for about 7 million deaths annually worldwide. It is estimated that 25% of all cancers are skin, and in Brazil the most frequent in all geographic regions type. Among them, the melanoma type, accounting for 4% of skin cancers, whose incidence has doubled worldwide in the past decade. Among the diagnostic methods employed, it is cited ABCD rule which considers asymmetry (A), edges (B), color (C) and diameter (D) stains or nevi. The digital image processing has shown good potential to aid in early diagnosis of melanoma. In this sense, the objective of this study was to develop software in MATLAB® platform, associated with hardware to standardize image acquisition aiming at performing the diagnosis and monitoring of suspected malignancy (melanoma) skin lesions. Was used as the ABCD rule for guiding the development of methods of computational analysis. We used MATLAB as a programming environment for the development of software for digital image processing. The images used were acquired two banks pictures free access. Images of melanomas (n = 15) and pictures nevi (not cancer) (n = 15) were included. We used the image in RGB color channel, which were converted to grayscale, application of 8x8 median filter and approximation technique for 3x3 neighborhood. After we preceded binarization and reversing black and white for subsequent feature extraction contours of the lesion. For the standardized image acquisition was developed a prototype hardware, which was not used in this study (that used with enclosed diagnostic images of image banks), but has been validated for evaluation of lesion diameter (D). We used descriptive statistics where the groups were subjected to non-parametric test for two independent samples Mann-Whitney U test yet, to evaluate the sensitivity (SE) and specificity (SP) of each variable, we used the ROC curve. The classifier used was an artificial neural network with radial basis function, obtaining diagnostic accuracy for melanoma images and 100% for images not cancer of 90.9%. Thus, the overall diagnostic accuracy for prediction was 95.5%. Regarding the SE and SP of the proposed method, obtained an area under the ROC curve of 0.967, which suggests an excellent diagnostic ability to predict, especially with low costs, since the software can be run in most systems operational use today.
152

Deep learning methods for detecting anomalies in videos: theoretical and methodological contributions / Métodos de deep learning para a detecção de anomalias em vídeos: contribuições teóricas e metodológicas

Ribeiro, Manassés 05 March 2018 (has links)
Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES) / A detecção de anomalias em vídeos de vigilância é um tema de pesquisa recorrente em visão computacional. Os métodos de aprendizagem profunda têm alcançado o estado da arte para o reconhecimento de padrões em imagens e o Autocodificador Convolucional (ACC) é uma das abordagens mais utilizadas por sua capacidade em capturar as estruturas 2D dos objetos. Neste trabalho, a detecção de anomalias se refere ao problema de encontrar padrões em vídeos que não pertencem a um conceito normal esperado. Com o objetivo de classificar anomalias adequadamente, foram verificadas formas de aprender representações relevantes para essa tarefa. Por esse motivo, estudos tanto da capacidade do modelo em aprender características automaticamente quanto do efeito da fusão de características extraídas manualmente foram realizados. Para problemas de detecção de anomalias do mundo real, a representação da classe normal é uma questão importante, sendo que um ou mais agrupamentos podem descrever diferentes aspectos de normalidade. Para fins de classificação, esses agrupamentos devem ser tão compactos (densos) quanto possível. Esta tese propõe o uso do ACC como uma abordagem orientada a dados aplicada ao contexto de detecção de anomalias em vídeos. Foram propostos métodos para o aprendizado de características espaço-temporais, bem como foi introduzida uma abordagem híbrida chamada Autocodificador Convolucional com Incorporação Compacta (ACC-IC), cujo objetivo é melhorar a compactação dos agrupamentos normais. Além disso, foi proposto um novo critério de parada baseado na sensibilidade e sua adequação para problemas de detecção de anomalias foi verificada. Todos os métodos propostos foram avaliados em conjuntos de dados disponíveis publicamente e comparados com abordagens estado da arte. Além do mais, foram introduzidos dois novos conjuntos de dados projetados para detecção de anomalias em vídeos de vigilância em rodovias. O ACC se mostrou promissor na detecção de anomalias em vídeos. Resultados sugerem que o ACC pode aprender características espaço-temporais automaticamente e a agregação de características extraídas manualmente parece ser valiosa para alguns conjuntos de dados. A compactação introduzida pelo ACC-IC melhorou o desempenho de classificação para a maioria dos casos e o critério de parada baseado na sensibilidade é uma nova abordagem que parece ser uma alternativa interessante. Os vídeos foram analisados qualitativamente de maneira visual, indicando que as características aprendidas com os dois métodos (ACC e ACC-IC) estão intimamente correlacionadas com os eventos anormais que ocorrem em seus quadros. De fato, ainda há muito a ser feito para uma definição mais geral e formal de normalidade, de modo que se possa ajudar pesquisadores a desenvolver métodos computacionais eficientes para a interpretação dos vídeos. / The anomaly detection in automated video surveillance is a recurrent topic in recent computer vision research. Deep Learning (DL) methods have achieved the state-of-the-art performance for pattern recognition in images and the Convolutional Autoencoder (CAE) is one of the most frequently used approach, which is capable of capturing the 2D structure of objects. In this work, anomaly detection refers to the problem of finding patterns in images and videos that do not belong to the expected normal concept. Aiming at classifying anomalies adequately, methods for learning relevant representations were verified. For this reason, both the capability of the model for learning automatically features and the effect of fusing hand-crafted features together with raw data were studied. Indeed, for real-world problems, the representation of the normal class is an important issue for detecting anomalies, in which one or more clusters can describe different aspects of normality. For classification purposes, these clusters must be as compact (dense) as possible. This thesis proposes the use of CAE as a data-driven approach in the context of anomaly detection problems. Methods for feature learning using as input both hand-crafted features and raw data were proposed, and how they affect the classification performance was investigated. This work also introduces a hybrid approach using DL and one-class support vector machine methods, named Convolutional Autoencoder with Compact Embedding (CAE-CE), for enhancing the compactness of normal clusters. Besides, a novel sensitivity-based stop criterion was proposed, and its suitability for anomaly detection problems was assessed. The proposed methods were evaluated using publicly available datasets and compared with the state-of-the-art approaches. Two novel benchmarks, designed for video anomaly detection in highways were introduced. CAE was shown to be promising as a data-driven approach for detecting anomalies in videos. Results suggest that the CAE can learn spatio-temporal features automatically, and the aggregation of hand-crafted features seems to be valuable for some datasets. Also, overall results suggest that the enhanced compactness introduced by the CAE-CE improved the classification performance for most cases, and the stop criterion based on the sensitivity is a novel approach that seems to be an interesting alternative. Videos were qualitatively analyzed at the visual level, indicating that features learned using both methods (CAE and CAE-CE) are closely correlated to the anomalous events occurring in the frames. In fact, there is much yet to be done towards a more general and formal definition of normality/abnormality, so as to support researchers to devise efficient computational methods to mimetize the semantic interpretation of visual scenes by humans.
153

Monitoramento da frequência cardíaca via método de magnificação de vídeo e Euleriana em tempo real

Simioni, Maicon Cezar 18 August 2015 (has links)
O monitoramento de sinais vitais em pacientes tem o intuito de obter rapidamente dados relevantes para decisões médicas. No entanto, tal mensuração é pouco eficiente, difícil, quando não impossível, em determinados casos, como por exemplo em pacientes vítimas de queimaduras, em função da impossibilidade de colocar o eletrodo diretamente na pele, ou em recém-nascidos, devido à fragilidade da pele. Este estudo trata do desenvolvimento de um sistema para aquisição contínua de sinais fotopletismográficos para a telemetria da frequência cardíaca em tempo real, em uma plataforma de baixo custo, utilizando a biblioteca OpenCV e o método desenvolvido pelo MIT chamado de Magnificação de Vídeo Euleriana, que revela variações que são imperceptíveis a olho nu. Para desenvolver o sistema foi utilizada a plataforma de hardware Raspberry Pi Versão B com processador ARM11 de 700MHz e 512MB de memória RAM. Os dados da frequência cardíaca coletados dos experimentos foram comparados com os dados coletados por um oxímetro de dedo More Fitness modelo MF-425. Esse foi escolhido por utilizar o mesmo princípio "Fotopletismografia"para efetuar a medição. Após a coleta de dados foi estimado o intervalo de confiança para aferir a precisão do sistema, que correspondeu a 96,5% em relação ao oxímetro utilizado. Ficou evidente que o meio utilizado para medir a frequência cardíaca via método de magnificação de vídeo Euleriana em tempo real é uma tecnologia de baixo custo (aproximadamente R$300,00) quando comparado aos monitores multiparamétricos utilizados para o monitoramento de pacientes críticos, cujo custo varia entre R$ 8.000,00 e R$ 34.000,00. Sendo assim, também contribui com a redução de custos no tratamento ao doente que necessita de monitorização constante, possibilitando que, com a economia gerada pela aquisição e implantação desta tecnologia, viabilize um maior investimento em outras áreas dos hospitais. / Monitoring vital signs in patients is used to obtain relevant data for medical decisions in a fast way. However, this measurement is both inefficient and difficult, if not impossible in certain cases, such as in burnt victims, due to the impossibility of placing the electrodes directly on the skin or in infants, because of the fragility of skin. This study aims to develop of a system for continuous acquisition of photopletismografics (PPG) signals for the telemetry of heart rate in real time in a low cost platform using the OpenCV library and the method developed by MIT called the Eulerian Video Magnification, amplifying variations that are imperceptible to the naked eye. To develop the system were used the hardware platform Raspberry Pi version B with ARM11 700MHz processor and 512MB RAM. The heart rate data collected from the experi- ments were compared with data collected by a finger oximeter model More Fitness MF-425 it was chosen, by using the same working principle "PPG"to effect the measurement. After data collection was estimated the confidence interval to measure system accuracy, which corresponded to 96,5% compared to the oximeter used. It became clear that the developed system used to measure heart rate via magnification method of Eulerian live video is a low-cost technology (approximately R$ 300.00) compared to the multiparameter monitors used for monitoring critically patients, ranging in cost from R$ 8,000.00 to R$ 34,000.00. So also, it contributes to cost reduction in the treatment to the patient in need of constant monitoring, enabling with the savings generated by the acquisition and deployment of this technology makes possible greater investment in other areas of hospitals. / 5000
154

Ferramenta de visão computacional para processos fotogramétricos / Tool of computer vision for joined fotogrametrics

Sandro Roberto Fernandes 29 April 2008 (has links)
Nesta dissertação é apresentado o desenvolvimento de uma ferramenta computacional para o processamento de pares de imagens estereoscópicas obtidos por câmeras aéreas métricas e não métricas. O programa foi desenvolvido na linguagem C++ e foi utilizado a biblioteca OpenGL. O resultado obtido é uma imagem tridimensional de onde pode ser extraídas cotas de altura e formas de terreno. Estas imagens poderão ser usadas no estudo de áreas de risco em encostas. / In this dissertation is presented the development of a computational tool for the processing of pairs of images estereoscópicas obtained by metric and not metric aerial cameras. The program was developed in the program language C++ and the library was used OpenGL. The result of the program is a three-dimensional image from where it can be extracted height quotas and land forms. These images can be used in the study of risk areas on slopes.
155

Uma abordagem para detecção de pessoas em imagens de veículos aéreos não-tripulados / An approach to people detection in unmanned aerial vehicles images

Oliveira, Diulhio Candido de 14 June 2016 (has links)
CAPES / Este trabalho tem como objetivo propor um método reconhecimento de pessoas em imagens aéreas obtidas a partir de Veículos Aéreos Não Tripulados de pequeno porte. Esta é uma aplicação de grande interesse, pois pode ser inserida em diversas situações tanto civis quanto militares como, por exemplo, missões de busca e salvamento. O uso de Veículos Aéreos Não Tripulados autônomos tende a aumentar com o barateamento desta tecnologia. Assim, esta tecnologia pode sobressair sobre outras utilizadas atualmente, como satélites e voos com grandes aeronaves. Para o reconhecimento de pessoas em imagens aéreas de forma autônoma, este trabalho propõe métodos na forma de Sistemas de Reconhecimento de Padrões (SRP) aplicados ao reconhecimento de imagens. Para este métodos, foram testadas quatro técnicas de aprendizado de máquina: Redes Neurais Convolucionais, HOG+SVM, Cascata Haar e Cascata LBP. Além disso, a fim de possibilitar o reconhecimento de pessoas em imagens aéreas em tempo real, foram testadas e avaliadas técnicas de detecção e segmentação de objetos: Mapa de Saliências e o Processamento de Imagens Térmicas de baixa resolução (PIT). Neste trabalho foram avaliadas as taxas de reconhecimento dos SRPs, além do seu tempo de processamento em um sistema embarcado de baixo custo e em uma Base de Controle Móvel (BCM). Os resultados de reconhecimento mostraram a efetividade das Redes Neurais Convolucionais, com uma acurácia de 0,9971, seguido do HOG+SVM com 0,9236, Cascata Haar com 0,7348 e por fim, Cascata LBP com 0,6615. Em situações onde foi simulado a oclusão parcial, as Redes Neurais Convolucionais atingiram Sensibilidade média 0,72, HOG+SVM de 0,50 e as Cascatas 0,20. Nos experimentos com os SRPs (algoritmos de segmentação e detecção juntamente com as técnicas de reconhecimento), o Mapa de Saliências pouco afetou as taxas de reconhecimento, quais ficaram muito próximas das obtidas no experimentos de reconhecimento. Já o Processamento de Imagens Térmicas de baixa resolução apresentou dificuldades em executar uma segmentação precisa, obtendo imagens com variação na translação, prejudicando a precisão do sistema. Por fim, este trabalho propõe uma nova abordagem para implementação de um SRP para o reconhecimento de pessoas em imagens áreas, utilizando Processamento de Imagens Térmicas juntamente com as Redes Neurais Convolucionais. Este SRP une altas taxas de reconhecimento com desempenho computacional de ao menos 1 fps na plataforma BCM. / This work aims to propose a method for people recognition in Small Unmanned Aerial Vehicles aerial imagery. This is an application of high interest, it can be used in several situations, both civilian and military, as search and rescue missions. The use of Unmanned Aerial Vehicles autonomously tends to increase with the cheapening of this technology, supporting search and rescue missions. Thus, this technology can excel over others currently used, as satellites and flights with large aircraft. For autonomous people recognition, this work proposes new methods as Pattern Reconigition System (PRS) applied to image recognition, applying it in aerial images. Four Pattern Reconigition techniques were tested: Convolutional Neural Networks, HOG+SVM, Haar Cascade and LBP Cascade. Furthermore, in order to achieve recognition of people in aerial images in Real-Time target and detection techniques were tested and evaluated: Saliency Maps and Low-resolution Thermal Image Processing (TIP). In this work were considered recognition rates of the methods and their computational time in a low-cost embedded system and a Mobile Ground Control Station (MGCS). The recognition results shown the Convolutional Neural Network potential, where an accuracy of 0.9971 was achieved, followed by HOG + SVM with 0.9236, Haar Cascade with 0.7348 and LBP Cascade with 0.6615. In situations simulated partial occlusion, where was the CNNs achieved average Sensitivity of 0.72, HOG+SVM with 0.50 and both Cascades 0.20. In experiments with PRS (targeting and detection algorithms with the recognition techniques), the Saliency Map had little influence in recongition rates, it was close to the rates achieved in recognition experiments. While the Low-resolution Thermal Image Processing had difficulties in segmentation process, where translation variantions occured, it harmed the system precision. Lastly, this work proposes a new approach for PRS implementation for people recognition in aerial imagery, using TIP with CNN. This PRS combines high rates of recognition with an computational performace of, at least, 1 fps in MGCS plataform.
156

Monitoramento da frequência cardíaca via método de magnificação de vídeo e Euleriana em tempo real

Simioni, Maicon Cezar 18 August 2015 (has links)
O monitoramento de sinais vitais em pacientes tem o intuito de obter rapidamente dados relevantes para decisões médicas. No entanto, tal mensuração é pouco eficiente, difícil, quando não impossível, em determinados casos, como por exemplo em pacientes vítimas de queimaduras, em função da impossibilidade de colocar o eletrodo diretamente na pele, ou em recém-nascidos, devido à fragilidade da pele. Este estudo trata do desenvolvimento de um sistema para aquisição contínua de sinais fotopletismográficos para a telemetria da frequência cardíaca em tempo real, em uma plataforma de baixo custo, utilizando a biblioteca OpenCV e o método desenvolvido pelo MIT chamado de Magnificação de Vídeo Euleriana, que revela variações que são imperceptíveis a olho nu. Para desenvolver o sistema foi utilizada a plataforma de hardware Raspberry Pi Versão B com processador ARM11 de 700MHz e 512MB de memória RAM. Os dados da frequência cardíaca coletados dos experimentos foram comparados com os dados coletados por um oxímetro de dedo More Fitness modelo MF-425. Esse foi escolhido por utilizar o mesmo princípio "Fotopletismografia"para efetuar a medição. Após a coleta de dados foi estimado o intervalo de confiança para aferir a precisão do sistema, que correspondeu a 96,5% em relação ao oxímetro utilizado. Ficou evidente que o meio utilizado para medir a frequência cardíaca via método de magnificação de vídeo Euleriana em tempo real é uma tecnologia de baixo custo (aproximadamente R$300,00) quando comparado aos monitores multiparamétricos utilizados para o monitoramento de pacientes críticos, cujo custo varia entre R$ 8.000,00 e R$ 34.000,00. Sendo assim, também contribui com a redução de custos no tratamento ao doente que necessita de monitorização constante, possibilitando que, com a economia gerada pela aquisição e implantação desta tecnologia, viabilize um maior investimento em outras áreas dos hospitais. / Monitoring vital signs in patients is used to obtain relevant data for medical decisions in a fast way. However, this measurement is both inefficient and difficult, if not impossible in certain cases, such as in burnt victims, due to the impossibility of placing the electrodes directly on the skin or in infants, because of the fragility of skin. This study aims to develop of a system for continuous acquisition of photopletismografics (PPG) signals for the telemetry of heart rate in real time in a low cost platform using the OpenCV library and the method developed by MIT called the Eulerian Video Magnification, amplifying variations that are imperceptible to the naked eye. To develop the system were used the hardware platform Raspberry Pi version B with ARM11 700MHz processor and 512MB RAM. The heart rate data collected from the experi- ments were compared with data collected by a finger oximeter model More Fitness MF-425 it was chosen, by using the same working principle "PPG"to effect the measurement. After data collection was estimated the confidence interval to measure system accuracy, which corresponded to 96,5% compared to the oximeter used. It became clear that the developed system used to measure heart rate via magnification method of Eulerian live video is a low-cost technology (approximately R$ 300.00) compared to the multiparameter monitors used for monitoring critically patients, ranging in cost from R$ 8,000.00 to R$ 34,000.00. So also, it contributes to cost reduction in the treatment to the patient in need of constant monitoring, enabling with the savings generated by the acquisition and deployment of this technology makes possible greater investment in other areas of hospitals. / 5000
157

A contribution to semantic description of images and videos: an application of soft biometrics / Uma contribuição para descrição semântica de imagens e vídeos: uma aplicação de biometrias fracas

Perlin, Hugo Alberto 08 December 2015 (has links)
Fundação Araucária / Os seres humanos possuem uma alta capacidade de extrair informações de dados visuais, adquiridos por meio da visão. Através de um processo de aprendizado, que se inicia ao nascer e continua ao longo da vida, a interpretação de imagens passa a ser feita de maneira quase instintiva. Em um relance, uma pessoa consegue facilmente descrever com certa precisão os componentes principais que compõem uma determinada cena. De maneira geral, isto é feito extraindo-se características de baixo nível, como arestas, texturas e formas, e associando-as com significados de alto nível. Ou seja, realiza-se uma descrição semântica desta cena. Um exemplo disto é a capacidade de reconhecer outras pessoas e descrever suas características físicas e comportamentais. A área de visão computacional tem como principal objetivo desenvolver métodos capazes de realizar interpretação visual com desempenho similar aos humanos. Estes métodos englobam conhecimento de aprendizado de máquina e processamento de imagens. Esta tese tem como objetivo propor métodos de visão computacional que permitam a extração de informações de alto nível na forma de biometrias leves. Estas biometrias representam características inerentes ao corpo e ao comportamento humano. Porém, não permitem a identificação unívoca de uma pessoa. Para tanto, este problema foi abordado de duas formas, aprendizado não-supervisionado e supervisionado. A primeira busca agrupar as imagens através de um processo de aprendizado automático de extração de características, empregando técnicas de convoluções, computação evolucionária e clusterização. Nesta abordagem as imagens utilizadas contém faces e pessoas. A segunda abordagem emprega redes neurais convolucionais, que possuem a capacidade de operar sobre imagens cruas, aprendendo tanto o processo de extração de características quanto a classificação. Aqui as imagens são classificadas de acordo com gênero e roupas, divididas em parte superior e inferior do corpo humano. A primeira abordagem, quando testada com diferentes bancos de imagens, obteve uma acurácia de aproximadamente 80% para faces e não-faces e 70% para pessoas e não-pessoas. A segunda, testada utilizando imagens e vídeos, obteve uma acurácia de cerca de 70% para gênero, 80% para roupas da parte superior e 90% para a parte inferior. Os resultados destes estudos de casos, mostram que os métodos propostos são promissores, permitindo a realização de anotação automática de informações de alto nível. Isto abre possibilidades para o desenvolvimento de aplicações em diversas áreas, como busca de imagens e vídeos baseada em conteúdo e segurança por vídeo, reduzindo o esforço humano nas tarefas de anotação manual e monitoramento. / Humans have a high ability to extract visual data information acquired by sight. Trought a learning process, which starts at birth and continues throughout life, image interpretation becomes almost instinctively. At a glance, one can easily describe a scene with reasonable precision, naming its main components. Usually, this is done by extracting low-level features such as edges, shapes and textures, and associanting them to high level meanings. In this way, a semantic description of the scene is done. An example of this, is the human capacity to recognize and describe other people physical and behavioral characteristics, or biometrics. Soft-biometrics also represents inherent characteristics of human body and behaviour, but do not allow unique person identification. Computer vision area aims to develop methods capable of performing visual interpretation with performance similar to humans. This thesis aims to propose computer vison methods which allows high level information extraction from images in the form of soft biometrics. This problem is approached in two ways, unsupervised and supervised learning methods. The first seeks to group images via an automatic feature extraction learning , using both convolution techniques, evolutionary computing and clustering. In this approach employed images contains faces and people. Second approach employs convolutional neural networks, which have the ability to operate on raw images, learning both feature extraction and classification processes. Here, images are classified according to gender and clothes, divided into upper and lower parts of human body. First approach, when tested with different image datasets obtained an accuracy of approximately 80% for faces and non-faces and 70% for people and non-person. The second tested using images and videos, obtained an accuracy of about 70% for gender, 80% to the upper clothes and 90% to lower clothes. The results of these case studies, show that proposed methods are promising, allowing the realization of automatic high level information image annotation. This opens possibilities for development of applications in diverse areas such as content-based image and video search and automatica video survaillance, reducing human effort in the task of manual annotation and monitoring.
158

Uma abordagem para detecção de pessoas em imagens de veículos aéreos não-tripulados / An approach to people detection in unmanned aerial vehicles images

Oliveira, Diulhio Candido de 14 June 2016 (has links)
CAPES / Este trabalho tem como objetivo propor um método reconhecimento de pessoas em imagens aéreas obtidas a partir de Veículos Aéreos Não Tripulados de pequeno porte. Esta é uma aplicação de grande interesse, pois pode ser inserida em diversas situações tanto civis quanto militares como, por exemplo, missões de busca e salvamento. O uso de Veículos Aéreos Não Tripulados autônomos tende a aumentar com o barateamento desta tecnologia. Assim, esta tecnologia pode sobressair sobre outras utilizadas atualmente, como satélites e voos com grandes aeronaves. Para o reconhecimento de pessoas em imagens aéreas de forma autônoma, este trabalho propõe métodos na forma de Sistemas de Reconhecimento de Padrões (SRP) aplicados ao reconhecimento de imagens. Para este métodos, foram testadas quatro técnicas de aprendizado de máquina: Redes Neurais Convolucionais, HOG+SVM, Cascata Haar e Cascata LBP. Além disso, a fim de possibilitar o reconhecimento de pessoas em imagens aéreas em tempo real, foram testadas e avaliadas técnicas de detecção e segmentação de objetos: Mapa de Saliências e o Processamento de Imagens Térmicas de baixa resolução (PIT). Neste trabalho foram avaliadas as taxas de reconhecimento dos SRPs, além do seu tempo de processamento em um sistema embarcado de baixo custo e em uma Base de Controle Móvel (BCM). Os resultados de reconhecimento mostraram a efetividade das Redes Neurais Convolucionais, com uma acurácia de 0,9971, seguido do HOG+SVM com 0,9236, Cascata Haar com 0,7348 e por fim, Cascata LBP com 0,6615. Em situações onde foi simulado a oclusão parcial, as Redes Neurais Convolucionais atingiram Sensibilidade média 0,72, HOG+SVM de 0,50 e as Cascatas 0,20. Nos experimentos com os SRPs (algoritmos de segmentação e detecção juntamente com as técnicas de reconhecimento), o Mapa de Saliências pouco afetou as taxas de reconhecimento, quais ficaram muito próximas das obtidas no experimentos de reconhecimento. Já o Processamento de Imagens Térmicas de baixa resolução apresentou dificuldades em executar uma segmentação precisa, obtendo imagens com variação na translação, prejudicando a precisão do sistema. Por fim, este trabalho propõe uma nova abordagem para implementação de um SRP para o reconhecimento de pessoas em imagens áreas, utilizando Processamento de Imagens Térmicas juntamente com as Redes Neurais Convolucionais. Este SRP une altas taxas de reconhecimento com desempenho computacional de ao menos 1 fps na plataforma BCM. / This work aims to propose a method for people recognition in Small Unmanned Aerial Vehicles aerial imagery. This is an application of high interest, it can be used in several situations, both civilian and military, as search and rescue missions. The use of Unmanned Aerial Vehicles autonomously tends to increase with the cheapening of this technology, supporting search and rescue missions. Thus, this technology can excel over others currently used, as satellites and flights with large aircraft. For autonomous people recognition, this work proposes new methods as Pattern Reconigition System (PRS) applied to image recognition, applying it in aerial images. Four Pattern Reconigition techniques were tested: Convolutional Neural Networks, HOG+SVM, Haar Cascade and LBP Cascade. Furthermore, in order to achieve recognition of people in aerial images in Real-Time target and detection techniques were tested and evaluated: Saliency Maps and Low-resolution Thermal Image Processing (TIP). In this work were considered recognition rates of the methods and their computational time in a low-cost embedded system and a Mobile Ground Control Station (MGCS). The recognition results shown the Convolutional Neural Network potential, where an accuracy of 0.9971 was achieved, followed by HOG + SVM with 0.9236, Haar Cascade with 0.7348 and LBP Cascade with 0.6615. In situations simulated partial occlusion, where was the CNNs achieved average Sensitivity of 0.72, HOG+SVM with 0.50 and both Cascades 0.20. In experiments with PRS (targeting and detection algorithms with the recognition techniques), the Saliency Map had little influence in recongition rates, it was close to the rates achieved in recognition experiments. While the Low-resolution Thermal Image Processing had difficulties in segmentation process, where translation variantions occured, it harmed the system precision. Lastly, this work proposes a new approach for PRS implementation for people recognition in aerial imagery, using TIP with CNN. This PRS combines high rates of recognition with an computational performace of, at least, 1 fps in MGCS plataform.
159

Controle de fixação atentivo para uma cabeça robótica com visão binocular / Attentive gaze control for a binocular robot head

Roos, André Filipe 29 August 2016 (has links)
A pesquisa em visão computacional ainda está distante de replicar a adaptabilidade e o desempenho do Sistema Visual Humano. Grande parte das técnicas consolidadas são válidas apenas em cenas estáticas e condições restritivas. Cabeças robóticas representam um avanço em flexibilidade, pois carregam câmeras que podem ser movimentadas livremente para a exploração dos arredores. A observação artificial de um ambiente dinâmico exige a solução de pelo menos dois problemas: determinar quais informações perceptuais relevantes extrair dos sensores e como controlar seu movimento para mudar e manter a fixação de alvos com forma e movimento arbitrários. Neste trabalho, um sistema de controle de fixação binocular geral é proposto, e o subsistema responsável pela seleção de alvos e fixação de deslocamentos laterais é projetado, experimentado e avaliado em uma cabeça robótica com quatro graus de liberdade. O subsistema emprega um popular modelo de atenção visual de baixo nível para detectar o ponto mais saliente da cena e um controlador proporcional-integral gera um movimento conjuntivo das duas câmeras para centralizá-lo na imagem da câmera esquerda, assumida como dominante. O desenvolvimento do sistema envolveu primeiramente a modelagem física detalhada do mecanismo de pan e tilt das câmeras. Então, a estrutura linearizada obtida foi ajustada por mínimos quadrados aos dados experimentais de entrada-saída. Por fim, os ganhos do controlador foram sintonizados por otimização e ajuste manual. A implementação em C++ com a biblioteca OpenCV permitiu operação em tempo real a 30 Hz. Experimentos demonstram que o sistema é capaz de fixar alvos estáticos e altamente salientes sem conhecimento prévio ou fortes suposições. Alvos em movimento harmônico são perseguidos naturalmente, embora com defasamento. Em cenas visualmente densas, onde múltiplos alvos em potencial competem pela atenção, o sistema pode apresentar comportamento oscilatório, exigindo o ajuste fino dos pesos do algoritmo para operação suave. A adição de um controlador para o pescoço e de um controlador de vergência para a compensação de deslocamentos em profundidade são os próximos passos rumo a um observador artificial genérico. / Computer vision research is still far from replicating the adaptability and performance of the Human Visual System. Most of its consolidated techniques are valid only over static scenes and restrictive conditions. Robot heads represent an advance in terms of flexibility by carrying cameras that can be freely moved to explore the surroundings. Artificial observation of dynamic environments requires the solution of at least two problems: to determine what is the relevant perceptual information to be extracted from the sensors and how to control their movement in order to shift and hold gaze on targets featuring arbitrary shapes and motions. In this work, a general binocular gaze control system is proposed, and the subsystem responsible for targeting and following lateral displacements is designed, tested and assessed in a four degrees-of-freedom robot head. The subsystem employs a popular low-level visual attention model to detect the most salient point in the scene, and a proportional-integral controller generates a conjunctive movement of the cameras to center it in the left camera image, assumed to be dominant. The development started with a detailed physical modeling of the pan and tilt mechanism that drives the cameras. Then, the linearized structure obtained was fitted via least squares estimation to experimental input-output data. Finally, the controller gains were tuned by optimization and manual adjustment. The OpenCV-based implementation in C++ allowed real-time execution at 30 Hz. Experiments demonstrate that the system is capable of fixating highly salient and static targets without any prior knowledge or strong assumptions. Targets describing harmonic motion are naturally pursued, albeit with a phase shift. In cluttered scenes, where multiple potential targets compete for attention, the system may present oscillatory behavior, requiring fine adjustment of algorithm weights for smooth operation. The addition of a controller for the neck and a vergence controller to compensate for depth displacements are the next steps towards a generic artificial observer.
160

Ferramenta de visão computacional para processos fotogramétricos / Tool of computer vision for joined fotogrametrics

Sandro Roberto Fernandes 29 April 2008 (has links)
Nesta dissertação é apresentado o desenvolvimento de uma ferramenta computacional para o processamento de pares de imagens estereoscópicas obtidos por câmeras aéreas métricas e não métricas. O programa foi desenvolvido na linguagem C++ e foi utilizado a biblioteca OpenGL. O resultado obtido é uma imagem tridimensional de onde pode ser extraídas cotas de altura e formas de terreno. Estas imagens poderão ser usadas no estudo de áreas de risco em encostas. / In this dissertation is presented the development of a computational tool for the processing of pairs of images estereoscópicas obtained by metric and not metric aerial cameras. The program was developed in the program language C++ and the library was used OpenGL. The result of the program is a three-dimensional image from where it can be extracted height quotas and land forms. These images can be used in the study of risk areas on slopes.

Page generated in 0.114 seconds