Global ETD Search

151	Sistema de estabilização de vídeo baseado em acelerômetro, filtragem robusta e algoritmo de busca de três etapas / Video stabilization system based on accelerometer, robust filtering and three-step search algorithm Florêncio, Ayrton Galindo Bernardino 17 September 2015 (has links) Câmeras embarcadas em sistemas robóticos móveis com sensoriamento visual geralmente são afetadas pelo movimento de seu suporte quando é necessária a aquisição de imagens com alta confiabilidade. Algumas câmeras disponíveis no mercado já estão equipadas com sistemas de estabilização de imagens, implementados nas lentes da câmera ou no sensor de imagem. Esses sistemas são relativamente caros para serem instalados em sistemas robóticos móveis aéreos ou terrestres de pequeno porte. Outro conceito que tem sido utilizado para alcançar a estabilização consiste em adotar sensores inerciais, algoritmos de visão computacional e aplicação de filtros digitais para estimativa e suavização de movimento. Esta dissertação tem por finalidade apresentar um sistema de estabilização digital de vídeo em conjunto com um acelerômetro para detectar movimentos da câmera. Considera-se que a câmera está instalada sobre plataforma instável ou em veículo em movimento, assim, utiliza-se filtragem robusta para minimizar o efeito da vibração sobre a câmera. Vários experimentos são realizados adicionando vibração em vídeo por meio de simulações em computador. Considera-se também experimentos em ambiente real com a câmera montada em um suporte dentro de um veículo em movimento. A principal contribuição deste trabalho é a realização de um estudo comparativo para analisar a vantagem de se usar uma abordagem robusta entre os métodos de filtragem comumente utilizados em sistemas de estabilização de vídeo. / Embedded cameras in robotic systems usually are susceptible to movements of your basis. The measurements can be affected mainly when they should obtain high performance in actual applications. Although some cameras available on the market are already equipped with an optical image stabilization system, implemented either in the camera lenses or in the image sensor. They are usually expensive to be installed into small aerial or land robotic systems. This dissertation presents a video stabilization system coupled with an accelerometer for motion detection at an unstable platform. It is embedded in a vehicle. Robust filtering is used to minimize vibration effects on the camera. Several experiments were performed, adding either vibrations via computer simulations and taking images from the camera with the vehicle moving. The main contribution of this work is the accomplishment of a comparative study to analyse the advantages of applying a robust approach among others filtering methods that frequently are used to video stabilizing systems. Computer vision Estimativa de movimento Filtro robusto Inertial sensor Motion estimation Robust filtering Sensor inercial Vibração Vibration Visão computacional
152	Uma abordagem livre de modelo para rastreamento de objetos em seqüências de imagens. / A model-free approach for object tracking in sequences of images. Bem, Rodrigo Andrade de 30 March 2007 (has links) Este trabalho propõe uma abordagem para o rastreamento de objetos observados em seqüências de imagens. O objetivo principal é o desenvolvimento de uma metodologia eficiente, capaz de realizar o rastreamento de um ou mais alvos heterogêneos, usando pouca informação a priori sobre os mesmos. Para alcançar este objetivo é proposta a descrição dos alvos livre de um modelo explícito de forma, através de uma representação baseada em contornos, a qual é interessante pois tem a capacidade de adaptar-se dinamicamente a alvos com formas heterogêneas de modo eficaz. Além disso, é usado um modelo de movimento único e simples, considerando somente translação e mudança de escala quadro a quadro. Este modelo possibilita o tratamento de movimentos suaves e previamente desconhecidos dos alvos. O rastreamento de cada alvo é executado com a combinação de dois Filtros de Kalman: um para estimação do movimento e outro para estimação do contorno. O modelo de observação é baseado em linhas de medida 1D fixadas ao longo do contorno estimado e tem baixo custo computacional. Experimentos foram conduzidos para avaliar a eficácia e eficiência da proposta, utilizando seqüências de imagens controladas e reais. Os resultados mostram que a abordagem proposta é capaz de rastrear alvos distintos (figuras geométricas, pessoas e robôs móveis), executando diferentes movimentos considerando a posição de observação da câmera. Embora haja uma relação crítica entre a variação quadro a quadro do movimento e da forma dos alvos, e o nível de ruído nas imagens, a abordagem é adequada nos casos em que informações detalhadas a respeito do movimento e da forma dos alvos não são disponíveis. / This work proposes an approach to track objects observed in sequences of images. The main objective is the development of an efficient methodology, capable of performing the tracking of one or more heterogeneous targets by using a small amount of a priori information about them. To accomplish this objective we propose a description of the targets free of an explicit shape model. This description is a contour-based representation, which is interesting because it is capable of adapting dynamically to targets that have heterogeneous shapes in an effective way. Besides this, a unique and simple movement model is used, considering only translation and scaling frame by frame. This model allows treating smooth and previously unknown targets movements. The tracking of each target is executed by the combination of two Kalman Filters: one used to estimate movement and another one to estimate contour. The observation model is based on 1D measurement lines fixed along the estimated contour and requires low computational power. Experiments were performed to evaluate the efficacy and the efficiency of the proposal, using controlled and real image sequences. Results show that the proposed approach is capable of tracking distinct targets (geometric figures, human bodies and mobile robots), which execute different movements regarding the observation position of the camera. Despite the critical tradeoff between the frame by frame variation of the targets movements and shapes and the level of noise in the images, the approach showed to be adequate for those cases of application where detailed information about target movement and shape are not available. Artificial intelligence Computer vision Digital image processing Inteligência artificial Processamento digital de imagens Rastreamento visual Visão computacional Visual tracking
153	Segmentação de movimento usando morfologia matemática / Motion segmentation using mathematical morphology Lara, Arnaldo Camara 06 November 2007 (has links) Esta dissertação apresenta um novo método de segmentação de movimento baseado na obtenção dos contornos e em filtros morfológicos. A nova técnica apresenta vantagens em relação ao número de falsos positivos e falsos negativos em situações específicas quando comparada às técnicas tradicionais. / This work presents a novel motion segmentation technique based in contours and in morphological filters. It presents advantages in the number of false positives and false negatives in some situations when compared to the classic techniques.
154	Avaliação biomecânica do mecanismo de lesões associadas à prática do tênis de campo / Biomechanical evaluation of the mechanism of injury associated with the practice of court tennis Bersanetti, Michelli Belotti 24 February 2014 (has links) A repetitividade dos golpes em uma partida de tênis pode sobrecarregar a musculatura do punho e predispor a lesões, como a epicondilite lateral. A presente pesquisa propõe o uso de visão computacional para a obtenção de imagens tridimensionais reconstruídas, valores de forças atuantes em grupos musculares e articulações específicas e posições, velocidades e acelerações. O objetivo deste estudo é propor um método para descrever as características biomecânicas dos movimentos do punho durante a prática do tênis de campo, segundo as técnicas de punho rígido, a partir de parâmetros dinâmicos e cinemáticos, segundo variáveis físicas e antropométricas. Um indivíduo do sexo masculino, que possuí domínio das técnicas analisadas, realizou cinco sequências do movimento forehand em um laboratório de análise do movimento. Foi utilizado um sistema de aquisição de imagens (Qualisys Motion Capture Systems) que permitiu a reconstrução tridimensional dos movimentos dos segmentos. A partir de dados obtidos, através do sistema, verificou-se que os torques encontrados nos três eixos de movimento do punho, correspondentes aos movimentos de pronação, desvio ulnar e flexão de punho, apresentam magnitudes de 1.11 Nm, 3.98 Nm e 7.68 Nm, respectivamente. Verificou-se o maior valor de torque em torno do eixo z (flexão do punho), que será sustentado pela musculatura extensora de punho. A sobrecarga repetitiva dessa musculatura pode desencadear a epicondilite lateral. / The repeatability of the hitting in a tennis match can overload the muscles of the wrist and predispose to injury, such as lateral epicondylitis. This research proposes the use of computer vision for obtaining reconstructed three-dimensional images, active forces values in specific joints and muscle groups and positions, velocities and accelerations. The objective of this study is to propose a method to describe the biomechanical characteristics of the movements of the wrist during the practice of court tennis, using static wrist techniques, from kinematic and dynamic parameters, according to physical and anthropometric variables. A male person, who possess mastery of the techniques analyzed, held five forehand motion sequences in a laboratory analysis of the movement. It was used an image acquisition system (Qualisys Motion Capture Systems) that allowed the three-dimensional reconstruction of the movements of the segments. From the data obtained, through the system, it was found the torques in the three axes of motion of the wrist, corresponding to the movements of pronation, wrist flexion and ulnar deviation, which presented magnitudes of 1.11 Nm, 3.98 Nm and 7.68 Nm, respectively. It was found the greatest value of torque around the z axis (wrist flexion), which will be sustained by the extensor muscle of wrist. Repetitive overload of this muscle can unleash the epicondylitis. Biomecânica Biomechanics Computer vision Court tennis Epicondilite lateral Imaging system Lateral epicondylitis Sistema de imagens Tênis de campo Visão computacional
155	Exploração de ambientes não estruturados através de manipulador robótico implementando controlador de impedância com parâmetros variáveis / Unstructured environment exploration using robotic manipulator performing impedance control with variable parameters Fernandes, Guilherme 16 September 2013 (has links) Manipulação robótica em ambientes não estruturados desafia intensamente a comunidade científica. Grandes esforços tem sido empregados em sistemas de visão computacional culminando em resultados notáveis. Entretanto, a informação obtida de sistemas de visão diversas vezes é incompleta, ruidosa e imprecisa devido a limitações técnicas dos sensores empregados ou devido a posição em que o sensor se encontra em relação ao ambiente. Além disso, pouca atenção tem sido destinada a utilização do tato como informação adicional para enriquecer a percepção do ambiente. Este trabalho apresenta um estudo experimental de exploração do ambiente através de contato estável utilizando controle de impedância aplicado a um manipulador robótico. Um framework de manipulação robótica é apresentado e o trabalho é posicionado neste framework na forma de sub-tarefas do mesmo. A descrição do sistema robótico utilizado assim como o detalhamento da implementação de comunicação e controle dos diversos sub-sistemas que o compõem são apresentadas. O trabalho descreve uma série de ensaios experimentais onde o manipulador executa o contato físico com o ambiente. Nestes ensaios é realizada a modificação dos parâmetros do controlador de impedância do manipulador com o objetivo de analisar a influência dos mesmos no resultado. A análise é feita com relação a estabilidade durante o contato e ao erro de acompanhamento de posição após a perda de contato. Em seguida, uma série de estratégias de alteração dos parâmetros do controlador de impedância durante a execução da tarefas é apresentada juntamente com os resultados experimentais e análises comparativas entre elas e os resultados anteriores. O objetivo destas estratégias é melhorar o desempenho e a estabilidade da tarefa garantindo uma medida precisa e estável da posição do objeto no ambiente. A análise dos resultados obtidos mostra que as estratégias efetivamente melhoram o desempenho do sistema em relação aos parâmetros de análise adotados. Finalmente são apresentados os resultados de um teste de repetibilidade da medição da posição de conjunto através da abordagem apresentada. Estes resultados são comparados com resultados de precisão de sistemas de visão computacional. Este teste suporta a conclusão que confirma a viabilidade do método explorado no trabalho. / Robotic manipulation in unstructured environments is a major challenge to the research community. Great efforts are being directed to computational vision systems development and incredible outcome has been achieved. However, the information retrieved from vision systems is often incomplete, noisy or inaccurate due to technical limitations linked to the sensors used in such systems or the positioning of the system in the environment. Furthermore, few attention is been delivered to the application of tactile information to increase the information quality about the environment. This work presents an experimental study about the environment exploration using stable contact and impedance controlled manipulators. A framework for robotic manipulation is presented and this work is positioned in such framework in a tasks and subtasks style. The detailed information about the manipulator system and the implementation is also outlined including all the control levels and communication layers is also outlined. The work describes a series of experimental tests where the manipulator performs physical contact to the environment. The impedance control parameters are than changed aiming to analyse and determine their influence into the observed results. The contact stability and the following error are used as performance indicators. Following such experimental series, four impedance control parameter change strategies are proposed, tested and analysed when performing a task of touching the environment. The results are also compared to the results obtained from the fix parameter tests. The strategies objective is improve the contact stability ensuring a accurate measurement of the environment position. The results show a real improvement of the environment position measurement towards the same measurement when using fixed impedance control parameters. Finally, results from a repeatability test for the results of environment position measurement using the best approach proposed where presented. Such results are compared from the results achieved from vision systems and show a greater performance for the tactile environment exploration approach. Controle de impedância Environment exploration Exploração de ambiente Impedance control Manipulação robótica Robotic manipulation Tactile exploration Tato Visão computacional
156	Método para classificação de café em grãos por imagens digitais pelo uso de atributos selecionados de morfologia, cor e textura / Method for coffee beans classification through digital images using selected morphological, colour and textural attributes Oyama, Pedro Ivo de Castro 31 July 2014 (has links) A análise da qualidade de grãos é um dos gargalos encontrados na cadeia produtiva do setor cafeeiro, tendo em vista que atualmente é feita de forma manual. Buscando uma solução para o problema, este trabalho apresenta um método baseado em visão computacional e redes neurais artificiais para identificar vinte e uma classes de grãos de café em amostras. No total, 421 atributos de três diferentes naturezas- morfologia, cor e textura- foram reunidos para compor o conjunto de características utilizado pela rede neural. Os atributos morfológicos são: Descritores de Fourier, Descritores Genéricos de Fourier, Momentos de Zernike, elementos do Modelo Autorregressivo e um conjunto de atributos diversos. Após avaliar duas abordagens para os atributos de cor- histogramas de frequências de cor e atributos estatísticos desses histogramas- a segunda foi escolhida e, assim, os atributos de cor adotados foram: média, variância, obliquidade, energia, curtose, entropia e suavidade de histogramas globais de cor, calculados para os espaços de cor RGB, HSV, I1I2I3 e CIELAB. Visando um melhor desempenho, os descritores de Haralick foram modificados para que dois pixels de referência fossem utilizados no cálculo da matriz de coocorrência. A versão modificada dos descritores superou as originais, e assim, seus valores calculados com o espaço de cor I1I2I3 (aquele que apresentou melhor eficácia em testes) foram utilizados como atributos de textura. O conjunto de atributos foi arranjado em cinco subconjuntos, cada um contendo diferentes combinações das distintas naturezas de atributos e sendo associado a uma análise. Para cada subconjunto selecionaram-se os melhores elementos pelas técnicas chi-quadrado, ganho de informação e PCA (Principal Component Analysis). O resultado dessa seleção determinou as entradas para três processos classificatórios, que foram avaliados a fim de se determinar o mais efetivo. Após as avaliações, e sendo determinada a melhor configuração, o processo classificatório escolhido proporcionou a acurácia de 85,08%, superando trabalhos correlatos. / The quality asssessment of beans is one of the bottlenecks found in the production chain of the coffee industry, as nowadays it is done manually. Seeking a solution for the problem, this work presents a method based on computer vision with neural networks to identify twenty-one classes of coffee beans in samples. In total, 421 features of three different types- morphological, colour and textural- were gathered to compose the feature set used by the neural network. The morphological features were Fourier Descriptors, Generic Fourier Descriptors, Zernike Moments, elements from Autoregressive Model and a miscellaneous set. After evaluating two approaches of colour features- colour frequency histograms and statistics from those histograms- the latter was chosen and the colour features comprised the mean, variance, skewness, kurtosis, energy, entropy and smoothness of global histograms calculated for the channels of the RGB, HSV, I1I2I3 and CIELAB colour spaces. Seeking better performance the Haralick features were modified, so two pixels were used as reference in the computation of the Grey Level Co-occurrence Matrix. The modified versions of the features outperformed the original ones and their computations with the I1I2I3 colour space (the one that provided the best results in tests) were used as textural features. The feature set was then rearranged in five intersecting subsets, each one containing different combinations of the feature types and being associated with an analysis. For each subset the best elements were selected using the techniques PCA (Principal Component Analysis), chi-squared and information gain. The resulting selections were used to determine the inputs to three classification processes, which were evaluated in order to select the most effective. After all evaluations, and having determined the best configuration, the selected classification process yielded an overall accuracy of 85.08%, outperforming related works. Classificação de grãos de café Coffee bean classification Computer vision Neural networks Pattern recognition Reconhecimento de padrões Redes neurais Textura Texture Visão computacional
157	Detecção de intrusão utilizando fluxo óptico e histograma de gradientes orientados / Instrusion detection using optical flow and hiatogram of oriented gradients Patruni, Ion Ferreira 25 August 2015 (has links) Made available in DSpace on 2016-12-12T20:22:53Z (GMT). No. of bitstreams: 1 Ion Ferreira Patruni.pdf: 3046553 bytes, checksum: 1979275f844ce748a3f9803c3498ab28 (MD5) Previous issue date: 2015-08-25 / Coordenação de Aperfeiçoamento de Pessoal de Nível Superior / This work is about people detection in surveillance images. This occurs in external environments, where there are transit of both people and cars. The aim is to settle an imaginary line that once overpassed by people an alarm is sent to the CCTV operator. The study is mainly focused in the use of Histograms of Oriented Gradients (HOG) together with analysis of characteristics extracted from vectors fields of Optical Flow (OF) for training of Support Vector Machines (SVM) and subsequent classification. Some experiments are also executed to verify if the order of cascade classifiers based in OF and HOG affects the quality of the final response. This is measured by Receiver Operating Characteristics (ROC) curves plotted from confusion matrixes. Temporal performance of each classifier was measured as well. A new database was created from a parking camera/surveillance system, and the videos were divided into two groups: (1) training and (2) testing for control purposes. The group called testing for control purposes is used to verify if partial results are presenting improvements in comparison to classifications by HOG alone. A third group of images extracted from the Internet related to intrusions situations was selected to compose the effective final test database. The approach used to detect the intrusion event is based on persistence and consistence of individual classifications. That is, involving more than one group of images, varying from 3 to 9 frames until an effective alarm is sent to the CCTV operator. The ROC curves of classifiers OF→HOG and HOG→OF are fully coincident for all tested points. The OF based classifiers are 3 times faster than the HOG based. For the region of interest of classifiers operation used in people detection for surveillance videos, considering intrusion events, that is the lower portions of x axis of ROC curves, the classifier OF→HOG had the best performance. Finally, 6 simulations were done involving final tests database, split by events in different situations to evaluate the proposed approach to detect intrusion events and again the OF→HOG classifier had the best performance. Adding movement information by analysing e classifying data extracted from OF field to distinguish people from car improved alarm generation performance, increasing True Positives and reducing False Positives, when analysing a video sequence. / Este trabalho trata da detecção de pessoas em imagens de vigilância. Esta busca ocorre em ambientes externos, onde há pessoas e carros transitando conjuntamente. O objetivo é estabelecer uma linha imaginária que, quando ultrapassada por pessoas, gere um alarme ao operador de Circuito Fechado de TV (CFTV). O estudo concentra-se principalmente na utilização conjunta de Histogramas de Gradientes Orientados (HOG) e análise de características estatísticas extraídas do campo de vetores de Fluxo Óptico (FO) para treinamento de Máquinas de Vetores Suportes (SVM) e posterior classificação. Foram realizados alguns experimentos para verificar se a ordem de aplicação dos classificadores baseados em análise do FO e HOG interferem na qualidade final da resposta que é mensurada através das curvas de Características Operacionais do Receptor (ROC) traçadas a partir das matrizes de confusão. O desempenho temporal de cada classificador é medido. Foi criada uma base de dados proveniente de uma câmera de estacionamento, separada em dois grupos: (1) treinamento e (2) testes para controle. O segundo grupo é usado para averiguar se os resultados parciais estão apresentando melhora em relação ao uso isolado das características HOG. Um terceiro grupo de imagens, extraídas de imagens da Internet relacionadas com questões de intrusão, foi escolhido para compor os testes finais efetivos. A abordagem utilizada para avaliar o evento intrusão é baseada na persistência e consistência das classificações, ou seja, envolvendo mais de um grupo de imagens, podendo variar de 3 a 9 quadros para se ter uma geração efetiva de alarme que avise um operador de CFTV. As curvas ROC dos classificadores FO→HOG e HOG→FO ficaram sobreposta para todos os pontos testados. Com relação ao desempenho temporal, a utilização do classificador baseado no FO teve desempenho 3 vezes mais rápido que o classificador baseado em HOG. Para região de interesse de operação dos classificadores usados na detecção de pessoas em vídeos de vigilância, levando-se em conta a detecção de eventos de intrusão, que é a região inicial da escala das curvas ROC dos classificadores, o classificador baseado em FO→HOG teve melhor desempenho geral. Por fim, 6 simulações foram realizadas no grupo de vídeos separados por eventos nas mais diferentes situações com o objetivo de se avaliar a abordagem proposta de detecção de eventos de intrusão e o classificador FO→HOG teve o melhor desempenho. A adição da informação do movimento, através da análise e classificação de informações extraídas do campo de fluxo óptico para diferenciar pessoas de carros, trouxe melhorias quando se analisa uma sequência de vídeo, gerando mais alarmes verdadeiro-positivos e reduzindo consideravelmente a geração de alarmes falso-positivos. Detecção de intrusão de pedestres Visão computacional Reconhecimento de padrões Pedestrian intrusion detection Computer vision Pattern recognition
158	Um método para correção automática de cartão de resposta utilizando processamento digital de imagem / A method for automatic correction of multiple-choice tests using digital image processing Pereira, Pedro Henrique 27 April 2018 (has links) Submitted by Pedro Henrique Pereira (pedro.pereirasp@gmail.com) on 2018-06-26T14:21:28Z No. of bitstreams: 1 DissertaçãoPedroHenriquePereira_VersãoFinal.pdf: 4177619 bytes, checksum: 063cd34385c56ed5081e839a845767b5 (MD5) / Approved for entry into archive by Cristina Alexandra de Godoy null (cristina@adm.feis.unesp.br) on 2018-06-26T17:55:12Z (GMT) No. of bitstreams: 1 pereira_ph_me_ilha.pdf: 4177619 bytes, checksum: 063cd34385c56ed5081e839a845767b5 (MD5) / Made available in DSpace on 2018-06-26T17:55:12Z (GMT). No. of bitstreams: 1 pereira_ph_me_ilha.pdf: 4177619 bytes, checksum: 063cd34385c56ed5081e839a845767b5 (MD5) Previous issue date: 2018-04-27 / Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES) / Neste trabalho propõe-se um método que envolve diferentes técnicas de processamento digital de imagem para a correção automática de cartão de respostas utilizados em avaliações de múltipla- escolha, vestibulares, concursos ou processos de seleção. O método tem como base um modelo de referência onde são identificados os seguintes elementos do cartão: campos de marcação das opções, número de opção de cada questão e uma imagem de marcação para identificar as extremidades da folha. No trabalho foi aplicada a técnica de Correlação Cruzada Normalizada para identificação da imagem na extremidade da folha. A Transformada de Hough foi utilizada para identificação das áreas onde se realiza a marcação das opções. Para identificar qual a questão que foi marcada utilizou-se a contagem de pixel. Foram realizados testes com 1.154 gabaritos contendo 40 questões, preenchidos no vestibular de uma faculdade particular. O tempo médio para correção de cada cartão foi de 1,39 segundos. A precisão do método foi avaliada utilizando-se 5% dos cartões digitalizados e processados. Basicamente, a avaliação foi realizada conferindo-se visualmente cada cartão e comparando os resultados com os gerados pela correção automática. O índice de acerto com as amostras utilizadas foi de 100%, o que comprova a eficiência do método proposto. / This work proposes a method that involves different techniques of digital image processing for automatic correction of card responses used in multiple-choice evaluations, “vestibular”, contests or selection processes. The method is based on a reference model where the following elements of the card are identified: marking fields of the options, the option number of each question and a marking image to identify the edges of the sheet. In this work, the Normalized Cross-Correlation technique was applied to identify the image at the leaf end. The Hough Transform was used to identify the areas where the options are marked. To identify which question was selected, the pixel count was used. We performed tests with 1.154 templates containing 40 questions that were completed in the entrance examination of a private college. The average time to correct each card was 1.39 seconds. Samples were collected on 5% of the scanned and processed cards by the method to verify their accuracy. The total sampled was visually checked with the results presented by the application of the method and it was verified the percentage of 100% of correct answers in the reading of the markings. / CAPES: 515/2017 Visão computacional Correlação cruzada normalizada Transformada de Hough Reading template Reading template Computer vision Standardized cross-correlation Hough transformation
159	Atenção visual bottom-up guiada por otimização via algoritmos genéticos. / Attention-oriented bottom-up visual optimization via genetic algorithms. PEREIRA, Eanes Torres. 31 July 2018 (has links) Submitted by Johnny Rodrigues (johnnyrodrigues@ufcg.edu.br) on 2018-07-31T14:31:59Z No. of bitstreams: 1 EANES TORRES PEREIRA - DISSERTAÇÃO PPGCC 2007..pdf: 4422108 bytes, checksum: 9b27a661074ca88e823ffb0472a68502 (MD5) / Made available in DSpace on 2018-07-31T14:31:59Z (GMT). No. of bitstreams: 1 EANES TORRES PEREIRA - DISSERTAÇÃO PPGCC 2007..pdf: 4422108 bytes, checksum: 9b27a661074ca88e823ffb0472a68502 (MD5) Previous issue date: 2007-03 / A atenção visual é um mecanismo biologicamente inspirado, o qual corresponde à habilidade de selecionar e processar somente as regiões mais relevantes de uma cena visual. Para ﬁns didáticos, a atenção visual pode ser dividida em duas categorias principais: bottom-up e top-down. A atenção visual bottom-up guia o foco de atenção a partir de características primitivas (como descontinuidades de intensidade em diferentes escalas e orientações) computadas diretamente na imagem,sem qualquer informação contextual. A atenção visual top-down, por outro lado, realiza uma busca por regiões de interesse a partir de características de alto nível, especiﬁcadas na forma de conhecimento prévio na forma ou modelos sobre o que se está buscando na cena. A principal questão de pesquisa que procuramos responder nessa dissertação é a seguinte: como seria possível agregar algum comportamento de alto nível a um mecanismo típico de atenção visual bottom-up (guiando dessa forma o foco de atenção para classes de regiões pré-estabelecidas)? O modelo mais conhecido de atenção visual bottom-up utiliza vários mapas de características primitivas para formar um mapa de saliência, o qual indica a importância do ponto de vista atencional das diferentes regiões de uma cena. Nesse trabalho, atribuímos pesos aos mapas de características e desenvolvemos um processo de otimização baseado em algoritmos genéticos simulados em uma grade computacional. Foram realizados experimentos com quatro classes de objetos (carros, faces de pessoas, objetos genéricos e pistolas). Os resultados utilizando atenção bottom-up com otimização foram comparados com os resultados de um mecanismo sem otimização de pesos e com um sistema existente que implementa o difundido modelo de atenção visual proposto por Itti et al. [Itti et al., 1998]. Os resultados mostraram ganhos de até 30% utilizando-se a abordagem proposta. Desta forma, este trabalho mostra que a atenção visual pode ser guiada para regiões pré-deﬁnidas, podendo ser utilizada como parte de sistemas de detecção de objetos. / Visual attention is a biologically inspired mechanism, which corresponds to the ability of selecting and processing only the most relevant regions of a visual scene. For didactic purposes, visual attention can be divided into two main categories: bottom-up and top down. Bottom-up visual attention guides the attention focus by using primitive visual features (such as discontinuities in intensity across different scales and orientations) computed directly from the input image,without the need of any context information. Top-down visual attention, on the other side, performs a search for interest regions from higher-level features, speciﬁed in the form of previous knowledge or models about what is being sought in the scene. Themain research question that we intended to answer in this dissertation was the following: how it would be possible to incorporate some higher-level be haviour into a typical bottom-up visual attention mechanism (thus guiding the attention focus to pre-established classes of objects)? The most known bottom-up visual attention model uses several primitive feature maps to form a saliency map, which indicates the importance of the different scene regions. In this work, we assigned weights to the feature maps and developed an optimization process based on genetic algorithms running on a computational grid. Experiments involving four object classes (cars, human faces, generic objects and pistols)have been performed. The results of the optimized bottom-up mechanism have been compared with the results of a mechanism not using optimized weights and with an existing system that implemented the well known visual attention mechanism proposed by Itti et al. [Itti et al., 1998]. The results have shown an improvement of up to 30% when using the optimized mechanism. Thus,this work shows that visual attention can indeed be guided towards pre-deﬁned regions and can be used as part of object detection systems. Ciência da Computação. Visão computacional Atenção visual bottom-up Algoritmos genéticos Grades computacionais Modelo de Itti - atenção visual Visual attention bottom-up
160	Estimativa do número de frutos verdes em laranjeiras com o uso de imagens digitais / Estimation of the number of green fruits in orange trees using digital images Maldonado Júnior, Walter [UNESP] 22 February 2016 (has links) Submitted by WALTER MALDONADO JÚNIOR null (walter@rainformatica.com.br) on 2016-03-29T21:27:14Z No. of bitstreams: 1 principal.pdf: 75187969 bytes, checksum: ed5b4271338552ed5f58e72f73d7073d (MD5) / Approved for entry into archive by Ana Paula Grisoto (grisotoana@reitoria.unesp.br) on 2016-03-30T11:37:55Z (GMT) No. of bitstreams: 1 maldonadojunior_w_dr_jabo.pdf: 75187969 bytes, checksum: ed5b4271338552ed5f58e72f73d7073d (MD5) / Made available in DSpace on 2016-03-30T11:37:55Z (GMT). No. of bitstreams: 1 maldonadojunior_w_dr_jabo.pdf: 75187969 bytes, checksum: ed5b4271338552ed5f58e72f73d7073d (MD5) Previous issue date: 2016-02-22 / Conselho Nacional de Desenvolvimento Científico e Tecnológico (CNPq) / A estimativa da produtividade é um fator importante no planejamento de um processo produtivo. No caso dos citros, pode colaborar com o gerenciamento do processo industrial e servir como orientação para os produtores, apresentando papel decisivo no mercado do produto e no manejo de tratos culturais. Vários estudos de técnicas para estimativa da produção da cultura vêm sendo realizados mas ainda apresentando limitações. Devido à correlação entre o número de frutos visíveis na imagem de uma planta e o número real de frutos na mesma já apontada em estudos anteriores, foi desenvolvido um método de amostragem automático e não-destrutivo, por meio da extração das características de frutos verdes em imagens digitais. Utilizou-se uma combinação das técnicas de conversão do modelo de cores, limiarização, equalização do histograma de níveis de cinza, filtragem espacial com os operadores de Laplace e Sobel e suavização gaussiana. Além disso, foi desenvolvido e testado um algoritmo para o reconhecimento e contagem dos frutos nessas imagens, com taxas de detecção de falso-positivos de 3\% em imagens de boa qualidade. É possível se estimar a média do número de frutos visíveis por planta com um erro tolerado de 5\% com até 46 imagens e em aproximadamente 8 minutos, sem nenhuma interação humana. A ausência de flash e a incidência de luz solar direta sobre a planta podem prejudicar consideravelmente o desempenho do algoritmo. / Yield estimation is an important factor in a production process planning. In the case of citrus orchards, can be useful for processing plants management and as guidance for farmers, showing a decisive role in the product market strategies and cultivation practices. Several techniques are being studied for estimating citrus crop yield, but still presenting significant limitations. On the basis of the known correlation between the number of visible fruits in a digital image and the total of fruits present in an orange tree, an automatic and non-destructive method for green fruit feature extraction was developed with a combination of the techniques of color model conversion, thresholding, histogram equalization, spatial filtering with Laplace and Sobel operators and gaussian blur. In addition, we built and tested an algorithm to recognize and count the fruits, with detection rates of false-positives of 3\% for images acquired in good conditions. It is possible to estimate the mean number of visible fruits in the trees within a tolerated error of 5\% with up to 46 images and taking approximately 8 minutes without any human interaction. The absence of flash light or the direct incidence of solar light on the plant can significantly detract the algorithm results. / CNPq: 140600/2013-2 Laranja Previsão de safra Visão computacional Agricultura de precisão Detecção de frutos Orange Yield estimation Computer vision Precision agriculture Fruit detection

Search results