Global ETD Search

61	Sistema de visão computacional aplicado a um robô cilíndrico acionado pneumaticamente Medina, Betânia Vargas Oliveira January 2015 (has links) O reconhecimento da posição e orientação de objetos em uma imagem é importante para diversos segmentos da engenharia, como robótica, automação industrial e processos de fabricação, permitindo às linhas de produção que utilizam sistemas de visão, melhorias na qualidade e redução do tempo de produção. O presente trabalho consiste na elaboração de um sistema de visão computacional para um robô cilíndrico de cinco graus de liberdade acionado pneumaticamente. Como resultado da aplicação do método desenvolvido, obtêm-se a posição e orientação de peças a fim de que as mesmas possam ser capturadas corretamente pelo robô. Para a obtenção da posição e orientação das peças, utilizou-se o método de cálculo dos momentos para extração de características de uma imagem, além da relação entre suas coordenadas em pixels com o sistema de coordenadas do robô. O desenvolvimento do presente trabalho visou também a integrar a esse sistema de visão computacional, um algoritmo de planejamento de trajetórias do robô, o qual, após receber os valores das coordenadas necessárias, gera a trajetória a ser seguida pelo robô, de forma que este possa pegar a peça em uma determinada posição e deslocá-la até outra posição pré-determinada. Também faz parte do escopo deste trabalho, a integração do sistema de visão, incluindo o planejamento de trajetórias, a um algoritmo de controle dos atuadores com compensação de atrito e a realização de testes experimentais com manipulação de peças. Para a demonstração da aplicação do método através de testes experimentais, foi montada uma estrutura para suportar as câmeras e as peças a serem manipuladas, levando em conta o espaço de trabalho do robô. Os resultados obtidos mostram que o algoritmo proposto de visão computacional determina a posição e orientação das peças permitindo ao robô a captação e manipulação das mesmas. / The recognition of the position and orientation of objects in an image is important for several technological areas in engineering, such as robotics, industrial automation and manufacturing processes, allowing production lines using vision systems, improvements in quality and reduction in production time. The present work consists of the development of a computer vision system for a pneumatically actuated cylindrical robot with five degrees of freedom. The application of the proposed method furnishes the position and orientation of pieces in a way that the robot could properly capture them. Position and orientation of the pieces are determined by means of a technique based on the method of calculating the moments for an image feature extraction and the relationship between their pixels coordinates with the robot coordinate system. The scope of the present work also comprises the integration of the computer vision system with a (previously developed) robot trajectory planning algorithm that use key-point coordinates (transmitted by the vision system) to generate the trajectory that must be followed by the robot, so that, departing from a given position, it moves suitably to another predetermined position. It is also object of this work, the integration of both vision system and trajectory planning algorithm with a (also previously developed) nonlinear control algorithm with friction compensation. Aiming at to demonstrate experimentally the application of the method, a special apparatus was mounted to support cameras and the pieces to be manipulated, taking into account the robot workspace. To validate the proposed algorithm, a case study was performed, with the results showing that the proposed computer vision algorithm determines the position and orientation of the pieces allowing the robot to capture and manipulation thereof. Robótica Manipuladores robóticos Controle automático Visao computacional Computer vision Image moments Pneumatic robot Pick-and-place trajectories generation Robot trajectory planning
62	Segmentação de movimento coerente aplicada à codificação de vídeos baseada em objetos Silva, Luciano Silva da January 2011 (has links) A variedade de dispositivos eletrônicos capazes de gravar e reproduzir vídeos digitais vem crescendo rapidamente, aumentando com isso a disponibilidade deste tipo de informação nas mais diferentes plataformas. Com isso, se torna cada vez mais importante o desenvolvimento de formas eficientes de armazenamento, transmissão, e acesso a estes dados. Nesse contexto, a codificação de vídeos tem um papel fundamental ao compactar informação, otimizando o uso de recursos aplicados no armazenamento e na transmissão de vídeos digitais. Não obstante, tarefas que envolvem a análise de vídeos, manipulação e busca baseada em conteúdo também se tornam cada vez mais relevantes, formando uma base para diversas aplicações que exploram a riqueza da informação contida em vídeos digitais. Muitas vezes a solução destes problemas passa pela segmentação de vídeos, que consiste da divisão de um vídeo em regiões que apresentam homogeneidade segundo determinadas características, como por exemplo cor, textura, movimento ou algum aspecto semântico. Nesta tese é proposto um novo método para segmentação de vídeos em objetos constituintes com base na coerência de movimento de regiões. O método de segmentação proposto inicialmente identifica as correspondências entre pontos esparsamente amostrados ao longo de diferentes quadros do vídeo. Logo após, agrupa conjuntos de pontos que apresentam trajetórias semelhantes. Finalmente, uma classificação pixel a pixel é obtida a partir destes grupos de pontos amostrados. O método proposto não assume nenhum modelo de câmera ou de movimento global para a cena e/ou objetos, e possibilita que múltiplos objetos sejam identificados, sem que o número de objetos seja conhecido a priori. Para validar o método de segmentação proposto, foi desenvolvida uma abordagem para a codificação de vídeos baseada em objetos. Segundo esta abordagem, o movimento de um objeto é representado através de transformações afins, enquanto a textura e a forma dos objetos são codificadas simultaneamente, de modo progressivo. O método de codificação de vídeos desenvolvido fornece funcionalidades tais como a transmissão progressiva e a escalabilidade a nível de objeto. Resultados experimentais dos métodos de segmentação e codificação de vídeos desenvolvidos são apresentados, e comparados a outros métodos da literatura. Vídeos codificados segundo o método proposto são comparados em termos de PSNR a vídeos codificados pelo software de referência JM H.264/AVC, versão 16.0, mostrando a que distância o método proposto está do estado da arte em termos de eficiência de codificação, ao mesmo tempo que provê funcionalidades da codificação baseada em objetos. O método de segmentação proposto no presente trabalho resultou em duas publicações, uma nos anais do SIBGRAPI de 2007 e outra no períodico IEEE Transactions on Image Processing. / The variety of electronic devices for digital video recording and playback is growing rapidly, thus increasing the availability of such information in many different platforms. So, the development of efficient ways of storing, transmitting and accessing such data becomes increasingly important. In this context, video coding plays a key role in compressing data, optimizing resource usage for storing and transmitting digital video. Nevertheless, tasks involving video analysis, manipulation and content-based search also become increasingly relevant, forming a basis for several applications that exploit the abundance of information in digital video. Often the solution to these problems makes use of video segmentation, which consists of dividing a video into homogeneous regions according to certain characteristics such as color, texture, motion or some semantic aspect. In this thesis, a new method for segmentation of videos in their constituent objects based on motion coherence of regions is proposed. The proposed segmentation method initially identifies the correspondences of sparsely sampled points along different video frames. Then, it performs clustering of point sets that have similar trajectories. Finally, a pixelwise classification is obtained from these sampled point sets. The proposed method does not assume any camera model or global motion model to the scene and/or objects. Still, it allows the identification of multiple objects, without knowing the number of objects a priori. In order to validate the proposed segmentation method, an object-based video coding approach was developed. According to this approach, the motion of an object is represented by affine transformations, while object texture and shape are simultaneously coded, in a progressive way. The developed video coding method yields functionalities such as progressive transmission and object scalability. Experimental results obtained by the proposed segmentation and coding methods are presented, and compared to other methods from the literature. Videos coded by the proposed method are compared in terms of PSNR to videos coded by the reference software JM H.264/AVC, version 16.0, showing the distance of the proposed method from the sate of the art in terms of coding efficiency, while providing functionalities of object-based video coding. The segmentation method proposed in this work resulted in two publications, one in the proceedings of SIBGRAPI 2007 and another in the journal IEEE Transactions on Image Processing. Computação gráfica Visao computacional Processamento : Imagem Video segmentation Motion segmentation Video coding Object-based coding Progressive coding
63	Visualização computacional como apoio à identificação do interesse do aluno em ambientes de EAD Amorim, Maurício José Viana January 2012 (has links) Este estudo apresenta uma investigação de como o uso das técnicas de Visualização Computacional (VC) podem servir no apoio à identificação do interesse do aluno em ambientes de Educação a Distância (EaD). Esta pesquisa se fundamenta nas premissas de que grande parte da comunicação ocorre através da Comunicação Não-Verbal e o estado afetivo de interesse pode ser reconhecido através da visualização interpessoal. Na realização deste trabalho, foi necessária uma revisão da literatura relacionada aos temas Afetividade, especificamente, Estado Afetivo de Interesse, Comportamento Visualizável, Comunicação Não Verbal, Análise de Expressões Faciais, Análise de Gestos e Posturas, Cognição e Técnicas de Sensoriamento Visual. A teoria da Aprendizagem Significativa responde pela concepção epistemológica, metodológica e experimental. Sob sua ótica foram preparados os materiais didáticos que compuseram os experimentos e o objeto de aprendizagem SQLOA. Foram construídos artefatos de software que apoiam a captura dos vídeos dos alunos durante atividades de aprendizagem e que permitiram a realização dos experimentos. Os artefatos desenvolvidos são: um framework, uma ferramenta e um objeto de aprendizagem, assim denominados: WICFramework, QuizWebcamXML e SQLOA. Eles permitem dotar os ambientes de ensino de mecanismos de Visualização Computacional, razão pela qual foram importantes instrumentos para o alcance dos objetivos propostos. Trinta e um alunos, correspondendo a três turmas da disciplina de Administração para Banco de Dados do Curso de Sistema de Informação do Instituto Federal Fluminense, RJ, foram submetidos ao SQLOA e tiveram sua interação capturada em vídeos. A estratégia metodológica compôs-se do levantamento dos Movimentos Corporais Gestuais e Posturais (MCGPs) visualizáveis, e a associação desses aos Estados Afetivos de Interesse e Tédio, testando e definindo os indicadores teóricos que melhor se aplicam a técnicas de VC em ambientes de EaD. A partir da definição dos principais Indicadores de Interesse, construiu-se um Esquema para Identificação do Interesse e um Modelo para Inferência de Interesse, auxiliando profissionais da educação a aplicarem a técnica. / This study presents an investigation on how the use of Computational Visualization (CV) techniques can support the identification of learners’ interest in Virtual Learning Environments (VLEs). The research was based on the premise that communication occurs mostly through non-verbal communication and that the affective state of interest can be identified by interpersonal visualization. For this study, it was necessary to undertake a review of the literature on topics such as Affect, in particular, Affective State of Interest, Visible Behavior, Non-Verbal Communication, Analysis of Facial Expressions, Analysis of Body Gestures and Postures, Cognition, and Visual Sensing Techniques. Principles of the Meaningful Learning Theory were used in the epistemological, methodological and experimental concept of the research theme. This theoretical framework supported the preparation of didactic materials used in the experiments, and the design of the learning object SQLOA. Software artifacts were built to conduct experiments, including video recording of students during learning activities. The following artifacts were developed: a framework (WICFramework), a tool (QuizWebcamXML), and a learning object (SQLOA). Since they can provide VLEs with computational visualization mechanisms, these artifacts were important in reaching the objectives proposed for this study. Thirty-one students, enrolled in the subject Data Bank Management in the Information Systems Course at the Instituto Federal Fluminense, RJ, used SQLOA, and their interaction was captured in videos. The methodological strategy included the observation of Body Gesture and Postural Movements (BGPM), and their association with the Affective States of Interest and Boredom, as well as testing and definition of the theoretical indicators that best support CV techniques in VLEs. Following the definition of the main Indicators of Interest, guidelines were created to assist distance education professionals in the application of such technique. Ensino à distância Comunicação não verbal Interesse Visao computacional Computational vision Affective state Interest Boredom Distance education Non-verbal communication
64	Sistema de visão computacional aplicado a um robô cilíndrico acionado pneumaticamente Medina, Betânia Vargas Oliveira January 2015 (has links) O reconhecimento da posição e orientação de objetos em uma imagem é importante para diversos segmentos da engenharia, como robótica, automação industrial e processos de fabricação, permitindo às linhas de produção que utilizam sistemas de visão, melhorias na qualidade e redução do tempo de produção. O presente trabalho consiste na elaboração de um sistema de visão computacional para um robô cilíndrico de cinco graus de liberdade acionado pneumaticamente. Como resultado da aplicação do método desenvolvido, obtêm-se a posição e orientação de peças a fim de que as mesmas possam ser capturadas corretamente pelo robô. Para a obtenção da posição e orientação das peças, utilizou-se o método de cálculo dos momentos para extração de características de uma imagem, além da relação entre suas coordenadas em pixels com o sistema de coordenadas do robô. O desenvolvimento do presente trabalho visou também a integrar a esse sistema de visão computacional, um algoritmo de planejamento de trajetórias do robô, o qual, após receber os valores das coordenadas necessárias, gera a trajetória a ser seguida pelo robô, de forma que este possa pegar a peça em uma determinada posição e deslocá-la até outra posição pré-determinada. Também faz parte do escopo deste trabalho, a integração do sistema de visão, incluindo o planejamento de trajetórias, a um algoritmo de controle dos atuadores com compensação de atrito e a realização de testes experimentais com manipulação de peças. Para a demonstração da aplicação do método através de testes experimentais, foi montada uma estrutura para suportar as câmeras e as peças a serem manipuladas, levando em conta o espaço de trabalho do robô. Os resultados obtidos mostram que o algoritmo proposto de visão computacional determina a posição e orientação das peças permitindo ao robô a captação e manipulação das mesmas. / The recognition of the position and orientation of objects in an image is important for several technological areas in engineering, such as robotics, industrial automation and manufacturing processes, allowing production lines using vision systems, improvements in quality and reduction in production time. The present work consists of the development of a computer vision system for a pneumatically actuated cylindrical robot with five degrees of freedom. The application of the proposed method furnishes the position and orientation of pieces in a way that the robot could properly capture them. Position and orientation of the pieces are determined by means of a technique based on the method of calculating the moments for an image feature extraction and the relationship between their pixels coordinates with the robot coordinate system. The scope of the present work also comprises the integration of the computer vision system with a (previously developed) robot trajectory planning algorithm that use key-point coordinates (transmitted by the vision system) to generate the trajectory that must be followed by the robot, so that, departing from a given position, it moves suitably to another predetermined position. It is also object of this work, the integration of both vision system and trajectory planning algorithm with a (also previously developed) nonlinear control algorithm with friction compensation. Aiming at to demonstrate experimentally the application of the method, a special apparatus was mounted to support cameras and the pieces to be manipulated, taking into account the robot workspace. To validate the proposed algorithm, a case study was performed, with the results showing that the proposed computer vision algorithm determines the position and orientation of the pieces allowing the robot to capture and manipulation thereof. Robótica Manipuladores robóticos Controle automático Visao computacional Computer vision Image moments Pneumatic robot Pick-and-place trajectories generation Robot trajectory planning
65	Visualização computacional como apoio à identificação do interesse do aluno em ambientes de EAD Amorim, Maurício José Viana January 2012 (has links) Este estudo apresenta uma investigação de como o uso das técnicas de Visualização Computacional (VC) podem servir no apoio à identificação do interesse do aluno em ambientes de Educação a Distância (EaD). Esta pesquisa se fundamenta nas premissas de que grande parte da comunicação ocorre através da Comunicação Não-Verbal e o estado afetivo de interesse pode ser reconhecido através da visualização interpessoal. Na realização deste trabalho, foi necessária uma revisão da literatura relacionada aos temas Afetividade, especificamente, Estado Afetivo de Interesse, Comportamento Visualizável, Comunicação Não Verbal, Análise de Expressões Faciais, Análise de Gestos e Posturas, Cognição e Técnicas de Sensoriamento Visual. A teoria da Aprendizagem Significativa responde pela concepção epistemológica, metodológica e experimental. Sob sua ótica foram preparados os materiais didáticos que compuseram os experimentos e o objeto de aprendizagem SQLOA. Foram construídos artefatos de software que apoiam a captura dos vídeos dos alunos durante atividades de aprendizagem e que permitiram a realização dos experimentos. Os artefatos desenvolvidos são: um framework, uma ferramenta e um objeto de aprendizagem, assim denominados: WICFramework, QuizWebcamXML e SQLOA. Eles permitem dotar os ambientes de ensino de mecanismos de Visualização Computacional, razão pela qual foram importantes instrumentos para o alcance dos objetivos propostos. Trinta e um alunos, correspondendo a três turmas da disciplina de Administração para Banco de Dados do Curso de Sistema de Informação do Instituto Federal Fluminense, RJ, foram submetidos ao SQLOA e tiveram sua interação capturada em vídeos. A estratégia metodológica compôs-se do levantamento dos Movimentos Corporais Gestuais e Posturais (MCGPs) visualizáveis, e a associação desses aos Estados Afetivos de Interesse e Tédio, testando e definindo os indicadores teóricos que melhor se aplicam a técnicas de VC em ambientes de EaD. A partir da definição dos principais Indicadores de Interesse, construiu-se um Esquema para Identificação do Interesse e um Modelo para Inferência de Interesse, auxiliando profissionais da educação a aplicarem a técnica. / This study presents an investigation on how the use of Computational Visualization (CV) techniques can support the identification of learners’ interest in Virtual Learning Environments (VLEs). The research was based on the premise that communication occurs mostly through non-verbal communication and that the affective state of interest can be identified by interpersonal visualization. For this study, it was necessary to undertake a review of the literature on topics such as Affect, in particular, Affective State of Interest, Visible Behavior, Non-Verbal Communication, Analysis of Facial Expressions, Analysis of Body Gestures and Postures, Cognition, and Visual Sensing Techniques. Principles of the Meaningful Learning Theory were used in the epistemological, methodological and experimental concept of the research theme. This theoretical framework supported the preparation of didactic materials used in the experiments, and the design of the learning object SQLOA. Software artifacts were built to conduct experiments, including video recording of students during learning activities. The following artifacts were developed: a framework (WICFramework), a tool (QuizWebcamXML), and a learning object (SQLOA). Since they can provide VLEs with computational visualization mechanisms, these artifacts were important in reaching the objectives proposed for this study. Thirty-one students, enrolled in the subject Data Bank Management in the Information Systems Course at the Instituto Federal Fluminense, RJ, used SQLOA, and their interaction was captured in videos. The methodological strategy included the observation of Body Gesture and Postural Movements (BGPM), and their association with the Affective States of Interest and Boredom, as well as testing and definition of the theoretical indicators that best support CV techniques in VLEs. Following the definition of the main Indicators of Interest, guidelines were created to assist distance education professionals in the application of such technique. Ensino à distância Comunicação não verbal Interesse Visao computacional Computational vision Affective state Interest Boredom Distance education Non-verbal communication
66	Reconhecimento automático de padrões em imagens ecocardiográficas / Automatic pattern recognition in echocardiographic images Siqueira, Mozart Lemos de January 2010 (has links) Ecocardiografia fetal é uma importante ferramenta para diagnóstico. Esta tese apresenta um método que provê localização automática de cavidades cardíacas em imagens ecocardiografias fetais, onde o diagnóstico de problemas congênitos do coração pode melhorar os resultados do tratamento. As estruturas de interesse são as quatro cavidades cardíacas (átrio direito, átrio esquerdo, ventrículo direito e ventrículo esquerdo). O método é baseado na busca por cavidades cardíacas através de uma molde de busca (template) para encontrar padrões de interesse. Este molde é calculado usando uma função densidade probabilidade que recebe como parâmetro os níveis de cinza de uma região representativa da cavidade, na imagem. Além disso, em alguns testes também foram utilizadas características espaciais da imagem para cálculo do molde de busca. Nesse sentido a busca é implementada de uma forma hierárquica: (i) primeiro, é localizada a região do coração; e (ii) em seguida, baseando na região do coração a cavidade de interesse á buscada. A comparação do molde de busca e as regiões de interesse na imagem é feita utilizando o Coeficiente de Bhattacharyya, o qual é analisado ao longo dos testes para justificar sua escolha. Uma das principais características do método é a invariância a rotação apresentada pelas estruturas. / Fetal echocardiography is an important tool for diagnosing. This thesis presents a method to provide automatic localization of cardiac cavities in fetal echocardiography images, where the early diagnostics of heart congenital diseases can greatly improve results from medical treatment. The structures of interest are the four cardiac cavities (left and right atrium, left and right ventricle). The method is based in the search of cardiac structures with a mold to find the pattern of interest. This mold is calculated using a probability density function that receives as parameter the gray level of a representative image and also uses spatial features of the images to calculate the mold. A hierarchical search is performed: (i) first, the region of interest is covered to locate the heart; and (ii) based on the position of the heart, the desired structure is found in the image. The comparison of the mold and the candidate image is made using the Bhattacharyya coefficient, which our experimental tests have shown good results. One of the main characteristics of the method is its rotation invariance. Informática médica Processamento : Imagem Reconhecimento : Padroes Segmentacao : Imagem Visao computacional Medical imaging Feature detection Pattern recognition Fetal cardiology Ultrasound
67	Detecção e contagem de veículos em vídeos de tráfego urbano / Detecting and counting vehicles in urban traffic video Barcellos, Pablo Roberlan Manke January 2014 (has links) Este trabalho apresenta um novo método para o rastreamento e contagem de veículos em vídeos de tráfego urbano. Usando técnicas de processamento de imagens e de agrupamentos de partículas, o método proposto usa coerência de movimento e coerência espacial para agrupar partículas, de modo que cada grupo represente veículos nas sequências de vídeo. Uma máscara contendo os objetos do primeiro plano é criada usando os métodos Gaussian Mixture Model e Motion Energy Images para determinar os locais onde as partículas devem ser geradas, e as regiões convexas dos agrupamentos são então analisadas para verificar se correspondem a um veículo. Esta análise leva em consideração a forma convexa dos grupos de partículas (objetos) e a máscara de foreground para realizar a fusão ou divisão dos agrupamentos obtidos. Depois que um veículo é identificado, ele é rastreado utilizando similaridade de histogramas de cor em janelas centradas nas partículas dos agrupamentos. A contagem de veículos acontece em laços virtuais definidos pelo usuário, através da interseção dos veículos rastreados com os laços virtuais. Testes foram realizados utilizando seis diferentes vídeos de tráfego, em um total de 80000 quadros. Os resultados foram comparados com métodos semelhantes disponíveis na literatura, fornecendo, resultados equivalentes ou superiores. / This work presents a new method for tracking and counting vehicles in traffic videos. Using techniques of image processing and particle clustering, the proposed method uses motion coherence and spatial adjacency to group particles so that each group represents vehicles in the video sequences. A foreground mask is created using Gaussian Mixture Model and Motion Energy Images to determine the locations where the particles must be generated, and the convex shapes of detecting groups are then analyzed for the potential detection of vehicles. This analysis takes into consideration the convex shape of the particle groups (objects) and the foreground mask to merge or split the obtained groupings. After a vehicle is identified, it is tracked using the similarity of color histograms on windows centered at the particle locations. The vehicle count takes place on userdefined virtual loops, through the intersections of tracked vehicles with the virtual loops. Tests were conducted using six different traffic videos, on a total of 80.000 frames. The results were compared with similar methods available in the literature, providing results equivalent or superior. Simulacao : Trafego Visao computacional Informatica : Transportes Vehicle counting Vehicle detection Vehicle tracking Particle clustering Video processing Computer vision
68	[en] PEOPLE COUNTING SYSTEM / [pt] SISTEMA DE CONTAGEM DE PESSOAS PRISCILA MARQUES DIAS 11 October 2005 (has links) [pt] Atualmente, a preocupação com segurança vem crescendo dia após dia. Vários trabalhos abordando o desenvolvimento de sistemas de supervisão já foram realizados. Esta dissertação propõe um método automático capaz de determinar o número de pessoas em uma área monitorada por uma câmera de vídeo, assim como detectar mudanças na imagem potencialmente causadas por atitudes ilícitas. Uma aplicação típica seria a segurança de galpões durante a noite, em finais de semana ou em qualquer momento onde o acesso de pessoas é permitido, mas o movimento de cargas não. Mais precisamente, a intenção é detectar se uma pessoa que está passando pelo ambiente carrega consigo um objeto pertencente ao local ou deixa um objeto no local, quando apenas o movimento de pessoas é admitido na área. Além disto, o sistema determina o número de pessoas na cena. O método consiste na aplicação de quatro etapas em seqüências de vídeo: a) separação de fundo / primeiro plano, b) atualização dinâmica da estimativa de fundo, c) localização / contagem de pessoas, e d) detecção de atitudes suspeitas. Os algoritmos de separação de fundo / primeiro plano e de estimativa de fundo toleram variações pequenas de iluminação e efeitos de sombra. Já a contagem / localização de pessoas explora informações de cor e coerência de movimento. Soluções para atender estes aspectos são encontradas na literatura, porém nenhuma delas atende todos eles juntos. O método foi avaliado por experimentos realizados através de um protótipo e apresentou resultados encorajadores. / [en] There is worldwide an increasing concern about security issues. A great deal of efforts have been undertaken in order to provide surveillance systems. This work proposes an automatic method to determine the number of people moving in an area monitored by a video camera, as well as to detect image changes, which are potentially due to illicit attitudes. A typical application is the security of warehouses during the night, on weekends or at any time when people access is allowed but no load movement is admissible. Specifically it focuses on detecting when a person passing by the environment carries any object belonging to the background away or leaves any object in the background, while only people movement is allowed in the area. Besides it estimates the number of people on scene. The method consists of performing four main tasks on video sequences: a) background and foreground separation, b) background estimative dynamic update, c) people location and counting, and d) suspicious attitudes detection. The proposed background and foreground separation and background estimative update algorithms deal with illumination fluctuation and shade effects. People location and counting explores colour information and motion coherence. Solutions meeting these requirements are proposed in the literature, but no one deals with all of them together. The method has been validated by experiments carried out on a prototype and produced encouraging results. [pt] VISAO COMPUTACIONAL [en] COMPUTER VISION [pt] SISTEMAS DE SEGURANCA E SUPERVISAO [en] SECURITY AND SURVEILLANCE SYSTEMS [pt] CONTAGEM DE PESSOAS [en] PEOPLE COUNTING
69	[en] USE OF ARTIFICIAL NEURAL NETWORKS IN THE RECOGNITION OF BI-DIMENSION IMAGES / [pt] REDES NEURAIS APLICADAS AO RECONHECIMENTO DE IMAGENS BI-DIMENSIONAIS GUY PERELMUTER 05 July 2006 (has links) [pt] Esta dissertação investiga a aplicação de Redes Neurais Artificiais no reconhecimento de imagens bi-dimensionais. O trabalho de tese foi dividido em quatro partes principais: um estudo sobre a importância da Visão Computacional e sobre os benefícios da aplicação das técnicas da Inteligência Computacional na área; um estudo da estrutura dos sistemas de reconhecimento de imagens encontrados na literatura; o desenvolvimento de dois sistemas de reconhecimento de imagens baseados em redes neurais; e o estudo de caso e a análise de desempenho dos sistemas desenvolvidos. A Visão Computacional tem se beneficiado das principais técnicas de Inteligência Computacional (redes neurais, algoritmos genéticos e lógica nebulosa) na implementação de sistemas de reconhecimento de imagens. Neste trabalho estudou-se a aplicação de diversos tipos de redes neurais na classificação de imagens Back-Propagation, Competitivas, RBF e Hierárquicas. Além disso, foi realizado um estudo das áreas de aplicação da Visão Computacional. A estrutura básica utilizada por diversos sistemas de Visão Computacional encontrada na literatura foi analisada. Esta estrutura é tipicamente composta por três módulos principais: um pré-processador, um extrator de características e um classificador. Dois sistemas de reconhecimento de imagens, denominados de XVision e SimpleNet, foram desenvolvidos neste trabalho. O sistema XVision segue a estrutura descrita acima, enquanto que o sistema SimpleNet utiliza a informação da imagem bruta para realizar a classificação. O módulo de pré-processamento do sistema XVision executa uma série de transformações na imagem, extraindo suas características intrínsecas para que seja obtida uma representação da imagem invariante a aspectos como rotação, translação e escalonamento. Este Pré- Processador é baseado em um trabalho previamente realizado no campo de Processamento de Sinais. A etapa de extração de características visa detectar as informações mais relevantes contidas na representação da imagem intrínseca obtida na etapa anterior. Foram investigados extratores baseados em técnicas estatísticas (utilizando o discriminante de Fisher) e em técnicas inteligentes (utilizando algoritmos genéticos). Para o módulo de classificação das imagens foram utilizados diversos tipos de redes neurais artificiais: Back-Propagation, Competitivas, RBFs e Hierárquicas. No sistema SimpleNet, o pré-processamento limita-se à redução das dimensões da imagem a ser classificada. Como os próprios pixels da imagem são utilizados para a classificação, não foi implementado um módulo de extração de características. Na etapa de classificação foram empregadas redes neurais Back- Propagation e Competitivas. O sistema XVision apresentou resultados promissores para dois conjuntos distintos de objetos bi-dimensionais: o primeiro composto por peças mecânicas e o segundo por objetos triviais. As amostras utilizadas nos testes apresentavam características diferentes daquelas com as quais as redes neurais foram treinadas - não apenas com rotações, translações e escalonamentos, mas com diferenças estruturais. O classificador conseguiu taxas de acerto superiores a 83% em ambos os conjuntos de objetos. O sistema SimpleNet também mostrou-se eficiente na diferenciação de imagens semelhantes (cartões telefônicos e radiografias de pulmões), obtendo taxas de acerto superiores a 80%. O desenvolvimento destes sistemas demonstrou a viabilidade da aplicação de redes neurais na classificação de objetos bi- dimensionais. Devido ao grande interesse na utilização de sistemas de Visão em aplicações de tempo real, mediu-se o tempo gasto nos processos de reconhecimento. Desta forma foram detectados os garagalos dos sistemas, facilitando assim sua otimização. / [en] This work investigates the use of Artificial Neural Networks in the recognition of bi-dimensional images. The work was divided in four main parts: a survey on the importance of Computational Vision and on the benefits of the application of intelligent techniques in the fiels; a survey on the structure of image recognition systems found in the literature; the development of two image recognition systems based on neural networks; and an analysis of the performance of the developed systems. Computational Vision has benefited from the main Computational Intelligence techniques (neural networks, genetic algoritms and fuzzy logic) to implement image recognition systems. In this work, the usage of different Kinds of neural networks in image classification was studied: Back-Propagation, Competitive, RBF and Hierarchical. Besiades that, a survey on the fields of application of Computational Vision was made. The basic structure is typically composed of three modules: a pre-processor, a characteristics extractor and a classifier. In this work, two image recognition systems, called Xvision and SimpleNet, were developed. The XVision system follows the structure described above, while the SimpleNet system performs the classification using the information present in the raw picture. The pre-processing module of the Xvision system executes a series of transforms over the image, extracting its essential characteristics so that an invariant representation of the image can be obtained. This pre- processor is based on a previous work in the fiels of Signal Processing. The characteristcs extractor aims to detect the most relevant information present in the image representation obtained after the previous step. Two kinds of extractors were investigated: one based on statistical tecniques (applyng the Fisher`s discriminant) and another based on intelligent techniques (applyng genetic algorithms). The classification module was implementede through several Kinds of neural networks: Back-Propagation, Competitive, RBF and Hierarchical. The pre-processing of the SimpleNet system simply reduces the image`s dimensions. Since the image`s pixels are used for the classification process, no characteristics extractor module was implemented. In the classification module, Back-Propagation and Competitive neural networks were employed. The Xvision system yielded promising results for two sets of objects: the first one composed of mechanical parts and the second one composed of trivial objects. The samples used during the tests presented different characteristics from those samples used during the training process - not only rotated, translated and scaled, but also with structural differences. The classifier obtained a hit ratio above 83% with both sets. The SimpleNet system also showed a good performance in the differentiation of similar objects (telephone cards and X-rays of lungs), achieving hit ratios of more than 80%. The development of both systems demonstrated the viability of the use of neural networks in the classification of bi- dimensional objects. Due to the interest of applying Vision systems in real-time, the time spent in the recognition process was measured. This allowed the detection of the systems` bottlenecks, making their optimization easier. [pt] REDES NEURAIS [en] NEURAL NETWORKS [pt] VISAO COMPUTACIONAL [en] COMPUTER VISION [pt] INTELIGENCIA COMPUTACIONAL [en] COMPUTATIONAL INTELLIGENCE [pt] RECONHECIMENTO DE IMAGENS [en] RECOGNITION OF IMAGES
70	[en] MAKE OR BUY: ANALYSIS UNDER THE PERSPECTIVE OF TRANSACTION COSTS ECONOMICS AND RESOURCE BASED VIEW THEORIES / [pt] FAZER OU COMPRAR: UMA ANÁLISE SOB A PERSPECTIVA DAS TEORIAS DA ECONOMIA DOS CUSTOS DE TRANSAÇÃO E DA VISÃO BASEADA NOS RECURSOS LINCOLN WOLF DE ALMEIDA NEVES 20 April 2010 (has links) [pt] As firmas enfrentam hoje um cenário altamente volátil e competitivo e muito mais complexo que 10 ou 20 anos atrás. Para enfrentar este cenário, as firmas têm usado a terceirização de atividades da sua cadeia de valores para reduzir custos, melhorar o desempenho e manter o foco nas atividades que propiciam vantagens competitivas. As teorias da Economia dos Custos de Transação (TCE) e Visão Baseada em Recursos (RBV) têm sido usadas nos estudos sobre fazer ou comprar (terceirização). Na TCE, o foco da questão são as transações internas da firma e desta com o mercado, analisando as dimensões de risco, ativos idiossincráticos e freqüência de trocas. Na RBV, o centro da questão está associado aos recursos que compõem a firma, analisando os atributos desses em relação à vantagem competitiva e desempenho comparado com o mercado. O objetivo central desta tese é compreender o porquê das firmas terceirizarem atividades da sua cadeia de valores. Para este fim, uma extensa revisão das teorias TCE e RBV foi feita, com o foco de aprofundar a compreensão das questões relacionadas com a terceirização. A pesquisa examina o entendimento de seis firmas da indústria de café solúvel em relação aos fundamentos dos processos de terceirização. A pesquisa foi qualitativa, através de múltiplos estudos de casos, onde entrevistas com altos executivos das firmas foram realizadas para elucidar e avaliar os casos. A indústria de café solúvel foi escolhida pela disponibilidade de acesso aos seus dados e integrantes, bem como pelo uso da terceirização em todas as firmas. Nos casos, buscou-se observar as vantagens competitivas particulares, os motivadores e variáveis das terceirizações e quais atividades foram terceirizadas. Na análise dos casos foi encontrado que quanto maior o risco que envolve a transação, maior a tendência das firmas internalizarem atividades. Competências internas fracas aumentam a probabilidade de terceirização, enquanto que quanto maior a possibilidade de vazamento de conhecimento estratégico proprietário, menor a probabilidade de terceirização. Esta tese afirma que as teorias TCE e RBV devem ser usadas de forma conjunta para determinar as fronteiras de uma firma, fundamentando a análise se uma atividade deve ser terceirizada ou mantida internamente. Adicionalmente, este trabalho sustenta que os custos de oportunidade são relevantes para a definição da terceirização de atividades e devem ser comparados aos custos de transação. / [en] Today, firms are submitted to a highly volatile and competitive scenario, far more complex than that of ten or twenty years ago. In order to face this, firms have outsourced some of their value chain activities, in an attempt to reduce costs, enhance performance and focus on activities that result in competitive advantages. Both the Transaction Costs Economics (TCE) and Resource-Based View (RBV) theories have been applied in outsourcing studies. TCE focuses on the firm’s internal transactions and transactions with the market, by evaluating risk dimensions, idiosyncratic assets and frequency of exchanges. The core issue for RBV is related to the firm’s resources; the theory evaluates their attributes in terms of competitive advantage and performance as compared with the market. The fundamental objective here is to understand why firms outsource their value chain activities. A thorough review of the TCE and RBV theories has been performed, aimed at deepening the understanding of outsourcing related issues. The present research assesses how six instant coffee firms perceive the outsourcing process rationale. The survey was qualitative and based on multiple case studies, and high executives of these firms were interviewed for clarification and evaluation of each case. Instant coffee industry was selected due to the availability of information and access to their members, and because all firms are engaged in outsourcing. In these cases, we have attempted to observe the particular competitive advantages, motivating factors and variables of outsourcing, and which activities had been outsourced. Case study analysis has shown that the higher the risk involved in a transaction, the more firms will tend to internalize activities. Weak competences increase the probability of outsourcing, while high risk of leak of strategic proprietary knowledge reduces the probability of outsourcing. This thesis asserts that both TCE and RBV theories shall be used in conjunction in order to determine the frontiers of a firm, and underlie the evaluation of whether an activity should be outsourced or performed internally. Additionally, this paper affirms that opportunity costs are relevant in defining the outsourcing of activities, and ought to be considered and compared with transaction costs. [pt] TERCEIRIZACAO [en] OUTSOURCING [pt] ECONOMIA [en] ECONOMICS [pt] CAFE [en] COFFEE [pt] VISAO BASEADA EM RECURSOS [en] RESOURCE-BASED VIEW

Search results