61 |
Sistema de visão computacional aplicado a um robô cilíndrico acionado pneumaticamenteMedina, Betânia Vargas Oliveira January 2015 (has links)
O reconhecimento da posição e orientação de objetos em uma imagem é importante para diversos segmentos da engenharia, como robótica, automação industrial e processos de fabricação, permitindo às linhas de produção que utilizam sistemas de visão, melhorias na qualidade e redução do tempo de produção. O presente trabalho consiste na elaboração de um sistema de visão computacional para um robô cilíndrico de cinco graus de liberdade acionado pneumaticamente. Como resultado da aplicação do método desenvolvido, obtêm-se a posição e orientação de peças a fim de que as mesmas possam ser capturadas corretamente pelo robô. Para a obtenção da posição e orientação das peças, utilizou-se o método de cálculo dos momentos para extração de características de uma imagem, além da relação entre suas coordenadas em pixels com o sistema de coordenadas do robô. O desenvolvimento do presente trabalho visou também a integrar a esse sistema de visão computacional, um algoritmo de planejamento de trajetórias do robô, o qual, após receber os valores das coordenadas necessárias, gera a trajetória a ser seguida pelo robô, de forma que este possa pegar a peça em uma determinada posição e deslocá-la até outra posição pré-determinada. Também faz parte do escopo deste trabalho, a integração do sistema de visão, incluindo o planejamento de trajetórias, a um algoritmo de controle dos atuadores com compensação de atrito e a realização de testes experimentais com manipulação de peças. Para a demonstração da aplicação do método através de testes experimentais, foi montada uma estrutura para suportar as câmeras e as peças a serem manipuladas, levando em conta o espaço de trabalho do robô. Os resultados obtidos mostram que o algoritmo proposto de visão computacional determina a posição e orientação das peças permitindo ao robô a captação e manipulação das mesmas. / The recognition of the position and orientation of objects in an image is important for several technological areas in engineering, such as robotics, industrial automation and manufacturing processes, allowing production lines using vision systems, improvements in quality and reduction in production time. The present work consists of the development of a computer vision system for a pneumatically actuated cylindrical robot with five degrees of freedom. The application of the proposed method furnishes the position and orientation of pieces in a way that the robot could properly capture them. Position and orientation of the pieces are determined by means of a technique based on the method of calculating the moments for an image feature extraction and the relationship between their pixels coordinates with the robot coordinate system. The scope of the present work also comprises the integration of the computer vision system with a (previously developed) robot trajectory planning algorithm that use key-point coordinates (transmitted by the vision system) to generate the trajectory that must be followed by the robot, so that, departing from a given position, it moves suitably to another predetermined position. It is also object of this work, the integration of both vision system and trajectory planning algorithm with a (also previously developed) nonlinear control algorithm with friction compensation. Aiming at to demonstrate experimentally the application of the method, a special apparatus was mounted to support cameras and the pieces to be manipulated, taking into account the robot workspace. To validate the proposed algorithm, a case study was performed, with the results showing that the proposed computer vision algorithm determines the position and orientation of the pieces allowing the robot to capture and manipulation thereof.
|
62 |
Segmentação de movimento coerente aplicada à codificação de vídeos baseada em objetosSilva, Luciano Silva da January 2011 (has links)
A variedade de dispositivos eletrônicos capazes de gravar e reproduzir vídeos digitais vem crescendo rapidamente, aumentando com isso a disponibilidade deste tipo de informação nas mais diferentes plataformas. Com isso, se torna cada vez mais importante o desenvolvimento de formas eficientes de armazenamento, transmissão, e acesso a estes dados. Nesse contexto, a codificação de vídeos tem um papel fundamental ao compactar informação, otimizando o uso de recursos aplicados no armazenamento e na transmissão de vídeos digitais. Não obstante, tarefas que envolvem a análise de vídeos, manipulação e busca baseada em conteúdo também se tornam cada vez mais relevantes, formando uma base para diversas aplicações que exploram a riqueza da informação contida em vídeos digitais. Muitas vezes a solução destes problemas passa pela segmentação de vídeos, que consiste da divisão de um vídeo em regiões que apresentam homogeneidade segundo determinadas características, como por exemplo cor, textura, movimento ou algum aspecto semântico. Nesta tese é proposto um novo método para segmentação de vídeos em objetos constituintes com base na coerência de movimento de regiões. O método de segmentação proposto inicialmente identifica as correspondências entre pontos esparsamente amostrados ao longo de diferentes quadros do vídeo. Logo após, agrupa conjuntos de pontos que apresentam trajetórias semelhantes. Finalmente, uma classificação pixel a pixel é obtida a partir destes grupos de pontos amostrados. O método proposto não assume nenhum modelo de câmera ou de movimento global para a cena e/ou objetos, e possibilita que múltiplos objetos sejam identificados, sem que o número de objetos seja conhecido a priori. Para validar o método de segmentação proposto, foi desenvolvida uma abordagem para a codificação de vídeos baseada em objetos. Segundo esta abordagem, o movimento de um objeto é representado através de transformações afins, enquanto a textura e a forma dos objetos são codificadas simultaneamente, de modo progressivo. O método de codificação de vídeos desenvolvido fornece funcionalidades tais como a transmissão progressiva e a escalabilidade a nível de objeto. Resultados experimentais dos métodos de segmentação e codificação de vídeos desenvolvidos são apresentados, e comparados a outros métodos da literatura. Vídeos codificados segundo o método proposto são comparados em termos de PSNR a vídeos codificados pelo software de referência JM H.264/AVC, versão 16.0, mostrando a que distância o método proposto está do estado da arte em termos de eficiência de codificação, ao mesmo tempo que provê funcionalidades da codificação baseada em objetos. O método de segmentação proposto no presente trabalho resultou em duas publicações, uma nos anais do SIBGRAPI de 2007 e outra no períodico IEEE Transactions on Image Processing. / The variety of electronic devices for digital video recording and playback is growing rapidly, thus increasing the availability of such information in many different platforms. So, the development of efficient ways of storing, transmitting and accessing such data becomes increasingly important. In this context, video coding plays a key role in compressing data, optimizing resource usage for storing and transmitting digital video. Nevertheless, tasks involving video analysis, manipulation and content-based search also become increasingly relevant, forming a basis for several applications that exploit the abundance of information in digital video. Often the solution to these problems makes use of video segmentation, which consists of dividing a video into homogeneous regions according to certain characteristics such as color, texture, motion or some semantic aspect. In this thesis, a new method for segmentation of videos in their constituent objects based on motion coherence of regions is proposed. The proposed segmentation method initially identifies the correspondences of sparsely sampled points along different video frames. Then, it performs clustering of point sets that have similar trajectories. Finally, a pixelwise classification is obtained from these sampled point sets. The proposed method does not assume any camera model or global motion model to the scene and/or objects. Still, it allows the identification of multiple objects, without knowing the number of objects a priori. In order to validate the proposed segmentation method, an object-based video coding approach was developed. According to this approach, the motion of an object is represented by affine transformations, while object texture and shape are simultaneously coded, in a progressive way. The developed video coding method yields functionalities such as progressive transmission and object scalability. Experimental results obtained by the proposed segmentation and coding methods are presented, and compared to other methods from the literature. Videos coded by the proposed method are compared in terms of PSNR to videos coded by the reference software JM H.264/AVC, version 16.0, showing the distance of the proposed method from the sate of the art in terms of coding efficiency, while providing functionalities of object-based video coding. The segmentation method proposed in this work resulted in two publications, one in the proceedings of SIBGRAPI 2007 and another in the journal IEEE Transactions on Image Processing.
|
63 |
Visualização computacional como apoio à identificação do interesse do aluno em ambientes de EADAmorim, Maurício José Viana January 2012 (has links)
Este estudo apresenta uma investigação de como o uso das técnicas de Visualização Computacional (VC) podem servir no apoio à identificação do interesse do aluno em ambientes de Educação a Distância (EaD). Esta pesquisa se fundamenta nas premissas de que grande parte da comunicação ocorre através da Comunicação Não-Verbal e o estado afetivo de interesse pode ser reconhecido através da visualização interpessoal. Na realização deste trabalho, foi necessária uma revisão da literatura relacionada aos temas Afetividade, especificamente, Estado Afetivo de Interesse, Comportamento Visualizável, Comunicação Não Verbal, Análise de Expressões Faciais, Análise de Gestos e Posturas, Cognição e Técnicas de Sensoriamento Visual. A teoria da Aprendizagem Significativa responde pela concepção epistemológica, metodológica e experimental. Sob sua ótica foram preparados os materiais didáticos que compuseram os experimentos e o objeto de aprendizagem SQLOA. Foram construídos artefatos de software que apoiam a captura dos vídeos dos alunos durante atividades de aprendizagem e que permitiram a realização dos experimentos. Os artefatos desenvolvidos são: um framework, uma ferramenta e um objeto de aprendizagem, assim denominados: WICFramework, QuizWebcamXML e SQLOA. Eles permitem dotar os ambientes de ensino de mecanismos de Visualização Computacional, razão pela qual foram importantes instrumentos para o alcance dos objetivos propostos. Trinta e um alunos, correspondendo a três turmas da disciplina de Administração para Banco de Dados do Curso de Sistema de Informação do Instituto Federal Fluminense, RJ, foram submetidos ao SQLOA e tiveram sua interação capturada em vídeos. A estratégia metodológica compôs-se do levantamento dos Movimentos Corporais Gestuais e Posturais (MCGPs) visualizáveis, e a associação desses aos Estados Afetivos de Interesse e Tédio, testando e definindo os indicadores teóricos que melhor se aplicam a técnicas de VC em ambientes de EaD. A partir da definição dos principais Indicadores de Interesse, construiu-se um Esquema para Identificação do Interesse e um Modelo para Inferência de Interesse, auxiliando profissionais da educação a aplicarem a técnica. / This study presents an investigation on how the use of Computational Visualization (CV) techniques can support the identification of learners’ interest in Virtual Learning Environments (VLEs). The research was based on the premise that communication occurs mostly through non-verbal communication and that the affective state of interest can be identified by interpersonal visualization. For this study, it was necessary to undertake a review of the literature on topics such as Affect, in particular, Affective State of Interest, Visible Behavior, Non-Verbal Communication, Analysis of Facial Expressions, Analysis of Body Gestures and Postures, Cognition, and Visual Sensing Techniques. Principles of the Meaningful Learning Theory were used in the epistemological, methodological and experimental concept of the research theme. This theoretical framework supported the preparation of didactic materials used in the experiments, and the design of the learning object SQLOA. Software artifacts were built to conduct experiments, including video recording of students during learning activities. The following artifacts were developed: a framework (WICFramework), a tool (QuizWebcamXML), and a learning object (SQLOA). Since they can provide VLEs with computational visualization mechanisms, these artifacts were important in reaching the objectives proposed for this study. Thirty-one students, enrolled in the subject Data Bank Management in the Information Systems Course at the Instituto Federal Fluminense, RJ, used SQLOA, and their interaction was captured in videos. The methodological strategy included the observation of Body Gesture and Postural Movements (BGPM), and their association with the Affective States of Interest and Boredom, as well as testing and definition of the theoretical indicators that best support CV techniques in VLEs. Following the definition of the main Indicators of Interest, guidelines were created to assist distance education professionals in the application of such technique.
|
64 |
Sistema de visão computacional aplicado a um robô cilíndrico acionado pneumaticamenteMedina, Betânia Vargas Oliveira January 2015 (has links)
O reconhecimento da posição e orientação de objetos em uma imagem é importante para diversos segmentos da engenharia, como robótica, automação industrial e processos de fabricação, permitindo às linhas de produção que utilizam sistemas de visão, melhorias na qualidade e redução do tempo de produção. O presente trabalho consiste na elaboração de um sistema de visão computacional para um robô cilíndrico de cinco graus de liberdade acionado pneumaticamente. Como resultado da aplicação do método desenvolvido, obtêm-se a posição e orientação de peças a fim de que as mesmas possam ser capturadas corretamente pelo robô. Para a obtenção da posição e orientação das peças, utilizou-se o método de cálculo dos momentos para extração de características de uma imagem, além da relação entre suas coordenadas em pixels com o sistema de coordenadas do robô. O desenvolvimento do presente trabalho visou também a integrar a esse sistema de visão computacional, um algoritmo de planejamento de trajetórias do robô, o qual, após receber os valores das coordenadas necessárias, gera a trajetória a ser seguida pelo robô, de forma que este possa pegar a peça em uma determinada posição e deslocá-la até outra posição pré-determinada. Também faz parte do escopo deste trabalho, a integração do sistema de visão, incluindo o planejamento de trajetórias, a um algoritmo de controle dos atuadores com compensação de atrito e a realização de testes experimentais com manipulação de peças. Para a demonstração da aplicação do método através de testes experimentais, foi montada uma estrutura para suportar as câmeras e as peças a serem manipuladas, levando em conta o espaço de trabalho do robô. Os resultados obtidos mostram que o algoritmo proposto de visão computacional determina a posição e orientação das peças permitindo ao robô a captação e manipulação das mesmas. / The recognition of the position and orientation of objects in an image is important for several technological areas in engineering, such as robotics, industrial automation and manufacturing processes, allowing production lines using vision systems, improvements in quality and reduction in production time. The present work consists of the development of a computer vision system for a pneumatically actuated cylindrical robot with five degrees of freedom. The application of the proposed method furnishes the position and orientation of pieces in a way that the robot could properly capture them. Position and orientation of the pieces are determined by means of a technique based on the method of calculating the moments for an image feature extraction and the relationship between their pixels coordinates with the robot coordinate system. The scope of the present work also comprises the integration of the computer vision system with a (previously developed) robot trajectory planning algorithm that use key-point coordinates (transmitted by the vision system) to generate the trajectory that must be followed by the robot, so that, departing from a given position, it moves suitably to another predetermined position. It is also object of this work, the integration of both vision system and trajectory planning algorithm with a (also previously developed) nonlinear control algorithm with friction compensation. Aiming at to demonstrate experimentally the application of the method, a special apparatus was mounted to support cameras and the pieces to be manipulated, taking into account the robot workspace. To validate the proposed algorithm, a case study was performed, with the results showing that the proposed computer vision algorithm determines the position and orientation of the pieces allowing the robot to capture and manipulation thereof.
|
65 |
Visualização computacional como apoio à identificação do interesse do aluno em ambientes de EADAmorim, Maurício José Viana January 2012 (has links)
Este estudo apresenta uma investigação de como o uso das técnicas de Visualização Computacional (VC) podem servir no apoio à identificação do interesse do aluno em ambientes de Educação a Distância (EaD). Esta pesquisa se fundamenta nas premissas de que grande parte da comunicação ocorre através da Comunicação Não-Verbal e o estado afetivo de interesse pode ser reconhecido através da visualização interpessoal. Na realização deste trabalho, foi necessária uma revisão da literatura relacionada aos temas Afetividade, especificamente, Estado Afetivo de Interesse, Comportamento Visualizável, Comunicação Não Verbal, Análise de Expressões Faciais, Análise de Gestos e Posturas, Cognição e Técnicas de Sensoriamento Visual. A teoria da Aprendizagem Significativa responde pela concepção epistemológica, metodológica e experimental. Sob sua ótica foram preparados os materiais didáticos que compuseram os experimentos e o objeto de aprendizagem SQLOA. Foram construídos artefatos de software que apoiam a captura dos vídeos dos alunos durante atividades de aprendizagem e que permitiram a realização dos experimentos. Os artefatos desenvolvidos são: um framework, uma ferramenta e um objeto de aprendizagem, assim denominados: WICFramework, QuizWebcamXML e SQLOA. Eles permitem dotar os ambientes de ensino de mecanismos de Visualização Computacional, razão pela qual foram importantes instrumentos para o alcance dos objetivos propostos. Trinta e um alunos, correspondendo a três turmas da disciplina de Administração para Banco de Dados do Curso de Sistema de Informação do Instituto Federal Fluminense, RJ, foram submetidos ao SQLOA e tiveram sua interação capturada em vídeos. A estratégia metodológica compôs-se do levantamento dos Movimentos Corporais Gestuais e Posturais (MCGPs) visualizáveis, e a associação desses aos Estados Afetivos de Interesse e Tédio, testando e definindo os indicadores teóricos que melhor se aplicam a técnicas de VC em ambientes de EaD. A partir da definição dos principais Indicadores de Interesse, construiu-se um Esquema para Identificação do Interesse e um Modelo para Inferência de Interesse, auxiliando profissionais da educação a aplicarem a técnica. / This study presents an investigation on how the use of Computational Visualization (CV) techniques can support the identification of learners’ interest in Virtual Learning Environments (VLEs). The research was based on the premise that communication occurs mostly through non-verbal communication and that the affective state of interest can be identified by interpersonal visualization. For this study, it was necessary to undertake a review of the literature on topics such as Affect, in particular, Affective State of Interest, Visible Behavior, Non-Verbal Communication, Analysis of Facial Expressions, Analysis of Body Gestures and Postures, Cognition, and Visual Sensing Techniques. Principles of the Meaningful Learning Theory were used in the epistemological, methodological and experimental concept of the research theme. This theoretical framework supported the preparation of didactic materials used in the experiments, and the design of the learning object SQLOA. Software artifacts were built to conduct experiments, including video recording of students during learning activities. The following artifacts were developed: a framework (WICFramework), a tool (QuizWebcamXML), and a learning object (SQLOA). Since they can provide VLEs with computational visualization mechanisms, these artifacts were important in reaching the objectives proposed for this study. Thirty-one students, enrolled in the subject Data Bank Management in the Information Systems Course at the Instituto Federal Fluminense, RJ, used SQLOA, and their interaction was captured in videos. The methodological strategy included the observation of Body Gesture and Postural Movements (BGPM), and their association with the Affective States of Interest and Boredom, as well as testing and definition of the theoretical indicators that best support CV techniques in VLEs. Following the definition of the main Indicators of Interest, guidelines were created to assist distance education professionals in the application of such technique.
|
66 |
Reconhecimento automático de padrões em imagens ecocardiográficas / Automatic pattern recognition in echocardiographic imagesSiqueira, Mozart Lemos de January 2010 (has links)
Ecocardiografia fetal é uma importante ferramenta para diagnóstico. Esta tese apresenta um método que provê localização automática de cavidades cardíacas em imagens ecocardiografias fetais, onde o diagnóstico de problemas congênitos do coração pode melhorar os resultados do tratamento. As estruturas de interesse são as quatro cavidades cardíacas (átrio direito, átrio esquerdo, ventrículo direito e ventrículo esquerdo). O método é baseado na busca por cavidades cardíacas através de uma molde de busca (template) para encontrar padrões de interesse. Este molde é calculado usando uma função densidade probabilidade que recebe como parâmetro os níveis de cinza de uma região representativa da cavidade, na imagem. Além disso, em alguns testes também foram utilizadas características espaciais da imagem para cálculo do molde de busca. Nesse sentido a busca é implementada de uma forma hierárquica: (i) primeiro, é localizada a região do coração; e (ii) em seguida, baseando na região do coração a cavidade de interesse á buscada. A comparação do molde de busca e as regiões de interesse na imagem é feita utilizando o Coeficiente de Bhattacharyya, o qual é analisado ao longo dos testes para justificar sua escolha. Uma das principais características do método é a invariância a rotação apresentada pelas estruturas. / Fetal echocardiography is an important tool for diagnosing. This thesis presents a method to provide automatic localization of cardiac cavities in fetal echocardiography images, where the early diagnostics of heart congenital diseases can greatly improve results from medical treatment. The structures of interest are the four cardiac cavities (left and right atrium, left and right ventricle). The method is based in the search of cardiac structures with a mold to find the pattern of interest. This mold is calculated using a probability density function that receives as parameter the gray level of a representative image and also uses spatial features of the images to calculate the mold. A hierarchical search is performed: (i) first, the region of interest is covered to locate the heart; and (ii) based on the position of the heart, the desired structure is found in the image. The comparison of the mold and the candidate image is made using the Bhattacharyya coefficient, which our experimental tests have shown good results. One of the main characteristics of the method is its rotation invariance.
|
67 |
Detecção e contagem de veículos em vídeos de tráfego urbano / Detecting and counting vehicles in urban traffic videoBarcellos, Pablo Roberlan Manke January 2014 (has links)
Este trabalho apresenta um novo método para o rastreamento e contagem de veículos em vídeos de tráfego urbano. Usando técnicas de processamento de imagens e de agrupamentos de partículas, o método proposto usa coerência de movimento e coerência espacial para agrupar partículas, de modo que cada grupo represente veículos nas sequências de vídeo. Uma máscara contendo os objetos do primeiro plano é criada usando os métodos Gaussian Mixture Model e Motion Energy Images para determinar os locais onde as partículas devem ser geradas, e as regiões convexas dos agrupamentos são então analisadas para verificar se correspondem a um veículo. Esta análise leva em consideração a forma convexa dos grupos de partículas (objetos) e a máscara de foreground para realizar a fusão ou divisão dos agrupamentos obtidos. Depois que um veículo é identificado, ele é rastreado utilizando similaridade de histogramas de cor em janelas centradas nas partículas dos agrupamentos. A contagem de veículos acontece em laços virtuais definidos pelo usuário, através da interseção dos veículos rastreados com os laços virtuais. Testes foram realizados utilizando seis diferentes vídeos de tráfego, em um total de 80000 quadros. Os resultados foram comparados com métodos semelhantes disponíveis na literatura, fornecendo, resultados equivalentes ou superiores. / This work presents a new method for tracking and counting vehicles in traffic videos. Using techniques of image processing and particle clustering, the proposed method uses motion coherence and spatial adjacency to group particles so that each group represents vehicles in the video sequences. A foreground mask is created using Gaussian Mixture Model and Motion Energy Images to determine the locations where the particles must be generated, and the convex shapes of detecting groups are then analyzed for the potential detection of vehicles. This analysis takes into consideration the convex shape of the particle groups (objects) and the foreground mask to merge or split the obtained groupings. After a vehicle is identified, it is tracked using the similarity of color histograms on windows centered at the particle locations. The vehicle count takes place on userdefined virtual loops, through the intersections of tracked vehicles with the virtual loops. Tests were conducted using six different traffic videos, on a total of 80.000 frames. The results were compared with similar methods available in the literature, providing results equivalent or superior.
|
68 |
[en] PEOPLE COUNTING SYSTEM / [pt] SISTEMA DE CONTAGEM DE PESSOASPRISCILA MARQUES DIAS 11 October 2005 (has links)
[pt] Atualmente, a preocupação com segurança vem crescendo dia
após dia.
Vários trabalhos abordando o desenvolvimento de sistemas
de supervisão já
foram realizados. Esta dissertação propõe um método
automático capaz de
determinar o número de pessoas em uma área monitorada por
uma câmera de
vídeo, assim como detectar mudanças na imagem
potencialmente causadas por
atitudes ilícitas. Uma aplicação típica seria a segurança
de galpões durante a
noite, em finais de semana ou em qualquer momento onde o
acesso de pessoas
é permitido, mas o movimento de cargas não. Mais
precisamente, a intenção é
detectar se uma pessoa que está passando pelo ambiente
carrega consigo um
objeto pertencente ao local ou deixa um objeto no local,
quando apenas o
movimento de pessoas é admitido na área. Além disto, o
sistema determina o
número de pessoas na cena. O método consiste na aplicação
de quatro etapas
em seqüências de vídeo: a) separação de fundo / primeiro
plano, b) atualização
dinâmica da estimativa de fundo, c) localização / contagem
de pessoas, e d)
detecção de atitudes suspeitas. Os algoritmos de separação
de fundo / primeiro
plano e de estimativa de fundo toleram variações pequenas
de iluminação e
efeitos de sombra. Já a contagem / localização de pessoas
explora informações
de cor e coerência de movimento. Soluções para atender
estes aspectos são
encontradas na literatura, porém nenhuma delas atende
todos eles juntos. O
método foi avaliado por experimentos realizados através de
um protótipo e
apresentou resultados encorajadores. / [en] There is worldwide an increasing concern about security
issues. A great
deal of efforts have been undertaken in order to provide
surveillance systems.
This work proposes an automatic method to determine the
number of people
moving in an area monitored by a video camera, as well as
to detect image
changes, which are potentially due to illicit attitudes. A
typical application is the
security of warehouses during the night, on weekends or at
any time when
people access is allowed but no load movement is
admissible. Specifically it
focuses on detecting when a person passing by the
environment carries any
object belonging to the background away or leaves any
object in the background,
while only people movement is allowed in the area. Besides
it estimates the
number of people on scene. The method consists of
performing four main tasks
on video sequences: a) background and foreground
separation, b) background
estimative dynamic update, c) people location and
counting, and d) suspicious
attitudes detection. The proposed background and
foreground separation and
background estimative update algorithms deal with
illumination fluctuation and
shade effects. People location and counting explores
colour information and
motion coherence. Solutions meeting these requirements are
proposed in the
literature, but no one deals with all of them together.
The method has been
validated by experiments carried out on a prototype and
produced encouraging results.
|
69 |
[en] USE OF ARTIFICIAL NEURAL NETWORKS IN THE RECOGNITION OF BI-DIMENSION IMAGES / [pt] REDES NEURAIS APLICADAS AO RECONHECIMENTO DE IMAGENS BI-DIMENSIONAISGUY PERELMUTER 05 July 2006 (has links)
[pt] Esta dissertação investiga a aplicação de Redes Neurais
Artificiais no reconhecimento de imagens bi-dimensionais. O
trabalho de tese foi dividido em quatro partes principais:
um estudo sobre a importância da Visão Computacional e
sobre os benefícios da aplicação das técnicas da
Inteligência Computacional na área; um estudo da estrutura
dos sistemas de reconhecimento de imagens encontrados na
literatura; o desenvolvimento de dois sistemas de
reconhecimento de imagens baseados em redes neurais; e o
estudo de caso e a análise de desempenho dos sistemas
desenvolvidos. A Visão Computacional tem se beneficiado das
principais técnicas de Inteligência Computacional (redes
neurais, algoritmos genéticos e lógica nebulosa) na
implementação de sistemas de reconhecimento de imagens.
Neste trabalho estudou-se a aplicação de diversos tipos de
redes neurais na classificação de imagens Back-Propagation,
Competitivas, RBF e Hierárquicas. Além disso, foi realizado
um estudo das áreas de aplicação da Visão Computacional. A
estrutura básica utilizada por diversos sistemas de Visão
Computacional encontrada na literatura foi analisada. Esta
estrutura é tipicamente composta por três módulos
principais: um pré-processador, um extrator de
características e um classificador. Dois sistemas de
reconhecimento de imagens, denominados de XVision e
SimpleNet, foram desenvolvidos neste trabalho. O sistema
XVision segue a estrutura descrita acima, enquanto que o
sistema SimpleNet utiliza a informação da imagem bruta para
realizar a classificação. O módulo de pré-processamento do
sistema XVision executa uma série de transformações na
imagem, extraindo suas características intrínsecas para que
seja obtida uma representação da imagem invariante a
aspectos como rotação, translação e escalonamento. Este Pré-
Processador é baseado em um trabalho previamente realizado
no campo de Processamento de Sinais. A etapa de extração de
características visa detectar as informações mais
relevantes contidas na representação da imagem intrínseca
obtida na etapa anterior. Foram investigados extratores
baseados em técnicas estatísticas (utilizando o
discriminante de Fisher) e em técnicas inteligentes
(utilizando algoritmos genéticos). Para o módulo de
classificação das imagens foram utilizados diversos tipos
de redes neurais artificiais: Back-Propagation,
Competitivas, RBFs e Hierárquicas. No sistema SimpleNet, o
pré-processamento limita-se à redução das dimensões da
imagem a ser classificada. Como os próprios pixels da
imagem são utilizados para a classificação, não foi
implementado um módulo de extração de características. Na
etapa de classificação foram empregadas redes neurais Back-
Propagation e Competitivas. O sistema XVision apresentou
resultados promissores para dois conjuntos distintos de
objetos bi-dimensionais: o primeiro composto por peças
mecânicas e o segundo por objetos triviais. As amostras
utilizadas nos testes apresentavam características
diferentes daquelas com as quais as redes neurais foram
treinadas - não apenas com rotações, translações e
escalonamentos, mas com diferenças estruturais. O
classificador conseguiu taxas de acerto superiores a 83% em
ambos os conjuntos de objetos. O sistema SimpleNet também
mostrou-se eficiente na diferenciação de imagens
semelhantes (cartões telefônicos e radiografias de
pulmões), obtendo taxas de acerto superiores a 80%. O
desenvolvimento destes sistemas demonstrou a viabilidade da
aplicação de redes neurais na classificação de objetos bi-
dimensionais. Devido ao grande interesse na utilização de
sistemas de Visão em aplicações de tempo real, mediu-se o
tempo gasto nos processos de reconhecimento. Desta forma
foram detectados os garagalos dos sistemas, facilitando
assim sua otimização. / [en] This work investigates the use of Artificial Neural
Networks in the recognition of bi-dimensional images. The
work was divided in four main parts: a survey on the
importance of Computational Vision and on the benefits of
the application of intelligent techniques in the fiels; a
survey on the structure of image recognition systems found
in the literature; the development of two image recognition
systems based on neural networks; and an analysis of the
performance of the developed systems.
Computational Vision has benefited from the main
Computational Intelligence techniques (neural networks,
genetic algoritms and fuzzy logic) to implement image
recognition systems. In this work, the usage of different
Kinds of neural networks in image classification was
studied: Back-Propagation, Competitive, RBF and
Hierarchical. Besiades that, a survey on the fields of
application of Computational Vision was made.
The basic structure is typically composed of three modules:
a pre-processor, a characteristics extractor and a
classifier.
In this work, two image recognition systems, called Xvision
and SimpleNet, were developed. The XVision system follows
the structure described above, while the SimpleNet system
performs the classification using the information present
in the raw picture.
The pre-processing module of the Xvision system executes a
series of transforms over the image, extracting its
essential characteristics so that an invariant
representation of the image can be obtained. This pre-
processor is based on a previous work in the fiels of
Signal Processing.
The characteristcs extractor aims to detect the most
relevant information present in the image representation
obtained after the previous step. Two kinds of extractors
were investigated: one based on statistical tecniques
(applyng the Fisher`s discriminant) and another based on
intelligent techniques (applyng genetic algorithms).
The classification module was implementede through several
Kinds of neural networks: Back-Propagation, Competitive,
RBF and Hierarchical.
The pre-processing of the SimpleNet system simply reduces
the image`s dimensions. Since the image`s pixels are used
for the classification process, no characteristics
extractor module was implemented. In the classification
module, Back-Propagation and Competitive neural networks
were employed.
The Xvision system yielded promising results for two sets
of objects: the first one composed of mechanical parts and
the second one composed of trivial objects. The samples
used during the tests presented different characteristics
from those samples used during the training process - not
only rotated, translated and scaled, but also with
structural differences. The classifier obtained a hit ratio
above 83% with both sets. The SimpleNet system also showed
a good performance in the differentiation of similar
objects (telephone cards and X-rays of lungs), achieving
hit ratios of more than 80%.
The development of both systems demonstrated the viability
of the use of neural networks in the classification of bi-
dimensional objects. Due to the interest of applying Vision
systems in real-time, the time spent in the recognition
process was measured. This allowed the detection of the
systems` bottlenecks, making their optimization easier.
|
70 |
[en] MAKE OR BUY: ANALYSIS UNDER THE PERSPECTIVE OF TRANSACTION COSTS ECONOMICS AND RESOURCE BASED VIEW THEORIES / [pt] FAZER OU COMPRAR: UMA ANÁLISE SOB A PERSPECTIVA DAS TEORIAS DA ECONOMIA DOS CUSTOS DE TRANSAÇÃO E DA VISÃO BASEADA NOS RECURSOSLINCOLN WOLF DE ALMEIDA NEVES 20 April 2010 (has links)
[pt] As firmas enfrentam hoje um cenário altamente volátil e competitivo e
muito mais complexo que 10 ou 20 anos atrás. Para enfrentar este cenário, as
firmas têm usado a terceirização de atividades da sua cadeia de valores para
reduzir custos, melhorar o desempenho e manter o foco nas atividades que
propiciam vantagens competitivas. As teorias da Economia dos Custos de
Transação (TCE) e Visão Baseada em Recursos (RBV) têm sido usadas nos
estudos sobre fazer ou comprar (terceirização). Na TCE, o foco da questão são as
transações internas da firma e desta com o mercado, analisando as dimensões de
risco, ativos idiossincráticos e freqüência de trocas. Na RBV, o centro da questão
está associado aos recursos que compõem a firma, analisando os atributos desses
em relação à vantagem competitiva e desempenho comparado com o mercado. O
objetivo central desta tese é compreender o porquê das firmas terceirizarem
atividades da sua cadeia de valores. Para este fim, uma extensa revisão das teorias
TCE e RBV foi feita, com o foco de aprofundar a compreensão das questões
relacionadas com a terceirização. A pesquisa examina o entendimento de seis
firmas da indústria de café solúvel em relação aos fundamentos dos processos de
terceirização. A pesquisa foi qualitativa, através de múltiplos estudos de casos,
onde entrevistas com altos executivos das firmas foram realizadas para elucidar e
avaliar os casos. A indústria de café solúvel foi escolhida pela disponibilidade de
acesso aos seus dados e integrantes, bem como pelo uso da terceirização em todas
as firmas. Nos casos, buscou-se observar as vantagens competitivas particulares,
os motivadores e variáveis das terceirizações e quais atividades foram
terceirizadas. Na análise dos casos foi encontrado que quanto maior o risco que
envolve a transação, maior a tendência das firmas internalizarem atividades.
Competências internas fracas aumentam a probabilidade de terceirização,
enquanto que quanto maior a possibilidade de vazamento de conhecimento estratégico proprietário, menor a probabilidade de terceirização. Esta tese afirma
que as teorias TCE e RBV devem ser usadas de forma conjunta para determinar as
fronteiras de uma firma, fundamentando a análise se uma atividade deve ser
terceirizada ou mantida internamente. Adicionalmente, este trabalho sustenta que
os custos de oportunidade são relevantes para a definição da terceirização de
atividades e devem ser comparados aos custos de transação. / [en] Today, firms are submitted to a highly volatile and competitive scenario, far
more complex than that of ten or twenty years ago. In order to face this, firms
have outsourced some of their value chain activities, in an attempt to reduce costs,
enhance performance and focus on activities that result in competitive advantages.
Both the Transaction Costs Economics (TCE) and Resource-Based View (RBV)
theories have been applied in outsourcing studies. TCE focuses on the firm’s
internal transactions and transactions with the market, by evaluating risk
dimensions, idiosyncratic assets and frequency of exchanges. The core issue for
RBV is related to the firm’s resources; the theory evaluates their attributes in
terms of competitive advantage and performance as compared with the market.
The fundamental objective here is to understand why firms outsource their value
chain activities. A thorough review of the TCE and RBV theories has been
performed, aimed at deepening the understanding of outsourcing related issues.
The present research assesses how six instant coffee firms perceive the
outsourcing process rationale. The survey was qualitative and based on multiple
case studies, and high executives of these firms were interviewed for clarification
and evaluation of each case. Instant coffee industry was selected due to the
availability of information and access to their members, and because all firms are
engaged in outsourcing. In these cases, we have attempted to observe the
particular competitive advantages, motivating factors and variables of
outsourcing, and which activities had been outsourced. Case study analysis has
shown that the higher the risk involved in a transaction, the more firms will tend
to internalize activities. Weak competences increase the probability of
outsourcing, while high risk of leak of strategic proprietary knowledge reduces the
probability of outsourcing. This thesis asserts that both TCE and RBV theories
shall be used in conjunction in order to determine the frontiers of a firm, and underlie the evaluation of whether an activity should be outsourced or performed
internally. Additionally, this paper affirms that opportunity costs are relevant in
defining the outsourcing of activities, and ought to be considered and compared
with transaction costs.
|
Page generated in 0.0265 seconds