1 |
[en] DEVELOPMENT OF THREE-DIMENSIONAL ACTUATORS BASED ON DIELECTRIC ARTIFICIAL MUSCLES OF ONE OR MULTIPLE LAYERS / [pt] DESENVOLVIMENTO DE ATUADORES TRIDIMENSIONAIS BASEADOS EM MÚSCULOS ARTIFICIAIS DIELÉTRICOS DE UMA OU MÚLTIPLAS CAMADASROCEM POL JIMENEZ LOPEZ 18 November 2009 (has links)
[pt] Músculos artificiais são versáteis para o projeto de atuadores pois, assim
como os músculos naturais, podem ter pequenas dimensões ou serem agrupados
para alcançar maiores dimensões. A capacidade do músculo de permitir a
construção de atuadores sem partes móveis permite uma grande economia de
energia, evitando atritos por deslizamento, menor desgaste, e baixos
ruídos.Músculos artificiais são usados para desenvolver atuadores contínuos ou
binários, utilizando diversos tipos de configurações para aproveitar ao máximo as
vantagens que oferecem estes materiais. Músculos artificiais eletrostrictivos,
acionados por altas tensões, já estão sendo utilizados em aplicações comerciais.
Circuitos eletrônicos estão sendo projetados para trabalhar com altas tensões
elétricas e interagir com estes tipos de músculos. Diversos tipos de material estão
sendo avaliados para a implementação destes músculos.Este trabalho visa
desenvolver um atuador de configuração cilíndrica de acionamento elétrico, por
efeito capacitivo. O atuador é acionado por 3 músculos artificiais em configuração
paralela, construídos a partir do elastômero acrílico VHB4905, o qual possui
características visco-elásticas e baixo custo de produção. São analisados distintos
modelos constitutivos dos músculos, baseados em molas e amortecedores em
série e em paralelo.São desenvolvidos métodos de calibragem para calcular os
parâmetros dos modelos matemáticos dos músculos a partir de dados obtidos em
laboratório. Um método de medição baseado em processamento de imagens e
teoria de visão estéreo, desenvolvido especificamente para este trabalho, permite
que a posição da extremidade do atuador seja medida de forma não-invasiva, sem
interferir em seu movimento, e sem a necessidade de colocar sensores ou
instrumentos de medição. Os resultados mostram que os modelos matemáticos
são eficientes para descrever o comportamento do atuador. / [en] Artificial muscles are versatile for the actuator projects, because, as well as
the natural muscles, they can have small dimensions or they are grouped to obtain
big dimensions. Muscle capacity to allow construction of actuators without
movable parts allows great economy of energy, avoiding attritions for sliding,
lessening waste, and reducing noise.Artificial muscles are used to develop
continuous or binary actuators, using different types of configurations to take
advantage to the benefit that offer these materials. Eletrostrictive artificial
muscles, worked by high tensions, are already being used in commercial
applications. Electronic circuits are being projected to work with high electric
tensions and to interact with these types of muscles. Many types of materials are
being evaluated for the implementation of these muscles.This work looks for to
develop a cylindrical configuration actuator of electric activation, for capacitive
effect. The actuator is activated by 3 artificial muscles in parallel configuration,
built starting from the acrylic elastomer VHB4905, which possesses viscouselastic
characteristics and low production cost. Different models of the muscles
are analyzed, based on springs and shock absorbers in series and parallel.Calibrate
methods are developed to calculate parameters of the mathematical models of the
muscles starting from data obtained at laboratory. Measurement method based on
processing of images and theory of stereo vision, specifically developed for this
work, allows no-invasive measurement of the actuator’s extremity, without
interfering in actuator’s movement, and without the need to put sensor or
measurement instruments. The results show that mathematical models are
efficient to describe the behavior of the actuator.
|
2 |
[en] METHOD FOR OPTICAL FLOW EVALUATION WITH CONFIDENCE INTERVAL ESTIMATION / [pt] UM MÉTODO PARA O CÁLCULO DE FLUXO ÓTICO COM ESTIMATIVA DE CONFIABILIDADELUIZ EDUARDO AZAMBUJA SAUERBRONN 03 June 2019 (has links)
[pt] Muitos sistemas biológicos utilizam visão como forma primária de sensoriamento. Ao longo de milhões de anos de evolução,as diferentes espécies vêm demonstrando o potencial associado à capacidade de visão.A partir da década de 60,foram iniciados os primeiros estudos no sentido de proporcionar às máquinas esta forma de sensoriamento. A esta nova forma de sensoriamento dá-se o nome de Visão Computacional. Em Visão Computacional,muitos casos requerem a determinação de um campo vetorial que descreva os deslocamentos ocorridos entre dois quadros consecutivos de uma sequência genérica de vídeo.A este campo vetorial dá-se o nome de Optical Flow(Fluxo Ótico). A determinação do Optical Flow é ainda um problema sem solução.No presente trabalho,propõ-se um novo estimador estatístico para a determinação do Fluxo Ótico. Este estimador possui complexidade O(n) e associa um grau de confiabilidade a cada estimativa realizada.É aplicável a qualquer sinal digital(não apenas imagens ou vídeo, mas também a som,volume,etc) e vem demonstrando resultados muito promissores. / [en] Many biological systems make use of vision as its primary sensory mechanism. During million years,different species have been showing the great potencial associated with vison.From the early sixties onwards,studies have been done to provide machines with this important sense.The research area involved in this task is called Computer Vision. In Computer Visiom there are many situations where it is necessary to evaluate a vector field which describes existing displacements between two consecutive frames of a generic video sequence.This vector field is called Optical Flow. The Optical Flow determination is still a problem with unknown solution.This work proposes a new statistic algorithm to estimate the Optical Flow.The proposed
algorithm has O(n) complexity and associates a degree of rebeliabity to each estimation. The algorithm can be applied to any digital signal(not only images or videos,but also sound,volume etc)and is achieving promising results.
|
3 |
[en] A METHOD FOR OPTICAL FLOW EVALUATION CONSIDERING RELIABILITY ESTIMATION / [pt] UM MÉTODO PARA O CÁLCULO DE FLUXO ÓTICO COM ESTIMATIVA DE CONFIABILIDADELUIZ EDUARDO A. SAUERBRONN 03 June 2002 (has links)
[pt] Muitos sistemas biológicos utilizam visão como forma
primária de sensoriamento.Ao longo de milhões de anos de
evolução, as diferentes espécies vêm demonstrando o
potencial associado à capacidade de visão. A partir da
década de 60, foram iniciados os primeiros estudos no
sentido de proporcionar às máquinas esta forma de
sensoriamento. A esta nova forma de sensoriamento dá-se o
nome de Visão Computacional. Em Visão Computacional, muitos
casos requerem a determinação de um campo vetorial que
descreva os deslocamentos ocorridos entre dois quadros
consecutivos de uma seqüência genérica de vídeo. A este
campo vetorial dá-se o nome de Optical Flow (Fluxo
Ótico). A determinação do Optical Flow é ainda um problema
sem solução. No presente trabalho, propõe-se um novo
estimador estatístico para a determinação do Fluxo Ótico.
Este estimador possui complexidade O(n) e associa um grau
de confiabilidade a cada estimativa realizada. É aplicável
a qualquer sinal digital (não apenas imagens ou vídeo,
mas também a som, volume, etc) e vem demonstrando
esultados muito promissores. / [en] Many biological systems make use of vision as its primary
sensory mechanism. During million years, different species
have been showing the great potential associated
with vision. From the early sixties onwards, studies have
been done to provide machines with this important sense.
The research area involved in this task is called Computer
Vision. In Computer Vision there are many situations where
it is necessary to evaluate a vector field which describes
existing displacements between two consecutive frames of a
generic video sequence. This vector field is called Optical
Flow. The Optical Flow determination is still a problem
with unknown solution. This work proposes a new statistic
algorithm to estimate the Optical Flow. The proposed
algorithm has O(n) complexity and associates a degree of
reliability to each estimation.The algorithm can be applied
to any digital signal (not only images or videos, but also
sound, volume etc) and is achieving promising results.
|
4 |
[en] IMAGE PROCESSING AND COMPUTER VISION ALGORITHMS FOR GRAPHICS CARDS PARALLEL ARCHITECTURES / [pt] ALGORITMOS PARA PROCESSAMENTO DE IMAGENS E VISÃO COMPUTACIONAL PARA ARQUITETURAS PARALELAS EM PLACAS GRÁFICASCRISTINA NADER VASCONCELOS 11 May 2009 (has links)
[pt] Diversas tarefas de Visão Computacional (VC) são formadas por operações aritméticas, replicadas sobre grandes volumes de dados. Esta caracterização descreve também as qualidades desejadas ao considerar uma aplicação qualquer como boa candidata a usufruir do crescente poder de processamento do hardware gráfico. Esta tese formula um conjunto de algoritmos de VC sobre representações do conteúdo visual em baixo nível, para serem processados em GPU. Dando suporte às propostas, são apresentadas uma visão geral das GPUs e de padrões de programação paralelos, os quais oferecem blocos construtores para tarefas de visão. Neste sentido, propomos uma definição formal para o padrão de Redução Múltipla e analisamos seu desempenho segundo diferentes fatores de redução e variações para seus arranjos. Apresentamos duas propostas para extração de informações no espaço da imagem em GPU: a MOCT descreve a localização de objetos identificáveis por suas cores em vídeos naturais, enquanto o operador de Redução Regional Múltipla Paralela (MRR) distribui a computação de operadores definidos sobre diferentes regiões de interesse. Como aplicação do MRR, descrevemos a construção em GPU de um Diagrama Centroidal de Voronoi baseado no algoritmo de Lloyd. Tratamos do conteúdo visual em aglomerados de pixels, mais especificamente, em Quadtrees de regiões. Introduzimos a QuadN4tree, um modelo para representação de quadtrees que permite a navegação através do sistema de vizinhança das folhas e alcança custos ótimos no levantamento do conjunto de vizinhas de uma folha. Em seguida, propomos uma aceleração para aplicações baseadas em minimização de energia via corte de grafo, introduzindo uma etapa de pré-processamento que agrupa pixels similares em folhas de uma quadtree, com o objetivo de reduzir o tamanho do grafo sobre o qual o corte mínimo é encontrado. O método proposto é aplicado ao problema de segmentação de imagens naturais com iluminação ativa. Algumas contribuições desta tese, descrevendo formulações paralelas a dados, foram publicadas nos artigos incluídos nos apêndices. / [en] Arithmetically intensive operations, replicated over huge data sets (usually image pixels or scanned data), are an important part of many Computer Vision (CV) tasks, making them good candidates for taking advantage of the processing power of contemporary graphics processing units (GPUs). This thesis formulates a set of CV algorithms that use low level representations of visual content and are tailored for running on GPUs. A general view of GPUs and parallel programming patterns that offers interesting building blocks for CV tasks provides the necessary background for the algorithms. We also propose a formal definition for the Multiple Reduction pattern and evaluate its efficiency according to different reduction factors and layouts. We present two techniques for extracting data from the image space using the GPU: MOCT, a technique for tracking a set of objects identified by their colors from natural videos, and MRR, a technique for distributing the evaluation of a set of operators defined over different regions of interest within an image. As a MRR application we describe a Centroidal Voronoi Diagram construction based on Lloyds algorithm but entirely computed using GPU resources. We also deal with visual content representations as pixel agglomerations, more specifically, as Regional Quadtrees. We introduce the QuadN4tree: a new model for representing quadtree leaves that allows navigation through their neighborhood systems and achieves an optimal cost for the retrieval of neighbor sets. We also propose modifying the setup for CV applications based on energy minimization via graph cuts, introducing a preprocessing step that groups similar pixels into regional quadtree leaves. This modification aims to reduce the size of the graph for which a minimum cut is to be found. We apply our proposed method to the problem of natural image segmentation by active illumination. Published papers detailing some contributions of this dissertation are included as appendixes. They present data-parallel formulations for the CV tasks we describe.
|
5 |
[en] CAMERA CALIBRATION AND POSITIONING USING PHOTOGRAPHS AND MODELS OF BUILDINGS / [pt] CALIBRAÇÃO E POSICIONAMENTO DE CÂMERA UTILIZANDO FOTOS E MODELOS DE EDIFICAÇÕESPABLO CARNEIRO ELIAS 11 November 2009 (has links)
[pt] A reconstrução de câmera é um dos problemas fundamentais da visão computacional.
Sistemas de software desta área utilizam modelos matemáticos
de câmera, ou câmeras virtuais, para, por exemplo, interpretar e reconstruir
a estrutura tridimensional de uma cena real a partir de fotos e vídeos digitais
ou para produzir imagens sintéticas com aparência realista. As técnicas de
reconstruçã de câmera da visão computacional são aplicadas em conjunto
com técnicas de realidade virtual para dar origem a novas aplicações chamadas
de aplicações de realidade aumentada, que utilizam câmeras virtuais
para combinar imagens reais e sintéticas em uma mesma foto digital. Dentre
os diversos usos destes tipos de aplicação, este trabalho tem particular interesse
naqueles que tratam de visitas aumentadas a edificações. Nestes casos,
fotos de edificações — tipicamente de construções antigas ou ruínas — são
reconstruídas a partir de modelos virtuais que são inseridos em meio a tais
fotos digitais com a finalidade de habilitar a visão de como essas edificações
eram em suas estruturas originais. Nesse contexto, este trabalho propõe um
método semi-automático e eficiente para realizar tal reconstrução e registrar
câmeras virtuais a partir de fotos reais e modelos computacionais de
edificações, permitindo compará-los através de superposição direta e disponibilizando
uma nova maneira de navegar de forma tridimensional por entre
diversas fotos registradas. Tal método requer a participação do usuário, mas
é projetado para ser simples e produtivo. / [en] Camera reconstruction is one of the major problems in computer vision.
Software systems in that field uses mathematical camera models, or virtual
cameras, for example, to interpret and reconstruct the tridimensional
structure of a real scene from a set of digital pictures or videos or to produce
synthetic images with realistic looking. Computer vision technics are
applied together with virtual reality technics in order to originate new types
of applications called augmented reality applications, which use virtual
cameras to combine both real and synthetic images within a single digital
image. Among the many uses of these types of applications, this work
has particular interest in those concerning augmented visits to buildings.
In these cases, pictures of buildings — typically old structures os ruins —
are reconstructed from virtual models that are inserted into such pictures
allowing one to have the vision of how those buildings were on they original
appearance. Within this context, this work proposes a semi-automatic and
efficient method to perform such reconstructions and to register virtual cameras
from real pictures and models of buildings, allowing comparing them
through direct superposing and making possible to navigate in a tridimensional
fashion between the many registered pictures. Such method requires
user interaction, but it is designed to be simple and productive.
|
6 |
[en] COMPARISON BETWEEN LOOK-AND-MOVE AND VISUAL SERVO CONTROL USING SIFT TRANSFORMS IN EYE-IN-HAND MANIPULATOR SYSTEMS / [pt] COMPARAÇÃO ENTRE CONTROLES LOOK-AND-MOVE E SERVO-VISUAL UTILIZANDO TRANSFORMADAS SIFT EM MANIPULADORES DO TIPO EYE-IN-HANDILANA NIGRI 17 March 2010 (has links)
[pt] Visão Computacional pode ser utilizada para calibrar e auto-localizar robôs.
Existem diversas aplicações de auto-localização e controle aplicadas a manipuladores
industriais e robôs móveis. Em particular, o controle visual pode ser útil em intervenções
submarinas, nas quais um manipulador robótico é acoplado a um ROV (Veículo de
Operação Remota) para execução de tarefas em grandes profundidades, como o manuseio
de válvulas de equipamentos como manifolds. Este trabalho tem como objetivo
desenvolver e implementar técnicas de controle visual para auto-localização e
posicionamento de manipuladores robóticos. Assume-se que o manipulador possui uma
câmera presa em sua extremidade (configuração eye-in-hand). Duas técnicas de controle
visual são estudadas: look-and-move e servo-visual, que diferem entre si pela
realimentação do controle. A primeira utiliza sensores de posição, a partir de uma única
imagem capturada no início da movimentação. A segunda utiliza diversas imagens
capturadas durante o processo. A principal contribuição deste trabalho está no uso da
transformada SIFT, robusta a rotações, translações, mudança de escala e iluminação, para
obter e correlacionar pontos-chave entre as imagens de referência e capturadas em tempo
real. A metodologia é validada experimentalmente através de um manipulador robótico
baseado na estrutura mecânica de uma mesa x-y-0. Um sistema eletrônico é utilizado
como interface entre o robô e o software de controle, onde estão implementadas todas as
técnicas propostas. Testes iniciais são realizados com imagens de objetos circulares, sem
o uso de transformações como o SIFT. Em seguida, são feitos testes com a imagem de
um painel real de um manifold, utilizando transformadas SIFT para determinar a
localização do manipulador em relação ao painel e controlá-lo até uma pose desejada. Os
resultados mostram que o desempenho do controle servo-visual depende muito do tempo
de processamento de cada imagem, ao contrário do look-and-move. No entanto, o
controle servo-visual apresenta erros finais de posicionamento muito menores. O método
SIFT é apropriado para uso em ambos os controles, desde que a resolução das imagens
seja alta o suficiente para evitar correlações falsas. / [en] Computer vision can be used to calibrate and self-localize robots. There are many
applications in self-localization and control applied to industrial manipulators and mobile
robots. In particular, visual control can be useful in submarine interventions, where a
robotic manipulator is mounted on a Remote Operated Vehicle (ROV) to execute tasks at
high depths, such as handling manifold valves. This work has the objective to develop
and implement visual control techniques to self-localize and position robotic
manipulators. It is assumed that a monocular camera is attached to the robot end-effector
(eye-in-hand configuration). Two visual control techniques are studied: look-and-move
and visual servo control. Their main difference is related to the adopted feedback sensors.
The first technique uses position sensors with the aid of a single image captured at the
beginning of the robot movement. The second technique relies on several images
captured in real time during the robot movement. The main contribution of this work is
the use of the SIFT transform, robust to rotation, translation, changes in scale and
illumination, to obtain and correlate key-points between reference images and images
captured in real time. The methodology is experimentally validated using a manipulator
based on the mechanical structure of an x-y-0 coordinate table. An electronic system was
developed to control the robot through a software in a computer, where were
implemented all the techniques proposed. Preliminary tests are performed on simple
circular-shaped objects, without the need for SIFT transforms. Next, tests are performed
with a photo of an actual manifold panel typically used in submarine interventions, using
SIFT transform to find the localization of the manipulator with respect to the panel. The
results show that the performance of the visual servo control depends on the image
processing time, unlike the look-and-move. However, the visual-servo control presents
smaller positioning errors. The SIFT method is appropriate for both controls, since image
resolution be high enough to avoid false matching.
|
7 |
[en] INTEGRATING AN OPTICAL TRACKING DEVICE WITH A VIRTUAL REALITY TOOLKIT / [pt] INTEGRAÇÃO DE UM DISPOSITIVO ÓPTICO DE RASTREAMENTO A UMA FERRAMENTA DE REALIDADE VIRTUALROMANO JOSE MAGACHO DA SILVA 02 September 2004 (has links)
[pt] Os sistemas de realidade virtual requerem dispositivos de
interação que não obstruam o caráter imersivo da
aplicação. Com a difusão das câmeras digitais, a captura
óptica do movimento do usuário se firmou como uma nova
área de pesquisa. Este trabalho apresenta a integração de
um dispositivo óptico para interação em uma ferramenta de
desenvolvimento de aplicações em realidade virtual. O
dispositivo óptico proposto é composto por uma esfera
revestida de material retroreflexivo rastreada por quatro
câmeras com sensores infravermelhos. O estudo engloba a
implementação do dispositivo de rastreamento óptico e sua
integração com a ferramenta ViRAL (Virtual Reality
Abstraction Layer). / [en] Virtual reality systems require tracking devices that do
not harm the application immersive sensation. With the
spread of digital cameras, the optical tracking of users`
movement has been firmed as a new area of research. This
work presents the integration of an optical tracking
device with a virtual reality application development
library. The proposed optical device is composed of a
sphere coated with retroreflexive material, which is
tracked by four cameras with infrared sensors. The study
contains the implementation of the tracking device and
its integration with ViRAL (Virtual Reality Abstraction
Layer) tool.
|
8 |
[en] APPLICATION OF THE SIFT TECHNIQUE TO DETERMINE MATERIAL STRAIN FIELDS USING COMPUTER VISION / [pt] APLICAÇÃO DA TÉCNICA SIFT PARA DETERMINAÇÃO DE CAMPOS DE DEFORMAÇÕES DE MATERIAIS USANDO VISÃO COMPUTACIONALGIANCARLO LUIS GOMEZ GONZALES 10 March 2011 (has links)
[pt] Esta dissertação apresenta uma metodologia para medição visual de campos de deformações (2D) em materiais, por meio da aplicação da técnica SIFT (Scale Invariant Feature Transform). A análise de imagens capturadas é feita por uma câmera digital em estágios diferentes durante o processo de deformação de um material quando este é submetido a esforços mecânicos. SIFT é uma das técnicas modernas de visão computacional e um eficiente filtro para extração e descrição de pontos de características relevantes em imagens, invariantes a transformações em escala, iluminação e rotação. A metodologia é baseada no cálculo do gradiente de funções que representam o campo de deformações em um material durante um ensaio mecânico sob diferentes condições de contorno. As funções são calibradas com a aplicação da análise inversa sobre o conjunto de pontos homólogos de duas imagens extraídos pelo algoritmo SIFT. A formulação da solução ao problema inverso combina os dados experimentais fornecidos pelo SIFT e o método linear de mínimos quadrados para estimação dos parâmetros de deformação. Os modelos propostos para diferentes corpos de prova são avaliados experimentalmente com a ajuda de extensômetros para medição direta das deformações. O campo de deformações identificado pelo sistema de visão computacional é comparado com os valores obtidos pelos extensômetros e por simulações feitas no programa de Elementos Finitos ANSYS. Os resultados obtidos mostram que o campo de deformações pode ser medido utilizando a técnica SIFT, gerando uma nova ferramenta visual de medição para ensaios mecânicos que não se baseia nas técnicas tradicionais de correlação de imagens. / [en] This thesis presents a methodology for measurement of strain fields in
materials by applying the SIFT technique (Scale Invariant Feature Transform).
The images analyzed are captured by a digital camera at different stages during
the deformation process of a material when it is subjected to mechanical stress.
SIFT is one of the modern computer vision techniques and an efficient filter for
extraction and description of relevant feature points in images. These interest
points are largely invariant to changes in scale, illumination and rotation. The
methodology is based on the calculation of the gradient of the functions that
represents the corresponding strain field in the material during a mechanical test
under different boundary conditions. The functions are calibrated with the
application of inverse analysis on the set of homologous points of two images
extracted by the SIFT algorithm. The formulation of the solution to the inverse
problem combines the experimental data processed by the SIFT and linear least
squares method for the estimation of strain parameters. The proposed models for
different specimens are evaluated experimentally with strain gauges for direct
measurement of the deformations. The strain field identified by the computer
vision system is compared with values obtained by strain gauges and simulations
with the ANSYS finite element program. The proposed models for different types
of measurements are experimentally evaluated with strain gages, including the
estimation of mechanical properties. The results show that the strain field can be
measured using the SIFT technique, developing a new visual tool for
measurement of mechanical tests that are not based on traditional techniques of
image correlation.
|
9 |
[en] LOCAL SLAM / [pt] LOCAL SLAM: LOCALIZAÇÃO DE CÂMERA E MAPEAMENTO LOCAL DE AMBIENTES SIMULTÂNEOSLUCAS PINTO TEIXEIRA 07 February 2017 (has links)
[pt] Atualmente, sistemas de visão computacional em computadores portáteis estão se tornando uma importante ferramenta de uso pessoal. Sistemas de visão para localização de objetos é uma área de pesquisa muito ativa. Essa dissertação propõe um algoritmo para localizar posições no espaço e objetos em ambientes não instrumentados com o uso de uma câmera web e um computador pessoal. Para isso, são usados dois algoritmos de rastreamento de marcadores para reinicializar frequentemente um algoritmo de Visual Simultaneous Localisation and Mapping. Essa dissertação também apresenta uma implementação e um conjunto de testes para validar o algoritmo proposto. / [en] Nowadays, vision systems in portable computers are becoming an important tool for personal use. Vision systems for object localization are an active area of research. This dissertation proposes an algorithm to locate position and objects in a regular environment with the use of a simple webcam and a personal computer. To that end, we use two algorithms of marker tracking to reboot often a Visual Simultaneous Localisation and Mapping algorithm. This dissertation also presents an implementation and a set of tests that validate the proposed algorithm.
|
10 |
[en] A ROBUST WORKFLOW FOR PERSON TRACKING AND META-DATA GENERATION IN VIDEOS / [pt] UMA METODOLOGIA ROBUSTA PARA RASTREAMENTO DE PESSOAS E GERAÇÃO DE META-DADOS EM VÍDEOSRAFAEL ANTONIO PINTO PENA 23 June 2021 (has links)
[pt] A quantidade de vídeos gravados no mundo cresce muito, não somente devido aos interesses e hábitos humanos em relação a esse tipo de mídia, mas também pela diversidade de dispositivos utilizados para criação de vídeos. No entanto, faltam informações sobre conteúdos em vídeo porque a geração de
metadados é complexa e requer muito tempo para ser executado por humanos. Do ponto de vista da tecnologia, não é fácil superar os obstáculos relacionados à grande quantidade e diversidade de frames de vídeo. O trabalho propõe um sistema automatizado de reconhecimento facial para detectar personagens em vídeos. Ele foi desenvolvido para reconhecer personagens, a fim de aumentar os metadados de vídeo. Ele combina técnicas padrão de visão computacional para melhorar a precisão, processando os dados de saída dos modelos existentes de maneira complementar. O modelo teve um desempenho satisfatório usando um
conjunto de dados da vida real de uma grande empresa de mídia. / [en] The amount of recorded video in the world is increasing a lot due not only to the humans interests and habits regarding this kind of media, but also the diversity of devices used to create them. However, there is a lack of information about video content because generating video meta-data is complex. It demands too much time to be performed by humans, and from the technology perspective, it is not easy to overcome obstacles regarding the huge amount and diversity of video frames. In this work we propose an automated face recognition system to detect and recognize humans within videos. It was developed to recognize characters,in order to increase video meta-data. It combines standard computer vision techniques to improved accuracy by processing existing models output data in a complementary manner. We evaluated the performance of the system in a real data set from a large media company.
|
Page generated in 0.0267 seconds