Spelling suggestions: "subject:"Motion descriptors""
1 |
Tensor baseado em fluxo óptico para descrição global de movimento em vídeosMota, Virgínia Fernandes 28 February 2011 (has links)
Submitted by Renata Lopes (renatasil82@gmail.com) on 2017-03-02T19:31:32Z
No. of bitstreams: 1
virginiafernandesmota.pdf: 2597727 bytes, checksum: df1d36b8c756398774e8649591f66a32 (MD5) / Approved for entry into archive by Adriana Oliveira (adriana.oliveira@ufjf.edu.br) on 2017-03-06T20:02:23Z (GMT) No. of bitstreams: 1
virginiafernandesmota.pdf: 2597727 bytes, checksum: df1d36b8c756398774e8649591f66a32 (MD5) / Made available in DSpace on 2017-03-06T20:02:23Z (GMT). No. of bitstreams: 1
virginiafernandesmota.pdf: 2597727 bytes, checksum: df1d36b8c756398774e8649591f66a32 (MD5)
Previous issue date: 2011-02-28 / CAPES - Coordenação de Aperfeiçoamento de Pessoal de Nível Superior / Movimento é uma das características fundamentais que refletem a informação semântica
em vídeos. Uma das técnicas de estimativa do movimento é o cálculo do fluxo óptico.
Este é uma representação 2D (bidimensional) das velocidades aparentes de uma sequência
de quadros (frames) adjacentes, ou seja, a projeção 2D do movimento 3D (tridimensional)
projetado na câmera.
Neste trabalho é proposto um descritor global de movimento baseado no tensor de
orientação. O mesmo é formado à partir dos coeficientes dos polinômios de Legendre
calculados para cada quadro de um vídeo. Os coeficientes são encontrados através da
projeção do fluxo óptico nos polinômios de Legendre, obtendo-se uma representação polinomial
do movimento.
O descritor tensorial criado é avaliado classificando-se a base de vídeos KTH com um
classificador SVM (máquina de vetor de suporte). É possível concluir que a precisão da
abordagem deste trabalho supera às encontradas pelos descritores globais encontrados na
literatura. / Motion is one of the main characteristics that describe the semantic information of videos.
One of the techniques of motion estimation is the extraction of optical flow. The optical
flow is a bidimensional representation of velocities in a sequence of adjacent frames, in
other words, is the 2D projection of the 3D motion projected on the camera.
In this work it is proposed a global video descriptor based on orientation tensor. This
descriptor is composed by coefficients of Legendre polynomials calculated for each video
frame. The coefficients are found though the projection of the optical flow on Legendre
polynomials, obtaining a polynomial representation of the motion.
The tensorial descriptor created is evaluated by a classification of the KTH video
database with a SVM (support vector machine) classifier. Results show that the precision
of our approach is greater than those obtained by global descriptors in the literature.
|
2 |
Um descritor tensorial de movimento baseado em múltiplos estimadores de gradienteSad, Dhiego Cristiano Oliveira da Silva 22 February 2013 (has links)
Submitted by Renata Lopes (renatasil82@gmail.com) on 2017-05-30T19:45:09Z
No. of bitstreams: 1
dhiegocristianooliveiradasilvasad.pdf: 1920111 bytes, checksum: c7bccda6c65e798776738b9581721c98 (MD5) / Approved for entry into archive by Adriana Oliveira (adriana.oliveira@ufjf.edu.br) on 2017-06-01T11:37:10Z (GMT) No. of bitstreams: 1
dhiegocristianooliveiradasilvasad.pdf: 1920111 bytes, checksum: c7bccda6c65e798776738b9581721c98 (MD5) / Made available in DSpace on 2017-06-01T11:37:10Z (GMT). No. of bitstreams: 1
dhiegocristianooliveiradasilvasad.pdf: 1920111 bytes, checksum: c7bccda6c65e798776738b9581721c98 (MD5)
Previous issue date: 2013-02-22 / CAPES - Coordenação de Aperfeiçoamento de Pessoal de Nível Superior / Este trabalho apresenta uma nova abordagem para a descrição de movimento em
vídeos usando múltiplos filtros passa-banda que agem como estimadores derivativos de
primeira ordem. A resposta dos filtros em cada quadro do vídeo é extraída e codificada
em histogramas de gradientes para reduzir a sua dimensionalidade. Essa combinação
é realizada através de tensores de orientação. O grande diferencial deste trabalho em
relação à maioria das abordagens encontradas na literatura é que nenhuma característica
local é extraída e nenhum método de aprendizagem é realizado previamente, isto é, o
descritor depende unicamente do vídeo de entrada. Para o problema de reconhecimento
da ação humana utilizando a base de dados KTH, nosso descritor alcançou a taxa de
reconhecimento de 93,3% usando três filtros da família Daubechies combinado com mais
um filtro extra que é a correlação entre esses três filtros. O descritor resultante é então
classificado através do SVM utilizando um protocolo two-fold. Essa classificação se mostra
superior para a maioria das abordagens que usam descritores globais e pode ser comparável
aos métodos do estado-da-arte. / This work presents a novel approach for motion description in videos using multiple
band-pass filters that act as first order derivative estimators. The filters response on each
frame are coded into individual histograms of gradients to reduce their dimensionality.
They are combined using orientation tensors. No local features are extracted and no
learning is performed, i.e., the descriptor depends uniquely on the input video. Motion
description can be enhanced even using multiple filters with similar or overlapping fre
quency response. For the problem of human action recognition using the KTH database,
our descriptor achieved the recognition rate of 93,3% using three Daubechies filters, one
extra filter designed to correlate them, two-fold protocol and a SVM classifier. It is su
perior to most global descriptor approaches and fairly comparable to the state-of-the-art
methods.
|
3 |
Descritor de movimento baseado em tensor e histograma de gradientesPerez, Eder de Almeida 24 August 2012 (has links)
Submitted by Renata Lopes (renatasil82@gmail.com) on 2017-03-06T15:14:46Z
No. of bitstreams: 1
ederdealmeidaperez.pdf: 749381 bytes, checksum: 7338f694cc850057100e730b520d74eb (MD5) / Approved for entry into archive by Adriana Oliveira (adriana.oliveira@ufjf.edu.br) on 2017-03-06T20:25:35Z (GMT) No. of bitstreams: 1
ederdealmeidaperez.pdf: 749381 bytes, checksum: 7338f694cc850057100e730b520d74eb (MD5) / Made available in DSpace on 2017-03-06T20:25:35Z (GMT). No. of bitstreams: 1
ederdealmeidaperez.pdf: 749381 bytes, checksum: 7338f694cc850057100e730b520d74eb (MD5)
Previous issue date: 2012-08-24 / CAPES - Coordenação de Aperfeiçoamento de Pessoal de Nível Superior / O reconhecimento de padrões de movimentos tem se tornado um campo de pesquisa muito
atrativo nos últimos anos devido, entre outros fatores, à grande massificação de dados em
vídeos e a tendência na criação de interfaces homem-máquina que utilizam expressões
faciais e corporais. Esse campo pode ser considerado um dos requisitos chave para análise
e entendimento de vídeos.
Neste trabalho é proposto um descritor de movimentos baseado em tensores de 2a
ordem e histogramas de gradientes (HOG - Histogram of Oriented Gradients). O cálculo
do descritor é rápido, simples e eficaz. Além disso, nenhum aprendizado prévio é necessário
sendo que a adição de novas classes de movimentos ou novos vídeos não necessita de
mudanças ou que se recalculem os descritores já existentes. Cada quadro do vídeo é
particionado e em cada partição calcula-se o histograma de gradientes no espaço e no
tempo. A partir daí calcula-se o tensor do quadro e o descritor final é formado por uma
série de tensores de cada quadro.
O descritor criado é avaliado classificando-se as bases de vídeos KTH e Hollywood2,
utilizadas na literatura atual, com um classificador Máquina Vetor Suporte (SVM). Os
resultados obtidos na base KTH são próximos aos descritores do estado da arte que utilizam
informação local do vídeo. Os resultados obtidos na base Hollywood2 não superam
o estado da arte, mas são próximos o suficiente para concluirmos que o método proposto
é eficaz. Apesar de a literatura apresentar descritores que possuem resultados superiores
na classificação, suas abordagens são complexas e de alto custo computacional. / The motion pattern recognition has become a very attractive research field in recent years
due to the large amount of video data and the creation of human-machine interfaces that
use facial and body expressions. This field can be considered one of the key requirements
for analysis and understanding in video.
This thesis proposes a motion descriptor based on second order tensor and histograms
of oriented gradients. The calculation of the descriptor is fast, simple and effective.
Furthermore, no prior knowledge of data basis is required and the addition of new classes
of motion and videos do not need to recalculate the existing descriptors. The frame of a
video is divided into a grid and the histogram of oriented gradients is computed in each
cell. After that, the frame tensor is computed and the final descriptor is built by a series
of frame tensors.
The descriptor is evaluated in both KTH and Hollywood2 data basis, used in the
current literature, with a Support Vector Machine classifier (SVM). The results obtained
on the basis KTH are very close to the descriptors of the state-of-the-art that use local
information of the video. The results obtained on the basis Hollywood2 not outweigh the
state-of-the-art but are close enough to conclude that the proposed method is effective.
Although the literature presents descriptors that have superior results, their approaches
are complex and with computational cost.
|
Page generated in 0.0683 seconds