Spelling suggestions: "subject:"descritos"" "subject:"descrito""
31 |
Um descritor tensorial de movimento baseado em múltiplos estimadores de gradienteSad, Dhiego Cristiano Oliveira da Silva 22 February 2013 (has links)
Submitted by Renata Lopes (renatasil82@gmail.com) on 2017-05-30T19:45:09Z
No. of bitstreams: 1
dhiegocristianooliveiradasilvasad.pdf: 1920111 bytes, checksum: c7bccda6c65e798776738b9581721c98 (MD5) / Approved for entry into archive by Adriana Oliveira (adriana.oliveira@ufjf.edu.br) on 2017-06-01T11:37:10Z (GMT) No. of bitstreams: 1
dhiegocristianooliveiradasilvasad.pdf: 1920111 bytes, checksum: c7bccda6c65e798776738b9581721c98 (MD5) / Made available in DSpace on 2017-06-01T11:37:10Z (GMT). No. of bitstreams: 1
dhiegocristianooliveiradasilvasad.pdf: 1920111 bytes, checksum: c7bccda6c65e798776738b9581721c98 (MD5)
Previous issue date: 2013-02-22 / CAPES - Coordenação de Aperfeiçoamento de Pessoal de Nível Superior / Este trabalho apresenta uma nova abordagem para a descrição de movimento em
vídeos usando múltiplos filtros passa-banda que agem como estimadores derivativos de
primeira ordem. A resposta dos filtros em cada quadro do vídeo é extraída e codificada
em histogramas de gradientes para reduzir a sua dimensionalidade. Essa combinação
é realizada através de tensores de orientação. O grande diferencial deste trabalho em
relação à maioria das abordagens encontradas na literatura é que nenhuma característica
local é extraída e nenhum método de aprendizagem é realizado previamente, isto é, o
descritor depende unicamente do vídeo de entrada. Para o problema de reconhecimento
da ação humana utilizando a base de dados KTH, nosso descritor alcançou a taxa de
reconhecimento de 93,3% usando três filtros da família Daubechies combinado com mais
um filtro extra que é a correlação entre esses três filtros. O descritor resultante é então
classificado através do SVM utilizando um protocolo two-fold. Essa classificação se mostra
superior para a maioria das abordagens que usam descritores globais e pode ser comparável
aos métodos do estado-da-arte. / This work presents a novel approach for motion description in videos using multiple
band-pass filters that act as first order derivative estimators. The filters response on each
frame are coded into individual histograms of gradients to reduce their dimensionality.
They are combined using orientation tensors. No local features are extracted and no
learning is performed, i.e., the descriptor depends uniquely on the input video. Motion
description can be enhanced even using multiple filters with similar or overlapping fre
quency response. For the problem of human action recognition using the KTH database,
our descriptor achieved the recognition rate of 93,3% using three Daubechies filters, one
extra filter designed to correlate them, two-fold protocol and a SVM classifier. It is su
perior to most global descriptor approaches and fairly comparable to the state-of-the-art
methods.
|
32 |
Reconhecimento de texto e rastreamento de objetos 2D/3D / Text recognition and 2D/3D object trackingMinetto, Rodrigo, 1983- 20 August 2018 (has links)
Orientadores: Jorge Stolfi, Neucimar Jerônimo Leite / Tese (doutorado) - Universidade Estadual de Campinas, Instituto de Computação / Made available in DSpace on 2018-08-20T03:12:07Z (GMT). No. of bitstreams: 1
Minetto_Rodrigo_D.pdf: 35894128 bytes, checksum: 8a0e453fba7e6a9a02fb17a52fdbf878 (MD5)
Previous issue date: 2012 / Resumo: Nesta tese abordamos três problemas de visão computacional: (1) detecção e reconhecimento de objetos de texto planos em imagens de cenas reais; (2) rastreamento destes objetos de texto em vídeos digitais; e (3) o rastreamento de um objeto tridimensional rígido arbitrário com marcas conhecidas em um vídeo digital. Nós desenvolvemos, para cada um dos problemas, algoritmos inovadores, que são pelo menos tão precisos e robustos quanto outros algoritmos estado-da-arte. Especificamente, para reconhecimento de texto nós desenvolvemos (e validamos extensivamente) um novo descritor de imagem baseado em HOG especializado para escrita romana, que denominamos T-HOG, e mostramos sua contribuição como um filtro em um detector de texto (SNOOPERTEXT). Nós também melhoramos o algoritmo SNOOPERTEXT através do uso da técnica multiescala para tratar caracteres de tamanhos bastante variados e limitar a sensibilidade do algoritmo a vários artefatos. Para rastreamento de texto, nós descrevemos quatro estratégias básicas para combinar a detecção e o rastreamento de texto, e desenvolvemos também um rastreador específico baseado em filtro de partículas que explora o uso do reconhecedor T-HOG. Para o rastreamento de objetos rígidos, nós desenvolvemos um novo algoritmo preciso e robusto (AFFTRACK) que combina rastreamento de características por KLT com uma calibração de câmera melhorada. Nós testamos extensivamente nossos algoritmos com diversas bases de dados descritas na literatura. Nós também desenvolvemos algumas bases de dados (publicamente disponíveis) para a validação de algoritmos de detecção e rastreamento de texto e de rastreamento de objetos rígidos em vídeos / Abstract: In this thesis we address three computer vision problems: (1) the detection and recognition of flat text objects in images of real scenes; (2) the tracking of such text objects in a digital video; and (3) the tracking an arbitrary three-dimensional rigid object with known markings in a digital video. For each problem we developed innovative algorithms, which are at least as accurate and robust as other state-of-the-art algorithms. Specifically, for text classification we developed (and extensively evaluated) a new HOG-based descriptor specialized for Roman script, which we call T-HOG, and showed its value as a post-filter for an existing text detector (SNOOPERTEXT). We also improved the SNOOPERTEXT algorithm by using the multi-scale technique to handle widely different letter sizes while limiting the sensitivity of the algorithm to various artifacts. For text tracking, we describe four basic ways of combining a text detector and a text tracker, and we developed a specific tracker based on a particle-filter which exploits the T-HOG recognizer. For rigid object tracking we developed a new accurate and robust algorithm (AFFTRACK) that combines the KLT feature tracker with an improved camera calibration procedure. We extensively tested our algorithms on several benchmarks well-known in the literature. We also created benchmarks (publicly available) for the evaluation of text detection and tracking and rigid object tracking algorithms / Doutorado / Ciência da Computação / Doutor em Ciência da Computação
|
33 |
Spatially explicit modeling on networks: understanding patterns & describing processes / Modelagem espacialmente explícita em redes: compreendendo padrões e descrevendo processosMiranda, Gisele Helena Barboni 28 May 2019 (has links)
In contrast to established approaches that analyze networks based on their structural properties, networks can also be studied by investigating the patterns that are evolved by a discrete dynamical system built upon them, such as cellular automata (CAs). Combined with networks these tools can be used to map the relationship between the network architecture and its impact on the patterns evolved by the governing spatially discrete dynamical system. This thesis focuses on the investigation of discrete spatially explicit models (SEMs), among which are CAs, for network analysis and characterization. The relationship between network architecture and its dynamic aspects concerning pattern formation is studied. Additionally, this work aims at the development of evolutionary methods that can be employed for extracting features from such patterns and then be used as network descriptors. In order to achieve this goal, methods that integrate the network structure with the SEMs were proposed, implemented and analyzed. The proposed family of network automata is characterized by birth-survival dynamics that results in different categories of spatio-temporal patterns. Such patterns were quantitatively assessed and used to characterize different network topologies and perform classification tasks in the context of pattern recognition. Inspired by the classic Life-like CA, the proposed Life-like Network Automata (LLNA) illustrate how such tasks can be performed in real-world applications. In addition, the rock-paper-scissors (RPS) model, normally implemented on square lattices, was investigated by defining it on networks. The obtained results confirm the potential of the proposed quantitative analysis of the spatio-temporal patterns for network classification. This quantitative analysis was performed for a set of different pattern recognition tasks and for the majority of them, the classification performance improved. In addition, the reliability of LLNA as a general tool for pattern recognition applications was demonstrated in a diverse scope of classification tasks. The applicability of structural network descriptors was also highlighted in the context of shape characterization in computer vision. Through the proposed approach, the link between these network descriptors and the shape properties, such as angle and curvature, was illustrated. Moreover, when chosen adequately, the network descriptors led to a better classification performance for different shape recognition tasks. Regarding the RPS model, we demonstrated that the presence of long-range correlations in some networks directly influence the RPS dynamics. Finally, it was shown how a commuter network can be used to predict influenza outbreaks. All the proposed methods use different aspects of network analysis and contribute to the study of CAs and other SEMs on irregular tessellations, in contrast to the commonly used regular topologies. In addition, new insights were obtained concerning pattern recognition in networks through the use of spatio-temporal patterns as network descriptors. / Em contraste às abordagens clássicas que analisam redes com base em suas propriedades estruturais, as redes também podem ser estudadas investigando-se os padrões desenvolvidos por um sistema dinâmico discreto construído sobre essas redes, como os autômatos celulares (CAs). Combinadas às redes, essas ferramentas podem ser usadas para se mapear a relação entre a arquitetura da rede e seu impacto nos padrões obtidos pelo sistema dinâmico subjacente. Esta tese está focada na investigação de modelos discretos espacialmente explícitos (SEMs), entre os quais os CAs, para análise e caracterização de redes. A relação entre a arquitetura da rede e seu aspecto dinâmico em relação à formação de padrões é investigada. Além disso, este trabalho visa o desenvolvimento de métodos evolutivos que podem ser usados para extrair características de tais padrões para, então, serem usados como descritores de redes. Para atingir este objetivo, métodos que integram a estrutura da rede com os SEMs foram propostos, implementados e analisados. A família de redes-autômatos proposta é caracterizada por uma dinâmica de nascimento-sobrevivência que resulta em diferentes categorias de padrões espaço-temporais. Tais padrões foram avaliados quantitativamente e utilizados para caracterizar diferentes topologias de redes e realizar tarefas de classificação no contexto do reconhecimento de padrões. Inspirados pelo clássico Life-Like CA, a rede-autômato proposta, Life-like (LLNA), ilustra como tais tarefas podem ser realizadas em aplicações mais realistas. Além disso, o modelo de rock-paper-scissors (RPS), normalmente implementado em reticulados quadrados, foi investigado usando-se redes como tesselações. Os resultados obtidos confirmam o potencial da análise quantitativa proposta dos padrões espaço-temporais para classificação de redes. Essa análise quantitativa foi realizada para um conjunto de tarefas de reconhecimento de padrões, e, para a maioria dessas tarefas, o desempenho da classificação melhorou. Além disso, a confiabilidade do LLNA como uma ferramenta genérica para reconhecimento de padrões foi demonstrada para várias tarefas de classificação de diferentes escopos. A aplicabilidade de descritores estruturais de redes também foi destacada no contexto de caracterização de formas em visão computacional. Através da abordagem proposta, a ligação entre esses descritores de rede e as propriedades da forma, como ângulo e curvatura, foi ilustrada. Além disso, quando escolhidos adequadamente, os descritores de rede levam a um melhor desempenho de classificação para diferentes tarefas de categorização de formas. No que diz respeito ao modelo RPS, demonstramos que a presença de correlações de longo alcance nas redes afeta diretamente a dinâmica do modelo. Finalmente, foi apresentado como uma rede de transporte pode ser usada para prever surtos de gripe. Todos os métodos propostos utilizam diferentes aspectos da análise de redes e contribuem para o estudo de CAs e outras SEMs em tesselações irregulares, uma vez que estes modelos são geralmente descritos em topologias regulares. Além disso, uma nova metodologia foi proposta em relação ao reconhecimento de padrões em redes através do uso de padrões espaço-temporais como descritores da rede.
|
34 |
Recuperação de imagens: similaridade parcial baseada em espectro de grafo e corSantos, Dalí Freire Dias dos 17 August 2012 (has links)
Traditionally, local shape descriptors or color and texture based descriptors are used
to describe the content of images. Although, these solutions achieving good results, they
are not able to distinguish scenes that contain objects with the same colors, but with a
different spatial organization or do not supports partial matching. In this work we focus
on a particular case of the partial matching that is to find individual objects in images
that contain various objects.
Since the color is one of the most visually distinguishable properties, we propose a
new descriptor based only on color able to find pictures of objects that are contained in
other images. Although our descriptor has shown better results when compared to related
works, this new color descriptor is not able to discriminate objects topologically different
but having the same colors. To overcome this problem, we also propose a new approach
to the partial matching of images that combine color and topological features on a single
descriptor. This new descriptor, first performs a simplification process of the original
image, which identifies the color regions that make up the image. Then, we represent
the spatial information among the color regions using a topological graph, where vertices
represent the color regions and the edges represent the spatial connections between them.
To calculate the descriptor from this graph representation, we use the spectral theory of
graphs, avoiding the need to make a direct comparison between graphs. To support the
partial matching, we propose a decomposition of the main graph into several subgraphs,
and also calculate descriptors for these subgraphs. / Tradicionalmente, descritores de forma, ou descritores baseados em cor e textura,
são utilizados para descrever o conteúdo visual das imagens. Embora essas abordagens
apresentem bons resultados, elas não são capazes de diferenciar adequadamente imagens
que contêm objetos com as mesmas cores, mas com organização espacial diferente ou não
suportam a pesquisa parcial de imagens. Neste trabalho focamos em um caso particular
da pesquisa parcial de imagens, que é encontrar objetos em imagens que contenham vários
objetos, não deixando de lado a pesquisa total (encontrar imagens similares à original).
Dado que a cor é uma das propriedades visuais mais discriminativas, propomos um
novo descritor baseado somente em cor capaz de encontrar imagens de objetos que estão
contidos em outras imagens. Embora tenha apresentado melhores resultados quando
comparado a trabalhos correlatos, esse novo descritor de cor não é capaz de discriminar
objetos topologicamente diferentes mas que possuam as mesmas cores. Com o intuito
de resolver esse problema, também propomos uma nova abordagem para a recuperação
parcial de imagens que combina características topológicas e de cor em um único descritor.
Esse novo descritor primeiramente realiza um processo de simplificação da imagem
original, onde são identificadas as regiões de cor que compõem a imagem. Após esse processo
de simplificação, a organização espacial das regiões de cor previamente identificadas
é representada por meio de um grafo topológico, onde os vértices representam as regiões
de cor e as arestas representam as conexões entre essas regiões. O descritor topológico
é então calculado a partir do grafo de topologia utilizando a teoria espectral de grafos,
evitando a necessidade de se realizar uma comparação direta entre grafos. Para suportar a
pesquisa parcial de imagens, é realizada uma decomposição do grafo principal em diversos
subgrafos. / Mestre em Ciência da Computação
|
35 |
Processos de trabalho [no campo psicossocial] de uma equipe de referência do CAPS III percursos para a construção compartilhada de projetos para a vida de uma usuária do serviço / Processes of work [in the psychosocial field] of a reference team of a CAPS III: paths for the shared construction of projects of life of a user of the serviceSouza, Ana Carolina Santos de 17 June 2011 (has links)
Esta pesquisa tomou como objeto de estudo os processos de trabalho e a relação entre atores (trabalhadores e usuária) que guiou a construção do projeto terapêutico singular ou projetos para a vida de Maria Luiza da Silva, nome que a usuária do serviço escolheu para ser identificada. Preocupou-se em saber se esses processos de trabalho e as relações produziram emancipação ou subordinação, analisados à luz do referencial teórico da reabilitação como cidadania. A presente pesquisa é um estudo qualitativo do tipo estudo de caso observacional. Utilizou como estratégia metodológica para captação dos processos de trabalho o fluxograma descritor (que se mostrou um instrumento eficaz), cumpriu a orientação metodológica da sua construção coletiva, buscando no registro da memória da equipe de referência, no prontuário e no diário de bordo da pesquisadora, os passos seguidos pela usuária. Os processos de trabalho captados por meio do fluxograma descritor foram: Promover adesão ao serviço e vinculação com equipe de referência; Mediar problemas de moradia: conseguir vaga em albergue e alugar vaga em quarto; Viabilizar o acesso a benefício de prestação continuada; Mediar o processo de resgate do vínculo com familiares; Mediar a procura por curso profissionalizante; Mediar a relação com as proprietárias dos quartos; Ajudar a organizar o cotidiano; Ajudar a conseguir vaga de trabalho temporário ou informal e Reorientar o projeto terapêutico singular compartilhado. Constatou-se que todos os processos de trabalho desenvolvidos pela equipe de referência foram acionados pelas necessidades da usuária, portanto, aferiu-se centralidade na usuária para a produção da ação de saúde. A análise indica clareza e pertinência com relação aos instrumentos de intervenção engendrados, mas observa-se que as finalidades não ficam claramente definidas em todos os processos de trabalho. Ao final da análise constata-se um objeto de intervenção - uma Maria Luiza protagonista, questionando seu PTS. A equipe de referência, neste processo de trabalho, em particular, radicaliza a forma de organização dos saberes, como deve ser no campo psicossocial, e sustenta que quem sabe de suas necessidades é o sujeito que as porta. O instrumento de intervenção, no caso, foi o vínculo e a inclusão do seu saber laico, leigo, não codificado. A finalidade deste processo de trabalho, em particular, é uma diretriz da Reforma Psiquiátrica e do SUS: dialogar com uma cidadã. / The object of study of this research is the process of work and the relations between actors (workers and user of a mental health service) that guided the construction of the singular therapeutic project, or projects for the life of Maria Luiza da Silva, name that the user of the service chose to be identified. The researchers aimed to know if theses processes and the relations established produced emancipation or subordination, analyzed under the theoretical reference of rehabilitation as citizenship. The present research is a qualitative study, of the observational case study type. A describer fluxogram was used as methodological strategy for capturing the processes of work (It has shown as a useful instrument), all the methodological orientation was followed for the collective construction of the fluxogram, collecting the information from the memory of the workers, the chart and the board diary built by the researcher, for the construction of the steps of the user of the service. The processes of work captured by the describer fluxogram were: Promoting adherence to the service and connection to the reference team; Mediate the problems of housing: getting vacancies in albergues and vacancy in rooms; Provide the access to the BPC; Mediate the rescue of the relations with family; Mediate the search for professionalizing courses; Mediate the relation between the landladies; Helping with the every day organization; Helping getting an informal job vacancy and Reorient the shared singular therapeutic project. It was realized that all the processes of work developed by the reference team were started by her needs, therefore, it was checked the centrality in the user of the service for the construction of actions in health. The analysis points to the clarity and coherence related to the instruments for intervention generated, but it is possible to observe that the goals are not clearly defined in all the processes of work. By the end of the analysis it is possible to realize an intervention object a protagonist Maria Luiza, questioning her singular therapeutic project. The reference team, in this process of work in particular, radicalizes the way the knowledge is organized, as it is supposed to be in the psychosocial field, and sustains that who knows about one needs is the own person who needs. The instrument of intervention, in this case, was the connection and the inclusion of her secular and layman knowledge, un-codified. The goal of this process of work in particular, is a direction of the Brazilian Psychosocial Reform and the SUS: conversing with a citizenship.
|
36 |
Processos de trabalho [no campo psicossocial] de uma equipe de referência do CAPS III percursos para a construção compartilhada de projetos para a vida de uma usuária do serviço / Processes of work [in the psychosocial field] of a reference team of a CAPS III: paths for the shared construction of projects of life of a user of the serviceAna Carolina Santos de Souza 17 June 2011 (has links)
Esta pesquisa tomou como objeto de estudo os processos de trabalho e a relação entre atores (trabalhadores e usuária) que guiou a construção do projeto terapêutico singular ou projetos para a vida de Maria Luiza da Silva, nome que a usuária do serviço escolheu para ser identificada. Preocupou-se em saber se esses processos de trabalho e as relações produziram emancipação ou subordinação, analisados à luz do referencial teórico da reabilitação como cidadania. A presente pesquisa é um estudo qualitativo do tipo estudo de caso observacional. Utilizou como estratégia metodológica para captação dos processos de trabalho o fluxograma descritor (que se mostrou um instrumento eficaz), cumpriu a orientação metodológica da sua construção coletiva, buscando no registro da memória da equipe de referência, no prontuário e no diário de bordo da pesquisadora, os passos seguidos pela usuária. Os processos de trabalho captados por meio do fluxograma descritor foram: Promover adesão ao serviço e vinculação com equipe de referência; Mediar problemas de moradia: conseguir vaga em albergue e alugar vaga em quarto; Viabilizar o acesso a benefício de prestação continuada; Mediar o processo de resgate do vínculo com familiares; Mediar a procura por curso profissionalizante; Mediar a relação com as proprietárias dos quartos; Ajudar a organizar o cotidiano; Ajudar a conseguir vaga de trabalho temporário ou informal e Reorientar o projeto terapêutico singular compartilhado. Constatou-se que todos os processos de trabalho desenvolvidos pela equipe de referência foram acionados pelas necessidades da usuária, portanto, aferiu-se centralidade na usuária para a produção da ação de saúde. A análise indica clareza e pertinência com relação aos instrumentos de intervenção engendrados, mas observa-se que as finalidades não ficam claramente definidas em todos os processos de trabalho. Ao final da análise constata-se um objeto de intervenção - uma Maria Luiza protagonista, questionando seu PTS. A equipe de referência, neste processo de trabalho, em particular, radicaliza a forma de organização dos saberes, como deve ser no campo psicossocial, e sustenta que quem sabe de suas necessidades é o sujeito que as porta. O instrumento de intervenção, no caso, foi o vínculo e a inclusão do seu saber laico, leigo, não codificado. A finalidade deste processo de trabalho, em particular, é uma diretriz da Reforma Psiquiátrica e do SUS: dialogar com uma cidadã. / The object of study of this research is the process of work and the relations between actors (workers and user of a mental health service) that guided the construction of the singular therapeutic project, or projects for the life of Maria Luiza da Silva, name that the user of the service chose to be identified. The researchers aimed to know if theses processes and the relations established produced emancipation or subordination, analyzed under the theoretical reference of rehabilitation as citizenship. The present research is a qualitative study, of the observational case study type. A describer fluxogram was used as methodological strategy for capturing the processes of work (It has shown as a useful instrument), all the methodological orientation was followed for the collective construction of the fluxogram, collecting the information from the memory of the workers, the chart and the board diary built by the researcher, for the construction of the steps of the user of the service. The processes of work captured by the describer fluxogram were: Promoting adherence to the service and connection to the reference team; Mediate the problems of housing: getting vacancies in albergues and vacancy in rooms; Provide the access to the BPC; Mediate the rescue of the relations with family; Mediate the search for professionalizing courses; Mediate the relation between the landladies; Helping with the every day organization; Helping getting an informal job vacancy and Reorient the shared singular therapeutic project. It was realized that all the processes of work developed by the reference team were started by her needs, therefore, it was checked the centrality in the user of the service for the construction of actions in health. The analysis points to the clarity and coherence related to the instruments for intervention generated, but it is possible to observe that the goals are not clearly defined in all the processes of work. By the end of the analysis it is possible to realize an intervention object a protagonist Maria Luiza, questioning her singular therapeutic project. The reference team, in this process of work in particular, radicalizes the way the knowledge is organized, as it is supposed to be in the psychosocial field, and sustains that who knows about one needs is the own person who needs. The instrument of intervention, in this case, was the connection and the inclusion of her secular and layman knowledge, un-codified. The goal of this process of work in particular, is a direction of the Brazilian Psychosocial Reform and the SUS: conversing with a citizenship.
|
37 |
Descritor de movimento baseado em tensor e histograma de gradientesPerez, Eder de Almeida 24 August 2012 (has links)
Submitted by Renata Lopes (renatasil82@gmail.com) on 2017-03-06T15:14:46Z
No. of bitstreams: 1
ederdealmeidaperez.pdf: 749381 bytes, checksum: 7338f694cc850057100e730b520d74eb (MD5) / Approved for entry into archive by Adriana Oliveira (adriana.oliveira@ufjf.edu.br) on 2017-03-06T20:25:35Z (GMT) No. of bitstreams: 1
ederdealmeidaperez.pdf: 749381 bytes, checksum: 7338f694cc850057100e730b520d74eb (MD5) / Made available in DSpace on 2017-03-06T20:25:35Z (GMT). No. of bitstreams: 1
ederdealmeidaperez.pdf: 749381 bytes, checksum: 7338f694cc850057100e730b520d74eb (MD5)
Previous issue date: 2012-08-24 / CAPES - Coordenação de Aperfeiçoamento de Pessoal de Nível Superior / O reconhecimento de padrões de movimentos tem se tornado um campo de pesquisa muito
atrativo nos últimos anos devido, entre outros fatores, à grande massificação de dados em
vídeos e a tendência na criação de interfaces homem-máquina que utilizam expressões
faciais e corporais. Esse campo pode ser considerado um dos requisitos chave para análise
e entendimento de vídeos.
Neste trabalho é proposto um descritor de movimentos baseado em tensores de 2a
ordem e histogramas de gradientes (HOG - Histogram of Oriented Gradients). O cálculo
do descritor é rápido, simples e eficaz. Além disso, nenhum aprendizado prévio é necessário
sendo que a adição de novas classes de movimentos ou novos vídeos não necessita de
mudanças ou que se recalculem os descritores já existentes. Cada quadro do vídeo é
particionado e em cada partição calcula-se o histograma de gradientes no espaço e no
tempo. A partir daí calcula-se o tensor do quadro e o descritor final é formado por uma
série de tensores de cada quadro.
O descritor criado é avaliado classificando-se as bases de vídeos KTH e Hollywood2,
utilizadas na literatura atual, com um classificador Máquina Vetor Suporte (SVM). Os
resultados obtidos na base KTH são próximos aos descritores do estado da arte que utilizam
informação local do vídeo. Os resultados obtidos na base Hollywood2 não superam
o estado da arte, mas são próximos o suficiente para concluirmos que o método proposto
é eficaz. Apesar de a literatura apresentar descritores que possuem resultados superiores
na classificação, suas abordagens são complexas e de alto custo computacional. / The motion pattern recognition has become a very attractive research field in recent years
due to the large amount of video data and the creation of human-machine interfaces that
use facial and body expressions. This field can be considered one of the key requirements
for analysis and understanding in video.
This thesis proposes a motion descriptor based on second order tensor and histograms
of oriented gradients. The calculation of the descriptor is fast, simple and effective.
Furthermore, no prior knowledge of data basis is required and the addition of new classes
of motion and videos do not need to recalculate the existing descriptors. The frame of a
video is divided into a grid and the histogram of oriented gradients is computed in each
cell. After that, the frame tensor is computed and the final descriptor is built by a series
of frame tensors.
The descriptor is evaluated in both KTH and Hollywood2 data basis, used in the
current literature, with a Support Vector Machine classifier (SVM). The results obtained
on the basis KTH are very close to the descriptors of the state-of-the-art that use local
information of the video. The results obtained on the basis Hollywood2 not outweigh the
state-of-the-art but are close enough to conclude that the proposed method is effective.
Although the literature presents descriptors that have superior results, their approaches
are complex and with computational cost.
|
38 |
Video motion description based on histograms of sparse trajectoriesOliveira, Fábio Luiz Marinho de 05 September 2016 (has links)
Submitted by Renata Lopes (renatasil82@gmail.com) on 2017-06-06T19:12:19Z
No. of bitstreams: 1
fabioluizmarinhodeoliveira.pdf: 1410854 bytes, checksum: cb71ee666cda7d462ce0dd33963a988c (MD5) / Approved for entry into archive by Adriana Oliveira (adriana.oliveira@ufjf.edu.br) on 2017-06-07T13:33:08Z (GMT) No. of bitstreams: 1
fabioluizmarinhodeoliveira.pdf: 1410854 bytes, checksum: cb71ee666cda7d462ce0dd33963a988c (MD5) / Made available in DSpace on 2017-06-07T13:33:08Z (GMT). No. of bitstreams: 1
fabioluizmarinhodeoliveira.pdf: 1410854 bytes, checksum: cb71ee666cda7d462ce0dd33963a988c (MD5)
Previous issue date: 2016-09-05 / Descrição de movimento tem sido um tema desafiador e popular há muitos anos em
visão computacional e processamento de sinais, mas também intimamente relacionado a
aprendizado de máquina e reconhecimento de padrões. Frequentemente, para realizar essa
tarefa, informação de movimento é extraída e codificada em um descritor. Este trabalho
apresenta um método simples e de rápida computação para extrair essa informação e
codificá-la em descritores baseados em histogramas de deslocamentos relativos. Nossos
descritores são compactos, globais, que agregam informação de quadros inteiros, e o que
chamamos de auto-descritor, que não depende de informações de sequências senão aquela
que pretendemos descrever. Para validar estes descritores e compará-los com outros tra
balhos, os utilizamos no contexto de Reconhecimento de Ações Humanas, no qual cenas
são classificadas de acordo com as ações nelas exibidas. Nessa validação, obtemos resul
tados comparáveis aos do estado-da-arte para a base de dados KTH. Também avaliamos
nosso método utilizando as bases UCF11 e Hollywood2, com menores taxas de reconhe
cimento, considerando suas maiores complexidades. Nossa abordagem é promissora, pelas
razoáveis taxas de reconhecimento obtidas com um método muito menos complexo que os
do estado-da-arte, em termos de velocidade de computação e compacidade dos descritores
obtidos. Adicionalmente, experimentamos com o uso de Aprendizado de Métrica para a
classificação de nossos descritores, com o intuito de melhorar a separabilidade e a com
pacidade dos descritores. Os resultados com Aprendizado de Métrica apresentam taxas
de reconhecimento inferiores, mas grande melhoria na compacidade dos descritores. / Motion description has been a challenging and popular theme over many years within
computer vision and signal processing, but also very closely related to machine learn
ing and pattern recognition. Very frequently, to address this task, one extracts motion
information from image sequences and encodes this information into a descriptor. This
work presents a simple and fast computing method to extract this information and en
code it into descriptors based on histograms of relative displacements. Our descriptors
are compact, global, meaning it aggregates information from whole frames, and what we
call self-descriptors, meaning they do not depend on information from sequences other
than the one we want to describe. To validate these descriptors and compare them to
other works, we use them in the context of Human Action Recognition, where scenes are
classified according to the action portrayed. In this validation, we achieve results that are
comparable to those in the state-of-the-art for the KTH dataset. We also evaluate our
method on the UCF11 and Hollywood2 datasets, with lower recognition rates, considering
their higher complexity. Our approach is a promising one, due to the fairly good recogni
tion rates we obtain with a much less complex method than those of the state-of-the-art,
in terms of speed of computation and final descriptor compactness. Additionally, we ex
periment with the use of Metric Learning in the classification of our descriptors, aiming
to improve the separability and compactness of the descriptors. Our results for Metric
Learning show inferior recognition rates, but great improvement for the compactness of
the descriptors.
|
Page generated in 0.0631 seconds