• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 35
  • 2
  • Tagged with
  • 38
  • 25
  • 10
  • 9
  • 9
  • 8
  • 7
  • 7
  • 7
  • 7
  • 7
  • 6
  • 6
  • 6
  • 5
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
31

Um descritor tensorial de movimento baseado em múltiplos estimadores de gradiente

Sad, Dhiego Cristiano Oliveira da Silva 22 February 2013 (has links)
Submitted by Renata Lopes (renatasil82@gmail.com) on 2017-05-30T19:45:09Z No. of bitstreams: 1 dhiegocristianooliveiradasilvasad.pdf: 1920111 bytes, checksum: c7bccda6c65e798776738b9581721c98 (MD5) / Approved for entry into archive by Adriana Oliveira (adriana.oliveira@ufjf.edu.br) on 2017-06-01T11:37:10Z (GMT) No. of bitstreams: 1 dhiegocristianooliveiradasilvasad.pdf: 1920111 bytes, checksum: c7bccda6c65e798776738b9581721c98 (MD5) / Made available in DSpace on 2017-06-01T11:37:10Z (GMT). No. of bitstreams: 1 dhiegocristianooliveiradasilvasad.pdf: 1920111 bytes, checksum: c7bccda6c65e798776738b9581721c98 (MD5) Previous issue date: 2013-02-22 / CAPES - Coordenação de Aperfeiçoamento de Pessoal de Nível Superior / Este trabalho apresenta uma nova abordagem para a descrição de movimento em vídeos usando múltiplos filtros passa-banda que agem como estimadores derivativos de primeira ordem. A resposta dos filtros em cada quadro do vídeo é extraída e codificada em histogramas de gradientes para reduzir a sua dimensionalidade. Essa combinação é realizada através de tensores de orientação. O grande diferencial deste trabalho em relação à maioria das abordagens encontradas na literatura é que nenhuma característica local é extraída e nenhum método de aprendizagem é realizado previamente, isto é, o descritor depende unicamente do vídeo de entrada. Para o problema de reconhecimento da ação humana utilizando a base de dados KTH, nosso descritor alcançou a taxa de reconhecimento de 93,3% usando três filtros da família Daubechies combinado com mais um filtro extra que é a correlação entre esses três filtros. O descritor resultante é então classificado através do SVM utilizando um protocolo two-fold. Essa classificação se mostra superior para a maioria das abordagens que usam descritores globais e pode ser comparável aos métodos do estado-da-arte. / This work presents a novel approach for motion description in videos using multiple band-pass filters that act as first order derivative estimators. The filters response on each frame are coded into individual histograms of gradients to reduce their dimensionality. They are combined using orientation tensors. No local features are extracted and no learning is performed, i.e., the descriptor depends uniquely on the input video. Motion description can be enhanced even using multiple filters with similar or overlapping fre quency response. For the problem of human action recognition using the KTH database, our descriptor achieved the recognition rate of 93,3% using three Daubechies filters, one extra filter designed to correlate them, two-fold protocol and a SVM classifier. It is su perior to most global descriptor approaches and fairly comparable to the state-of-the-art methods.
32

Reconhecimento de texto e rastreamento de objetos 2D/3D / Text recognition and 2D/3D object tracking

Minetto, Rodrigo, 1983- 20 August 2018 (has links)
Orientadores: Jorge Stolfi, Neucimar Jerônimo Leite / Tese (doutorado) - Universidade Estadual de Campinas, Instituto de Computação / Made available in DSpace on 2018-08-20T03:12:07Z (GMT). No. of bitstreams: 1 Minetto_Rodrigo_D.pdf: 35894128 bytes, checksum: 8a0e453fba7e6a9a02fb17a52fdbf878 (MD5) Previous issue date: 2012 / Resumo: Nesta tese abordamos três problemas de visão computacional: (1) detecção e reconhecimento de objetos de texto planos em imagens de cenas reais; (2) rastreamento destes objetos de texto em vídeos digitais; e (3) o rastreamento de um objeto tridimensional rígido arbitrário com marcas conhecidas em um vídeo digital. Nós desenvolvemos, para cada um dos problemas, algoritmos inovadores, que são pelo menos tão precisos e robustos quanto outros algoritmos estado-da-arte. Especificamente, para reconhecimento de texto nós desenvolvemos (e validamos extensivamente) um novo descritor de imagem baseado em HOG especializado para escrita romana, que denominamos T-HOG, e mostramos sua contribuição como um filtro em um detector de texto (SNOOPERTEXT). Nós também melhoramos o algoritmo SNOOPERTEXT através do uso da técnica multiescala para tratar caracteres de tamanhos bastante variados e limitar a sensibilidade do algoritmo a vários artefatos. Para rastreamento de texto, nós descrevemos quatro estratégias básicas para combinar a detecção e o rastreamento de texto, e desenvolvemos também um rastreador específico baseado em filtro de partículas que explora o uso do reconhecedor T-HOG. Para o rastreamento de objetos rígidos, nós desenvolvemos um novo algoritmo preciso e robusto (AFFTRACK) que combina rastreamento de características por KLT com uma calibração de câmera melhorada. Nós testamos extensivamente nossos algoritmos com diversas bases de dados descritas na literatura. Nós também desenvolvemos algumas bases de dados (publicamente disponíveis) para a validação de algoritmos de detecção e rastreamento de texto e de rastreamento de objetos rígidos em vídeos / Abstract: In this thesis we address three computer vision problems: (1) the detection and recognition of flat text objects in images of real scenes; (2) the tracking of such text objects in a digital video; and (3) the tracking an arbitrary three-dimensional rigid object with known markings in a digital video. For each problem we developed innovative algorithms, which are at least as accurate and robust as other state-of-the-art algorithms. Specifically, for text classification we developed (and extensively evaluated) a new HOG-based descriptor specialized for Roman script, which we call T-HOG, and showed its value as a post-filter for an existing text detector (SNOOPERTEXT). We also improved the SNOOPERTEXT algorithm by using the multi-scale technique to handle widely different letter sizes while limiting the sensitivity of the algorithm to various artifacts. For text tracking, we describe four basic ways of combining a text detector and a text tracker, and we developed a specific tracker based on a particle-filter which exploits the T-HOG recognizer. For rigid object tracking we developed a new accurate and robust algorithm (AFFTRACK) that combines the KLT feature tracker with an improved camera calibration procedure. We extensively tested our algorithms on several benchmarks well-known in the literature. We also created benchmarks (publicly available) for the evaluation of text detection and tracking and rigid object tracking algorithms / Doutorado / Ciência da Computação / Doutor em Ciência da Computação
33

Spatially explicit modeling on networks: understanding patterns & describing processes / Modelagem espacialmente explícita em redes: compreendendo padrões e descrevendo processos

Miranda, Gisele Helena Barboni 28 May 2019 (has links)
In contrast to established approaches that analyze networks based on their structural properties, networks can also be studied by investigating the patterns that are evolved by a discrete dynamical system built upon them, such as cellular automata (CAs). Combined with networks these tools can be used to map the relationship between the network architecture and its impact on the patterns evolved by the governing spatially discrete dynamical system. This thesis focuses on the investigation of discrete spatially explicit models (SEMs), among which are CAs, for network analysis and characterization. The relationship between network architecture and its dynamic aspects concerning pattern formation is studied. Additionally, this work aims at the development of evolutionary methods that can be employed for extracting features from such patterns and then be used as network descriptors. In order to achieve this goal, methods that integrate the network structure with the SEMs were proposed, implemented and analyzed. The proposed family of network automata is characterized by birth-survival dynamics that results in different categories of spatio-temporal patterns. Such patterns were quantitatively assessed and used to characterize different network topologies and perform classification tasks in the context of pattern recognition. Inspired by the classic Life-like CA, the proposed Life-like Network Automata (LLNA) illustrate how such tasks can be performed in real-world applications. In addition, the rock-paper-scissors (RPS) model, normally implemented on square lattices, was investigated by defining it on networks. The obtained results confirm the potential of the proposed quantitative analysis of the spatio-temporal patterns for network classification. This quantitative analysis was performed for a set of different pattern recognition tasks and for the majority of them, the classification performance improved. In addition, the reliability of LLNA as a general tool for pattern recognition applications was demonstrated in a diverse scope of classification tasks. The applicability of structural network descriptors was also highlighted in the context of shape characterization in computer vision. Through the proposed approach, the link between these network descriptors and the shape properties, such as angle and curvature, was illustrated. Moreover, when chosen adequately, the network descriptors led to a better classification performance for different shape recognition tasks. Regarding the RPS model, we demonstrated that the presence of long-range correlations in some networks directly influence the RPS dynamics. Finally, it was shown how a commuter network can be used to predict influenza outbreaks. All the proposed methods use different aspects of network analysis and contribute to the study of CAs and other SEMs on irregular tessellations, in contrast to the commonly used regular topologies. In addition, new insights were obtained concerning pattern recognition in networks through the use of spatio-temporal patterns as network descriptors. / Em contraste às abordagens clássicas que analisam redes com base em suas propriedades estruturais, as redes também podem ser estudadas investigando-se os padrões desenvolvidos por um sistema dinâmico discreto construído sobre essas redes, como os autômatos celulares (CAs). Combinadas às redes, essas ferramentas podem ser usadas para se mapear a relação entre a arquitetura da rede e seu impacto nos padrões obtidos pelo sistema dinâmico subjacente. Esta tese está focada na investigação de modelos discretos espacialmente explícitos (SEMs), entre os quais os CAs, para análise e caracterização de redes. A relação entre a arquitetura da rede e seu aspecto dinâmico em relação à formação de padrões é investigada. Além disso, este trabalho visa o desenvolvimento de métodos evolutivos que podem ser usados para extrair características de tais padrões para, então, serem usados como descritores de redes. Para atingir este objetivo, métodos que integram a estrutura da rede com os SEMs foram propostos, implementados e analisados. A família de redes-autômatos proposta é caracterizada por uma dinâmica de nascimento-sobrevivência que resulta em diferentes categorias de padrões espaço-temporais. Tais padrões foram avaliados quantitativamente e utilizados para caracterizar diferentes topologias de redes e realizar tarefas de classificação no contexto do reconhecimento de padrões. Inspirados pelo clássico Life-Like CA, a rede-autômato proposta, Life-like (LLNA), ilustra como tais tarefas podem ser realizadas em aplicações mais realistas. Além disso, o modelo de rock-paper-scissors (RPS), normalmente implementado em reticulados quadrados, foi investigado usando-se redes como tesselações. Os resultados obtidos confirmam o potencial da análise quantitativa proposta dos padrões espaço-temporais para classificação de redes. Essa análise quantitativa foi realizada para um conjunto de tarefas de reconhecimento de padrões, e, para a maioria dessas tarefas, o desempenho da classificação melhorou. Além disso, a confiabilidade do LLNA como uma ferramenta genérica para reconhecimento de padrões foi demonstrada para várias tarefas de classificação de diferentes escopos. A aplicabilidade de descritores estruturais de redes também foi destacada no contexto de caracterização de formas em visão computacional. Através da abordagem proposta, a ligação entre esses descritores de rede e as propriedades da forma, como ângulo e curvatura, foi ilustrada. Além disso, quando escolhidos adequadamente, os descritores de rede levam a um melhor desempenho de classificação para diferentes tarefas de categorização de formas. No que diz respeito ao modelo RPS, demonstramos que a presença de correlações de longo alcance nas redes afeta diretamente a dinâmica do modelo. Finalmente, foi apresentado como uma rede de transporte pode ser usada para prever surtos de gripe. Todos os métodos propostos utilizam diferentes aspectos da análise de redes e contribuem para o estudo de CAs e outras SEMs em tesselações irregulares, uma vez que estes modelos são geralmente descritos em topologias regulares. Além disso, uma nova metodologia foi proposta em relação ao reconhecimento de padrões em redes através do uso de padrões espaço-temporais como descritores da rede.
34

Recuperação de imagens: similaridade parcial baseada em espectro de grafo e cor

Santos, Dalí Freire Dias dos 17 August 2012 (has links)
Traditionally, local shape descriptors or color and texture based descriptors are used to describe the content of images. Although, these solutions achieving good results, they are not able to distinguish scenes that contain objects with the same colors, but with a different spatial organization or do not supports partial matching. In this work we focus on a particular case of the partial matching that is to find individual objects in images that contain various objects. Since the color is one of the most visually distinguishable properties, we propose a new descriptor based only on color able to find pictures of objects that are contained in other images. Although our descriptor has shown better results when compared to related works, this new color descriptor is not able to discriminate objects topologically different but having the same colors. To overcome this problem, we also propose a new approach to the partial matching of images that combine color and topological features on a single descriptor. This new descriptor, first performs a simplification process of the original image, which identifies the color regions that make up the image. Then, we represent the spatial information among the color regions using a topological graph, where vertices represent the color regions and the edges represent the spatial connections between them. To calculate the descriptor from this graph representation, we use the spectral theory of graphs, avoiding the need to make a direct comparison between graphs. To support the partial matching, we propose a decomposition of the main graph into several subgraphs, and also calculate descriptors for these subgraphs. / Tradicionalmente, descritores de forma, ou descritores baseados em cor e textura, são utilizados para descrever o conteúdo visual das imagens. Embora essas abordagens apresentem bons resultados, elas não são capazes de diferenciar adequadamente imagens que contêm objetos com as mesmas cores, mas com organização espacial diferente ou não suportam a pesquisa parcial de imagens. Neste trabalho focamos em um caso particular da pesquisa parcial de imagens, que é encontrar objetos em imagens que contenham vários objetos, não deixando de lado a pesquisa total (encontrar imagens similares à original). Dado que a cor é uma das propriedades visuais mais discriminativas, propomos um novo descritor baseado somente em cor capaz de encontrar imagens de objetos que estão contidos em outras imagens. Embora tenha apresentado melhores resultados quando comparado a trabalhos correlatos, esse novo descritor de cor não é capaz de discriminar objetos topologicamente diferentes mas que possuam as mesmas cores. Com o intuito de resolver esse problema, também propomos uma nova abordagem para a recuperação parcial de imagens que combina características topológicas e de cor em um único descritor. Esse novo descritor primeiramente realiza um processo de simplificação da imagem original, onde são identificadas as regiões de cor que compõem a imagem. Após esse processo de simplificação, a organização espacial das regiões de cor previamente identificadas é representada por meio de um grafo topológico, onde os vértices representam as regiões de cor e as arestas representam as conexões entre essas regiões. O descritor topológico é então calculado a partir do grafo de topologia utilizando a teoria espectral de grafos, evitando a necessidade de se realizar uma comparação direta entre grafos. Para suportar a pesquisa parcial de imagens, é realizada uma decomposição do grafo principal em diversos subgrafos. / Mestre em Ciência da Computação
35

Processos de trabalho [no campo psicossocial] de uma equipe de referência do CAPS III percursos para a construção compartilhada de projetos para a vida de uma usuária do serviço / Processes of work [in the psychosocial field] of a reference team of a CAPS III: paths for the shared construction of projects of life of a user of the service

Souza, Ana Carolina Santos de 17 June 2011 (has links)
Esta pesquisa tomou como objeto de estudo os processos de trabalho e a relação entre atores (trabalhadores e usuária) que guiou a construção do projeto terapêutico singular ou projetos para a vida de Maria Luiza da Silva, nome que a usuária do serviço escolheu para ser identificada. Preocupou-se em saber se esses processos de trabalho e as relações produziram emancipação ou subordinação, analisados à luz do referencial teórico da reabilitação como cidadania. A presente pesquisa é um estudo qualitativo do tipo estudo de caso observacional. Utilizou como estratégia metodológica para captação dos processos de trabalho o fluxograma descritor (que se mostrou um instrumento eficaz), cumpriu a orientação metodológica da sua construção coletiva, buscando no registro da memória da equipe de referência, no prontuário e no diário de bordo da pesquisadora, os passos seguidos pela usuária. Os processos de trabalho captados por meio do fluxograma descritor foram: Promover adesão ao serviço e vinculação com equipe de referência; Mediar problemas de moradia: conseguir vaga em albergue e alugar vaga em quarto; Viabilizar o acesso a benefício de prestação continuada; Mediar o processo de resgate do vínculo com familiares; Mediar a procura por curso profissionalizante; Mediar a relação com as proprietárias dos quartos; Ajudar a organizar o cotidiano; Ajudar a conseguir vaga de trabalho temporário ou informal e Reorientar o projeto terapêutico singular compartilhado. Constatou-se que todos os processos de trabalho desenvolvidos pela equipe de referência foram acionados pelas necessidades da usuária, portanto, aferiu-se centralidade na usuária para a produção da ação de saúde. A análise indica clareza e pertinência com relação aos instrumentos de intervenção engendrados, mas observa-se que as finalidades não ficam claramente definidas em todos os processos de trabalho. Ao final da análise constata-se um objeto de intervenção - uma Maria Luiza protagonista, questionando seu PTS. A equipe de referência, neste processo de trabalho, em particular, radicaliza a forma de organização dos saberes, como deve ser no campo psicossocial, e sustenta que quem sabe de suas necessidades é o sujeito que as porta. O instrumento de intervenção, no caso, foi o vínculo e a inclusão do seu saber laico, leigo, não codificado. A finalidade deste processo de trabalho, em particular, é uma diretriz da Reforma Psiquiátrica e do SUS: dialogar com uma cidadã. / The object of study of this research is the process of work and the relations between actors (workers and user of a mental health service) that guided the construction of the singular therapeutic project, or projects for the life of Maria Luiza da Silva, name that the user of the service chose to be identified. The researchers aimed to know if theses processes and the relations established produced emancipation or subordination, analyzed under the theoretical reference of rehabilitation as citizenship. The present research is a qualitative study, of the observational case study type. A describer fluxogram was used as methodological strategy for capturing the processes of work (It has shown as a useful instrument), all the methodological orientation was followed for the collective construction of the fluxogram, collecting the information from the memory of the workers, the chart and the board diary built by the researcher, for the construction of the steps of the user of the service. The processes of work captured by the describer fluxogram were: Promoting adherence to the service and connection to the reference team; Mediate the problems of housing: getting vacancies in albergues and vacancy in rooms; Provide the access to the BPC; Mediate the rescue of the relations with family; Mediate the search for professionalizing courses; Mediate the relation between the landladies; Helping with the every day organization; Helping getting an informal job vacancy and Reorient the shared singular therapeutic project. It was realized that all the processes of work developed by the reference team were started by her needs, therefore, it was checked the centrality in the user of the service for the construction of actions in health. The analysis points to the clarity and coherence related to the instruments for intervention generated, but it is possible to observe that the goals are not clearly defined in all the processes of work. By the end of the analysis it is possible to realize an intervention object a protagonist Maria Luiza, questioning her singular therapeutic project. The reference team, in this process of work in particular, radicalizes the way the knowledge is organized, as it is supposed to be in the psychosocial field, and sustains that who knows about one needs is the own person who needs. The instrument of intervention, in this case, was the connection and the inclusion of her secular and layman knowledge, un-codified. The goal of this process of work in particular, is a direction of the Brazilian Psychosocial Reform and the SUS: conversing with a citizenship.
36

Processos de trabalho [no campo psicossocial] de uma equipe de referência do CAPS III percursos para a construção compartilhada de projetos para a vida de uma usuária do serviço / Processes of work [in the psychosocial field] of a reference team of a CAPS III: paths for the shared construction of projects of life of a user of the service

Ana Carolina Santos de Souza 17 June 2011 (has links)
Esta pesquisa tomou como objeto de estudo os processos de trabalho e a relação entre atores (trabalhadores e usuária) que guiou a construção do projeto terapêutico singular ou projetos para a vida de Maria Luiza da Silva, nome que a usuária do serviço escolheu para ser identificada. Preocupou-se em saber se esses processos de trabalho e as relações produziram emancipação ou subordinação, analisados à luz do referencial teórico da reabilitação como cidadania. A presente pesquisa é um estudo qualitativo do tipo estudo de caso observacional. Utilizou como estratégia metodológica para captação dos processos de trabalho o fluxograma descritor (que se mostrou um instrumento eficaz), cumpriu a orientação metodológica da sua construção coletiva, buscando no registro da memória da equipe de referência, no prontuário e no diário de bordo da pesquisadora, os passos seguidos pela usuária. Os processos de trabalho captados por meio do fluxograma descritor foram: Promover adesão ao serviço e vinculação com equipe de referência; Mediar problemas de moradia: conseguir vaga em albergue e alugar vaga em quarto; Viabilizar o acesso a benefício de prestação continuada; Mediar o processo de resgate do vínculo com familiares; Mediar a procura por curso profissionalizante; Mediar a relação com as proprietárias dos quartos; Ajudar a organizar o cotidiano; Ajudar a conseguir vaga de trabalho temporário ou informal e Reorientar o projeto terapêutico singular compartilhado. Constatou-se que todos os processos de trabalho desenvolvidos pela equipe de referência foram acionados pelas necessidades da usuária, portanto, aferiu-se centralidade na usuária para a produção da ação de saúde. A análise indica clareza e pertinência com relação aos instrumentos de intervenção engendrados, mas observa-se que as finalidades não ficam claramente definidas em todos os processos de trabalho. Ao final da análise constata-se um objeto de intervenção - uma Maria Luiza protagonista, questionando seu PTS. A equipe de referência, neste processo de trabalho, em particular, radicaliza a forma de organização dos saberes, como deve ser no campo psicossocial, e sustenta que quem sabe de suas necessidades é o sujeito que as porta. O instrumento de intervenção, no caso, foi o vínculo e a inclusão do seu saber laico, leigo, não codificado. A finalidade deste processo de trabalho, em particular, é uma diretriz da Reforma Psiquiátrica e do SUS: dialogar com uma cidadã. / The object of study of this research is the process of work and the relations between actors (workers and user of a mental health service) that guided the construction of the singular therapeutic project, or projects for the life of Maria Luiza da Silva, name that the user of the service chose to be identified. The researchers aimed to know if theses processes and the relations established produced emancipation or subordination, analyzed under the theoretical reference of rehabilitation as citizenship. The present research is a qualitative study, of the observational case study type. A describer fluxogram was used as methodological strategy for capturing the processes of work (It has shown as a useful instrument), all the methodological orientation was followed for the collective construction of the fluxogram, collecting the information from the memory of the workers, the chart and the board diary built by the researcher, for the construction of the steps of the user of the service. The processes of work captured by the describer fluxogram were: Promoting adherence to the service and connection to the reference team; Mediate the problems of housing: getting vacancies in albergues and vacancy in rooms; Provide the access to the BPC; Mediate the rescue of the relations with family; Mediate the search for professionalizing courses; Mediate the relation between the landladies; Helping with the every day organization; Helping getting an informal job vacancy and Reorient the shared singular therapeutic project. It was realized that all the processes of work developed by the reference team were started by her needs, therefore, it was checked the centrality in the user of the service for the construction of actions in health. The analysis points to the clarity and coherence related to the instruments for intervention generated, but it is possible to observe that the goals are not clearly defined in all the processes of work. By the end of the analysis it is possible to realize an intervention object a protagonist Maria Luiza, questioning her singular therapeutic project. The reference team, in this process of work in particular, radicalizes the way the knowledge is organized, as it is supposed to be in the psychosocial field, and sustains that who knows about one needs is the own person who needs. The instrument of intervention, in this case, was the connection and the inclusion of her secular and layman knowledge, un-codified. The goal of this process of work in particular, is a direction of the Brazilian Psychosocial Reform and the SUS: conversing with a citizenship.
37

Descritor de movimento baseado em tensor e histograma de gradientes

Perez, Eder de Almeida 24 August 2012 (has links)
Submitted by Renata Lopes (renatasil82@gmail.com) on 2017-03-06T15:14:46Z No. of bitstreams: 1 ederdealmeidaperez.pdf: 749381 bytes, checksum: 7338f694cc850057100e730b520d74eb (MD5) / Approved for entry into archive by Adriana Oliveira (adriana.oliveira@ufjf.edu.br) on 2017-03-06T20:25:35Z (GMT) No. of bitstreams: 1 ederdealmeidaperez.pdf: 749381 bytes, checksum: 7338f694cc850057100e730b520d74eb (MD5) / Made available in DSpace on 2017-03-06T20:25:35Z (GMT). No. of bitstreams: 1 ederdealmeidaperez.pdf: 749381 bytes, checksum: 7338f694cc850057100e730b520d74eb (MD5) Previous issue date: 2012-08-24 / CAPES - Coordenação de Aperfeiçoamento de Pessoal de Nível Superior / O reconhecimento de padrões de movimentos tem se tornado um campo de pesquisa muito atrativo nos últimos anos devido, entre outros fatores, à grande massificação de dados em vídeos e a tendência na criação de interfaces homem-máquina que utilizam expressões faciais e corporais. Esse campo pode ser considerado um dos requisitos chave para análise e entendimento de vídeos. Neste trabalho é proposto um descritor de movimentos baseado em tensores de 2a ordem e histogramas de gradientes (HOG - Histogram of Oriented Gradients). O cálculo do descritor é rápido, simples e eficaz. Além disso, nenhum aprendizado prévio é necessário sendo que a adição de novas classes de movimentos ou novos vídeos não necessita de mudanças ou que se recalculem os descritores já existentes. Cada quadro do vídeo é particionado e em cada partição calcula-se o histograma de gradientes no espaço e no tempo. A partir daí calcula-se o tensor do quadro e o descritor final é formado por uma série de tensores de cada quadro. O descritor criado é avaliado classificando-se as bases de vídeos KTH e Hollywood2, utilizadas na literatura atual, com um classificador Máquina Vetor Suporte (SVM). Os resultados obtidos na base KTH são próximos aos descritores do estado da arte que utilizam informação local do vídeo. Os resultados obtidos na base Hollywood2 não superam o estado da arte, mas são próximos o suficiente para concluirmos que o método proposto é eficaz. Apesar de a literatura apresentar descritores que possuem resultados superiores na classificação, suas abordagens são complexas e de alto custo computacional. / The motion pattern recognition has become a very attractive research field in recent years due to the large amount of video data and the creation of human-machine interfaces that use facial and body expressions. This field can be considered one of the key requirements for analysis and understanding in video. This thesis proposes a motion descriptor based on second order tensor and histograms of oriented gradients. The calculation of the descriptor is fast, simple and effective. Furthermore, no prior knowledge of data basis is required and the addition of new classes of motion and videos do not need to recalculate the existing descriptors. The frame of a video is divided into a grid and the histogram of oriented gradients is computed in each cell. After that, the frame tensor is computed and the final descriptor is built by a series of frame tensors. The descriptor is evaluated in both KTH and Hollywood2 data basis, used in the current literature, with a Support Vector Machine classifier (SVM). The results obtained on the basis KTH are very close to the descriptors of the state-of-the-art that use local information of the video. The results obtained on the basis Hollywood2 not outweigh the state-of-the-art but are close enough to conclude that the proposed method is effective. Although the literature presents descriptors that have superior results, their approaches are complex and with computational cost.
38

Video motion description based on histograms of sparse trajectories

Oliveira, Fábio Luiz Marinho de 05 September 2016 (has links)
Submitted by Renata Lopes (renatasil82@gmail.com) on 2017-06-06T19:12:19Z No. of bitstreams: 1 fabioluizmarinhodeoliveira.pdf: 1410854 bytes, checksum: cb71ee666cda7d462ce0dd33963a988c (MD5) / Approved for entry into archive by Adriana Oliveira (adriana.oliveira@ufjf.edu.br) on 2017-06-07T13:33:08Z (GMT) No. of bitstreams: 1 fabioluizmarinhodeoliveira.pdf: 1410854 bytes, checksum: cb71ee666cda7d462ce0dd33963a988c (MD5) / Made available in DSpace on 2017-06-07T13:33:08Z (GMT). No. of bitstreams: 1 fabioluizmarinhodeoliveira.pdf: 1410854 bytes, checksum: cb71ee666cda7d462ce0dd33963a988c (MD5) Previous issue date: 2016-09-05 / Descrição de movimento tem sido um tema desafiador e popular há muitos anos em visão computacional e processamento de sinais, mas também intimamente relacionado a aprendizado de máquina e reconhecimento de padrões. Frequentemente, para realizar essa tarefa, informação de movimento é extraída e codificada em um descritor. Este trabalho apresenta um método simples e de rápida computação para extrair essa informação e codificá-la em descritores baseados em histogramas de deslocamentos relativos. Nossos descritores são compactos, globais, que agregam informação de quadros inteiros, e o que chamamos de auto-descritor, que não depende de informações de sequências senão aquela que pretendemos descrever. Para validar estes descritores e compará-los com outros tra balhos, os utilizamos no contexto de Reconhecimento de Ações Humanas, no qual cenas são classificadas de acordo com as ações nelas exibidas. Nessa validação, obtemos resul tados comparáveis aos do estado-da-arte para a base de dados KTH. Também avaliamos nosso método utilizando as bases UCF11 e Hollywood2, com menores taxas de reconhe cimento, considerando suas maiores complexidades. Nossa abordagem é promissora, pelas razoáveis taxas de reconhecimento obtidas com um método muito menos complexo que os do estado-da-arte, em termos de velocidade de computação e compacidade dos descritores obtidos. Adicionalmente, experimentamos com o uso de Aprendizado de Métrica para a classificação de nossos descritores, com o intuito de melhorar a separabilidade e a com pacidade dos descritores. Os resultados com Aprendizado de Métrica apresentam taxas de reconhecimento inferiores, mas grande melhoria na compacidade dos descritores. / Motion description has been a challenging and popular theme over many years within computer vision and signal processing, but also very closely related to machine learn ing and pattern recognition. Very frequently, to address this task, one extracts motion information from image sequences and encodes this information into a descriptor. This work presents a simple and fast computing method to extract this information and en code it into descriptors based on histograms of relative displacements. Our descriptors are compact, global, meaning it aggregates information from whole frames, and what we call self-descriptors, meaning they do not depend on information from sequences other than the one we want to describe. To validate these descriptors and compare them to other works, we use them in the context of Human Action Recognition, where scenes are classified according to the action portrayed. In this validation, we achieve results that are comparable to those in the state-of-the-art for the KTH dataset. We also evaluate our method on the UCF11 and Hollywood2 datasets, with lower recognition rates, considering their higher complexity. Our approach is a promising one, due to the fairly good recogni tion rates we obtain with a much less complex method than those of the state-of-the-art, in terms of speed of computation and final descriptor compactness. Additionally, we ex periment with the use of Metric Learning in the classification of our descriptors, aiming to improve the separability and compactness of the descriptors. Our results for Metric Learning show inferior recognition rates, but great improvement for the compactness of the descriptors.

Page generated in 0.0631 seconds