• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 160
  • 27
  • 20
  • 15
  • 14
  • 6
  • 5
  • 2
  • 2
  • 2
  • 2
  • 1
  • 1
  • 1
  • 1
  • Tagged with
  • 285
  • 285
  • 72
  • 71
  • 52
  • 50
  • 41
  • 37
  • 30
  • 29
  • 28
  • 26
  • 25
  • 25
  • 23
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
241

Avaliação do network calculus e VCC na caracterização de vídeo MPEG para sistemas multimídia

Fergutz, Laurinei 21 June 2010 (has links)
O padrão de codificação MPEG contém algoritmos que analisam a redundância temporal e espacial do vídeo. Devido a esta característica, grandes variações na taxa de dados são observadas numa sequência de vídeo. Deste modo, os sistemas multimídia apresentam dificuldades no planejamento, projeto e utilização dos recursos necessários para a reprodução adequada do vídeo. A proposta deste trabalho é avaliar o uso das abordagens "Network Calculus" (NC) e "Variability Characterization Curve" (VCC) na caracterização de vídeos MPEG, fornecendo informações úteis para a composição de sistemas multimídia. Usualmente, o NC é uma teoria utilizada para se obter limitantes de desempenho em redes de pacotes, enquanto o VCC apresenta técnicas para se obter limitantes inferior e superior de desempenho de um sistema computacional. Neste trabalho, porém, tanto o NC quanto o VCC são utilizados para definir limitantes de desempenho na forma de parâmetros a serem usados na caracterização de vídeo. Além disso, uma variação do VCC usando curvas aproximadas é utilizada neste trabalho para avaliação da economia de recursos. Adicionalmente aos métodos NC e VCC, é proposto um novo método para agregar informação ao conjunto de parâmetros utilizados na caracterização de vídeo. De forma a avaliar os métodos em diversas condições, são realizados testes com vídeos em diferentes configurações e conteúdos, usando os padrões MPEG-2, MPEG-4, H264/AVC. O resultado da aplicação destes métodos é um conjunto de parâmetros que podem ser utilizados para caracterizar os vídeos e indicar as particularidades e exigências que cada vídeo impõe aos sistemas multimídia. Além disso, uma ferramenta computacional para avaliação desta caracterização é proposta e implementada. / The MPEG video coding standard has algorithms for analyzing temporal and spatial video’s redundancies. Therefore, a great variation of data rate is observed in a video sequence. Consequently, planning, design and utilization of the necessary resources for playing video is not an easy task in multimedia systems. This work evaluates the application of Network Calculus (NC) and Variability Characterization Curve (VCC) approaches in MPEG video characterization by providing useful information to setup multimedia systems. Usually, NC theory is applied to obtain performance bounds for packet networks while VCC provides techniques to obtain lower and upper performance bounds for a computational system. However in this work, both NC and VCC are applied to define performance limits expressed as parameters to be used in this work to evaluate resource savings. In addition, a new method is proposed by adding information to the set of parameters used for video characterization. For evaluating these methods in several conditions, a set of tests in accomplished in different configurations with videos MPEG-2, MPEG-4 and H264/AVC. The result is a set of parameters that can be used to characterize videos and point out particularities and requirements imposed by each video to multimedia systems. Finally, a computational tool for evaluating this characterization is also proposed and implemented.
242

The iterative frame : algorithmic video editing, participant observation & the black box

Rapoport, Robert S. January 2016 (has links)
Machine learning is increasingly involved in both our production and consumption of video. One symptom of this is the appearance of automated video editing applications. As this technology spreads rapidly to consumers, the need for substantive research about its social impact grows. To this end, this project maintains a focus on video editing as a microcosm of larger shifts in cultural objects co-authored by artificial intelligence. The window in which this research occurred (2010-2015) saw machine learning move increasingly into the public eye, and with it ethical concerns. What follows is, on the most abstract level, a discussion of why these ethical concerns are particularly urgent in the realm of the moving image. Algorithmic editing consists of software instructions to automate the creation of timelines of moving images. The criteria that this software uses to query a database is variable. Algorithmic authorship already exists in other media, but I will argue that the moving image is a separate case insofar as the raw material of text and music software can develop on its own. The performance of a trained actor can still not be generated by software. Thus, my focus is on the relationship between live embodied performance, and the subsequent algorithmic editing of that footage. This is a process that can employ other software like computer vision (to analyze the content of video) and predictive analytics (to guess what kind of automated film to make for a given user). How is performance altered when it has to communicate to human and non-human alike? The ritual of the iterative frame gives literal form to something that throughout human history has been a projection: the omniscient participant observer, more commonly known as the Divine. We experience black boxed software (AI's, specifically neural networks, which are intrinsically opaque) as functionally omniscient and tacitly allow it to edit more and more of life (e.g. filtering articles, playlists and even potential spouses). As long as it remains disembodied, we will continue to project the Divine on to the black box, causing cultural anxiety. In other words, predictive analytics alienate us from the source code of our cultural texts. The iterative frame then is a space in which these forces can be inscribed on the body, and hence narrated. The algorithmic editing of content is already taken for granted. The editing of moving images, in contrast, still requires a human hand. We need to understand the social power of moving image editing before it is delegated to automation. Practice Section: This project is practice-led, meaning that the portfolio of work was produced as it was being theorized. To underscore this, the portfolio comes at the end of the document. Video editors use artificial intelligence (AI) in a number of different applications, from deciding the sequencing of timelines to using facial and language detection to find actors in archives. This changes traditional production workflows on a number of levels. How can the single decision cut a between two frames of video speak to the larger epistemological shifts brought on by predictive analytics and Big Data (upon which they rely)? When predictive analytics begin modeling the world of moving images, how will our own understanding of the world change? In the practice-based section of this thesis, I explore how these shifts will change the way in which actors might approach performance. What does a gesture mean to AI and how will the editor decontextualize it? The set of a video shoot that will employ an element of AI in editing represents a move towards ritualization of production, summarized in the term the 'iterative frame'. The portfolio contains eight works that treat the set was taken as a microcosm of larger shifts in the production of culture. There is, I argue, metaphorical significance in the changing understanding of terms like 'continuity' and 'sync' on the AI-watched set. Theory Section In the theoretical section, the approach is broadly comparative. I contextualize the current dynamic by looking at previous shifts in technology that changed the relationship between production and post-production, notably the lightweight recording technology of the 1960s. This section also draws on debates in ethnographic filmmaking about the matching of film and ritual. In this body of literature, there is a focus on how participant observation can be formalized in film. Triangulating between event, participant observer and edit grammar in ethnographic filmmaking provides a useful analogy in understanding how AI as film editor might function in relation to contemporary production. Rituals occur in a frame that is dependent on a spatially/temporally separate observer. This dynamic also exists on sets bound for post-production involving AI, The convergence of film grammar and ritual grammar occurred in the 1960s under the banner of cinéma vérité in which the relationship between participant observer/ethnographer and the subject became most transparent. In Rouch and Morin's Chronicle of a Summer (1961), reflexivity became ritualized in the form of on-screen feedback sessions. The edit became transparent-the black box of cinema disappeared. Today as artificial intelligence enters the film production process this relationship begins to reverse-feedback, while it exists, becomes less transparent. The weight of the feedback ritual gets gradually shifted from presence and production to montage and post-production. Put differently, in cinéma vérité, the participant observer was most present in the frame. As participant observation gradually becomes shared with code it becomes more difficult to give it an embodied representation and thus its presence is felt more in the edit of the film. The relationship between the ritual actor and the participant observer (the algorithm) is completely mediated by the edit, a reassertion of the black box, where once it had been transparent. The crucible for looking at the relationship between algorithmic editing, participant observation and the black box is the subject in trance. In ritual trance the individual is subsumed by collective codes. Long before the advent of automated editing trance was an epistemological problem posed to film editing. In the iterative frame, for the first time, film grammar can echo ritual grammar and indeed become continuous with it. This occurs through removing the act of cutting from the causal world, and projecting this logic of post-production onto performance. Why does this occur? Ritual and specifically ritual trance is the moment when a culture gives embodied form to what it could not otherwise articulate. The trance of predictive analytics-the AI that increasingly choreographs our relationship to information-is the ineffable that finds form in the iterative frame. In the iterative frame a gesture never exists in a single instance, but in a potential state. The performers in this frame begin to understand themselves in terms of how automated indexing processes reconfigure their performance. To the extent that gestures are complicit with this mode of databasing they can be seen as votive toward the algorithmic. The practice section focuses on the poetics of this position. Chapter One focuses on cinéma vérité as a moment in which the relationship between production and post-production shifted as a function of more agile recording technology, allowing the participant observer to enter the frame. This shift becomes a lens to look at changes that AI might bring. Chapter Two treats the work of Pierre Huyghe as a 'liminal phase' in which a new relationship between production and post-production is explored. Finally, Chapter Three looks at a film in which actors perform with awareness that footage will be processed by an algorithmic edit. / The conclusion looks at the implications this way of relating to AI-especially commercial AI-through embodied performance could foster a more critical relationship to the proliferating black-boxed modes of production.
243

Os usos pedagógicos dos vídeos digitais indexados

Dallacosta, Adriana January 2007 (has links)
A presente investigação pretende, de forma qualitativa, compreender se os vídeos indexados podem modificar o planejamento pedagógico do professor de escola municipal de Porto Alegre. Para atingir esse objetivo, buscamos embasamento em uma fundamentação teórica de fundo piagetiano, voltada para a construção do conhecimento e suas diversas possibilidades, além das teorias relativas às questões do vídeo e do computador no processo educativo, a partir do seu envolvimento como suporte pedagógico orientado na pedagogia de projetos. Inserido nesse contexto, propõe-se o SACCA (Sistema Automático de Catalogação de Conteúdo Audiovisual), que possibilita o processo de indexação de vídeos com a intermediação de um usuário que assiste ao vídeo e define as palavras-chaves que irão compor o índice. Posteriormente, poderá se navegar no interior desses vídeos permitindo ter uma visão rápida do que o vídeo trata. Foram acrescentados 49 vídeos da História do Brasil e disponibilizados para os professores de História do 3º Ciclo das Escolas da Rede Municipal de Porto Alegre participantes da pesquisa. Os dados foram coletados através de entrevistas. A partir das perguntas norteadoras da pesquisa e da investigação realizada, são definidas categorias de análise para as reflexões e as conclusões desta tese. Os resultados obtidos indicam que o uso dos vídeos indexados pode modificar o planejamento pedagógico do professor. / The present investigation intends to understand in a qualitative way if the indexed videos can modify the teacher's pedagogical planning of a public school in Porto Alegre. We searched for a theoretical Piagetian approach, in order to achieve this purpose, turned to the construction of knowledge and its several possibilities, besides the theories related to the points of the video and computer in the educational process, starting from its involvement as a pedagogical support guided in the pedagogy of projects. Inserted in this context, SACCA (Automatic System of Cataloguing of Audiovisual Content) is proposed, which makes the process of indexation of videos possible, with the user's intermediation who sees the video and defines the key-words, which will compose the index. Later, one can navigate in the interior of these videos allowing a fast vision of what the video deals with. 49 videos of the Brazilian History were added and available for the History teachers of the 3rd Cycle of the Public Schools in Porto Alegre, participants in the research. The data were collected through interviews. Starting from the directed questions of the research and of the accomplished investigation, analysis categories for the reflections and the conclusions of this theory are defined. The obtained results indicate that the use of the indexed videos can modify the teacher's pedagogical planning.
244

Os usos pedagógicos dos vídeos digitais indexados

Dallacosta, Adriana January 2007 (has links)
A presente investigação pretende, de forma qualitativa, compreender se os vídeos indexados podem modificar o planejamento pedagógico do professor de escola municipal de Porto Alegre. Para atingir esse objetivo, buscamos embasamento em uma fundamentação teórica de fundo piagetiano, voltada para a construção do conhecimento e suas diversas possibilidades, além das teorias relativas às questões do vídeo e do computador no processo educativo, a partir do seu envolvimento como suporte pedagógico orientado na pedagogia de projetos. Inserido nesse contexto, propõe-se o SACCA (Sistema Automático de Catalogação de Conteúdo Audiovisual), que possibilita o processo de indexação de vídeos com a intermediação de um usuário que assiste ao vídeo e define as palavras-chaves que irão compor o índice. Posteriormente, poderá se navegar no interior desses vídeos permitindo ter uma visão rápida do que o vídeo trata. Foram acrescentados 49 vídeos da História do Brasil e disponibilizados para os professores de História do 3º Ciclo das Escolas da Rede Municipal de Porto Alegre participantes da pesquisa. Os dados foram coletados através de entrevistas. A partir das perguntas norteadoras da pesquisa e da investigação realizada, são definidas categorias de análise para as reflexões e as conclusões desta tese. Os resultados obtidos indicam que o uso dos vídeos indexados pode modificar o planejamento pedagógico do professor. / The present investigation intends to understand in a qualitative way if the indexed videos can modify the teacher's pedagogical planning of a public school in Porto Alegre. We searched for a theoretical Piagetian approach, in order to achieve this purpose, turned to the construction of knowledge and its several possibilities, besides the theories related to the points of the video and computer in the educational process, starting from its involvement as a pedagogical support guided in the pedagogy of projects. Inserted in this context, SACCA (Automatic System of Cataloguing of Audiovisual Content) is proposed, which makes the process of indexation of videos possible, with the user's intermediation who sees the video and defines the key-words, which will compose the index. Later, one can navigate in the interior of these videos allowing a fast vision of what the video deals with. 49 videos of the Brazilian History were added and available for the History teachers of the 3rd Cycle of the Public Schools in Porto Alegre, participants in the research. The data were collected through interviews. Starting from the directed questions of the research and of the accomplished investigation, analysis categories for the reflections and the conclusions of this theory are defined. The obtained results indicate that the use of the indexed videos can modify the teacher's pedagogical planning.
245

Vehicle speed estimation by license plate detection and tracking

Luvizon, Diogo Carbonera 21 August 2015 (has links)
CNPq / Sistemas de controle de velocidade são utilizados em vários países para fiscalizar o cumprimento dos limites de velocidade, prevenindo assim acidentes de trânsito. Muitos desses sistemas são baseados em tecnologias intrusivas que requerem processos de instalação e manutenção complexos, geralmente atrapalhando o trânsito. Neste projeto, propõe-se um sistema não intrusivo para estimativa da velocidade de veículos baseado em vídeo. O sistema proposto detecta veículos em movimento utilizando um detector de movimento otimizado. Aplicou-se um detector de texto especializado para localizar a placa dos veículos, a qual foi utilizada para seleção e rastreamento de pontos estáveis. Os pontos rastreados são então filtrados e retificados para remoção do efeito da perspectiva. A velocidade dos veículos é estimada comparando-se a trajetória dos pontos rastreados com dimensões conhecidas no mundo. Para os testes, utilizou-se aproximadamente cinco horas de vídeos em diferentes condições, capturados por uma câmera de baixo custo posicionada a 5,5 metros de altura. Os vídeos capturados contém mais de 8.000 veículos distribuídos em três pistas diferentes, com as velocidades reais para cada veículo obtidas a partir de um detector por laço indutivo. O detector de placas proposto foi comparado com três outros métodos no estado da arte e obteve os melhores resultados de performance para os nossos vídeos, com precisão (precision) de 0,93 e coeficiente de revocação (recall) de 0,87. A estimativa de velocidade dos veículos apresentou erro médio de -0,5 km/h, permanecendo dentro da margem de +2/-3 km/h, determinada por agências reguladoras em vários países, em 96,0% dos casos. / Speed control systems are used in most countries to enforce speed limits and, consequently, to prevent accidents. Most of such systems are based on intrusive technologies which require complex installation and maintenance, usually causing traffic disturbance. In this work, we propose a non-intrusive video-based system for vehicle speed estimation. The proposed system detects moving vehicles using an optimized motion detector. We apply a specialized text detector to locate the vehicle’s license plate region, in which stable features are selected for tracking. The tracked features are then filtered and rectified for perspective distortion. Vehicle speed is estimated by comparing the trajectory of the tracked features to known real world measures. For our tests, we used almost five hours of videos in different conditions, captured by a single low-cost camera positioned at 5.5 meters height. The recorded videos contain more than 8,000 vehicles, in three different road lanes, with associated ground truth speeds obtained from an inductive loop detector. We compared our license plate detector with three other state-of-the-art text detectors, and our approach has shown the best performance for our dataset, attaining a precision of 0.93 and a recall of 0.87. Vehicle speeds were estimated with an average error of -0.5 km/h, staying inside the +2/-3 km/h limit determined by regulatory authorities in several countries in over 96.0% of the cases.
246

Métodos sem referência baseados em características espaço-temporais para avaliação objetiva de qualidade de vídeo digital

Silva, Wyllian Bezerra da 13 March 2013 (has links)
Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES) / O desenvolvimento de métodos sem referência para avaliação de qualidade de vídeo é um assunto incipiente na literatura e desafiador, no sentido de que os resultados obtidos pelo método proposto devem apresentar a melhor correlação possível com a percepção do Sistema Visual Humano. Esta tese apresenta três propostas para avaliação objetiva de qualidade de vídeo sem referência baseadas em características espaço-temporais. A primeira abordagem segue um modelo analítico sigmoidal com solução de mínimos quadrados que usa o método Levenberg-Marquardt e a segunda e terceira abordagens utilizam uma rede neural artificial Single-Hidden Layer Feedforward Neural Network com aprendizado baseado no algoritmo Extreme Learning Machine. Além disso, foi desenvolvida uma versão estendida desse algoritmo que busca os melhores parâmetros da rede neural artificial de forma iterativa, segundo um simples critério de parada, cujo objetivo é aumentar a correlação entre os escores objetivos e subjetivos. Os resultados experimentais, que usam técnicas de validação cruzada, indicam que os escores dos métodos propostos apresentam alta correlação com as escores do Sistema Visual Humano. Logo, eles são adequados para o monitoramento de qualidade de vídeo em sistemas de radiodifusão e em redes IP, bem como podem ser implementados em dispositivos como decodificadores, ultrabooks, tablets, smartphones e em equipamentos Wireless Display (WiDi). / The development of no-reference video quality assessment methods is an incipient topic in the literature and it is challenging in the sense that the results obtained by the proposed method should provide the best possible correlation with the evaluations of the Human Visual System. This thesis presents three proposals for objective no-reference video quality evaluation based on spatio-temporal features. The first approach uses a sigmoidal analytical model with leastsquares solution using the Levenberg-Marquardt method. The second and third approaches use a Single-Hidden Layer Feedforward Neural Network with learning based on the Extreme Learning Machine algorithm. Furthermore, an extended version of Extreme Learning Machine algorithm was developed which looks for the best parameters of the artificial neural network iteratively, according to a simple termination criteria, whose goal is to increase the correlation between the objective and subjective scores. The experimental results using cross-validation techniques indicate that the proposed methods are correlated to the Human Visual System scores. Therefore, they are suitable for the monitoring of video quality in broadcasting systems and over IP networks, and can be implemented in devices such as set-top boxes, ultrabooks, tablets, smartphones and Wireless Display (WiDi) devices.
247

Uma proposta de método para melhoria de desempenho do codificador x264 baseada na análise do acesso ao barramento externo de memória

Duma, Luiz Henrique 26 August 2011 (has links)
A codificação de vídeo digital é um recurso essencial para a produção de vídeo para a Internet, canais de TV e outras mídias. Através da codificação é possível melhorar a utilização de recursos de armazenamento, transmissão e recepção, como por exemplo, banda. Em sistemas embarcados, a limitação de recursos impacta no desempenho dos codificadores, como por exemplo, as câmeras de vídeo de telefones celulares. Este trabalho analisa o uso de técnicas para a diminuição de acesso a memória externa (RAM) especificamente para o codificador x264. Através do uso de ferramentas para software profiling e análise da performance do codificador a partir dos contadores de performance (HPC) disponíveis em muitos processadores modernos, foi possível estabelecer um método de análise de dados para direcionar a implementação do codificador para um melhor desempenho. Os resultados obtidos mostram uma melhora entre 16% e 18% no tempo de codificação em relação a um codificador não otimizado, mantendo-se os mesmos valores de qualidade de vídeo obtidos através de métricas objetivas. / This study attempts to systematize the use of techniques to reduce access to external memory (RAM) for the x264 encoder, as well the use of software profiling tools with focus on the usage of hardware performance counters (HPC), available in many modern processors. The results show up a reduction between 16% and 18% for execution time of the encoder, without noticeable changes on objective video quality metrics. Digital video coding is an essential resource to produce video for Internet, TV, and other media. Through video coding, it is possible to improve storage and bandwidth utilization for transmission and reception of video streams. On embedded devices, hardware resources impact on the encoder performance, for example, in video cameras of cellphones. This study analyzes the external memory access (RAM) at the x264 encoder implementation, aiming to identify ways to improve the encoding process performance. With software profiling tools and encoder performance analysis was possible to establish a data analysis method which results can be used to improve the overall encoder performance. The method implementation results show an improvement of 16% to 18% over a non-optimized encoder while keeping the same video quality measured from objective metrics.
248

Vehicle speed estimation by license plate detection and tracking

Luvizon, Diogo Carbonera 21 August 2015 (has links)
CNPq / Sistemas de controle de velocidade são utilizados em vários países para fiscalizar o cumprimento dos limites de velocidade, prevenindo assim acidentes de trânsito. Muitos desses sistemas são baseados em tecnologias intrusivas que requerem processos de instalação e manutenção complexos, geralmente atrapalhando o trânsito. Neste projeto, propõe-se um sistema não intrusivo para estimativa da velocidade de veículos baseado em vídeo. O sistema proposto detecta veículos em movimento utilizando um detector de movimento otimizado. Aplicou-se um detector de texto especializado para localizar a placa dos veículos, a qual foi utilizada para seleção e rastreamento de pontos estáveis. Os pontos rastreados são então filtrados e retificados para remoção do efeito da perspectiva. A velocidade dos veículos é estimada comparando-se a trajetória dos pontos rastreados com dimensões conhecidas no mundo. Para os testes, utilizou-se aproximadamente cinco horas de vídeos em diferentes condições, capturados por uma câmera de baixo custo posicionada a 5,5 metros de altura. Os vídeos capturados contém mais de 8.000 veículos distribuídos em três pistas diferentes, com as velocidades reais para cada veículo obtidas a partir de um detector por laço indutivo. O detector de placas proposto foi comparado com três outros métodos no estado da arte e obteve os melhores resultados de performance para os nossos vídeos, com precisão (precision) de 0,93 e coeficiente de revocação (recall) de 0,87. A estimativa de velocidade dos veículos apresentou erro médio de -0,5 km/h, permanecendo dentro da margem de +2/-3 km/h, determinada por agências reguladoras em vários países, em 96,0% dos casos. / Speed control systems are used in most countries to enforce speed limits and, consequently, to prevent accidents. Most of such systems are based on intrusive technologies which require complex installation and maintenance, usually causing traffic disturbance. In this work, we propose a non-intrusive video-based system for vehicle speed estimation. The proposed system detects moving vehicles using an optimized motion detector. We apply a specialized text detector to locate the vehicle’s license plate region, in which stable features are selected for tracking. The tracked features are then filtered and rectified for perspective distortion. Vehicle speed is estimated by comparing the trajectory of the tracked features to known real world measures. For our tests, we used almost five hours of videos in different conditions, captured by a single low-cost camera positioned at 5.5 meters height. The recorded videos contain more than 8,000 vehicles, in three different road lanes, with associated ground truth speeds obtained from an inductive loop detector. We compared our license plate detector with three other state-of-the-art text detectors, and our approach has shown the best performance for our dataset, attaining a precision of 0.93 and a recall of 0.87. Vehicle speeds were estimated with an average error of -0.5 km/h, staying inside the +2/-3 km/h limit determined by regulatory authorities in several countries in over 96.0% of the cases.
249

Métodos sem referência baseados em características espaço-temporais para avaliação objetiva de qualidade de vídeo digital

Silva, Wyllian Bezerra da 13 March 2013 (has links)
Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES) / O desenvolvimento de métodos sem referência para avaliação de qualidade de vídeo é um assunto incipiente na literatura e desafiador, no sentido de que os resultados obtidos pelo método proposto devem apresentar a melhor correlação possível com a percepção do Sistema Visual Humano. Esta tese apresenta três propostas para avaliação objetiva de qualidade de vídeo sem referência baseadas em características espaço-temporais. A primeira abordagem segue um modelo analítico sigmoidal com solução de mínimos quadrados que usa o método Levenberg-Marquardt e a segunda e terceira abordagens utilizam uma rede neural artificial Single-Hidden Layer Feedforward Neural Network com aprendizado baseado no algoritmo Extreme Learning Machine. Além disso, foi desenvolvida uma versão estendida desse algoritmo que busca os melhores parâmetros da rede neural artificial de forma iterativa, segundo um simples critério de parada, cujo objetivo é aumentar a correlação entre os escores objetivos e subjetivos. Os resultados experimentais, que usam técnicas de validação cruzada, indicam que os escores dos métodos propostos apresentam alta correlação com as escores do Sistema Visual Humano. Logo, eles são adequados para o monitoramento de qualidade de vídeo em sistemas de radiodifusão e em redes IP, bem como podem ser implementados em dispositivos como decodificadores, ultrabooks, tablets, smartphones e em equipamentos Wireless Display (WiDi). / The development of no-reference video quality assessment methods is an incipient topic in the literature and it is challenging in the sense that the results obtained by the proposed method should provide the best possible correlation with the evaluations of the Human Visual System. This thesis presents three proposals for objective no-reference video quality evaluation based on spatio-temporal features. The first approach uses a sigmoidal analytical model with leastsquares solution using the Levenberg-Marquardt method. The second and third approaches use a Single-Hidden Layer Feedforward Neural Network with learning based on the Extreme Learning Machine algorithm. Furthermore, an extended version of Extreme Learning Machine algorithm was developed which looks for the best parameters of the artificial neural network iteratively, according to a simple termination criteria, whose goal is to increase the correlation between the objective and subjective scores. The experimental results using cross-validation techniques indicate that the proposed methods are correlated to the Human Visual System scores. Therefore, they are suitable for the monitoring of video quality in broadcasting systems and over IP networks, and can be implemented in devices such as set-top boxes, ultrabooks, tablets, smartphones and Wireless Display (WiDi) devices.
250

Segmentação automática de vídeo em cenas baseada em coerência entre tomadas / Automatic scenes video segmentation based on shot coherence

Tiago Henrique Trojahn 24 February 2014 (has links)
A popularização de aplicativos e dispositivos capazes de produzir, exibir e editar conteúdos multimídia fez surgir a necessidade de se adaptar, modificar e customizar diferentes tipos de mídia a diferentes necessidades do usuário. Nesse contexto, a área de Personalização e Adaptação de Conteúdo busca desenvolver soluções que atendam a tais necessidades. Sistemas de personalização, em geral, necessitam conhecer os dados presentes na mídia, surgindo, assim, a necessidade de uma indexação do conteúdo presente na mídia. No caso de vídeo digital, os esforços para a indexação automática utilizam como passo inicial a segmentação de vídeos em unidades de informação menores, como tomadas e cenas. A segmentação em cenas, em especial, é um desafio para pesquisadores graças a enorme variedade entre os vídeos e a própria ausência de um consenso na definição de cena. Diversas técnicas diferentes para a segmentação em cenas são reportadas na literatura. Uma técnica, em particular, destaca-se pelo baixo custo computacional: a técnica baseada em coerências visual. Utilizando-se operações de histogramas, a técnica objetiva-se a comparar tomadas adjacentes em busca de similaridades que poderiam indicar a presença de uma cena. Para melhorar os resultados obtidos, autores de trabalhos com tal enfoque utilizam-se de outras características, capazes de medir a \"quantidade de movimento\" das cenas, como os vetores de movimento. Assim, este trabalho apresenta uma técnica de segmentação de vídeo digital em tomadas e em cenas através da coerência visual e do fluxo óptico. Apresenta-se, ainda, uma série de avaliações de eficácia e de desempenho da técnica ao segmentar em tomadas e em cenas uma base de vídeo do domínio filmes / The popularization of applications and devices capable of producing, displaying and editing multimedia content did increase the need to adapt, modify and customize different types of media for different user needs. In this context, the area of Personalization and Content Adaptation seeks to develop solutions that meet these needs. Personalization systems, in general, need to know the data present in the media, thus needing for a media indexing process. In the case of digital video, the efforts for automatic indexing usually involves, as an initial step, to segment videos into smaller information units, such as shots and scenes. The scene segmentation, in particular, is a challenge to researchers due to the huge variety among the videos and the very absence of a consensus on the scene definition. Several scenes segmentation techniques are reported in the literature. One technique in particular stands out for its low computational cost: those techniques based on visual coherence. By using histograms, the technique compares adjacent shots to find similar shots which may indicate the presence of a scene. To improve the results, some related works uses other features to evaluate the motion dynamics of the scenes using features such as motion vectors. In this sense, this work presents a digital video segmentation technique for shots and scenes, using visual coherence and optical flow as its features. It also presents a series of evaluation in terms of effectiveness and performance of the technique when segmenting scenes and shots of a custom video database of the film domain

Page generated in 0.0559 seconds