Spelling suggestions: "subject:"vídeo digital"" "subject:"ídeo digital""
41 |
Codificação de vídeo H.264Manoel, Edson Tadeu Monteiro January 2007 (has links)
Dissertação (mestrado) - Universidade Federal de Santa Catarina, Centro Tecnológico. Programa de Pós-Graduação em Engenharia Elétrica. / Made available in DSpace on 2012-10-23T11:57:21Z (GMT). No. of bitstreams: 1
241091.pdf: 4985254 bytes, checksum: cedc65854e3b86ebe9d4b3a3c19ea07e (MD5) / Esta dissertação trata da codificação e compressão de vídeo digital, particularmente focando o recente padrão de codificação H.264. O interesse em tal padrão tem crescido bastante ultimamente, principalmente para o uso em novos sistemas de armazenamento e de transmissão de vídeo digital. O H.264 é um padrão de vídeo atual que possui muito bom desempenho - taxa de bits 50% menor do que a do seu antecessor MPEG?2, mantendo o mesmo desempenho de qualidade. Nesta dissertação, são abordadas duas extensões (aprimoramentos) ao padrão H.264, visando melhorar ainda mais o desempenho de tal padrão, isto é, aumentar a qualidade do sinal comprimido (mantendo a mesma taxa de bits), ou reduzir a taxa de bits (mantendo a mesma qualidade). As extensões fundamentam?se no fato de que alguns tipos de macroblocos (segmentos do sinal de vídeo) possuem uma pequena região distinta que geralmente tem influência negativa na taxa de bits. Inicialmente, são apresentadas as principais características da codificação de vídeo e do padrão H.264. Em seguida, um detalhamento dos diversos processos que estão relacionados aos aprimoramentos são considerados, principalmente nos processos de codificação de macroblocos, predição e otimização da taxa?distorção Lagrangiana. Para avaliar os novos modos de codificação, o código do modelo de referência (JM) de implementação do padrão H.264 é modificado para incluir tais extensões (tanto na codificação quanto na decodificação). Os resultados obtidos decorrentes das modificações propostas são avaliados através do uso de diversas seqüências?padrão de teste. Tais resultados indicam que os aprimoramentos conseguidos são passíveis de serem incluídos no referido padrão.
|
42 |
Compactação de vídeo escalável / Scalable CompressionSoler, Luciano January 2006 (has links)
A codificação de vídeo é um problema cuja solução deve ser projetada de acordo com as necessidades da aplicação desejada. Neste trabalho, um método de compressão de vídeo com escalabilidade é apresentado, apresentando melhorias dos formatos de compressão atuais. A escalabilidade corresponde a capacidade de extrair do bitstream completo, conjuntos eficientes de bits que são decodificados oferecendo imagens ou vídeos decodificados com uma variação (escala) segundo uma dada característica da imagem ou vídeo. O número de conjuntos que podem ser extraídos do bitstream completo definem a granularidade da escalabilidade fornecida, que pode ser muito fina ou com passos grossos. Muitas das técnicas de codificação escalável utilizam uma camada base que deve ser sempre decodificada e uma ou mais camadas superiores que permitem uma melhoria em termos de qualidade (SNR), resolução espacial e/ou resolução temporal. O esquema de codificação escalável final presente na norma MPEG-4 é uma das técnicas mais promissoras, pois pode adaptar-se às características dos canais (Internet) ou terminais que apresentam um comportamento variável ou desconhecido, como velocidade maxima de acesso, variações de largura de banda, erros de canal, etc. Apesar da norma MPEG-4 FGS se afirmar como uma alternativa viável para aplicações de distribuição de vídeo, possui uma quebra significativa de desempenho em comparação com a codificação não escalável de vídeo (perfil ASP da norma MPEG-4 Visual). Este trabalho tem por objetivo estudar novas ferramentas de codificação de vídeo introduzidas na recente norma H.264/AVC e MPEG-4 Visual, desenvolvendo um modelo que integre a escalabilidade granular presente no MPEG-4 aos avanços na área de codificação presentes no H.264/AVC. Esta estrutura de escalabilidade permite reduzir o custo em termos de eficiência da codificação escalável. Os resultados apresentados dentro de cada capítulo mostram a eficácia do método proposto bem como idéias para melhorias em trabalhos futuros. / Video encoding is a problem whose solution should be designed according to the need of intended application. This work presents a method of video compression with scalability that improves the current compression formats. Scalability represents the extracting capacity of full bitstream, efficient set of bits that are decoded to supply images or decoded videos with a variation according to a given image or video feature. A number of sets that can be extracted from full bitstream defines the supplied scalability granularity, which can be very thin or with thick steps. Most scalable video coding techniques use a base layer which must always be decoded and one or more higher layers which allow improvements in terms of quality (also known as SNR), frame/sampling rate or spatial resolution (for images and video). The MPEG-4 Fine Granularity Scalable (FGS) video coding scheme is one of the most promising techniques, because it can adapt itself to the features of channels (Internet) or terminals that present an unpredictable or unknown behavior, as maximum speed of access, variations of the bandwidth, channel errors, etc. Although the MPEG-4 FGS standard is a feasible solution for video streaming applications, it shows a significant loss of performance in comparison with non-scalable video coding, in particular the rather efficient Advanced Simple Profile defined in MPEG-4 Visual Standard. This work aims at studying new tools of video encoding introduced by the recent H.264/AVC norm and Visual MPEG-4, developing a model that integrates the granular scalability present in MPEG-4 to the coding improvements present in H.264/AVC. This new scalability structure allows cost reduction in terms of efficiency of the scalable coding. The results presented in each chapter show the effectiveness of the proposed method as well as ideas for improvements in future work.
|
43 |
Uma abordagem para o transporte de vídeo digital baseada em técnicas proativas de QoSLeite, Carlos Alberto Brandão Barbosa January 2005 (has links)
Tese (doutorado) - Universidade Federal de Santa Catarina, Centro de Tecnológico. Programa de Pós-Graduação em Engenharia Elétrica / Made available in DSpace on 2013-07-16T02:10:36Z (GMT). No. of bitstreams: 1
221914.pdf: 956413 bytes, checksum: c73bebf12fdb05a3084f4519bd7b840e (MD5)
|
44 |
Students' perceptions on the use of videos in distance educationBender, Marinho Cristiel January 2013 (has links)
Dissertação (mestrado) - Universidade Federal de Santa Catarina, Centro de Comunicação e Expressão, Programa de Pós-Graduação em Letras/Inglês e Literatura Correspondente, Florianópolis, 2013. / Made available in DSpace on 2013-12-05T23:28:28Z (GMT). No. of bitstreams: 1
318591.pdf: 1298718 bytes, checksum: 994e110b7bab517ffe0c9f17ec16807a (MD5)
Previous issue date: 2013 / A educação à distância é uma modalidade no ensino e aprendizagem que está crescendo e é oferecido por cursos e universidades. Quando falamos do ensino de línguas estrangeiras (LE) na modalidade à distância, um número de ferramentas pode ser utilizado a fim de que esse processo se torne eficaz tanto para os alunos no processo de aprendizagem quanto para os professores no processo de ensino. O objetivo desse estudo é observar e analisar as percepções dos alunos que cursam curso Letras - Inglês na modalidade à distância na Universidade Federal de Santa Catarina sobre o uso de vídeo. O vídeo é uma das ferramentas que está disponível para maximizar a aprendizagem dos alunos na aprendizagem à distância e pode prover aos alunos oportunidades onde eles podem ver e ter a experiência das línguas sendo trabalhadas, usadas em situações contextualizadas (Lonergan, 1984). Além do mais, os alunos também podem ter experiências com vídeo onde a língua-alvo é utilizada para a explicação de certos assuntos, como no caso de tópicos gramaticais. Para este estudo, o uso de vídeo foi inserido dentro da abordagem de ensino de línguas com base em tarefas (TBLT), fazendo unidades de trabalho com base em vídeo. Assim, os alunos foram providos com vídeos que ofereceram insumo para uma produção que eles fizeram, que também é conhecida como produção final (Willis, 2004). As unidades de trabalho com base em vídeo foram desenvolvidas e disponibilizadas para os alunos que fizeram a disciplina Compreensão e Produção Oral em Língua Inglesa VI, que ocorreu no primeiro semestre de 2012. Para a análise, os dados foram coletados através de questionários e entrevistas. As informações obtidas mostraram que a ferramenta vídeo foi bem aceita pelos participantes, sendo colocados em duas categorias (vídeo-aulas, que apresentaram professores explicando conteúdos junto ao quadro, e vídeos que apresentaram os assuntos em situações contextualizadas) e que esta ferramenta deveria ser mais explorada, não apenas no ensino à distância, mas também em outros tipos de ambientes de aprendizagem, oferecendo melhores oportunidades para o desenvolvimento dos alunos e acesso ao uso autêntico da língua-alvo <br>
|
45 |
Redução de ruído em vídeos em tempo real baseado na fusão do filtro de Kalman e filtro bilateralPfleger, Sergio Genilson January 2016 (has links)
Dissertação (mestrado) - Universidade Federal de Santa Catarina, Centro Tecnológico, Programa de Pós-Graduação em Ciência da Computação, Florianópolis, 2016. / Made available in DSpace on 2017-04-04T04:13:05Z (GMT). No. of bitstreams: 1
344613.pdf: 6588279 bytes, checksum: 79ccc6f1f7f11b3a1a4afaaee59cd39a (MD5)
Previous issue date: 2016 / Neste trabalho é proposto um filtro para atenuação de ruído em vídeos, em tempo real, baseado na fusão de uma modificação do filtro de Kalman e do filtro bilateral, de forma a aproveitar características espaciais e temporais das imagens, preservando contornos e características essenciais à visão humana e computacional. O algoritmo proposto, chamado STMKF, mantém as características do filtro de Kalman original para regiões onde não há movimento e aplica o filtro bilateral nas regiões onde ocorre movimento, fazendo o filtro de Kalman convergir mais rápido para os novos valores adquiridos. Os resultados experimentais mostraram que o filtro é competitivo em relação aos demais, principalmente onde o fundo da imagem é estacionário. A avaliação de desempenho em CPUs e GPUs mostrou sua viabilidade em tempo real, com a filtragem de aproximadamente 30 frames FullHD por segundo em um Intel i7 e mais de 1000 FPS para um video 480p em GPU.<br> / Abstract : In this work is proposed a filter to minimize noise in videos, in real time, based on the fusion of a modified Kalman Filter and a bilateral filter, taking advantage of statial and temporal characteristics of the images, preserving contours and essential features for human and computer vision. The proposed algorithm, called STMKF, maintains the original Kalman filter characteristics in motionless regions and it applies the bilateral filter in regions with motion, which make the Kalman filter converge faster for the new acquired values. The experimental results show that the proposed filter is competitive in relation to others, mainly in videos with more static backgrounds. The performance evaluation in CPUs and GPUs shows that STMKF is viable in real time, filtering approximately 30 FullHD frames per second in a Intel i7 and over 1000 FPS of a 480p video on a GPU.
|
46 |
Adaptive Layered Multicast TCP-Friendly : análise e validação experimental / Adaptive layered multicast TCP-friendlyKrob, Andrea Collin January 2009 (has links)
Um dos obstáculos para o uso disseminado do multicast na Internet global é o desenvolvimento de protocolos de controle de congestionamento adequados. Um fator que contribui para este problema é a heterogeneidade de equipamentos, enlaces e condições de acesso dos receptores, a qual aumenta a complexidade de implementação e validação destes protocolos. Devido ao multicast poder envolver milhares de receptores simultaneamente, o desafio deste tipo de protocolo se torna ainda maior, pois além das questões relacionadas ao congestionamento da rede, é necessário considerar fatores como sincronismo, controle de feedbacks, equidade de tráfego, entre outros. Por esses motivos, os protocolos de controle de congestionamento multicast têm sido um tópico de intensa pesquisa nos últimos anos. Uma das alternativas para o controle de congestionamento multicast na Internet é o protocolo ALMTF (Adaptive Layered Multicast TCP-Friendly), o qual faz parte do projeto SAM (Sistema Adaptativo Multimídia). Uma vantagem desse algoritmo é inferir o nível de congestionamento da rede, determinando a taxa de recebimento mais apropriada para cada receptor. Além disso, ele realiza o controle da banda recebida, visando à justiça e a imparcialidade com os demais tráfegos concorrentes. O ALMTF foi desenvolvido originalmente em uma Tese de doutorado e teve a sua validação no simulador de redes NS-2 (Network Simulator). Este trabalho tem como objetivo estender o protocolo para uma rede real, implementando, validando os seus mecanismos e propondo novas alternativas que o adaptem para esse ambiente. Além disso, efetuar a comparação dos resultados reais com a simulação, identificando as diferenças e promovendo as pesquisas experimentais na área. / One of the obstacles for the widespread use of the multicast in the global Internet is the development of adequate protocols for congestion control. One factor that contributes for this problem is the heterogeneity of equipments, enlaces and conditions of access of the receivers, which increases the implementation and validation complexity of these protocols. Due to the number (thousands) of receivers simultaneously involved in multicast, the challenge of these protocols is even higher. Besides the issues related to the network congestion, it is necessary to consider factors such as synchronism, feedback control, fairness, among others. For these reasons, the multicast congestion control protocols have been a topic of intense research in recent years. The ALMTF protocol (Adaptive Layered Multicast TCP-Friendly), which is part of project SAM, is one of the alternatives for the multicast congestion control in the Internet. One advantage of this algorithm is its ability to infer the network congestion level, assigning the best receiving rate for each receptor. Besides that, the protocol manages the received rate, aiming to achieve fairness and impartiality with the competing network traffic. The ALMTF was developed originally in a Ph.D. Thesis and had its validation under NS-2 simulator. The goal this work is to extend the protocol ALMTF for a real network, validating its mechanisms and considering new alternatives to adapt it for this environment. Moreover, to make the comparison of the real results with the simulation, being identified the differences and promoting the experimental research in the area.
|
47 |
Imagens e narrativas midiáticas: análise dos vídeos do YoutubeMenegon, Érika Nogueira [UNESP] 26 February 2013 (has links) (PDF)
Made available in DSpace on 2014-06-11T19:24:56Z (GMT). No. of bitstreams: 0
Previous issue date: 2013-02-26Bitstream added on 2014-06-13T20:52:50Z : No. of bitstreams: 1
menegon_en_me_mar.pdf: 949113 bytes, checksum: 40dc09870f46664fb987b7417b414b04 (MD5) / Propõe-se a análise de características narrativas de vídeos publicados no site YouTube, tendo, como objetivo de fundo, gerar subsídio para o enfrentamento pedagógico dessa ferramenta tecnológica contemporânea. Foram selecionados 20 vídeos entre os mais assistidos nos meses de abril, maio, junho e julho de 2012, produzidos por usuários não ligados à indústria do entretenimento. Três categorias principais nortearam a análise: elementos de estória, recursos de narrativa e características de edição. Entre as características mais evidentes, está o fato de que as narrativas têm como substrato representações comuns da vida diária e privada, de registros familiares e de ritos de passagem. Quanto ao formato, as narrativas ainda se realizam como evento contínuo, com pouca ou nenhuma interferência de recursos de edição. O exibicionismo atravessa boa parte dos vídeos, de maneira explícita ou implícita / The objective of this paper is to analyze the narrative features of published videos on YouTube website, having as secondary goal produce resources to the pedagogical confront of this contemporary technological tool. Were selected twenty videos among the most watched in the months of April, May, June and July of 2012, produced by users not linked to the entertainment Industry. Three main categories guided the analysis: story elements, features of narrative and editing features. Among the most prominent characteristics, it is the fact that the narratives have as raw material representations of private everyday life, from familiar records and rites of passage. About the format, the narratives still realize as some continuous events, with less or nothing interference of editing features. The exhibitionism is presented in most of the videos, either explicitly or implicitly so
|
48 |
Um estudo sobre a distribuição de conteúdo digital NOW: o vídeo sob demanda da TV por assinatura a caboMolin, Gustavo Pires [UNESP] 28 February 2014 (has links) (PDF)
Made available in DSpace on 2014-12-02T11:16:41Z (GMT). No. of bitstreams: 0
Previous issue date: 2014-02-28Bitstream added on 2014-12-02T11:21:00Z : No. of bitstreams: 1
000797339.pdf: 3650825 bytes, checksum: 8eee6bd2b87bef1dad48b520db1f3c7a (MD5) / A televisão digital vive um momento de transformações, onde as novas tecnologias mediadas por computador estão mudando, por exemplo, os processos comunicativos e outras formas de comunicação que integram o cotidiano das famílias brasileiras. Considerando que a internet é o segundo meio de comunicação em investimentos publicitários e, por conta do crescimento nas velocidades de navegação e o constante aumenta das bandas de franquias, o consumo de conteúdo digital deixou de ser uma tendência e tornou-se realidade. A convergência entre televisão e internet, têm sido decisiva na implantação do vídeo sob demanda como um importante modelo de negócio para o audiovisual brasileiro. Uma interface digital na TV por assinatura a cabo que combina o conteúdo e a tecnologia de alta definição de uma forma fácil e personalizada. Utilizando pesquisa bibliográfica e documental, o estudo pretende caracterizar o serviço de VOD desenvolvido pela NET Serviços de Comunicação S/A: o NOW / La television digital vive un momento de transformaciones, donde las nuevas tecnologias mediadas por ordenador están cambiando, por ejemplo, los procesos comunicativos y otras formas comunicacionales que integran el cotidiano de las familias brasileñas. Considerando que internet es el segundo medio comunicacional en inversiones publicitarias y, por cuenta del crescimiento en las velocidades de navegación y el constante aumenta de as bandas de franquías, el consumo de contenido digital dejó de ser una tendencia y se hizo realidad. La convergencia entre televisión e internet, han sido decisiva en la implanción del vídeo bajo demanda como una importante pantilha de negocio para el mercado audiovisual brasileño. Una interfaz digital en la TELE por firma a cabo que combina el contenido y la tecnologia de alta definición de una forma fácil y personalizada. Utilizando investigación bibliográfica y documental, el estudio pretende caracterizar el servicio de VOD desarrollado por la NET Servicios comunicacionales S/A: el NOW
|
49 |
Um framework para processamento paralelo de algoritmos de aumento de resolução de vídeosFreitas, Pedro Garcia 19 February 2013 (has links)
Dissertação (mestrado)—Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, 2013. / Submitted by Luiza Silva Almeida (luizaalmeida@bce.unb.br) on 2013-07-22T15:55:22Z
No. of bitstreams: 1
2013_PedroGarciaFreitas.pdf: 26321002 bytes, checksum: 43198c842ebe82fc257908e2dcf98b7b (MD5) / Approved for entry into archive by Leandro Silva Borges(leandroborges@bce.unb.br) on 2013-07-23T20:36:47Z (GMT) No. of bitstreams: 1
2013_PedroGarciaFreitas.pdf: 26321002 bytes, checksum: 43198c842ebe82fc257908e2dcf98b7b (MD5) / Made available in DSpace on 2013-07-23T20:36:47Z (GMT). No. of bitstreams: 1
2013_PedroGarciaFreitas.pdf: 26321002 bytes, checksum: 43198c842ebe82fc257908e2dcf98b7b (MD5) / O aumento dimensional de sinais visuais consiste na alteração do tamanho de uma imagem ou de um vídeo para dimensões espaciais maiores, utilizando técnicas de processa- mento digital de sinais. Geralmente, esse aumento é feito com a utilização de técnicas de interpolação. Contudo, essas técnicas de interpolação produzem distorções nas imagens au- mentadas. Tais distorções ocorrem porque a imagem aumentada possui apenas as amostras da imagem original, de dimensões menores, que são insu cientes para reconstrução exata do sinal, o que gera efeitos de aliasing. Assim sendo, as técnicas de interpolação apenas estimam os coe cientes não-amostrados do sinal, o que muitas vezes produz resultados insatisfatórios para muitas aplicações, necessitando de outras técnicas para reconstituir os coe cientes não-amostrados com maior precisão. Para melhorar a aproximação de uma imagem estimada com relação à imagem origi- nal, existem técnicas que reconstroem os coe cientes não-amostrados. Essas técnicas são chamadas de super-resolução. Elas consistem em aumentar a resolução utilizando, geral- mente, informações de outras imagens em baixa ou alta-resolução para estimar a informação faltante na imagem que se deseja ampliar. Super-resolução é um processo computacionalmente intenso, onde a complexidade dos algoritmos são, geralmente, de ordem exponencial no tempo em função do bloco ou do fa- tor de ampliação. Portanto, quando essas técnicas são aplicadas para vídeos, é necessário que o algoritmo seja extremamente rápido. O problema é que os algoritmos mais com- putacionalmente e cientes, nem sempre são aqueles que produzem os melhores resultados visuais. Sendo assim, este trabalho propõe um framework para melhorar o desempenho de diversos algoritmos de super-resolução através de estratégias de processamento seletivo e paralelo. Para isso, nesta dissertação são examinadas as propriedades dos resultados produzidos pelos algoritmos de super-resolução e os resultados produzidos utilizando-se técnicas de interpolação. Com essas propriedades, é encontrado um critério para classi car as regiões em que os resultados produzidos sejam visualmente equivalentes, não importando o método utilizado para ampliação. Nessas regiões de equivalência utiliza-se um algoritmo de interpolação, que é muito mais veloz do que os computacionalmente complexos de super-resolução. Assim, consegue-se reduzir o tempo de processamento sem prejudicar a qualidade visual do vídeo ampliado. Além dessa abordagem, este trabalho também propõe uma estratégia de divisão de dados entre diferentes tarefas para que a operação de aumento de resolução seja realizada de forma paralela. Um resultado interessante do modelo proposto é que ele desacopla a abstração de distribuição de carga da função de aumento dimensional. Em outras palavras, diferentes métodos de super-resolução podem explorar os recursos do framework sem que para isso seus algoritmos precisem ser modi cados para obtenção do paralelismo. Isso torna o framework portável, escalável e reusável por diferentes métodos de super-resolução. ______________________________________________________________________________ ABSTRACT / The magni cation of visual signals consists of changing the size of an image or a video to larger spatial dimensions, using digital signal processing techniques. Usually, this mag- ni cation is done using numerical interpolation methods. However, these interpolation methods tend to produce some distortions in the increased images. Such distortions oc- cours because the interpolated image is reconstructed using only the original image samples, which are insu cients for the accurate signal reconstruction, generating aliasing e ects. These interpolation techniques only approximate the non-sampled signal coe cients, pro- ducing unsatisfactory results for many applications. Thus, for these applications, others techniques to estimate the non-sampled coe cients are needed. To improve the estimation accuracy of an image with respect to the original, the super- resolution techniques are used to reconstruct the non-sampled coe cients. Generally, these super-resolution techniques enhance the increased image using information of other images to estimate the missing information. Super-resolution is a computationally intensive process, where the algorithms com- plexity are, generally, exponential in time as function of the block size or magni cation factor. Therefore, when these techniques are applied for videos, it is required that the super-resolution algorithm be extremely fast. However, more computationally e cient algorithms are not always those that produce the best visual results. Therefore, this work proposes a framework to improve the performance of various super- resolution algorithms using selective processing and parallel processing strategies. Thus, this dissertation examines the properties of the results produced by the super-resolution algorithms and the results produced by using interpolation techniques. From these proper- ties, is achieved a criterion to classify regions wherein the results produced are equivalent (using both super-resolution or interpolation). In these regions of equivalence, the in- terpolation algorithms are used to increase the dimensions. In the anothers regions, the super-resolution algorithms are used. As interpolation algorithms are faster than the com- putationally complex super-resolution algorithms, the idea is decrease the processing time without a ecting the visual quality of ampli ed video. Besides this approach, this paper also proposes a strategy to divide the data among various processes to perform the super-resolution operation in parallel. An interesting re- sult of the proposed model is the decoupling of the super-resolution algorithm and the parallel processing strategy. In other words, di erent super-resolution algorithms can ex- plore the features of the proposed framework without algorithmic modi cations to achieve the parallelism. Thus, the framework is portable, scalable and can be reusable by di erent super-resolution methods.
|
50 |
Compactação de vídeo escalável / Scalable CompressionSoler, Luciano January 2006 (has links)
A codificação de vídeo é um problema cuja solução deve ser projetada de acordo com as necessidades da aplicação desejada. Neste trabalho, um método de compressão de vídeo com escalabilidade é apresentado, apresentando melhorias dos formatos de compressão atuais. A escalabilidade corresponde a capacidade de extrair do bitstream completo, conjuntos eficientes de bits que são decodificados oferecendo imagens ou vídeos decodificados com uma variação (escala) segundo uma dada característica da imagem ou vídeo. O número de conjuntos que podem ser extraídos do bitstream completo definem a granularidade da escalabilidade fornecida, que pode ser muito fina ou com passos grossos. Muitas das técnicas de codificação escalável utilizam uma camada base que deve ser sempre decodificada e uma ou mais camadas superiores que permitem uma melhoria em termos de qualidade (SNR), resolução espacial e/ou resolução temporal. O esquema de codificação escalável final presente na norma MPEG-4 é uma das técnicas mais promissoras, pois pode adaptar-se às características dos canais (Internet) ou terminais que apresentam um comportamento variável ou desconhecido, como velocidade maxima de acesso, variações de largura de banda, erros de canal, etc. Apesar da norma MPEG-4 FGS se afirmar como uma alternativa viável para aplicações de distribuição de vídeo, possui uma quebra significativa de desempenho em comparação com a codificação não escalável de vídeo (perfil ASP da norma MPEG-4 Visual). Este trabalho tem por objetivo estudar novas ferramentas de codificação de vídeo introduzidas na recente norma H.264/AVC e MPEG-4 Visual, desenvolvendo um modelo que integre a escalabilidade granular presente no MPEG-4 aos avanços na área de codificação presentes no H.264/AVC. Esta estrutura de escalabilidade permite reduzir o custo em termos de eficiência da codificação escalável. Os resultados apresentados dentro de cada capítulo mostram a eficácia do método proposto bem como idéias para melhorias em trabalhos futuros. / Video encoding is a problem whose solution should be designed according to the need of intended application. This work presents a method of video compression with scalability that improves the current compression formats. Scalability represents the extracting capacity of full bitstream, efficient set of bits that are decoded to supply images or decoded videos with a variation according to a given image or video feature. A number of sets that can be extracted from full bitstream defines the supplied scalability granularity, which can be very thin or with thick steps. Most scalable video coding techniques use a base layer which must always be decoded and one or more higher layers which allow improvements in terms of quality (also known as SNR), frame/sampling rate or spatial resolution (for images and video). The MPEG-4 Fine Granularity Scalable (FGS) video coding scheme is one of the most promising techniques, because it can adapt itself to the features of channels (Internet) or terminals that present an unpredictable or unknown behavior, as maximum speed of access, variations of the bandwidth, channel errors, etc. Although the MPEG-4 FGS standard is a feasible solution for video streaming applications, it shows a significant loss of performance in comparison with non-scalable video coding, in particular the rather efficient Advanced Simple Profile defined in MPEG-4 Visual Standard. This work aims at studying new tools of video encoding introduced by the recent H.264/AVC norm and Visual MPEG-4, developing a model that integrates the granular scalability present in MPEG-4 to the coding improvements present in H.264/AVC. This new scalability structure allows cost reduction in terms of efficiency of the scalable coding. The results presented in each chapter show the effectiveness of the proposed method as well as ideas for improvements in future work.
|
Page generated in 0.1386 seconds