Return to search

3D-videokoding med kontekstbasert, adaptiv, binæraritmetisk koding / 3D Video Coding Incorporating Context-Based Adaptiv Binary Arithmetic Coding

Masteroppgaven har hatt som formål å videreutvikle en tidligere utviklet 3D delbåndskoder for video. Videreutviklingen har medført at den foreslåtte koderen kan benytte seg av høyere ordens statistikk, samt betingete sannsynligheter mellom ulike symboler. Dette er gjort ved at en mer egnet kodingsmetode i lavpassdelbåndet er valgt, samt at en kontekstbasert, adaptiv, binæraritmetisk koder (CABAC) er implementert. Den foreslåtte koderen benytter diskret cosinus transformasjon (DCT) for temporal dekomposisjon, samt en romlig dekomposisjon bestående av en 64-delbånds ikke-unitær filterbank med oktavbånd dekomposisjon i inntil tre nivåer i lavpassdelbåndet. Det dekomponerte signalet blir kvantisert med en skalar kvantiserer med dødsone, hvor dødsonen angir størrelsen på nullområdet. Grunnet effektkorrelasjonen mellom bildepunkter i de ulike nivåene i lavpassdelbåndet, kodes denne informasjonen med en modifisert utgave av "zerotree" koding. De resterende delbåndene kodes vha. zig-zag skanning og CABAC. Fordelen med denne delingen er at den foreslåtte koderen får utnyttet effektkorrelasjonen mellom nabobildepunkter innad i delbåndene (intrabånd effektkorrelasjon), effektkorrelasjonen mellom bildepunkter i de ulike delbåndene (interbånd effektkorrelasjon), samt det faktum at de fleste kilder har et fallende effektspekter. Ved å velge bort bevegelseskompensasjon, senkes kompleksiteten i den foreslåtte koderen, samtidig som den romlige dekomposisjonen kan utføres mer effektivt i form av en filterbank. "Zerotree" kodingen og implementasjonen av CABAC gjør det mulig for koderen å tilpasse seg ulike kilder, samt hver kildes temporalt og romlig varierende lokale statistikk. Optimaliseringen av koderen viser at dens ytelse er sterkt avhengig av innholdet til orginalsekvensen. Den manglende bevegelseskompensasjonen medfører at koderen oppnår høyere ytelse for rolige sekvenser enn for sekvenser med mye objekt- og kamerabevegelser. Simuleringene viser også at koderens ytelse for rolige sekvenser er sterkt avhengig av antallet rammer den temporale dekomposisjonen utføres over. Sekvenser med mye bevegelser vil derimot oppnå lavere ytelse dersom antallet rammer i den temporale dekomposisjonen øker over et visst antall. Simuleringene viser at innføringen av CABAC medfører en bitratebesparelse på 10-20% sammenlignet med en referansekoder hvor blokkbasert aritmetisk koding er benyttet. Innføringen av CABAC medfører derimot en liten økning i kjøretiden, noe som tyder på at kompleksiteten i CABAC er noe høyere enn kompleksiteten i en vanlig aritmetisk koder. Dette skyldes i hovedsak at flere kontekstmodeller benyttes, samt at modellene er adaptive. Sammenligninger med den siste standardiserte koderen fra ITU-T/ISO/IEC H.264/AVC, viser at PSNR verdiene til den foreslåtte koderen ligger 1,5-2 dB lavere enn H.264/AVC main profile for sekvensen news. Den foreslåtte koderens ytelse for sekvensen foreman er 4-5 dB lavere enn H.264/AVC. Dette skyldes i hovedsak den foreslåtte koderens temporale dekomposisjon uten bevegelsesestimering.

Identiferoai:union.ndltd.org:UPSALLA1/oai:DiVA.org:ntnu-10275
Date January 2006
CreatorsFalkevik, Espen
PublisherNorges teknisk-naturvitenskapelige universitet, Institutt for elektronikk og telekommunikasjon, Institutt for elektronikk og telekommunikasjon
Source SetsDiVA Archive at Upsalla University
LanguageNorwegian
Detected LanguageNorwegian
TypeStudent thesis, info:eu-repo/semantics/bachelorThesis, text
Formatapplication/pdf
Rightsinfo:eu-repo/semantics/openAccess

Page generated in 0.0015 seconds