1 |
[en] ADAPTIVE SUB-BAND COMPRESSION OF IMAGES AT LOW BIT RATES / [pt] COMPRESSÃO ADAPTATIVA DE IMAGENS EM SUB-BANDAS A BAIXAS TAXAS DE BITSMARCELO MOLLICA JOURDAN 29 August 2006 (has links)
[pt] Essa dissertação propõe um codificador de imagens
adaptativo baseado em sub-bandas para baixas taxas de
bits. O espectro de freqüência bi-dimensional é decomposto
em 10 sub-bandas de maneira hierárquica através de um
banco de filtros QMF de 9 coeficientes. Uma técnica de
redução de irrelevância é usada para descartar vetores nas
sub-bandas de número 2 a 10. Os vetores remanescentes
nessas sub-bandas são classificadas em bordas ou texturas
e codificados por ECVQ (Entropy Constrained Vector
Quantization) multi-estágios. Já a primeira sub-banda é
codificada por ADPCM com preservação de bordas. Um
algoritmo ótimo de alocação de bits determina a
distribuição adequada de bits entre as sub-bandas.
Os resultados mostram excelentes desempenho para baixas
taxas, sendo melhores que os obtidos pelo padrão JPEG e
vários outros trabalhos apresentados na literatura recente. / [en] This dissertation proposes an adaptative subband coder for
low bit rate coding os still images. The bi-dimension
frequency spectrum is decomposed in 10 subbands by means
of a 9-coefficient QMF filter bank. Vector in subbands 2
to 10 are discarded by a new technique for irrelevancy
reduction. The remanining vectors are classified in one of
two classes, edges and textures, and coded by multistage
ECVQ (Entropy Constrained Vector Quantization). The first
subband is coded by an edge preserving ADPCM. An optimal
bit allocation procedure is used to distribute bits along
the subbands.
The results obtained show excellent performance for low
bit rate coding, outperforming JPEG and many other coders
recently presented in literature.
|
2 |
[en] LOW DELAY CELP STRUCTURES / [pt] CODIFICADORES CELP COM BAIXO RETARDADOSERGIO RICARDO MONTENEGRO FERNANDES AGUIAR 14 August 2006 (has links)
[pt] Neste trabalho são examinadas estruturas CELP com baixo
retardo (da ordem de 2 ms) para codificação digital de voz
a taxas de bits de 8 k, 9,6 k e 16 kbit/s. São avaliados
sete algoritmos de predição adaptativa a partir do sinal
sintetizado. Esses algoritmos são usados para adaptação do
filtro de predição com retardo curto e do filtro de
ponderação de codificadores CELP com baixo retardo. Dos
algoritmos analisados, um emprega adaptação em bloco e os
outros são recursivos utilizando estruturas transversais e
em treliça. As comparações são baseadas em termos das
medidas objetivas de razão sinal ruído (RSR), razão sinal
ruído segmentar (RSRSEG) e razão sinal ruído ponderada em
freqüência (RSRW) e em termos de medidas subjetivas
obtidas através de testes de escuta informais. / [en] Low delay (about 2 ms) CELP structures are studied for
digital coding of speech at 8, 9,6 and 16 kbit/s. Seven
backward adaptative prediction algorithms are
investigated. These algorithms are used for adapting the
short-term prediction filter and the weighting filter in
low delay CELP coders. One algorithm uses block adaptation
and the others are recursive with transversal and lattice
structures. Comparisons are based on the objective
measures of signal to noise ratio, segmental signal to
noise ratio and a frequency weighted signal to noise and
on subjective results obtained from informal listening
tests.
|
3 |
[en] ARBITRARILY SHAPED OBJECT CODING USING SHAPE-ADAPTATIVE DWT AND SHAPE-ADAPTATIVE SPIHT / [es] CODIFICACIÓN DE FORMA ARBITRARIA A TRAVÉS DE DWT Y SPIHT ADAPATAD A LA FORMA / [pt] CODIFICAÇÃO DE OBJETOS DE FORMA ARBITRÁRIA ATRAVÉS DE DWT E SPIHT ADAPTATIVOS À FORMAMARCIO ALBUQUERQUE DE SOUZA 25 July 2001 (has links)
[pt] Codificação de objetos de forma arbitrária extraídos de
imagens regulares é um dos assuntos de maior desafio nos
mais recentes padrões de codificação de vídeo (MPEG-4).
Neste estudo, é proposta uma nova estratégia de codificação
de objetos envolvendo maior eficiência na decomposição e
quantização de sub-bandas. A técnica de transformação
proposta envolve Transformada Wavelet Discreta (DWT) e a de
quantização é baseada no algoritmo de Partição de Conjuntos
em Árvores Hierárquicas (SPIHT). / [en] Coding of arbitrarily shaped objects extracted from regular
images is one of the most challenging issues on the latest
video coding standards (MPEG-4). In this work, a new object
coding strategy is proposed, involving greater efficiency on
subband splitting and quantization. The proposed transform
technique involves Discrete Wavelet Transform (DWT) and the
proposed quantization technique is based on the Set
Partitioning in Hierarchical Trees (SPIHT) algorithm. / [es] La codificación de objetos de forma arbitraria extraídos de
imágenes regulares es uno de los asuntos de mayor desafío
en los más recientes padrones de codificación de video
(MPEG-4). En este estudio, se propone una nueva estrategia
de codificación de objetos con mayor eficiencia en la
descomposición y cuantización de subbandas. La técnica de
transformación propuesta incluye Transformada Wavelet
Discreta (DWT) y la de cuantización tiene como base el
algoritmo de Partición de Conjuntos en Árboles Jerárquicas
(SPIHT).
|
4 |
[pt] CODIFICADORES UNIVERSAIS VIA RECORRÊNCIA DE PADRÕES PARA FONTES COM NÚMERO DE ESTADOS FINITO / [en] UNIVERSAL STRING MATCHING ENCODERS BY RECURRENCE OF STANDARDS FOR SOURCES WITH FINITE NUMBER OF STATESMARCELO DA SILVA PINHO 01 December 2005 (has links)
[pt] Os codificadores universais via recorrência de padrões
surgiram nos anos 70, quando foram propostos os
codificadores lz77 e lz78. Devido a baixa complexidade
computacional e ao bom desempenho, quando aplicados na
compressão de arquivos de dados, estes codificadores se
tornaram extremamente populares. Embora estes
codificadores sejam universais, i.e., possuam taxas de
compressão que convergem para entropia, recentemente foi
mostrado que as taxas de compressão não convergem da forma
mais rápida possível, nem mesmo para a classe de fontes
sem memória. A redundância de um codificador universal C,
dada por R, mede a rapidez com que a taxa de compressão
converge para a entropia. Para fontes com número de
estados finito, enquanto os melhores resultados de
codificadores universais via recorrência de padrões
apresentam uma redundância da ordem de 1/{log n}, existem
codificadores que atingem uma redundancia de {log n} /n.
Portanto, os codificadores via recorrência de padrões não
são ótimos. Embora seja conhecido codificadores ótimos
segundo o critério da redundância, tais codificadores
possuem uma alta complexidade computacional e são pouco
úteis na prática. Dentre os codificadores via recorrência
de padrões, o codificador lz78 possui uma das mais baixas
redundâncias para a classe de fontes com número de estados
finito. De fato, não existe outro codificador desta
classe, tal que a redundância seja melhor que a do lz78.
Tomando como base o lz78, este trabalho propõe novas
técnicas para acelerar a convergência da taxa de
compressão (diminuir a redundância) dos codificadores
universais via recorrência de padrões, para fontes com
número de estados finito. Estas técnicas dão origem a
novas versões do lz78. As redundâncias das novas versões
são estabelecidas, considerando a classe de fontes com
número de estados finito. Estas versões são aplicadas na
compressão de arquivos de dados, e os resultados obtidos
são comparados com os resultados de versões anteriores. / [en] The string matching encoders were proposed about 20 years
ago, when the lz77 and lz78 were introduced. They became
extremely popular because of the relationship between
their low complexity and their good performance. Although
these encoders are universal, that is, their compression
rates converge to the source entropy, it was shown,
recently, that those rates do not converge as fast as
possible, even for the class of memoryless source. The
redundancy of an unversal encoder C, denoted by Rc,
measures how fast the compression rate converge to the
entropy. In the class of Finite State Machine (FSM)
source, while the best result of the string matching
encoders is O 1/ {log n}, there are encoders which achieve
a redundancy of O {log n}/n. Therefore, the string
matching encoders are not optimal. Even though optimal
encoders are known, in general, those encoders have a high
complexity and are not useful in practice. Considering the
class of string matching encoders, the lz78 has one of the
best results over the class of FSM source. In fact, there
is no encoder based on the string matching, which archives
a better redundancy. This work makes use of the lz78
encoder to propose new techniques to improve the
performance of sting matching encoders over the class of
FSM. These techniques bring up new versions of the lz78.
For the class of FSM, the redundancies of this versions
are stablished. These versions are used to compress data
files, and their perfoermances are compared to the
performances of older versions.
|
5 |
[en] ANALYSIS OF WAVEFORM CODERS FOR SPEECH AND DATA SIGNALS / [pt] ANÁLISE DE CODIFICADORES DE FORMA DE ONDA PARA SINAIS DE VOZ E DADOSANTONIO MARCOS DE LIMA ARAUJO 07 November 2006 (has links)
[pt] O trabalho examina o comportamento de Codificadores de
forma de onda operando a 32,56 e 64kbit/s para transmissão
digital de sinais de voz e de sinais de dados PSK-8 a 4800
bit/s e QAM-16 a 9600 bit/s. A partir de uma análise
detalhada dos diversos sistemas, tanto em canal ideal como
um canal ruidoso, é verificada a necessidade de se fazer
uma identificação do tipo de sinal. De modo a permitir sua
codificação de forma mais eficiente. É, então, proposta e
avaliada a utilização de uma técnica de identificação
estatística de sinais de voz e dados, em codificadores de
forma de onda. A incorporação desta técnica ao sistema
ADPCM a 32 kbit/s recomendado pelo CCITT permite uma
melhoria do desempenho para sinais de dados, sem com isso
alterar sua eficiência para sinais de voz. / [en] This thesis evaluates the performance of waveform coders
at 32,56 and 64kbit/s for digital transmission of speech
signal and 4800 bit/s PSK-8 and 9600 bit/s QAM-16
voiceband data signas. A detailed analysis of the systems
is carried out both under ideal and noisy channel
conditions. From this analysis it was found that a scheme
which accurately distinguishes the two classes of signals,
would allow a more efficient encoding procedure. A method
of statistical identification of speech and data signals
is proposed and its use in wakeform coders is, then,
analysed. The incorporation of this method into the 32
kbit/s ADPCM system recommended by CCITT provides an
improvement in performance for data signals, without
sacrificing its efficiency for speech signal.
|
6 |
[en] STUDY ON SPEECH CODING IN SUB-BANDS AT 16 KBITS/S / [pt] ESTUDO DE CODIFICAÇÃO DE VOZ EM SUB-BANDAS A 16 KBIT/SCARLOS FELIPE DE BRITO JACCOUD 09 November 2006 (has links)
[pt] Neste trabalho são estudados sistemas de codificação
digital de sinais de voz em sub-bandas, operando na taxa
de 16 kbit/s. Os sistemas são analisados em função do
número de sub-bandas, dos esquemas de codificação
utilizados nas diversas sub-bandas, dos parâmetros e das
técnicas empregados na adaptação dos quantizadores e do
tipo de alocação dos recursos binários. A decomposição
espectral do sinal é realizada a partir de bancos de
filtros espelhados em quadratura (QMF), que tem a vantagem
de evitar a sobreposição dos espectros nas diversas sub-
bandas. Os sistemas são avaliados, através de simulação em
computador, tanto em canal ideal como em um canal ruidoso,
utilizando como figura de mérito a razão sinal-ruído
frequencial. O desempenho obtido em termos das razões
sinal-ruído global e segmentada também é apresentado em
todos os casos analisados.
A partir de um exame detalhado dos diversos
sistemas e proposta uma estrutura de codificação em que a
configuração do quantizador e sua técnica de adaptação
dependem da sub-banda a ser codificada. Além disso, o
sistema proposto utiliza um algoritmo para alocação dos
recursos binários baseado em comparações de energias de
blocos de amostras das diversas sub-bandas. / [en] In this thesis a study of 16 kbit/s sub-band coding of
speech signals is presented. The encoding systems are
examined in terms of the number of sub-bands, the schemes
used to encode the sub-band signals, the parameters and
techniques employed in the quantizers adaptation and the
type of bit allocation. Spectral decomposition of the
input signal is carried out by means of quadrature mirror
filter (QMF) banks. The systems are evaluated through
computer simulation, both in ideal and noisy channels,
using the frequency - weighted signal-to-noise ratio as
the performance criterion. The global and segmental signal-
to-noise ratio performances are also given in all cases.
After a detailed examination of the various
systems, a coding structure is proposed , in which the
configuration of the quantizer and its adaptation
techniques depend on the sub-band to be coded.
Furthermore, the proposed system uses an algorithm for bit
allocation based on comparison of the energies fo blocks
of samples in the several sub-bands.
|
7 |
[en] JOINT SOURCE/CHANNEL CODING USING LAPPED TRANSFORMS / [pt] CODIFICAÇÃO CONJUNTA FONTE/CANAL UTILIZANDO TRANSFORMADASARTHUR LUIZ AMARAL DA CUNHA 15 July 2002 (has links)
[pt] Neste trabalho é feito um estudo sobre compressão de
imagens para canal ruidoso.Inicialmente, esquemas de
complexidade moderada sem a utilização do princípio da
separação de Shannon são investigados e simulados. Com
isso, mostra-se que esquemas eficientes de codificação
conjunta fonte/canal existem e podem eventualmente
apresentar melhor performance do que esquemas separados de
codificação e canal e fonte. São também investigados,
algoritmos de codificação de imagens visando a transmissão
num capital ruidoso. Nesse contexto, é proposto um esquema
utilizando transformadas com superposição com boa
performance, como mostram as simulações realizadas. O
esquema posteriormente estendido para imagens multi-
espectrais mostrando-se igualmente eficiente. / [en] In the present dissertation we investigate image
compression techniques for transmission over binary
symmetric channels poluted with noise. Frist we simulate
some known techniques for joint source/channel coding that
dispenses with the use of error correcting codes. These
techiniques may exhibit better performance when complexity
and delay constraits are at stake. We further propose an
image compression algorithm for noisy channels based on
lapped/block transforms and block source/channel coding. We
simulate the proposed scheme for various channel
situations. The algorithm is further extented to handle
compression and transmission of multiepectral remote
sensing satellite imagery. Results for natural and
multiespectral images are presented showing the good
performance attained by the proposed schemes.
|
8 |
[en] CONTRIBUTIONS TO THE SA-DCT AND BLOCK-BASED DCT APPROACHES FOR OBJECT-ORIENTED IMAGE CODING / [pt] CONTRIBUIÇÕES ÀS ABORDAGENS SA-DCT E DCT BASEADA EM BLOCOS PARA CODIFICAÇÃO DE IMAGENS ORIENTADA POR OBJETOFLAVIA MAGALHAES FREITAS FERREIRA 27 October 2004 (has links)
[pt] Esta tese examina e apresenta contribuições para a
codificação de textura intra-quadro na codificação de
imagens baseada em objeto. Duas abordagens de codificação
são focadas: a DCT baseada em blocos e a DCT adaptativa
à forma (SA-DCT). São propostos indicadores morfológicos
para extrair características de forma e textura intrínsecas
ao objeto a ser codificado, classificando os blocos de
imagem 8 X 8 segundo o número de pixels do objeto neles
contidos. Esses indicadores são utilizados para a análise
de algoritmos de codificação conhecidos na literatura e
também para a proposição de esquemas híbridos que
solucionem problemas identificados. Os esquemas híbridos
propostos baseiam-se no tratamento diferenciado para
grupos de blocos distintos, usando como base a informação
sobre a textura média nesses grupos. Por fim, é proposta
uma estrutura de codificação adaptativa em função da taxa
de bits, da textura e da forma do objeto a ser codificado.
Essa estratégia incorpora os esquemas híbridos propostos
nesta tese para a escolha da direção preferencial de
processamento do algoritmo de extrapolação EI - Extension
Interpolation - e da SA-DCT. Ela seleciona automaticamente
a abordagem de codificação mais adequada a um grupo
específico de blocos a cada faixa de taxas de bits, valendo-
se dos indicadores morfológicos. O codificador adaptativo
proposto mostrou-se equivalente ou superior em desempenho
aos melhores esquemas conhecidos na literatura, tanto para
taxas baixas, quanto para taxas altas. Os resultados podem
ser verificados a partir das curvas de desempenho e também
a partir da observação da qualidade subjetiva das imagens
recuperadas. / [en] This thesis examines and presents contributions to the
intra-frame texture coding of Object-Based Image Coding.
Two coding approaches are focused: the block-based DCT and
the shape-adaptive DCT (SA-DCT). Morphological features
are proposed in order to extract intrinsic characteristics
of shape and texture from the object to be encoded.
These features classify the 8 X 8 image blocks according to
their number of object pixels. These morphological features
are used both in the analysis of coding algorithms reported
in the literature and in the design of hybrid schemes
that overcome some problems identified during the analysis
procedure. The proposed hybrid schemes employ different
strategies to deal with different groups of blocks. The
information about the mean texture value at these groups
is used as the basis of the algorithms. Finally, an adaptive
coding structure, which is a function of the bit rate,
texture and shape of the object, is proposed. This strategy
incorporates the hybrid schemes introduced in this thesis,
in order to choose the preferential processing direction
for the EI - Extension Interpolation - padding technique
and for the SA-DCT. It automatically selects the more
adequate approach for a specific group of blocks at a given
bit rate, depending on the morphological features.
Performance of this adaptive coding scheme is either
comparable or better than the best object-based transform
coding schemes reported in the literature. This is valid
both at low and high bit rates. Results are presented in
terms of PSNR performance curves and subjective quality of
the decoded images.
|
9 |
[en] SUB-BAND IMAGE CODING / [pt] CODIFICAÇÃO DE IMAGENS POR DECOMPOSIÇÃO EM SUB-BANDASEDMAR DA COSTA VASCONCELLOS 05 July 2006 (has links)
[pt] Este trabalho aborda o problema da compressão de imagens
explorando a técnica de codificação por sub-bandas(SBB).
Como estrutura básica, usada na primeira parte do
trabalho, tem-se a divisão da imagem em 16 sub-bandas
buscando replicar os resultados de woods [1]. As
componentes das 16 SBB são quantizadas e codificadas, e
bits são alocados às SBB usando como critério a
minimização do erro médio quadrático. Os quantizadores são
projetados segundo uma distribuição Gaussiana Generalizada.
Neste processo de codificação, a sub-banda de mais baixa
freqüência é codificada com DPCM, enquanto as demais SBB
são codificadas por PCM.
Como inovação, é proposto o uso do algoritmo de Lempel-Ziv
na codificação sem perdas (compactação) das sub-bandas
quantizadas.
Na compactação são empregados os algoritmos de Huffman e
LZW (modificação do LZA). Os resultados das simulações são
apresentados em termos da taxa (bits/pixel) versus relação
sinal ruído de pico e em termos de analise subjetiva das
imagens reconstruídas. Os resultados obtidos indicam um
desempenho de compressão superior quanto o algoritmo de
Huffman é usado, comparado com o algoritmo LZW. A melhoria
de desempenho, na técnica de decomposição em sub-bandas,
observada com o algoritmo de Huffman foi superior (2dB
acima). Todavia, tendo em vista as vantagens da
universalidade do algoritmo de Lempel-Ziv, deve-se
continuar a investigar o seu desempenho implementado de
forma diferente do explorado neste trabalho. / [en] This work focus on the problem of image compression, with
exploring the techniques of subband coding.
The basic structure, used in the sirst part of this tesis,
encompass the uniform decomposition of the image into 16
subbands. This procedure aims at reproducing the reults of
Woods [1]. The component of the 16 subbands are quatized
and coded and bits are optimally allocated among the
subbands to minimize the mean-squared error. The
quantizers desingned match the Generelized Gaussian
Distribuition, which model the subband components.
In the coding process, the lowest subband is DPCM coded
while the higher subbands are coded with PCM.
As an innovation, it is proposed the use of the algorithm
LZW for coding without error (compaction) the quantized
subbands.
In the compactation process, the Huffamn and LZW
algorithms are used. The simulation results are presented
in terms of rate (bits/pel) versus peak signal-to-noise
and subjective quality. The performance of the subband
decomposition tecnique obtained with the Huffamn´s
algorithm is about 2dB better than that obtained with the
LZW. The universality of the Lempel-Ziv algorithm is,
however, an advantage that leads us to think that further
investigation should still be pursued.
|
10 |
[en] DISTRIBUTED VIDEO CODING WITH CORRELATION CHANNEL MODELING IN THE TRANSFORM DOMAIN / [pt] CODIFICAÇÃO DISTRIBUÍDA DE VÍDEO COM MODELAGEM DO CANAL DE CORRELAÇÃO NO DOMÍNIO DA TRANSFORMADARODRIGO SILVA MELLO 27 May 2011 (has links)
[pt] A codificação distribuída de vídeo é um novo paradigma de codificação de
vídeo que permite explorar a estatística da fonte apenas no decodificador. Nesse
cenário, duas fontes correlatadas são independentemente codificadas usando
codificadores distintos e os fluxos binários associados a cada uma são
conjuntamente decodificados, explorando a correlação entre eles. A resiliência a
erros é uma importante funcionalidade deste novo paradigma uma vez que a
tradicional malha de predição no codificador e a propagação de erros associada a
esta malha não existe ao não se explorar a correlação do sinal no codificador.
Desta forma, esta tese tem como objetivo apresentar uma nova arquitetura de
codificação distribuída de vídeo, desenvolvendo e analisando algoritmos mais
eficientes para a mesma, reduzindo, desta forma, o gap de desempenho quando
comparado aos sistemas tradicionais de codificação de vídeo [68]. Assim, o codec
proposto nesta tese proporcionou: a otimização da arquitetura DVC (Distributed
Vídeo Coding), o desenvolvimento de novas ferramentas para a geração da
informação lateral, a inclusão de um módulo de medida de correlação entre
quadros para auxiliar na decodificação, a utilização de um processo de
quantização Wyner-Ziv variável, a opção de uma codificação parcial de bitplanes,
uma modelagem do canal de correlação baseada na estimação de parâmetros em
nível de banda e de coeficientes da transformada DCT (Discrete Cosine
Transform), a inclusão de um módulo de normalização da informação lateral e o
desenvolvimento de um código de canal mais adequado à arquitetura proposta. / [en] Distributed video coding is a new video coding paradigm that allows
exploiting the source statistics at the decoder only. In this scenario, two correlated
sources are independently encoded using separated encoders and the bit streams
associated to each one are jointly decoded exploiting the correlation between
them. Improved error resilience is another major functionality of this new video
coding paradigm since the usual encoder prediction loop and the associated error
propagation do not exist anymore, because the signal correlation is not explored in
the encoder. Therefore, this thesis aims to present a new architecture for
distributed video coding, analyzing and developing more efficient algorithms for
it, thus reducing the gap in performance when it is compared to traditional video
coding [68]. Therefore, the codec proposed in this thesis provided: a DVC
architecture optimization; the development of new tools for side information
generation process; inclusion of a module for measuring correlation between
frames in order to assist in the Wyner-Ziv frame reconstruction; the use of a
Wyner-Ziv variable quantization process; the option of partial coding of bitplanes;
a correlation channel model based on the estimation of parameters in band and
DCT coefficient levels; an inclusion of a normalization stage to the side
information; and the development of a channel code more appropriate to the
proposed architecture.
|
Page generated in 0.0292 seconds