Global ETD Search

1	[en] ADAPTIVE SUB-BAND COMPRESSION OF IMAGES AT LOW BIT RATES / [pt] COMPRESSÃO ADAPTATIVA DE IMAGENS EM SUB-BANDAS A BAIXAS TAXAS DE BITS MARCELO MOLLICA JOURDAN 29 August 2006 (has links) [pt] Essa dissertação propõe um codificador de imagens adaptativo baseado em sub-bandas para baixas taxas de bits. O espectro de freqüência bi-dimensional é decomposto em 10 sub-bandas de maneira hierárquica através de um banco de filtros QMF de 9 coeficientes. Uma técnica de redução de irrelevância é usada para descartar vetores nas sub-bandas de número 2 a 10. Os vetores remanescentes nessas sub-bandas são classificadas em bordas ou texturas e codificados por ECVQ (Entropy Constrained Vector Quantization) multi-estágios. Já a primeira sub-banda é codificada por ADPCM com preservação de bordas. Um algoritmo ótimo de alocação de bits determina a distribuição adequada de bits entre as sub-bandas. Os resultados mostram excelentes desempenho para baixas taxas, sendo melhores que os obtidos pelo padrão JPEG e vários outros trabalhos apresentados na literatura recente. / [en] This dissertation proposes an adaptative subband coder for low bit rate coding os still images. The bi-dimension frequency spectrum is decomposed in 10 subbands by means of a 9-coefficient QMF filter bank. Vector in subbands 2 to 10 are discarded by a new technique for irrelevancy reduction. The remanining vectors are classified in one of two classes, edges and textures, and coded by multistage ECVQ (Entropy Constrained Vector Quantization). The first subband is coded by an edge preserving ADPCM. An optimal bit allocation procedure is used to distribute bits along the subbands. The results obtained show excellent performance for low bit rate coding, outperforming JPEG and many other coders recently presented in literature. [pt] IMAGEM [en] IMAGE [pt] CODIFICACAO [en] CODE NUMBERING
2	[en] LOW DELAY CELP STRUCTURES / [pt] CODIFICADORES CELP COM BAIXO RETARDADO SERGIO RICARDO MONTENEGRO FERNANDES AGUIAR 14 August 2006 (has links) [pt] Neste trabalho são examinadas estruturas CELP com baixo retardo (da ordem de 2 ms) para codificação digital de voz a taxas de bits de 8 k, 9,6 k e 16 kbit/s. São avaliados sete algoritmos de predição adaptativa a partir do sinal sintetizado. Esses algoritmos são usados para adaptação do filtro de predição com retardo curto e do filtro de ponderação de codificadores CELP com baixo retardo. Dos algoritmos analisados, um emprega adaptação em bloco e os outros são recursivos utilizando estruturas transversais e em treliça. As comparações são baseadas em termos das medidas objetivas de razão sinal ruído (RSR), razão sinal ruído segmentar (RSRSEG) e razão sinal ruído ponderada em freqüência (RSRW) e em termos de medidas subjetivas obtidas através de testes de escuta informais. / [en] Low delay (about 2 ms) CELP structures are studied for digital coding of speech at 8, 9,6 and 16 kbit/s. Seven backward adaptative prediction algorithms are investigated. These algorithms are used for adapting the short-term prediction filter and the weighting filter in low delay CELP coders. One algorithm uses block adaptation and the others are recursive with transversal and lattice structures. Comparisons are based on the objective measures of signal to noise ratio, segmental signal to noise ratio and a frequency weighted signal to noise and on subjective results obtained from informal listening tests. [pt] ESTRUTURA [en] STRUCTURE [pt] CODIFICACAO [en] CODE NUMBERING
3	[en] ARBITRARILY SHAPED OBJECT CODING USING SHAPE-ADAPTATIVE DWT AND SHAPE-ADAPTATIVE SPIHT / [es] CODIFICACIÓN DE FORMA ARBITRARIA A TRAVÉS DE DWT Y SPIHT ADAPATAD A LA FORMA / [pt] CODIFICAÇÃO DE OBJETOS DE FORMA ARBITRÁRIA ATRAVÉS DE DWT E SPIHT ADAPTATIVOS À FORMA MARCIO ALBUQUERQUE DE SOUZA 25 July 2001 (has links) [pt] Codificação de objetos de forma arbitrária extraídos de imagens regulares é um dos assuntos de maior desafio nos mais recentes padrões de codificação de vídeo (MPEG-4). Neste estudo, é proposta uma nova estratégia de codificação de objetos envolvendo maior eficiência na decomposição e quantização de sub-bandas. A técnica de transformação proposta envolve Transformada Wavelet Discreta (DWT) e a de quantização é baseada no algoritmo de Partição de Conjuntos em Árvores Hierárquicas (SPIHT). / [en] Coding of arbitrarily shaped objects extracted from regular images is one of the most challenging issues on the latest video coding standards (MPEG-4). In this work, a new object coding strategy is proposed, involving greater efficiency on subband splitting and quantization. The proposed transform technique involves Discrete Wavelet Transform (DWT) and the proposed quantization technique is based on the Set Partitioning in Hierarchical Trees (SPIHT) algorithm. / [es] La codificación de objetos de forma arbitraria extraídos de imágenes regulares es uno de los asuntos de mayor desafío en los más recientes padrones de codificación de video (MPEG-4). En este estudio, se propone una nueva estrategia de codificación de objetos con mayor eficiencia en la descomposición y cuantización de subbandas. La técnica de transformación propuesta incluye Transformada Wavelet Discreta (DWT) y la de cuantización tiene como base el algoritmo de Partición de Conjuntos en Árboles Jerárquicas (SPIHT). [pt] CODIFICACAO DE VIDEO [en] VIDEO CODING [pt] CODIFICACAO DE OBJETO [en] OBJECT CODING [pt] CONTROLE [en] CONTROL [pt] SPIHT [en] SPIHT
4	[pt] CODIFICADORES UNIVERSAIS VIA RECORRÊNCIA DE PADRÕES PARA FONTES COM NÚMERO DE ESTADOS FINITO / [en] UNIVERSAL STRING MATCHING ENCODERS BY RECURRENCE OF STANDARDS FOR SOURCES WITH FINITE NUMBER OF STATES MARCELO DA SILVA PINHO 01 December 2005 (has links) [pt] Os codificadores universais via recorrência de padrões surgiram nos anos 70, quando foram propostos os codificadores lz77 e lz78. Devido a baixa complexidade computacional e ao bom desempenho, quando aplicados na compressão de arquivos de dados, estes codificadores se tornaram extremamente populares. Embora estes codificadores sejam universais, i.e., possuam taxas de compressão que convergem para entropia, recentemente foi mostrado que as taxas de compressão não convergem da forma mais rápida possível, nem mesmo para a classe de fontes sem memória. A redundância de um codificador universal C, dada por R, mede a rapidez com que a taxa de compressão converge para a entropia. Para fontes com número de estados finito, enquanto os melhores resultados de codificadores universais via recorrência de padrões apresentam uma redundância da ordem de 1/{log n}, existem codificadores que atingem uma redundancia de {log n} /n. Portanto, os codificadores via recorrência de padrões não são ótimos. Embora seja conhecido codificadores ótimos segundo o critério da redundância, tais codificadores possuem uma alta complexidade computacional e são pouco úteis na prática. Dentre os codificadores via recorrência de padrões, o codificador lz78 possui uma das mais baixas redundâncias para a classe de fontes com número de estados finito. De fato, não existe outro codificador desta classe, tal que a redundância seja melhor que a do lz78. Tomando como base o lz78, este trabalho propõe novas técnicas para acelerar a convergência da taxa de compressão (diminuir a redundância) dos codificadores universais via recorrência de padrões, para fontes com número de estados finito. Estas técnicas dão origem a novas versões do lz78. As redundâncias das novas versões são estabelecidas, considerando a classe de fontes com número de estados finito. Estas versões são aplicadas na compressão de arquivos de dados, e os resultados obtidos são comparados com os resultados de versões anteriores. / [en] The string matching encoders were proposed about 20 years ago, when the lz77 and lz78 were introduced. They became extremely popular because of the relationship between their low complexity and their good performance. Although these encoders are universal, that is, their compression rates converge to the source entropy, it was shown, recently, that those rates do not converge as fast as possible, even for the class of memoryless source. The redundancy of an unversal encoder C, denoted by Rc, measures how fast the compression rate converge to the entropy. In the class of Finite State Machine (FSM) source, while the best result of the string matching encoders is O 1/ {log n}, there are encoders which achieve a redundancy of O {log n}/n. Therefore, the string matching encoders are not optimal. Even though optimal encoders are known, in general, those encoders have a high complexity and are not useful in practice. Considering the class of string matching encoders, the lz78 has one of the best results over the class of FSM source. In fact, there is no encoder based on the string matching, which archives a better redundancy. This work makes use of the lz78 encoder to propose new techniques to improve the performance of sting matching encoders over the class of FSM. These techniques bring up new versions of the lz78. For the class of FSM, the redundancies of this versions are stablished. These versions are used to compress data files, and their perfoermances are compared to the performances of older versions. [pt] CODIFICACAO DE FONTE [pt] RECORRENCIA DE PADROES [pt] CODIFICACAO UNIVERSAL [en] SOURCE CODING [en] RECURRENCE OF STANDARDS [en] UNIVERSAL CODIFICATION
5	[en] ANALYSIS OF WAVEFORM CODERS FOR SPEECH AND DATA SIGNALS / [pt] ANÁLISE DE CODIFICADORES DE FORMA DE ONDA PARA SINAIS DE VOZ E DADOS ANTONIO MARCOS DE LIMA ARAUJO 07 November 2006 (has links) [pt] O trabalho examina o comportamento de Codificadores de forma de onda operando a 32,56 e 64kbit/s para transmissão digital de sinais de voz e de sinais de dados PSK-8 a 4800 bit/s e QAM-16 a 9600 bit/s. A partir de uma análise detalhada dos diversos sistemas, tanto em canal ideal como um canal ruidoso, é verificada a necessidade de se fazer uma identificação do tipo de sinal. De modo a permitir sua codificação de forma mais eficiente. É, então, proposta e avaliada a utilização de uma técnica de identificação estatística de sinais de voz e dados, em codificadores de forma de onda. A incorporação desta técnica ao sistema ADPCM a 32 kbit/s recomendado pelo CCITT permite uma melhoria do desempenho para sinais de dados, sem com isso alterar sua eficiência para sinais de voz. / [en] This thesis evaluates the performance of waveform coders at 32,56 and 64kbit/s for digital transmission of speech signal and 4800 bit/s PSK-8 and 9600 bit/s QAM-16 voiceband data signas. A detailed analysis of the systems is carried out both under ideal and noisy channel conditions. From this analysis it was found that a scheme which accurately distinguishes the two classes of signals, would allow a more efficient encoding procedure. A method of statistical identification of speech and data signals is proposed and its use in wakeform coders is, then, analysed. The incorporation of this method into the 32 kbit/s ADPCM system recommended by CCITT provides an improvement in performance for data signals, without sacrificing its efficiency for speech signal. [pt] CODIFICACAO DE VOZ [en] SPEECH CODING [pt] TRANSMISSAO DIGITAL [en] DIGITAL TRANSMISSION
6	[en] STUDY ON SPEECH CODING IN SUB-BANDS AT 16 KBITS/S / [pt] ESTUDO DE CODIFICAÇÃO DE VOZ EM SUB-BANDAS A 16 KBIT/S CARLOS FELIPE DE BRITO JACCOUD 09 November 2006 (has links) [pt] Neste trabalho são estudados sistemas de codificação digital de sinais de voz em sub-bandas, operando na taxa de 16 kbit/s. Os sistemas são analisados em função do número de sub-bandas, dos esquemas de codificação utilizados nas diversas sub-bandas, dos parâmetros e das técnicas empregados na adaptação dos quantizadores e do tipo de alocação dos recursos binários. A decomposição espectral do sinal é realizada a partir de bancos de filtros espelhados em quadratura (QMF), que tem a vantagem de evitar a sobreposição dos espectros nas diversas sub- bandas. Os sistemas são avaliados, através de simulação em computador, tanto em canal ideal como em um canal ruidoso, utilizando como figura de mérito a razão sinal-ruído frequencial. O desempenho obtido em termos das razões sinal-ruído global e segmentada também é apresentado em todos os casos analisados. A partir de um exame detalhado dos diversos sistemas e proposta uma estrutura de codificação em que a configuração do quantizador e sua técnica de adaptação dependem da sub-banda a ser codificada. Além disso, o sistema proposto utiliza um algoritmo para alocação dos recursos binários baseado em comparações de energias de blocos de amostras das diversas sub-bandas. / [en] In this thesis a study of 16 kbit/s sub-band coding of speech signals is presented. The encoding systems are examined in terms of the number of sub-bands, the schemes used to encode the sub-band signals, the parameters and techniques employed in the quantizers adaptation and the type of bit allocation. Spectral decomposition of the input signal is carried out by means of quadrature mirror filter (QMF) banks. The systems are evaluated through computer simulation, both in ideal and noisy channels, using the frequency - weighted signal-to-noise ratio as the performance criterion. The global and segmental signal- to-noise ratio performances are also given in all cases. After a detailed examination of the various systems, a coding structure is proposed , in which the configuration of the quantizer and its adaptation techniques depend on the sub-band to be coded. Furthermore, the proposed system uses an algorithm for bit allocation based on comparison of the energies fo blocks of samples in the several sub-bands. [pt] CODIFICACAO DE VOZ [en] SPEECH CODING [pt] TRANSMISSAO DIGITAL [en] DIGITAL TRANSMISSION
7	[en] JOINT SOURCE/CHANNEL CODING USING LAPPED TRANSFORMS / [pt] CODIFICAÇÃO CONJUNTA FONTE/CANAL UTILIZANDO TRANSFORMADAS ARTHUR LUIZ AMARAL DA CUNHA 15 July 2002 (has links) [pt] Neste trabalho é feito um estudo sobre compressão de imagens para canal ruidoso.Inicialmente, esquemas de complexidade moderada sem a utilização do princípio da separação de Shannon são investigados e simulados. Com isso, mostra-se que esquemas eficientes de codificação conjunta fonte/canal existem e podem eventualmente apresentar melhor performance do que esquemas separados de codificação e canal e fonte. São também investigados, algoritmos de codificação de imagens visando a transmissão num capital ruidoso. Nesse contexto, é proposto um esquema utilizando transformadas com superposição com boa performance, como mostram as simulações realizadas. O esquema posteriormente estendido para imagens multi- espectrais mostrando-se igualmente eficiente. / [en] In the present dissertation we investigate image compression techniques for transmission over binary symmetric channels poluted with noise. Frist we simulate some known techniques for joint source/channel coding that dispenses with the use of error correcting codes. These techiniques may exhibit better performance when complexity and delay constraits are at stake. We further propose an image compression algorithm for noisy channels based on lapped/block transforms and block source/channel coding. We simulate the proposed scheme for various channel situations. The algorithm is further extented to handle compression and transmission of multiepectral remote sensing satellite imagery. Results for natural and multiespectral images are presented showing the good performance attained by the proposed schemes. [pt] CODIFICACAO DE FONTE [en] SOURCE CODING [pt] CODIFICACAO DE CANAL [en] CHANNEL CODING [pt] CANAL BINARIO SIMETRICO [en] BINARY SYMETRIC CHANNEL [pt] BANCOS DE FILTROS [en] FILTER BANKS
8	[en] CONTRIBUTIONS TO THE SA-DCT AND BLOCK-BASED DCT APPROACHES FOR OBJECT-ORIENTED IMAGE CODING / [pt] CONTRIBUIÇÕES ÀS ABORDAGENS SA-DCT E DCT BASEADA EM BLOCOS PARA CODIFICAÇÃO DE IMAGENS ORIENTADA POR OBJETO FLAVIA MAGALHAES FREITAS FERREIRA 27 October 2004 (has links) [pt] Esta tese examina e apresenta contribuições para a codificação de textura intra-quadro na codificação de imagens baseada em objeto. Duas abordagens de codificação são focadas: a DCT baseada em blocos e a DCT adaptativa à forma (SA-DCT). São propostos indicadores morfológicos para extrair características de forma e textura intrínsecas ao objeto a ser codificado, classificando os blocos de imagem 8 X 8 segundo o número de pixels do objeto neles contidos. Esses indicadores são utilizados para a análise de algoritmos de codificação conhecidos na literatura e também para a proposição de esquemas híbridos que solucionem problemas identificados. Os esquemas híbridos propostos baseiam-se no tratamento diferenciado para grupos de blocos distintos, usando como base a informação sobre a textura média nesses grupos. Por fim, é proposta uma estrutura de codificação adaptativa em função da taxa de bits, da textura e da forma do objeto a ser codificado. Essa estratégia incorpora os esquemas híbridos propostos nesta tese para a escolha da direção preferencial de processamento do algoritmo de extrapolação EI - Extension Interpolation - e da SA-DCT. Ela seleciona automaticamente a abordagem de codificação mais adequada a um grupo específico de blocos a cada faixa de taxas de bits, valendo- se dos indicadores morfológicos. O codificador adaptativo proposto mostrou-se equivalente ou superior em desempenho aos melhores esquemas conhecidos na literatura, tanto para taxas baixas, quanto para taxas altas. Os resultados podem ser verificados a partir das curvas de desempenho e também a partir da observação da qualidade subjetiva das imagens recuperadas. / [en] This thesis examines and presents contributions to the intra-frame texture coding of Object-Based Image Coding. Two coding approaches are focused: the block-based DCT and the shape-adaptive DCT (SA-DCT). Morphological features are proposed in order to extract intrinsic characteristics of shape and texture from the object to be encoded. These features classify the 8 X 8 image blocks according to their number of object pixels. These morphological features are used both in the analysis of coding algorithms reported in the literature and in the design of hybrid schemes that overcome some problems identified during the analysis procedure. The proposed hybrid schemes employ different strategies to deal with different groups of blocks. The information about the mean texture value at these groups is used as the basis of the algorithms. Finally, an adaptive coding structure, which is a function of the bit rate, texture and shape of the object, is proposed. This strategy incorporates the hybrid schemes introduced in this thesis, in order to choose the preferential processing direction for the EI - Extension Interpolation - padding technique and for the SA-DCT. It automatically selects the more adequate approach for a specific group of blocks at a given bit rate, depending on the morphological features. Performance of this adaptive coding scheme is either comparable or better than the best object-based transform coding schemes reported in the literature. This is valid both at low and high bit rates. Results are presented in terms of PSNR performance curves and subjective quality of the decoded images. [pt] INDICADORES MORFOLOGICOS [en] MORPHOLOGICAL FEATURES [pt] CODIFICACAO BASEADA EM OBJETO [en] OBJECT-BASED CODING
9	[en] SUB-BAND IMAGE CODING / [pt] CODIFICAÇÃO DE IMAGENS POR DECOMPOSIÇÃO EM SUB-BANDAS EDMAR DA COSTA VASCONCELLOS 05 July 2006 (has links) [pt] Este trabalho aborda o problema da compressão de imagens explorando a técnica de codificação por sub-bandas(SBB). Como estrutura básica, usada na primeira parte do trabalho, tem-se a divisão da imagem em 16 sub-bandas buscando replicar os resultados de woods [1]. As componentes das 16 SBB são quantizadas e codificadas, e bits são alocados às SBB usando como critério a minimização do erro médio quadrático. Os quantizadores são projetados segundo uma distribuição Gaussiana Generalizada. Neste processo de codificação, a sub-banda de mais baixa freqüência é codificada com DPCM, enquanto as demais SBB são codificadas por PCM. Como inovação, é proposto o uso do algoritmo de Lempel-Ziv na codificação sem perdas (compactação) das sub-bandas quantizadas. Na compactação são empregados os algoritmos de Huffman e LZW (modificação do LZA). Os resultados das simulações são apresentados em termos da taxa (bits/pixel) versus relação sinal ruído de pico e em termos de analise subjetiva das imagens reconstruídas. Os resultados obtidos indicam um desempenho de compressão superior quanto o algoritmo de Huffman é usado, comparado com o algoritmo LZW. A melhoria de desempenho, na técnica de decomposição em sub-bandas, observada com o algoritmo de Huffman foi superior (2dB acima). Todavia, tendo em vista as vantagens da universalidade do algoritmo de Lempel-Ziv, deve-se continuar a investigar o seu desempenho implementado de forma diferente do explorado neste trabalho. / [en] This work focus on the problem of image compression, with exploring the techniques of subband coding. The basic structure, used in the sirst part of this tesis, encompass the uniform decomposition of the image into 16 subbands. This procedure aims at reproducing the reults of Woods [1]. The component of the 16 subbands are quatized and coded and bits are optimally allocated among the subbands to minimize the mean-squared error. The quantizers desingned match the Generelized Gaussian Distribuition, which model the subband components. In the coding process, the lowest subband is DPCM coded while the higher subbands are coded with PCM. As an innovation, it is proposed the use of the algorithm LZW for coding without error (compaction) the quantized subbands. In the compactation process, the Huffamn and LZW algorithms are used. The simulation results are presented in terms of rate (bits/pel) versus peak signal-to-noise and subjective quality. The performance of the subband decomposition tecnique obtained with the Huffamn´s algorithm is about 2dB better than that obtained with the LZW. The universality of the Lempel-Ziv algorithm is, however, an advantage that leads us to think that further investigation should still be pursued. [pt] ALGORITMO [en] ALGORITHM [pt] SUB-BANDA [en] SUB-BAND [pt] CODIFICACAO [en] CODE NUMBERING
10	[en] DISTRIBUTED VIDEO CODING WITH CORRELATION CHANNEL MODELING IN THE TRANSFORM DOMAIN / [pt] CODIFICAÇÃO DISTRIBUÍDA DE VÍDEO COM MODELAGEM DO CANAL DE CORRELAÇÃO NO DOMÍNIO DA TRANSFORMADA RODRIGO SILVA MELLO 27 May 2011 (has links) [pt] A codificação distribuída de vídeo é um novo paradigma de codificação de vídeo que permite explorar a estatística da fonte apenas no decodificador. Nesse cenário, duas fontes correlatadas são independentemente codificadas usando codificadores distintos e os fluxos binários associados a cada uma são conjuntamente decodificados, explorando a correlação entre eles. A resiliência a erros é uma importante funcionalidade deste novo paradigma uma vez que a tradicional malha de predição no codificador e a propagação de erros associada a esta malha não existe ao não se explorar a correlação do sinal no codificador. Desta forma, esta tese tem como objetivo apresentar uma nova arquitetura de codificação distribuída de vídeo, desenvolvendo e analisando algoritmos mais eficientes para a mesma, reduzindo, desta forma, o gap de desempenho quando comparado aos sistemas tradicionais de codificação de vídeo [68]. Assim, o codec proposto nesta tese proporcionou: a otimização da arquitetura DVC (Distributed Vídeo Coding), o desenvolvimento de novas ferramentas para a geração da informação lateral, a inclusão de um módulo de medida de correlação entre quadros para auxiliar na decodificação, a utilização de um processo de quantização Wyner-Ziv variável, a opção de uma codificação parcial de bitplanes, uma modelagem do canal de correlação baseada na estimação de parâmetros em nível de banda e de coeficientes da transformada DCT (Discrete Cosine Transform), a inclusão de um módulo de normalização da informação lateral e o desenvolvimento de um código de canal mais adequado à arquitetura proposta. / [en] Distributed video coding is a new video coding paradigm that allows exploiting the source statistics at the decoder only. In this scenario, two correlated sources are independently encoded using separated encoders and the bit streams associated to each one are jointly decoded exploiting the correlation between them. Improved error resilience is another major functionality of this new video coding paradigm since the usual encoder prediction loop and the associated error propagation do not exist anymore, because the signal correlation is not explored in the encoder. Therefore, this thesis aims to present a new architecture for distributed video coding, analyzing and developing more efficient algorithms for it, thus reducing the gap in performance when it is compared to traditional video coding [68]. Therefore, the codec proposed in this thesis provided: a DVC architecture optimization; the development of new tools for side information generation process; inclusion of a module for measuring correlation between frames in order to assist in the Wyner-Ziv frame reconstruction; the use of a Wyner-Ziv variable quantization process; the option of partial coding of bitplanes; a correlation channel model based on the estimation of parameters in band and DCT coefficient levels; an inclusion of a normalization stage to the side information; and the development of a channel code more appropriate to the proposed architecture. [pt] INFORMACAO [en] INFORMATION [pt] CODIFICACAO [en] CODE NUMBERING [pt] INTERPOLACAO [pt] CODIGO DE CANAL

Search results