1 |
[en] SUB-BAND CODING OF IMAGES USING INTER-BAND VECTOR QUANTIZATION / [pt] CODIFICAÇÃO DE IMAGENS EM SUB-BANDAS USANDO QUANTIZAÇÃO VETORIAL INTER-BANDASLUCIANO RILA 31 July 2006 (has links)
[pt] Neste trabalho são examinados métodos de codificação de
imagens em sub-bandas utilizando quantização vetorial
inter-bandas para faixas abaixo de 1 bit/pixel. O espectro
de freqüências da imagem é decomposto em 16 sub-bandas
uniformes através de um banco de filtros espelhados em
quadratura bi-dimensionais. As amostras dos sinais das 16
sub-bandas são usadas para compor um vetor de 16
componentes que, posteriormente, é codificado por um
esquema de quantização vetorial (QV). Com o objetivo de
reduzir a complexidade e o espaço de memória, são
investigadas duas estruturas de quantização vetorial. Uma
delas utiliza QV particionada, com o objetivo não só de
reduzir a complexidade, como também de explorar as
propriedades espectrais. A outra realiza a quantização
vetorial direta, enquanto a complexidade é reduzida
significativamente. Resultados de simulações são
apresentados para as taxas de 0,50 bit/pixel, 0,63
bit/pixel e 0,75 bit/pixel. Uma análise comparativa mostra
que o desempenho dos dois esquemas é comparável ao que
utiliza quantização vetorial direta, enquanto a
complexidade é reduzida significativamente. Resultados de
simulações mostram ainda que, a taxas abaixo de 1
bit/pixel, não é recomendável o uso de QV inter-bandas
particionada com alocação de bits adaptativa, nem de QV
inter-bandas multi-estágios com busca em árvore. A
técnica QV inter-bandas quando a sub-banda dominante é
codificada separadamente através de um quantizador
vetorial intra-banda. Considera-se a decomposição do
espectro de freqüências em 16 sub-bandas uniformes e em 13
sub-bandas. Para a decomposição em 16 sub-bandas, esse
esquema apresenta desempenho comparável à QV inter-bandas
direta e complexidade equivalente à QV inter-bandas multi-
estágios. / [en] In this thesis sub-band coding of images using inter-band
vector quantization is examined at rates below 1
bit/pixel. The image spectrum is decomposed into 16
uniform bands using 2-D separable quadrature mirror
filters. These 16 bands are used to create 16-dimension
vectores, which are coded using vector quantization (VQ).
In order to reduce the computational complexity and the
storage requirements, two vector quantization structures
are considered. One approach is to split the vectors not
only to reduce complexity but also to exploit spectral
properties of the data image. In the order approach the
vector quantization is done in multiple stages. Simulation
results are presented at rates of 0,50 bit/pixel, 0,63
bit/pixel and 0,75 bit/pixel. A comparative analysis shows
that the performance of the two systems is comparable to
the basic coding structure, while the complexity is
significantly reduced. Simulation results also show that
split VQ with adaptive bit allocation and multi-stage VQ
with tree search are not recommended at these rates. The
best trade-off between complexity and performance is
achieved with the inter-band multi-stage VQ scheme using
the sequential search procedure. At last, the use of inter-
band VQ is examined when the dominant sub-band is
separately coded using intra-band VQ. When the image
spectrum is decomposed into 16 bands, this scheme has a
performance comparable to the basic coding structure while
the complexity and storage reduction is equivalent to the
inter-band multi-stage VQ technique.
|
2 |
[en] SUB-BAND IMAGE CODING / [pt] CODIFICAÇÃO DE IMAGENS POR DECOMPOSIÇÃO EM SUB-BANDASEDMAR DA COSTA VASCONCELLOS 05 July 2006 (has links)
[pt] Este trabalho aborda o problema da compressão de imagens
explorando a técnica de codificação por sub-bandas(SBB).
Como estrutura básica, usada na primeira parte do
trabalho, tem-se a divisão da imagem em 16 sub-bandas
buscando replicar os resultados de woods [1]. As
componentes das 16 SBB são quantizadas e codificadas, e
bits são alocados às SBB usando como critério a
minimização do erro médio quadrático. Os quantizadores são
projetados segundo uma distribuição Gaussiana Generalizada.
Neste processo de codificação, a sub-banda de mais baixa
freqüência é codificada com DPCM, enquanto as demais SBB
são codificadas por PCM.
Como inovação, é proposto o uso do algoritmo de Lempel-Ziv
na codificação sem perdas (compactação) das sub-bandas
quantizadas.
Na compactação são empregados os algoritmos de Huffman e
LZW (modificação do LZA). Os resultados das simulações são
apresentados em termos da taxa (bits/pixel) versus relação
sinal ruído de pico e em termos de analise subjetiva das
imagens reconstruídas. Os resultados obtidos indicam um
desempenho de compressão superior quanto o algoritmo de
Huffman é usado, comparado com o algoritmo LZW. A melhoria
de desempenho, na técnica de decomposição em sub-bandas,
observada com o algoritmo de Huffman foi superior (2dB
acima). Todavia, tendo em vista as vantagens da
universalidade do algoritmo de Lempel-Ziv, deve-se
continuar a investigar o seu desempenho implementado de
forma diferente do explorado neste trabalho. / [en] This work focus on the problem of image compression, with
exploring the techniques of subband coding.
The basic structure, used in the sirst part of this tesis,
encompass the uniform decomposition of the image into 16
subbands. This procedure aims at reproducing the reults of
Woods [1]. The component of the 16 subbands are quatized
and coded and bits are optimally allocated among the
subbands to minimize the mean-squared error. The
quantizers desingned match the Generelized Gaussian
Distribuition, which model the subband components.
In the coding process, the lowest subband is DPCM coded
while the higher subbands are coded with PCM.
As an innovation, it is proposed the use of the algorithm
LZW for coding without error (compaction) the quantized
subbands.
In the compactation process, the Huffamn and LZW
algorithms are used. The simulation results are presented
in terms of rate (bits/pel) versus peak signal-to-noise
and subjective quality. The performance of the subband
decomposition tecnique obtained with the Huffamn´s
algorithm is about 2dB better than that obtained with the
LZW. The universality of the Lempel-Ziv algorithm is,
however, an advantage that leads us to think that further
investigation should still be pursued.
|
3 |
[en] SIGNALS AND SYSTEMS FREQUENCY SUBBAND DECOMPOSITION STRUCTURE / [pt] ESTRUTURA DE DECOMPOSIÇÃO DE SINAIS E SISTEMAS EM SUB-BANDAS DE FREQÜÊNCIAMARCELLO MARINHO PIGNATARO 26 July 2006 (has links)
[pt] Este trabalho amplia a estrutura clássica de decomposição
de sinais em sub-bandas de freqüência. É desenvolvida uma
estrutura capaz de decompor simultaneamente sinais
quaisquer e sistemas lineares, discretos e invariantes no
tempo. As funções codificadas podem ser implementadas nas
sub-bandas de forma paralela, a uma taxa de operação mais
baixa do que a do sistema original. É proposta uma
arquitetura para implementação, em cujas simulações o
sinal decomposto e processado é recuperado com baixa
distorção, caracterizando a reconstrução perfeita da
estrutura.
Os filtros utilizados para o processo de decomposição
caracterizam-se por sua simplicidade (passa-tudo de 2a.
ordem) com boa rejeição em freqüência. Os filtros de
reconstrução, normalmente instáveis, são estabilizados por
técnicas que realizam reversão do sinal no tempo. Uma das
soluções utiliza a passagem de condições iniciais do bloco
de decomposição para o de reconstrução. É apresentada
também, outra solução, mais gera, que dispensa esta
passagem e faz uso da característica de convergência
assintótica dos filtros de reconstrução. A estrutura de
decomposição proposta pode ser aplicada recursiva, gerando
uma estrutura em árvore binária. / [en] This work extends the classical signal subband
decomposition scheme to incorporate the decomposition of
linear systems. A network decomposition structure is
developed to simultaneously decompose signals and systems
into subband of frequencies. The procedure allows simply
rate reduction, as well as the network partition
repetitive subnetworks.
The method uses second order allpass as
decomposition/synthesis filters and a specific structure
is proposed to implement the unstable synthesis filters.
In the system simulation the signal is processed with very
small distortion supporting the theory.
|
4 |
[en] IMAGE COMPRESSION TECHNIQUES BASEC ON SUBBAND CODING / [pt] TÉCNICAS DE COMPRESSÃO DE IMAGENS POR SUB-BANDASJAIME GORNSZTEJN 31 July 2006 (has links)
[pt] Neste trabalho são examinadas técnicas de compressão de
imagens por sub-bandas. O algoritmo de análise/síntese
utilizado emprega filtros recursivos passa-tudo de 1º
ordem, o que reduz a complexidade computacional sem
introduzir aliasing ou distorção de fase. Técnicas de
processamento específicas para o caso destes filtros foram
discutidas.
As limitações da codificação direta das sub-bandas
mostraram a conveniência de, inicialmente, separar
componentes de baixa e alta freqüências. A imagem de baixa
freqüência representa o brilho e a textura e é codificada
por blocos no domínio da Transformada Cossenoidal Discreta.
A imagem de erro, com aspecto essencialmente passa-alta,
destacando as transições, é dividida em sub-bandas que são
quantizadas vetorialmente. A exploração das
características e correlação das sub-bandas permite
aperfeiçoar esta técnica.
A qualidade objetiva de cada técnica é medida pela razão
sinal/ruído de pico e a subjetiva resulta da análise
visual das imagens. Ambas são comparáveis ou superiores às
de codificadores existentes com complexidade semelhante,
para taxas entre 0.6 e 0.7 bits/pixel. / [en] Image compression techniques based on subband coding are
studied in this work. The analysis/synthesis algorithm is
implemented using first-order all-pass recursive filters,
which significantly reduces the computational complexity
and reconstructs the input with neither aliasing nor phase
distortion. Specific processing techniques for these
filters were discussed.
Limitations in direct subband coding show the convenience
of initially splitting the image to be compressed into its
low-pass and high-pass components, representing sharp
edges, is divided into subbands which are vector
quantized. Further improvement of this technique results
from the study of subband characteristics and correlacion.
Objective quality of each technique is measured by the
peak signal-to-noise ratio and subjective quality results
from visual inspection of reconstructed images. Both are
superior or comparable to existing coders of similar
complexity, for rates between 0.6 and 0.7 bits/pixel.
|
5 |
[en] ROBUST TEXT-INDEPENDENT SPEAKER IDENTIFICATION USING MULTIPLE CLASSIFIERS IN SUB-BANDS / [pt] IDENTIFICAÇÃO DE LOCUTOR ROBUSTA E INDEPENDENTE DO TEXTO USANDO MÚLTIPLOS CLASSIFICADORES EM SUB-BANDASEDUARDO ESTEVES VALE 07 April 2011 (has links)
[pt] Esta tese destina-se ao desenvolvimento de novas técnicas de combinação
de classificadores aplicados em sub-bandas visando melhorar a identificação de
locutor robusta e independente do texto. As vantagens observadas nas pesquisas
utilizando múltiplos classificadores em sub-bandas para o reconhecimento de
locutor robusto motivaram o desenvolvimento de técnicas de combinação desses
algoritmos. Nessa tese foram propostas novas abordagens para a combinação das
respostas dos classificadores nas sub-bandas. O principal objetivo é melhorar a
taxa de acerto em situações onde nada se sabe sobre o tipo de ruído que pode estar
corrompendo os sinais de voz usados no teste do sistema. As diferentes propostas
consistem no emprego de pesos não-uniformes, espaço nulo, treinamento em
múltiplas condições, atributos dinâmicos e coeficientes de autocorrelação –
MFCC. A aplicação das novas propostas contribui significativamente para a
melhoria da taxa de acerto do sistema de reconhecimento. Obteve-se, por
exemplo, um aumento na taxa de reconhecimento, em relação à técnica de
combinação Soma apresentada na literatura, de aproximadamente 47% em testes
com ruído branco, e de 32% em testes com ruído não-branco em 15 segundos de
fala e 10 dB de RSR (Relação Sinal Ruído), apenas utilizando uma nova estratégia
que emprega o espaço nulo na combinação de classificadores em sub-bandas.
Resultados mais significativos foram obtidos empregando-se as demais propostas
apresentadas no presente trabalho. / [en] This Thesis aims to develop new classifier combination techniques applied
in sub-bands in order to improve the robustness of text-independent speaker
identification systems. The advantages observed in previous experiments using
multiple classifiers in sub-bands for robust speaker recognition motivated the
development of combination techniques for these algorithms. New strategies to
combine the classifiers responses are proposed in this Thesis. The main purpose is
to increase the recognition performance in situations when there is no knowledge
about the type of noise that corrupts the testing speech signal. The different
proposals consist in applying non-uniform weights, null space, multicondition
training, dynamic features and autocorrelation based MFCC features. The
employment of the new strategies significantly contribute to increase the
recognition performance. It was obtained an increase, for instance, compared to
the Sum combination technique shown in the literature, of about 47% in tests with
white noise, and 32% with non-white noise in 15 seconds of speech in 10 dB of
SNR (Signal-to-noise ratio), just using a new strategy which employ the null
space to combine the sub-band classifiers. Even better results were obtained by
using the other proposals.
|
6 |
[pt] ESTIMAÇÃO EM TEMPO REAL DE SENÓIDES HARMÔNICAS POR DECOMPOSIÇÃO EM SUB-BANDAS / [en] REAL TIME HARMONIC SINE WAVE ESTIMATION BY SUB-BAND DECOMPOSITIONRAFAEL ANTONIO FLORES CHACON 29 November 2005 (has links)
[pt] A medição da qualidade de energia é um aspecto cada vez
mais importante com o avanço tecnológico. Um destes
aspectos é a estimação dos harmônicos em sinais de
potência. Este trabalho, apresenta um algoritmo para
obter, simultaneamente, os valores reais de freqüência,
amplitude e fase de cada componente do sinal, baseados em
valores distorcidos originários do uso da FFT. Contrário a
outros métodos, o algoritmo requer um número reduzido de
dados, permitindo sua implementação em tempo real. Para
estender este método a um sinal com componentes de
harmônicos de ordem elevada utilizam-se bancos de filtros
para decomposição em sub-bandas e eventual reconstrução
numa estrutura de operação orientada ao tempo real. O
trabalho apresenta resultados comprovando a correta
operação e robustez do processo. O método é otimizado para
implementação com reduzido número de operações em ponto
flutuante. / [en] Power quality measurement is a key issue with the
technology advance in power systems. One fo these issues
is harmonics estimation of power systems signals. This
work shows an algorithm to obtain, simultaneously, the
real values of frequency, amplitude and phase of each
signal component, based in distorted values originated by
the use of FFT. In contrast to other methods, the
algorithm requires a small number of data, allowing its
implementation in real time. To extended this method to a
high harmonic order signal, filter banks are used to
decompose it in sub bands and eventually reconstruct it,
in a real time operation structure.
This work shows results testing the correct operation and
robustness of the process. Th eAlgorithm is optimized to
its imlementation with a reduced number of float point
operations.
|
7 |
[en] INDEPENDENT TEXT ROBUST SPEAKER RECOGNITION IN THE PRESENCE OF NOISE USING PAC-MFCC AND SUB BAND CLASSIFIERS / [pt] RECONHECIMENTO DE LOCUTOR INDEPENDENTE DO TEXTO EM PRESENÇA DE RUÍDO USANDO PAC-MFCC E CLASSIFICADORES EM SUB-BANDASHARRY ARNOLD ANACLETO SILVA 06 September 2011 (has links)
[pt] O presente trabalho é proposto o atributo PAC-MFCC operando com Classificadores em Sub-Bandas para a tarefa de identificação de locutor independente do texto em ruído. O sistema proposto é comparado com os atributos MFCC (Coeficientes Cepestrais de Frequência Mel), PAC- MFCC (Fase Autocorrelação-MFCC ) sem uso de classificadores em sub-bandas, SSCH(Histogramas de Centróides de Sub-Bandas Espectrais) e TECC (Coeficientes Cepestrais da Energia Teager). Nesta tarefa de reconhecimento, utilizou-se a base TIMIT a qual é composta de 630 locutores onde cada um deles falam 10 frases de aproximadamente 3 segundos cada frase, das quais 8 frases foram utilizadas para treinamento e 2 para teste, obtendo-se um total de 1260 locuções para o reconhecimento. Investigou-se o desempenho dos diversos sistemas utilizando diferentes tipos de ruídos da base Noisex 92 com diferentes relação sinal ruído. Verificou-se que a taxa de acerto da técnica PAC-MFCC com classificador em Sub-Bandas apresenta o melhor desempenho em comparação com as outras técnicas quando se tem uma relação sinal ruído menor que 10dB. / [en] In this work is proposed the use of the PAC-MFCC feature with Sub-band
Classifiers for the task of text-independent speaker identification in noise. The
proposed scheme is compared with the features MFCC (Mel-Frequency Cepstral
Coefficients ), PAC-MFCC (Phase Autocorrelation MFCC) without subband
classifiers, SSCH (Subband Spectral Centroid Histograms) and TECC
(Teager Energy Cepstrum Coefficients). In this recognition task, we used the
TIMIT database which consists of 630 speakers, where every one of them speak
10 utterances of 3 seconds each one approximately, of which eight utterance
were used for training and two for testing, thus obtaining a total of 1260 test
utterance for the recognition. We investigated the performance of these techniques
using differents types of noise from the base Noisex 92 with different
signal to noise ratios. It was found that the accuracy rate of the PAC-MFCC
feature with Sub-band Classifiers performs better in comparison with other
techniques at a lower signal noise(less than 10dB).
|
Page generated in 0.0305 seconds