1 |
[en] ANALYSIS OF WAVEFORM CODERS FOR SPEECH AND DATA SIGNALS / [pt] ANÁLISE DE CODIFICADORES DE FORMA DE ONDA PARA SINAIS DE VOZ E DADOSANTONIO MARCOS DE LIMA ARAUJO 07 November 2006 (has links)
[pt] O trabalho examina o comportamento de Codificadores de
forma de onda operando a 32,56 e 64kbit/s para transmissão
digital de sinais de voz e de sinais de dados PSK-8 a 4800
bit/s e QAM-16 a 9600 bit/s. A partir de uma análise
detalhada dos diversos sistemas, tanto em canal ideal como
um canal ruidoso, é verificada a necessidade de se fazer
uma identificação do tipo de sinal. De modo a permitir sua
codificação de forma mais eficiente. É, então, proposta e
avaliada a utilização de uma técnica de identificação
estatística de sinais de voz e dados, em codificadores de
forma de onda. A incorporação desta técnica ao sistema
ADPCM a 32 kbit/s recomendado pelo CCITT permite uma
melhoria do desempenho para sinais de dados, sem com isso
alterar sua eficiência para sinais de voz. / [en] This thesis evaluates the performance of waveform coders
at 32,56 and 64kbit/s for digital transmission of speech
signal and 4800 bit/s PSK-8 and 9600 bit/s QAM-16
voiceband data signas. A detailed analysis of the systems
is carried out both under ideal and noisy channel
conditions. From this analysis it was found that a scheme
which accurately distinguishes the two classes of signals,
would allow a more efficient encoding procedure. A method
of statistical identification of speech and data signals
is proposed and its use in wakeform coders is, then,
analysed. The incorporation of this method into the 32
kbit/s ADPCM system recommended by CCITT provides an
improvement in performance for data signals, without
sacrificing its efficiency for speech signal.
|
2 |
[en] STUDY ON SPEECH CODING IN SUB-BANDS AT 16 KBITS/S / [pt] ESTUDO DE CODIFICAÇÃO DE VOZ EM SUB-BANDAS A 16 KBIT/SCARLOS FELIPE DE BRITO JACCOUD 09 November 2006 (has links)
[pt] Neste trabalho são estudados sistemas de codificação
digital de sinais de voz em sub-bandas, operando na taxa
de 16 kbit/s. Os sistemas são analisados em função do
número de sub-bandas, dos esquemas de codificação
utilizados nas diversas sub-bandas, dos parâmetros e das
técnicas empregados na adaptação dos quantizadores e do
tipo de alocação dos recursos binários. A decomposição
espectral do sinal é realizada a partir de bancos de
filtros espelhados em quadratura (QMF), que tem a vantagem
de evitar a sobreposição dos espectros nas diversas sub-
bandas. Os sistemas são avaliados, através de simulação em
computador, tanto em canal ideal como em um canal ruidoso,
utilizando como figura de mérito a razão sinal-ruído
frequencial. O desempenho obtido em termos das razões
sinal-ruído global e segmentada também é apresentado em
todos os casos analisados.
A partir de um exame detalhado dos diversos
sistemas e proposta uma estrutura de codificação em que a
configuração do quantizador e sua técnica de adaptação
dependem da sub-banda a ser codificada. Além disso, o
sistema proposto utiliza um algoritmo para alocação dos
recursos binários baseado em comparações de energias de
blocos de amostras das diversas sub-bandas. / [en] In this thesis a study of 16 kbit/s sub-band coding of
speech signals is presented. The encoding systems are
examined in terms of the number of sub-bands, the schemes
used to encode the sub-band signals, the parameters and
techniques employed in the quantizers adaptation and the
type of bit allocation. Spectral decomposition of the
input signal is carried out by means of quadrature mirror
filter (QMF) banks. The systems are evaluated through
computer simulation, both in ideal and noisy channels,
using the frequency - weighted signal-to-noise ratio as
the performance criterion. The global and segmental signal-
to-noise ratio performances are also given in all cases.
After a detailed examination of the various
systems, a coding structure is proposed , in which the
configuration of the quantizer and its adaptation
techniques depend on the sub-band to be coded.
Furthermore, the proposed system uses an algorithm for bit
allocation based on comparison of the energies fo blocks
of samples in the several sub-bands.
|
3 |
[en] SPEECH CODING AT AVERAGE RATES BELOW 2KB/S / [es] CODIFICACIÓN DE VOZ A TASAS MEDIAS ABAJO DE 2 KB/S / [pt] CODIFICAÇÃO DE VOZ A TAXAS MÉDIAS ABAIXO DE 2 KB/SRODRIGO CAIADO DE LAMARE 21 August 2001 (has links)
[pt] Esta dissertação propõe algoritmos para codificações de voz
a taxas médias em torno de 1,2 Kb/s. Um esquema de
quantização vetorial preditiva chaveada com desempenho
superior aos esquemas previamente descritos na literatura é
proposto e avaliado em canal com ou sem ruído. Detectores
eficientes de período fundamental e de sons oclusivos e
fricativos são examinados e adaptados ao codificador
proposto. Técnicas de exitação a baixas taxas de bits são
investigadas a fim de reproduzir uma boa qualidade de voz
decodificada. O modelo de exitação mista em multi-bandas
com três sub-bandas é adotado para codificar os quadros
sonoros. Para os quadros surdos são empregadas técnicas de
modelagem e síntese de sinais fricativos e oclusivos,
capazes de oferecer qualidade de voz satisfatória,
reduzindo a taxa de bits destes quadros para apenas 0,4
Kb/s. Técnicas de pós-filtragem para reduzir o ruído de
codificação e melhorar a qualidade de voz reconstruída são
também examinadas e comparadas em uma mesma plataforma.
Para reduzir o nível de ruído ambiente são ainda analisados
métodos de supressão de ruído. Finalmente, o codificador
proposto é comparado ao padrão norte-americano Mixed
Excitation Linear Prediction (MELP), por meios de teste de
comparação do tipo A/B. Os testes realizados indicam que o
sistema proposto, operando a 1,2 Kb/s, apresenta qualidade
de voz ligeiramente superior ao MELP, operando a 2,4 Kb/s.
Para situações de transcodificação, o codificador proposto
também apresenta desempenho superior ao MELP. / [en] This dissertation presents algorithms to encode at an
avarage bit rate of 1.2 Kb/s. A novel switched-predictive
vector quantiser technique that outperforms previously
reported schemes is proposed and assessed under noise-free
and noisy channels. Efficient detectors for the pitch
period and fricative and stop sounds are examined and
adapted to the proposed coder. Low bit rate excitation
methods are investigated in order to reproduce rather high
quality speech. A mixed multiband excitation approach with
three sub-bands is employed to encode voiced frames. For
unvoiced frames, fricatives and stops modelling and
synthesis techniques are used. This approach has shown to
provide high quality synthesised speech, whilts it reduces
the bit rate to only 0.4 Kb/s for unvoiced frames. To
reduce coding noise and improve decoded speech, post-
filtering techniques are analysed and compared on the same
plataform. To reduce background noise, noise suppression
methods are also examined. Finally, the propose coder is
evaluated against the North American Mixed Prediction
(MELP) coder, through A/B comparison tests. Assessment
results have shown that the proposed system, operating at
1.2 Kb/s, slightly outperformed the MELP coder, operating
at 2.4 Kb/s. For tandem connection situations, the proposed
algorithm has presented a superior performance than the
MELP coder. / [es] Esta disertación propone algoritmos para codificaciones de voz a tasas medias en torno de 1,2 Kb/s.
Se propone un esquema de cuantización vectorial predictiva, con desempeño superior a los
esquemas previamente descritos en la literatura. Este esquema se evalúa en canal con o sin ruido. Se
examinan detectores eficientes de período fundamental y de sueños oclusivos y fricativos se adaptan
al codificador propuesto. Técnicas de exitación a bajas tasas de bits son investigadas a fin de
reproducir una boa calidad de voz decodificada. Se adopta el modelo de exitación mixta en
multi-bandas con tres sub-bandas para codificar los cuadros sonoros. Para los cuadros surdos se
emplean técnicas de modelación y síntesis de señales fricativos y oclusivos, capaces de ofrecer
calidad de voz satisfactoria, reduciendo la tasa de bits de estos cuadros para apenas 0,4 Kb/s.
También se examinan y se comparan las técnicas de pós-filtragen para reducir el ruido de
codificación y mejorar la calidad de voz reconstruída. Para reducir el nível de ruído ambiente se
analizan métodos de supresión de ruido. Finalmente, el codificador propuesto se compara al padrón
norteamericano Mixed Excitation Lineal Prediction (MELP), por medio de pruebas de comparación
del tipo LA/B. Las pruebas realizadas indican que el sistema propuesto, operando a 1,2 Kb/s, presenta
calidad de voz ligeramente superior al MELP, operando a 2,4 Kb/s. Para situaciones de
transcodificación, el codificador propuesto también presenta desempeño superior al MELP.
|
Page generated in 0.0423 seconds