1 |
[en] CONTRIBUITIONS TO IMPROVING CELP CODING AT LOW BIT RATS / [pt] CONTRIBUIÇÕES PARA A MELHORIA DA CODIFICAÇÃO CELP A BAIXAS TAXAS DE BITSLUCIO MARTINS DA SILVA 24 May 2006 (has links)
[pt] Esta tese propõe novas melhorias para a codificação CELP a
baixas taxas de bits. Primeiro, é proposto um algoritmo
CELP em que a complexidade do procedimento de busca no
dicionário adaptativo é grandemente reduzida, graças a uma
modificação introduzida no modelo de síntese CELP.
Resultados de simulação mostram que a qualidade da voz
codificada com o algoritmo CELP proposto tem qualidade
comparável àquela obtida com o algoritmo CELP convencional.
As demais contribuições têm o propósito de melhorar a
qualidade da voz codificada com o algoritmo CELP a baixas
taxas de bits. Uma delas propicia uma codificação mais
eficiente da envoltória espectral LPC da voz: é,
especificamente, um esquema que combina quantização
vetorial e interpolação interbloco dos parâmetros LSF. Com
este esquema a envoltória espectral LPC codificada tem boa
qualidade a uma taxa de bits tão baixa quanto 1 kb/s.
A voz codificada com os algoritmos CELP apresenta
freqüentemente distorções em sua envoltória espectral que
são causadas por deficiências do sinal de excitação. Esta
tese propõe um novo pós-filtro que reduz estas distorções
e, com isso, melhora significativamente a qualidade
subjetiva da voz codificada.
A baixas taxas de bits a estrutura CELP convencional é
incapaz de reproduzir com boa qualidade os ataques dos
sons sonoros, que são cruciais para uma boa percepção da
voz. Nesta tese é descrito um algoritmo CELP que dá
prioridade a estes segmentos críticos. Cada bloco da voz é
classificado em um dentre dezesseis padrões de sonoridade
e cada padrão tem uma configuração de codificação e
alocação de bits distintas. Resultados de simulação
mostram que a qualidade da voz codificada a 4 kb/s com o
algoritmo CELP proposto é significativamente melhor do que
aquela conseguida com um codificador CELP convencional,
também operando a 4 kb/s. / [en] This work presents new improvements to CELP speech coding
at low bit rates. First, a CELP algorithm is proposed in
wich the complexity of the adaptive codebook search is
gratly decreased. This is achieved by means of a modified
model of the CELP synthesizer. Simulation results show
that the proposed algorithm can provide speech quality
comparable to one obtained with the conventional CELP
codec.
The rest of contributions aim to improve the quality of
speech codec at low bit rates with CELP algorithm. One of
them is an efficient scheme for coding the LPC spectral
envelope of speech for coding the LPC spectral envelope of
speech. The proposed scheme combines vector quantization
and interpolation of LSF parameters, and it provides a
coded spectral envelope with very good quality at 1 kb/s.
Speech coded with CELP codecs frequently displays
distortions in its spectral envelope that are produced by
deficient excitation. This thesis proposes a new
postfilter that enhances the perceptual quality of codec
speech by decreasin these distortions.
This work presents new improvements to CELP speech coding
at low bit rates. First, a CELP algorithm is proposed in
wich the complexity of the adaptive codebook search is
gratly decreased. This is achieved by means of a modified
model of the CELP synthesizer. Simulation results show
that the proposed algorithm can provide speech quality
comparable to one obtained with the conventional CELP
codec.
The rest of contributions aim to improve the quality of
speech codec at low bit rates with CELP algorithm. One of
them is an efficient scheme for coding the LPC spectral
envelope of speech for coding the LPC spectral envelope of
speech. The proposed scheme combines vector quantization
and interpolation of LSF parameters, and it provides a
coded spectral envelope with very good quality at 1 kb/s.
Speech coded with CELP codecs frequently displays
distortions in its spectral envelope that are produced by
deficient excitation. This thesis proposes a new
postfilter that enhances the perceptual quality of codec
speech by decreasin these distortions.
Voiced onsets are crucial for a good perception of speech
but, at low bit rates, the conventional CELP is unable to
reproduce them with good quality. This work presents a
CELP algorithm into one of a set of sixteen voicing
patterns. A distinct coding configuration and bit
allocation are applied to each pattern. Simulation results
show that the quality of speech codec with the proposed 4
kb/s CELP codec is significantly bette than the one
obtained with conventional 4 kb/s CELP codec.
|
2 |
[en] SPEECH CODING AT AVERAGE RATES BELOW 2KB/S / [es] CODIFICACIÓN DE VOZ A TASAS MEDIAS ABAJO DE 2 KB/S / [pt] CODIFICAÇÃO DE VOZ A TAXAS MÉDIAS ABAIXO DE 2 KB/SRODRIGO CAIADO DE LAMARE 21 August 2001 (has links)
[pt] Esta dissertação propõe algoritmos para codificações de voz
a taxas médias em torno de 1,2 Kb/s. Um esquema de
quantização vetorial preditiva chaveada com desempenho
superior aos esquemas previamente descritos na literatura é
proposto e avaliado em canal com ou sem ruído. Detectores
eficientes de período fundamental e de sons oclusivos e
fricativos são examinados e adaptados ao codificador
proposto. Técnicas de exitação a baixas taxas de bits são
investigadas a fim de reproduzir uma boa qualidade de voz
decodificada. O modelo de exitação mista em multi-bandas
com três sub-bandas é adotado para codificar os quadros
sonoros. Para os quadros surdos são empregadas técnicas de
modelagem e síntese de sinais fricativos e oclusivos,
capazes de oferecer qualidade de voz satisfatória,
reduzindo a taxa de bits destes quadros para apenas 0,4
Kb/s. Técnicas de pós-filtragem para reduzir o ruído de
codificação e melhorar a qualidade de voz reconstruída são
também examinadas e comparadas em uma mesma plataforma.
Para reduzir o nível de ruído ambiente são ainda analisados
métodos de supressão de ruído. Finalmente, o codificador
proposto é comparado ao padrão norte-americano Mixed
Excitation Linear Prediction (MELP), por meios de teste de
comparação do tipo A/B. Os testes realizados indicam que o
sistema proposto, operando a 1,2 Kb/s, apresenta qualidade
de voz ligeiramente superior ao MELP, operando a 2,4 Kb/s.
Para situações de transcodificação, o codificador proposto
também apresenta desempenho superior ao MELP. / [en] This dissertation presents algorithms to encode at an
avarage bit rate of 1.2 Kb/s. A novel switched-predictive
vector quantiser technique that outperforms previously
reported schemes is proposed and assessed under noise-free
and noisy channels. Efficient detectors for the pitch
period and fricative and stop sounds are examined and
adapted to the proposed coder. Low bit rate excitation
methods are investigated in order to reproduce rather high
quality speech. A mixed multiband excitation approach with
three sub-bands is employed to encode voiced frames. For
unvoiced frames, fricatives and stops modelling and
synthesis techniques are used. This approach has shown to
provide high quality synthesised speech, whilts it reduces
the bit rate to only 0.4 Kb/s for unvoiced frames. To
reduce coding noise and improve decoded speech, post-
filtering techniques are analysed and compared on the same
plataform. To reduce background noise, noise suppression
methods are also examined. Finally, the propose coder is
evaluated against the North American Mixed Prediction
(MELP) coder, through A/B comparison tests. Assessment
results have shown that the proposed system, operating at
1.2 Kb/s, slightly outperformed the MELP coder, operating
at 2.4 Kb/s. For tandem connection situations, the proposed
algorithm has presented a superior performance than the
MELP coder. / [es] Esta disertación propone algoritmos para codificaciones de voz a tasas medias en torno de 1,2 Kb/s.
Se propone un esquema de cuantización vectorial predictiva, con desempeño superior a los
esquemas previamente descritos en la literatura. Este esquema se evalúa en canal con o sin ruido. Se
examinan detectores eficientes de período fundamental y de sueños oclusivos y fricativos se adaptan
al codificador propuesto. Técnicas de exitación a bajas tasas de bits son investigadas a fin de
reproducir una boa calidad de voz decodificada. Se adopta el modelo de exitación mixta en
multi-bandas con tres sub-bandas para codificar los cuadros sonoros. Para los cuadros surdos se
emplean técnicas de modelación y síntesis de señales fricativos y oclusivos, capaces de ofrecer
calidad de voz satisfactoria, reduciendo la tasa de bits de estos cuadros para apenas 0,4 Kb/s.
También se examinan y se comparan las técnicas de pós-filtragen para reducir el ruido de
codificación y mejorar la calidad de voz reconstruída. Para reducir el nível de ruído ambiente se
analizan métodos de supresión de ruido. Finalmente, el codificador propuesto se compara al padrón
norteamericano Mixed Excitation Lineal Prediction (MELP), por medio de pruebas de comparación
del tipo LA/B. Las pruebas realizadas indican que el sistema propuesto, operando a 1,2 Kb/s, presenta
calidad de voz ligeramente superior al MELP, operando a 2,4 Kb/s. Para situaciones de
transcodificación, el codificador propuesto también presenta desempeño superior al MELP.
|
Page generated in 0.0484 seconds