Global ETD Search

1	[en] ANALYSIS OF WAVEFORM CODERS FOR SPEECH AND DATA SIGNALS / [pt] ANÁLISE DE CODIFICADORES DE FORMA DE ONDA PARA SINAIS DE VOZ E DADOS ANTONIO MARCOS DE LIMA ARAUJO 07 November 2006 (has links) [pt] O trabalho examina o comportamento de Codificadores de forma de onda operando a 32,56 e 64kbit/s para transmissão digital de sinais de voz e de sinais de dados PSK-8 a 4800 bit/s e QAM-16 a 9600 bit/s. A partir de uma análise detalhada dos diversos sistemas, tanto em canal ideal como um canal ruidoso, é verificada a necessidade de se fazer uma identificação do tipo de sinal. De modo a permitir sua codificação de forma mais eficiente. É, então, proposta e avaliada a utilização de uma técnica de identificação estatística de sinais de voz e dados, em codificadores de forma de onda. A incorporação desta técnica ao sistema ADPCM a 32 kbit/s recomendado pelo CCITT permite uma melhoria do desempenho para sinais de dados, sem com isso alterar sua eficiência para sinais de voz. / [en] This thesis evaluates the performance of waveform coders at 32,56 and 64kbit/s for digital transmission of speech signal and 4800 bit/s PSK-8 and 9600 bit/s QAM-16 voiceband data signas. A detailed analysis of the systems is carried out both under ideal and noisy channel conditions. From this analysis it was found that a scheme which accurately distinguishes the two classes of signals, would allow a more efficient encoding procedure. A method of statistical identification of speech and data signals is proposed and its use in wakeform coders is, then, analysed. The incorporation of this method into the 32 kbit/s ADPCM system recommended by CCITT provides an improvement in performance for data signals, without sacrificing its efficiency for speech signal. [pt] CODIFICACAO DE VOZ [en] SPEECH CODING [pt] TRANSMISSAO DIGITAL [en] DIGITAL TRANSMISSION
2	[en] STUDY ON SPEECH CODING IN SUB-BANDS AT 16 KBITS/S / [pt] ESTUDO DE CODIFICAÇÃO DE VOZ EM SUB-BANDAS A 16 KBIT/S CARLOS FELIPE DE BRITO JACCOUD 09 November 2006 (has links) [pt] Neste trabalho são estudados sistemas de codificação digital de sinais de voz em sub-bandas, operando na taxa de 16 kbit/s. Os sistemas são analisados em função do número de sub-bandas, dos esquemas de codificação utilizados nas diversas sub-bandas, dos parâmetros e das técnicas empregados na adaptação dos quantizadores e do tipo de alocação dos recursos binários. A decomposição espectral do sinal é realizada a partir de bancos de filtros espelhados em quadratura (QMF), que tem a vantagem de evitar a sobreposição dos espectros nas diversas sub- bandas. Os sistemas são avaliados, através de simulação em computador, tanto em canal ideal como em um canal ruidoso, utilizando como figura de mérito a razão sinal-ruído frequencial. O desempenho obtido em termos das razões sinal-ruído global e segmentada também é apresentado em todos os casos analisados. A partir de um exame detalhado dos diversos sistemas e proposta uma estrutura de codificação em que a configuração do quantizador e sua técnica de adaptação dependem da sub-banda a ser codificada. Além disso, o sistema proposto utiliza um algoritmo para alocação dos recursos binários baseado em comparações de energias de blocos de amostras das diversas sub-bandas. / [en] In this thesis a study of 16 kbit/s sub-band coding of speech signals is presented. The encoding systems are examined in terms of the number of sub-bands, the schemes used to encode the sub-band signals, the parameters and techniques employed in the quantizers adaptation and the type of bit allocation. Spectral decomposition of the input signal is carried out by means of quadrature mirror filter (QMF) banks. The systems are evaluated through computer simulation, both in ideal and noisy channels, using the frequency - weighted signal-to-noise ratio as the performance criterion. The global and segmental signal- to-noise ratio performances are also given in all cases. After a detailed examination of the various systems, a coding structure is proposed , in which the configuration of the quantizer and its adaptation techniques depend on the sub-band to be coded. Furthermore, the proposed system uses an algorithm for bit allocation based on comparison of the energies fo blocks of samples in the several sub-bands. [pt] CODIFICACAO DE VOZ [en] SPEECH CODING [pt] TRANSMISSAO DIGITAL [en] DIGITAL TRANSMISSION
3	[en] SPEECH CODING AT AVERAGE RATES BELOW 2KB/S / [es] CODIFICACIÓN DE VOZ A TASAS MEDIAS ABAJO DE 2 KB/S / [pt] CODIFICAÇÃO DE VOZ A TAXAS MÉDIAS ABAIXO DE 2 KB/S RODRIGO CAIADO DE LAMARE 21 August 2001 (has links) [pt] Esta dissertação propõe algoritmos para codificações de voz a taxas médias em torno de 1,2 Kb/s. Um esquema de quantização vetorial preditiva chaveada com desempenho superior aos esquemas previamente descritos na literatura é proposto e avaliado em canal com ou sem ruído. Detectores eficientes de período fundamental e de sons oclusivos e fricativos são examinados e adaptados ao codificador proposto. Técnicas de exitação a baixas taxas de bits são investigadas a fim de reproduzir uma boa qualidade de voz decodificada. O modelo de exitação mista em multi-bandas com três sub-bandas é adotado para codificar os quadros sonoros. Para os quadros surdos são empregadas técnicas de modelagem e síntese de sinais fricativos e oclusivos, capazes de oferecer qualidade de voz satisfatória, reduzindo a taxa de bits destes quadros para apenas 0,4 Kb/s. Técnicas de pós-filtragem para reduzir o ruído de codificação e melhorar a qualidade de voz reconstruída são também examinadas e comparadas em uma mesma plataforma. Para reduzir o nível de ruído ambiente são ainda analisados métodos de supressão de ruído. Finalmente, o codificador proposto é comparado ao padrão norte-americano Mixed Excitation Linear Prediction (MELP), por meios de teste de comparação do tipo A/B. Os testes realizados indicam que o sistema proposto, operando a 1,2 Kb/s, apresenta qualidade de voz ligeiramente superior ao MELP, operando a 2,4 Kb/s. Para situações de transcodificação, o codificador proposto também apresenta desempenho superior ao MELP. / [en] This dissertation presents algorithms to encode at an avarage bit rate of 1.2 Kb/s. A novel switched-predictive vector quantiser technique that outperforms previously reported schemes is proposed and assessed under noise-free and noisy channels. Efficient detectors for the pitch period and fricative and stop sounds are examined and adapted to the proposed coder. Low bit rate excitation methods are investigated in order to reproduce rather high quality speech. A mixed multiband excitation approach with three sub-bands is employed to encode voiced frames. For unvoiced frames, fricatives and stops modelling and synthesis techniques are used. This approach has shown to provide high quality synthesised speech, whilts it reduces the bit rate to only 0.4 Kb/s for unvoiced frames. To reduce coding noise and improve decoded speech, post- filtering techniques are analysed and compared on the same plataform. To reduce background noise, noise suppression methods are also examined. Finally, the propose coder is evaluated against the North American Mixed Prediction (MELP) coder, through A/B comparison tests. Assessment results have shown that the proposed system, operating at 1.2 Kb/s, slightly outperformed the MELP coder, operating at 2.4 Kb/s. For tandem connection situations, the proposed algorithm has presented a superior performance than the MELP coder. / [es] Esta disertación propone algoritmos para codificaciones de voz a tasas medias en torno de 1,2 Kb/s. Se propone un esquema de cuantización vectorial predictiva, con desempeño superior a los esquemas previamente descritos en la literatura. Este esquema se evalúa en canal con o sin ruido. Se examinan detectores eficientes de período fundamental y de sueños oclusivos y fricativos se adaptan al codificador propuesto. Técnicas de exitación a bajas tasas de bits son investigadas a fin de reproducir una boa calidad de voz decodificada. Se adopta el modelo de exitación mixta en multi-bandas con tres sub-bandas para codificar los cuadros sonoros. Para los cuadros surdos se emplean técnicas de modelación y síntesis de señales fricativos y oclusivos, capaces de ofrecer calidad de voz satisfactoria, reduciendo la tasa de bits de estos cuadros para apenas 0,4 Kb/s. También se examinan y se comparan las técnicas de pós-filtragen para reducir el ruido de codificación y mejorar la calidad de voz reconstruída. Para reducir el nível de ruído ambiente se analizan métodos de supresión de ruido. Finalmente, el codificador propuesto se compara al padrón norteamericano Mixed Excitation Lineal Prediction (MELP), por medio de pruebas de comparación del tipo LA/B. Las pruebas realizadas indican que el sistema propuesto, operando a 1,2 Kb/s, presenta calidad de voz ligeramente superior al MELP, operando a 2,4 Kb/s. Para situaciones de transcodificación, el codificador propuesto también presenta desempeño superior al MELP. [pt] CODIFICACAO DE VOZ [en] SPEECH CODING [pt] BAIXAS TAXAS DE BITS [en] LOW BIT RATE [pt] PARAMETROS LSF [en] LSF PARAMETERS [pt] QUANTIZACAO VETORIAL [en] VECTOR QUANTISATION [pt] TECNICAS DE EXCITACAO [en] EXCITATION TECHNIQUES [pt] FRICATIVOS [en] FRICATIVES [pt] OCLUSIVOS [en] STOPS [pt] POS-FILTROS [en] POST-FILTERS [pt] AVALIACAO DE QUALIDADE SUBJETIVA [en] SUBJECTIVE QUALITY EVALUATION

1

Page generated in 0.0387 seconds