Made available in DSpace on 2016-08-17T14:52:55Z (GMT). No. of bitstreams: 1
Paulo Henrique Bezerra de Carvalho.pdf: 6145212 bytes, checksum: 1f5a8a10fa0d0e9f555a3fe1f67ac240 (MD5)
Previous issue date: 2003-12-12 / This work proposes an speech signal encoder variation based on two concepts: the formants
and the modulating components of the speech signal. The method suggested for the
codification extracts the modulating components (instantaneous amplitude and frequency) to
be transmitted. The method is based on the fact that the transmission of the speech can be
substituted by the transmission of its AM-FM modulating components (amplitude modulation
- frequency modulation). Thus, to send such components, the LPC (linear predictive coding)
method is used to determine the frequencies that correspond to the first four formants of the
speech spectrum within a 4 kHz band. Then, through a modified Gabor s wavelet function,
four narrow bands are filtered around the formants. Finally, the properties of the Hilbert
transform are used to determine the modulating components of the filtered bands, in other
words, the instantaneous amplitudes and frequencies. The final result is the codification of
eight signals in which four of them correspond to the instantaneous amplitudes and the other
four correspond to the instantaneous frequencies. It is also presented a recovery of human
speech where tests of intelligibility of the samples are applied after their respective recoveries.
The results obtained showed that the method is a promising technique to be implemented in
actual applications. / Este trabalho propõe uma variação de codificador do sinal de voz baseada em dois conceitos:
os formantes e as componentes modulantes do sinal. O método proposto de codificação extrai
as componentes modulantes (amplitudes e freqüências instantâneas) para serem transmitidas.
O método é baseado no fato de que a transmissão da voz pode ser substituída pelo envio de
suas componentes modulantes AM-FM (amplitude modulation - frequency modulation).
Desse modo, para o envio de tais componentes é utilizado o método LPC (linear predictive
coding) para a determinação das freqüências correspondentes aos quatro primeiros formantes
do espectro de voz na faixa de 4 kHz. Em seguida, através de uma função wavelet modificada
de Gabor, são filtradas quatro faixas estreitas em torno desses formantes. Por último,
utilizando-se as propriedades da transformada de Hilbert, são determinadas as componentes
modulantes das faixas filtradas, ou seja, as amplitudes e freqüências instantâneas. O resultado
final é a codificação de oito sinais, sendo quatro correspondentes às amplitudes instantâneas e
quatro das freqüências instantâneas. Também é apresentada a recuperação da voz a partir dos
oitos sinais e para a validação do método são utilizadas cinco amostras de voz humana onde
são empregados testes de inteligibilidade das amostras após as suas respectivas recuperações.
Os resultados obtidos mostraram que o método é factível de implementação em aplicações
reais.
Identifer | oai:union.ndltd.org:IBICT/oai:tede2:tede/370 |
Date | 12 December 2003 |
Creators | Carvalho, Paulo Henrique Bezerra de |
Contributors | BARROS FILHO, Allan Kardec Duailibe |
Publisher | Universidade Federal do Maranhão, PROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA DE ELETRICIDADE/CCET, UFMA, BR, Engenharia |
Source Sets | IBICT Brazilian ETDs |
Language | Portuguese |
Detected Language | English |
Type | info:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/masterThesis |
Format | application/pdf |
Source | reponame:Biblioteca Digital de Teses e Dissertações da UFMA, instname:Universidade Federal do Maranhão, instacron:UFMA |
Rights | info:eu-repo/semantics/openAccess |
Page generated in 0.0023 seconds