Return to search

Estimativas de Comportamento Vocálico de Locutores e Um Novo Sistema de Separação Silábica

Submitted by Eduarda Figueiredo (eduarda.ffigueiredo@ufpe.br) on 2015-03-06T14:03:59Z
No. of bitstreams: 2
Dissertacao_Elda.pdf: 8023121 bytes, checksum: 4f0cbf2e2826229912c86465beff3283 (MD5)
license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5) / Made available in DSpace on 2015-03-06T14:03:59Z (GMT). No. of bitstreams: 2
Dissertacao_Elda.pdf: 8023121 bytes, checksum: 4f0cbf2e2826229912c86465beff3283 (MD5)
license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5)
Previous issue date: 2012-05-28 / CNPq / Nesta dissertação um método simples para a estimação automática do
comportamento espectral de trechos vocálicos de locutores é proposto. Uma implementação
computacional em Matlab® é apresentada e sua validação é conduzida comparando os
resultados com uma identificação realizada manualmente, empregando o Audacity 1.3®.
Locutores (masculinos e femininos) foram considerados e os testes foram conduzidos para
sete diferentes sons vocálicos da língua portuguesa (a, é, ê, i, ó, ô, u). A abordagem é
potencialmente útil em modelos de trato vocal, na melhoria da qualidade de sintetizadores de
voz ou em algoritmos de reconhecimento automático de locutor. Em uma segunda parte, um
novo algoritmo para divisão silábica automática de arquivos de voz na língua portuguesa é
proposto, com base na envoltória do sinal de voz. Uma implementação computacional em
Matlab® é apresentada, a qual encontra-se disponibilizada na URL
http://www2.ee.ufpe.br/codec/divisao_silabica.html. Trechos longos contendo mais de uma
sílaba e identificados com uma mesma envoltória são chamados de supersilabas e são
separados posteriormente. Os resultados identificam as amostras correspondentes ao início e o
fim de cada sílaba detectada. Foram realizados testes preliminares com meia centena de
palavras, com uma taxa de identificação de cerca de 70%, porém melhorias podem ser
incorporadas para tratar fonemas nos quais o envelope não é o principal parâmetro na
identificação. Este algoritmo também pode ser particularmente útil em sistemas com
comandos de voz ou como ferramenta de apoio no ensino da língua portuguesa ou para
pacientes em tratamento fonoaudiológico.

Identiferoai:union.ndltd.org:IBICT/oai:repositorio.ufpe.br:123456789/11123
Date28 May 2012
CreatorsSilva, Elda Lizandra Fernandes da
ContributorsOliveira, Hélio Magalhães de
PublisherUniversidade Federal de Pernambuco
Source SetsIBICT Brazilian ETDs
LanguageBreton
Detected LanguagePortuguese
Typeinfo:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/masterThesis
Sourcereponame:Repositório Institucional da UFPE, instname:Universidade Federal de Pernambuco, instacron:UFPE
RightsAttribution-NonCommercial-NoDerivs 3.0 Brazil, http://creativecommons.org/licenses/by-nc-nd/3.0/br/, info:eu-repo/semantics/openAccess

Page generated in 0.0018 seconds