Global ETD Search

Return to search

Estimativas de Comportamento Vocálico de Locutores e Um Novo Sistema de Separação Silábica

Submitted by Eduarda Figueiredo (eduarda.ffigueiredo@ufpe.br) on 2015-03-06T14:03:59Z
No. of bitstreams: 2
Dissertacao_Elda.pdf: 8023121 bytes, checksum: 4f0cbf2e2826229912c86465beff3283 (MD5)
license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5) / Made available in DSpace on 2015-03-06T14:03:59Z (GMT). No. of bitstreams: 2
Dissertacao_Elda.pdf: 8023121 bytes, checksum: 4f0cbf2e2826229912c86465beff3283 (MD5)
license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5)
Previous issue date: 2012-05-28 / CNPq / Nesta dissertação um método simples para a estimação automática do
comportamento espectral de trechos vocálicos de locutores é proposto. Uma implementação
computacional em Matlab® é apresentada e sua validação é conduzida comparando os
resultados com uma identificação realizada manualmente, empregando o Audacity 1.3®.
Locutores (masculinos e femininos) foram considerados e os testes foram conduzidos para
sete diferentes sons vocálicos da língua portuguesa (a, é, ê, i, ó, ô, u). A abordagem é
potencialmente útil em modelos de trato vocal, na melhoria da qualidade de sintetizadores de
voz ou em algoritmos de reconhecimento automático de locutor. Em uma segunda parte, um
novo algoritmo para divisão silábica automática de arquivos de voz na língua portuguesa é
proposto, com base na envoltória do sinal de voz. Uma implementação computacional em
Matlab® é apresentada, a qual encontra-se disponibilizada na URL
http://www2.ee.ufpe.br/codec/divisao_silabica.html. Trechos longos contendo mais de uma
sílaba e identificados com uma mesma envoltória são chamados de supersilabas e são
separados posteriormente. Os resultados identificam as amostras correspondentes ao início e o
fim de cada sílaba detectada. Foram realizados testes preliminares com meia centena de
palavras, com uma taxa de identificação de cerca de 70%, porém melhorias podem ser
incorporadas para tratar fonemas nos quais o envelope não é o principal parâmetro na
identificação. Este algoritmo também pode ser particularmente útil em sistemas com
comandos de voz ou como ferramenta de apoio no ensino da língua portuguesa ou para
pacientes em tratamento fonoaudiológico.

Caracterização de Voz

Processamento de Fala

Conversão Fala-para-texto

Identifer	oai:union.ndltd.org:IBICT/oai:repositorio.ufpe.br:123456789/11123
Date	28 May 2012
Creators	Silva, Elda Lizandra Fernandes da
Contributors	Oliveira, Hélio Magalhães de
Publisher	Universidade Federal de Pernambuco
Source Sets	IBICT Brazilian ETDs
Language	Breton
Detected Language	Portuguese
Type	info:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/masterThesis
Source	reponame:Repositório Institucional da UFPE, instname:Universidade Federal de Pernambuco, instacron:UFPE
Rights	Attribution-NonCommercial-NoDerivs 3.0 Brazil, http://creativecommons.org/licenses/by-nc-nd/3.0/br/, info:eu-repo/semantics/openAccess

Page generated in 0.0061 seconds

Estimativas de Comportamento Vocálico de Locutores e Um Novo Sistema de Separação Silábica

Description

Links & Downloads

Tags

Additional Fields