Desenvolvimento de aplicativos usando reconhecimento e síntese de voz

Submitted by Edisangela Bastos (edisangela@ufpa.br) on 2013-01-08T18:29:15Z
No. of bitstreams: 2
license_rdf: 23898 bytes, checksum: e363e809996cf46ada20da1accfcd9c7 (MD5)
Dissertacao_DesenvolvimentoAplicativosReconhecimento.pdf: 383779 bytes, checksum: 1bbfef9c6a7a070ce4816598bc9f3462 (MD5) / Approved for entry into archive by Ana Rosa Silva(arosa@ufpa.br) on 2013-01-17T14:10:48Z (GMT) No. of bitstreams: 2
license_rdf: 23898 bytes, checksum: e363e809996cf46ada20da1accfcd9c7 (MD5)
Dissertacao_DesenvolvimentoAplicativosReconhecimento.pdf: 383779 bytes, checksum: 1bbfef9c6a7a070ce4816598bc9f3462 (MD5) / Made available in DSpace on 2013-01-17T14:10:49Z (GMT). No. of bitstreams: 2
license_rdf: 23898 bytes, checksum: e363e809996cf46ada20da1accfcd9c7 (MD5)
Dissertacao_DesenvolvimentoAplicativosReconhecimento.pdf: 383779 bytes, checksum: 1bbfef9c6a7a070ce4816598bc9f3462 (MD5)
Previous issue date: 2006 / A fala é um mecanismo natural para a interação homem-máquina. A tecnologia de processamento de fala (ou voz) encontra-se bastante avançada e, em escala mundial, existe vasta disponibilidade de software, tanto comercial quanto acadêmico. a maioria assume a disponibilidade de um reconhecedor e/ou sintetizador, que pode ser programado via API. Ao contrário do que ocorre, por exemplo, na língua inglesa, inexiste atualmente uma gama variada de recursos para o português brasileiro. O presente trabalho discute alguns esforços realizados nesse sentido, avaliando a utilização da SAPI E JSAPI, que são as APIs da Microsoft e Sun, respectivamente. Serão apresentados, outrossim, exemplos de aplicativos: uma aplicação CALL (baseada em SAPI) usando síntese em inglês e português, reconhecimento em inglês e agentes visuais; e uma proposta para agregar reconhecimento e síntese de voz ao chat IRC através de APIs Java. / Speech is a natural mechanism for human-machine interaction. Speech (or voice) technology is a well-developed field when one considers the international community. There is a wide variety of academic and industrial software. The majority of them assumes a recognizer or synthesizer is available, and can be programmed through an
API. In contrast, there are no such resources in public domain for Brazilian Portuguese.
This work discusses some of these issues and compares SAPI and JSAPI, which are
APIs promoted by Microsoft and Sun, respectively. We also present two examples:
a CALL application using SAPI-based speech synthesis in English and Portuguese,
recognition in English, and visual agents; and a JSAPI-based software that incorporates
speech synthesis and recognition to IRC through Java APIs.

Identiferoai:union.ndltd.org:IBICT/oai:repositorio.ufpa.br:2011/3341
Date30 August 2006
CreatorsSAMPAIO NETO, Nelson Cruz
ContributorsKLAUTAU JÚNIOR, Aldebaro Barreto da Rocha
PublisherUniversidade Federal do Pará, Programa de Pós-Graduação em Engenharia Elétrica, UFPA, Brasil, Instituto de Tecnologia
Source SetsIBICT Brazilian ETDs
LanguagePortuguese
Detected LanguagePortuguese
Typeinfo:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/masterThesis
Sourcereponame:Repositório Institucional da UFPA, instname:Universidade Federal do Pará, instacron:UFPA
Rightsinfo:eu-repo/semantics/openAccess

Page generated in 0.0023 seconds