CoordenaÃÃo de AperfeÃoamento de Pessoal de NÃvel Superior / O Potigrafone e um transdutor de estados finitos que faz a transcriÃÃo automÃtica das formas grÃficas da lÃngua portuguesa para as formas fonÃticas da variedade linguÃstica potiguar. Com o desenvolvimento desse sistema, conseguimos identificar e separar os padrÃes fonÃticos da variedade linguÃstica potiguar, atravÃs do Atlas linguÃstico do Centro-Oeste potiguar e no Atlas GeolinguÃstico do Litoral Potiguar; apresentar uma ferramenta de transcriÃÃo fonÃtica utilizando o alfabeto fonÃtico Speech Assessment Methods Phonetic Alphabet (SAMPA) e, alem disso, conseguimos avaliar o desempenho do sistema em corpus de textos escritos de lÃngua portuguesa por meio de duas medidas multinÃveis: Exact Match Ratio e Labelling Fscore. Para isso, foram atendidos passos fundamentais: primeiro, foram necessÃrias a identificaÃÃo e a separaÃÃo dos padrÃes fonolÃgicos presentes nas cartas fonÃticas dos Atlas supracitados; segundo, a definiÃÃo de alguns critÃrios pertinentes as entradas (inputs) do sistema; terceiro, a implementaÃÃo das regras que relacionam a forma subjacente com a forma superficial e; por Ãltimo, a escolha das duas medidas adequadas a avaliaÃÃo de um sistema que apresentava mais de uma forma de transcriÃÃo. Os resultados mostram que o desempenho do Potigrafone foi de 81% para a medida Exact Match Ratio e 89% para a medida Labelling FScore, apresentando, assim, boa performance na exatidÃo e nos acertos totais e parciais, no que se refere a transcriÃÃo sem a marcaÃÃo da silaba tÃnica e sem os fenÃmenos fonÃticos da nasalidade, da palatalizaÃÃo, da ditongaÃÃo, da monotongaÃÃo, do apagamento, da epÃntese; outro resultado importante e que os mÃdulos de consoantes e de nÃcleo silÃbico tambÃm interferem no desempenho, uma vez que os valores com todos os mÃdulos e sem esses dois mÃdulos se assemelham. O Potigrafone apresenta bom desempenho na transcriÃÃo fonÃtica, mas existem alguns erros pontuais que torna necessÃrio a constituiÃÃo de novas regras para corrigi-los e, consequentemente, melhorar o desempenho do sistema, tanto na exatidÃo quanto na correspondÃncia total e parcial da transcriÃÃo. / The Potigrafone is a finite-state transducer that automatically transcripts the graphic forms from the Portuguese language to the phonetic forms belonging to theâpotiguarâ linguistic variety. It was through the development of this system, by using of the Atlas LinguÃstico do Centro-Oeste Potiguar and to the Atlas GeolinguÃstico do Litoral Potiguar, that it has been possible to identify and separate the phonetic patterns in the linguistic variety belonging to the studied region, presenting a phonetic transcription tool while using the Speech Assessment Methods Phonetic Alphabet - SAMPA; and, in addition, a performance assessment in the corpus of written texts in Portuguese has been made through the use of two multi-level measures: Exact Match Ratio and Labelling Fscore. To do so, the identification and separation of phonological patterns present in the phonetic letters of Atlas, the definition of some relevant criteria to inputs in the system, the implementation of rules relating to underlying form with the surface form and, also, two system evaluation measures have been needed. The results have showed that the Potigrafone performance was 81% for the Exact Match Ratio measurement and 89% for the Labelling FScore, presenting thus, increased accuracy in total or partial correct attempts, when the transcript is made without stress markup and without the phonetic phenomena of nasality, the palatalization, the diphthongization, the monophthongization, the deletion, the epenthesis; another important result is that the consonant modules and the syllabic core also interfere with this performance, since the values with all modules and without these two modules are similar. The Potigrafone performs well during the phonetic transcription, but there are some occasional errors that have made necessary the creation of new rules to correct them and, consequently, help to improve the system performance, both in accuracy and in full and partial transcription match.
Identifer | oai:union.ndltd.org:IBICT/oai:www.teses.ufc.br:11192 |
Date | 06 May 2016 |
Creators | Cid Ivan da Costa Carvalho |
Contributors | Leonel Figueiredo de Alencar Araripe, Maria Elias Soares, Rosemeire Selma Monteiro, ElisÃngela Nogueira Teixeira, VlÃdia CÃlia Monteiro Pinheiro |
Publisher | Universidade Federal do CearÃ, Programa de PÃs-GraduaÃÃo em LingÃÃstica, UFC, BR |
Source Sets | IBICT Brazilian ETDs |
Language | Portuguese |
Detected Language | English |
Type | info:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/doctoralThesis |
Format | application/pdf |
Source | reponame:Biblioteca Digital de Teses e Dissertações da UFC, instname:Universidade Federal do Ceará, instacron:UFC |
Rights | info:eu-repo/semantics/openAccess |
Page generated in 0.0019 seconds