Return to search

Escansão automática de versos em português

Tese (doutorado) - Universidade Federal de Santa Catarina, Centro Tecnológico, Programa de Pós-Graduação em Ciência da Computação, Florianópolis, 2016. / Made available in DSpace on 2017-05-23T04:11:41Z (GMT). No. of bitstreams: 1
345441.pdf: 1702787 bytes, checksum: 51f063c1d010c581cc86f9b07d5993a4 (MD5)
Previous issue date: 2016 / Esta tese apresenta o Aoidos, um sistema capaz de escandir versos em português. Os versos passíveis de serem analisados pelo sistema são os métricos, aqueles para os quais o número de sílabas constitui uma característica fundamental. A partir de um poema, o sistema processa os versos palavra a palavra, encontrando sua sílaba tônica e realizando a divisão silábica. O sistema concatena então todas as palavras de um verso numa só unidade e obtém uma lista de possíveis pronúncias para o verso através da aplicação de diversas regras, realizando ou não fenômenos como sinéreses e sinalefas. As pronúncias encontradas para todos os versos de um poema são analisadas de forma conjunta para determinar a métrica do poema, ou seja, a quantidade de sílabas que cada um dos versos possui. Agrupando os versos de cada tamanho, o sistema encontra os padrões rítmicos e, dentre as pronúncias de cada verso, escolhe aquela que mais adere ao ritmo. Para validar o sistema, foram processados dez corpora compostos por autores diferentes e produzidos entre os séculos XVI e XX, somando mais de 100.000 versos. Através da conferência manual de 1.080 versos aleatoriamente selecionados (1% do total), averiguou-se que a taxa média de acerto do sistema foi de 99,0%, variando entre os corpora de 97,5 a 100,0%.<br> / Abstract : This thesis presents a system capable of scanning verses in Portuguese. The system aims to scan metrical verses, those for which the number of syllables is a fundamental feature. Given a poem, the system first processes individual words, finding the position of their stress and dividing them into syllables. Words are then concatenated and the system finds a list of possible pronunciations for each verse, using a set of rules in order to apply phenomena such as synaeresis or synaloepha. The set of pronunciations for all verses in the poem are analyzed together in order to determine the poem?s meter, that is, the number of syllables its verses should contain. By grouping together all verses of a given length, the system finds rhythmical patterns and chooses, for each verse, the pronunciation that most closely matches the pattern. In order to validate the system, it was applied to ten corpora, from different authors and whose production dates range from the 16th to the 20th century, for a total of more than 100,000 verses. By manually assessing the correctness of the scansion produced for 1.080 randomly selected verses (1% of the total), the accuracy rate was ascertained to be 99,0%, ranging from 97,5 to 100,0% among the different corpora.

Identiferoai:union.ndltd.org:IBICT/oai:repositorio.ufsc.br:123456789/175819
Date January 2016
CreatorsMittmann, Adiel
ContributorsUniversidade Federal de Santa Catarina, Wangenheim, Aldo v.
Source SetsIBICT Brazilian ETDs
LanguagePortuguese
Detected LanguagePortuguese
Typeinfo:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/doctoralThesis
Format300 p.| il., grafs., tabs.
Sourcereponame:Repositório Institucional da UFSC, instname:Universidade Federal de Santa Catarina, instacron:UFSC
Rightsinfo:eu-repo/semantics/openAccess

Page generated in 0.002 seconds