Spelling suggestions: "subject:"processamento dde palavras"" "subject:"processamento dee palavras""
1 |
Escansão automática de versos em portuguêsMittmann, Adiel January 2016 (has links)
Tese (doutorado) - Universidade Federal de Santa Catarina, Centro Tecnológico, Programa de Pós-Graduação em Ciência da Computação, Florianópolis, 2016. / Made available in DSpace on 2017-05-23T04:11:41Z (GMT). No. of bitstreams: 1
345441.pdf: 1702787 bytes, checksum: 51f063c1d010c581cc86f9b07d5993a4 (MD5)
Previous issue date: 2016 / Esta tese apresenta o Aoidos, um sistema capaz de escandir versos em português. Os versos passíveis de serem analisados pelo sistema são os métricos, aqueles para os quais o número de sílabas constitui uma característica fundamental. A partir de um poema, o sistema processa os versos palavra a palavra, encontrando sua sílaba tônica e realizando a divisão silábica. O sistema concatena então todas as palavras de um verso numa só unidade e obtém uma lista de possíveis pronúncias para o verso através da aplicação de diversas regras, realizando ou não fenômenos como sinéreses e sinalefas. As pronúncias encontradas para todos os versos de um poema são analisadas de forma conjunta para determinar a métrica do poema, ou seja, a quantidade de sílabas que cada um dos versos possui. Agrupando os versos de cada tamanho, o sistema encontra os padrões rítmicos e, dentre as pronúncias de cada verso, escolhe aquela que mais adere ao ritmo. Para validar o sistema, foram processados dez corpora compostos por autores diferentes e produzidos entre os séculos XVI e XX, somando mais de 100.000 versos. Através da conferência manual de 1.080 versos aleatoriamente selecionados (1% do total), averiguou-se que a taxa média de acerto do sistema foi de 99,0%, variando entre os corpora de 97,5 a 100,0%.<br> / Abstract : This thesis presents a system capable of scanning verses in Portuguese. The system aims to scan metrical verses, those for which the number of syllables is a fundamental feature. Given a poem, the system first processes individual words, finding the position of their stress and dividing them into syllables. Words are then concatenated and the system finds a list of possible pronunciations for each verse, using a set of rules in order to apply phenomena such as synaeresis or synaloepha. The set of pronunciations for all verses in the poem are analyzed together in order to determine the poem?s meter, that is, the number of syllables its verses should contain. By grouping together all verses of a given length, the system finds rhythmical patterns and chooses, for each verse, the pronunciation that most closely matches the pattern. In order to validate the system, it was applied to ten corpora, from different authors and whose production dates range from the 16th to the 20th century, for a total of more than 100,000 verses. By manually assessing the correctness of the scansion produced for 1.080 randomly selected verses (1% of the total), the accuracy rate was ascertained to be 99,0%, ranging from 97,5 to 100,0% among the different corpora.
|
2 |
Rebolar e requebrar, algo a mais do que dançar? : um estudo experimental sobre o acesso visual de verbos prefixados e pseudo-prefixados na lingua portuguesaRuiz, Luciana Garcia 23 February 2001 (has links)
Orientador: Edson Françoso / Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Estudos da Linguagem / Made available in DSpace on 2018-07-29T00:51:01Z (GMT). No. of bitstreams: 1
Ruiz_LucianaGarcia_M.pdf: 3329902 bytes, checksum: 8d356aaf3e6c91dd4989147ba49880c5 (MD5)
Previous issue date: 2001 / Resumo: O propósito desta dissertação é estudar, por via de um enfoque experimental, o acesso lexical de palavras morfologicamente complexas, apresentadas visualmente. A questão de interesse central relaciona-se a como as palavras morfologicamente complexas ¿ em especial, os verbos prefixados - estão representadas: as unidades de processamento correspondem à palavra integral, ou elas correspondem às unidades morfológicas constituintes (base e afixos)? Inicialmente procedeu-se a uma revisão bibliográfica, e em seguida uma série de experimentos foi planejada. Esse programa experimental foi parcialmente implementado, constituindo-se de dois experimentos (ao que se sabe, inéditos em Língua Portuguesa). No primeiro deles, replicou-se resultados tradicionais na literatura relativos à existência de efeito de priming semântico entre pares de palavras morfologicamente simples. Já no segundo experimento, trabalhamos o efeito de priming semântico com duas classes de verbos prefixados, os verbos prefixados transparentes e os pseudo-prefixados. No caso destas últimas, existe uma aparente prefixação formal, mas de fato esta palavra é uma outra unidade lexical semanticamente distante desta unidade analisada (por exemplo, requebrar nada tem a ver com quebrar). A comparação do comportamento dos sujeitos experimentais, numa tarefa de decisão lexical, frente a essas duas condições, permite estabelecer uma distinção no processamento de palavras que pode refletir diferenças de representação. Assim, conclui-se que as informações morfológicas têm um papel importante no acesso lexical / Abstract: The aim of this dissertation is to experimentally study the lexical access of morphologically complex words, presented visually. The main question relates to how morphologically complex words ¿ especially prefixed verbs - are represented: are processing units in correspondence to a whole-word representation, or are they in correspondence to morphological constituents (base and affixes)? Firstly, a literature review was conducted, and next a series of experiments was designed. Such an experimental program was partially implemented, and two experiments were run (to the best of our knowledge, none of them has ever been carried out in Portuguese). In the first, it was shown that semantic priming obtains between morphologically simple pairs; this is a common result in the psycholinguistic literature. In the second, semantic priming was employed to study the processing of two classes of morphologically complex verbs: those that are derivationally transparent, and those that are pseudo-prefixed. The latter are apparently the result of prefixation, but in fact form semantically different words (for instance, reserve cannot be put in correspondence with serve). The comparison of the subjects' responses on these two conditions, in a lexical decision task, allows one to determine processing differences related to differences in access representation. Thus, morphological information is shown to play a most important role in lexical access / Mestrado / Mestre em Linguística
|
3 |
Segmentação automatica e treinamento discriminativo aplicados a um sistema de reconhecimento de digitos conectadosFigueiredo, Fabricio Lira 17 December 1999 (has links)
Orientador: Fabio Violaro / Dissertação (mestrado) - Universidade Estadual de Campinas, Faculdade de Engenharia Eletrica e de Computação / Made available in DSpace on 2018-07-26T00:16:55Z (GMT). No. of bitstreams: 1
Figueiredo_FabricioLira_M.pdf: 8181706 bytes, checksum: 4b3db6624620a5cb43cd1b3304195637 (MD5)
Previous issue date: 1999 / Resumo: Os Modelos Ocultos de Markov constituem, atualmente, a principal abordagem para o problema de Reconhecimento de Fala, pois proporcionam bom desempenho e alto grau de flexibilidade. Infelizmente, este modelo acústico não é ideal e alguns problemas afetam sua robustez e desempenho em condições adversas. A inconsistência do modelamento temporal implícito nos HMM's é um exemplo de um sério problema sem soluções bem definidas. De fato, o Modelo de Duração de Estados com distribuição exponencial é incompatível com o comportamento estatístico das unidades lingüísticas reais. A hipótese de independência entre observações representa outra limitação dos HMM's, já que não se verifica nos experimentos práticos. De fato, existe forte dependência contextual no caso de quadros pertencentes a regiões de transição entre unidades acústicas de uma elocução. Alguns modelos e algoritmos têm sido propostos para tentar transpor estes obstáculos, tais como Modelos Segmentais e Duração Explícita de Estados. Nesta tese, uma estratégia alternativa é proposta para atenuar estes problemas, sem acréscimos significativos no custo computacional. A informação relativa às transições entre fones, ao longo de uma elocução, é obtida através de métodos de segmentação automática. Realiza-se uma ponderação no algoritmo de Viterbi, a fim de penalizar os modelos que gerarem segmentações inconsistentes. Bons resultados são obtidos, para várias condições relacionadas a uma aplicação de Dígitos Conectados. O objetivo atual é aplicar esta técnica para o caso de vocabulários extensos / Abstract: Hidden Markov Model is actually the main approach to Speech Recognition problem, because of the good performance and high degree of flexibility that can be achieved. Unfortunately, this acoustical modeling is not optimum and some problems still affect it's robustness and performance in a more realistic condition. The weakness of the temporal modeling embedded in HMM is an example of a serious problem without well defined solutions. In fact, the implicit state duration model with exponential distribution may not describe the real linguistic units distributions. The hypothesis of independence between observations is other difficult problem to solve and it is incompatible with practical experiments because there is strong correlation between frames in the same acoustic segment. Some models and algorithms have been proposed to overcome or, at lest, attenuate those problems, such as Stochastic Segment Models and Explicit State Duration. This thesis presents an alternative approach to alleviate these problems, with relatively low computational cost. The information on phoneme boundaries in time is obtained through an Automatic segmentation algorithm and it is used in a Weighted Viterbi Algorithm in order to penalize the, models that generates inconsistent segmentations. Good results were achieved for various conditions related to connected digits application. The actual objective is to expand it to continuous speech recognition / Mestrado / Mestre em Engenharia Elétrica
|
Page generated in 0.0841 seconds