Dissertação (mestrado) - Universidade Federal de Santa Catarina, Centro de Comunicação e Expressão. Programa de Pós-Graduação em Linguística. / Made available in DSpace on 2012-10-23T00:26:23Z (GMT). No. of bitstreams: 1
243738.pdf: 824497 bytes, checksum: 7fce452747e473e42a334207c5448b8c (MD5) / Esta pesquisa tem como objetivo investigar os possíveis sentidos do item lexical correto em um corpus de português escrito. Espera-se utilizar os resultados como subsídio para fundamentar lingüisticamente um sistema capacitado a realizar a desambiguação deste item lexical. A análise do contexto imediato das ocorrências do item lexical no corpus é vista como a fonte fundamental de informações lingüísticas tendo em vista a mencionada desambiguação. O material utilizado no presente trabalho foi coletado do corpus NILC (Núcleo Institucional de Lingüística Computacional), e a análise foi feita através do programa WordSmith (Scott, 1995), um software para a análise de corpora. O estudo deve ser visto como uma contribuição inicial para a definição de uma metodologia de análise de itens lexicais de polissemia complexa que venha a servir de base para investigações semelhantes, uma vez que os diferentes sentidos encontrados podem ser transformados em um conjunto de etiquetas para uso em um etiquetador
semântico dentro de um sistema que utiliza tecnologia de análise lingüística.
Identifer | oai:union.ndltd.org:IBICT/oai:repositorio.ufsc.br:123456789/89620 |
Date | January 2007 |
Creators | Azevedo, Flávia |
Contributors | Universidade Federal de Santa Catarina, Rocha, Marco Antônio Esteves da |
Publisher | Florianópolis, SC |
Source Sets | IBICT Brazilian ETDs |
Language | Portuguese |
Detected Language | Portuguese |
Type | info:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/masterThesis |
Source | reponame:Repositório Institucional da UFSC, instname:Universidade Federal de Santa Catarina, instacron:UFSC |
Rights | info:eu-repo/semantics/openAccess |
Page generated in 0.0023 seconds