Made available in DSpace on 2015-04-14T14:49:58Z (GMT). No. of bitstreams: 1
445541.pdf: 1627180 bytes, checksum: 184a4b2054d700b987b074f0fcdf3122 (MD5)
Previous issue date: 2011-03-15 / The definitory context is part of a text or utterance that provides information about a concept based on its use. The extraction of definitions from texts is an important task in various applications. Several papers present this feature as an aid in the construction of ontologies, in the development of material for aid in translation, in question answering systems, in creation of glossaries, dictionaries, among others. Thus, this study proposes set of heuristics to make the automatic extraction of potentially definitory contexts contained in Portuguese texts. The results of these heuristics were evaluated by terminologists and obtained 35.1 % F-measure when applied in a General Geology corpus and 51.7 % F-measure when applied in a General Chemistry corpus, reducing in both more than 50%of the amount of contexts to be examined by a specialist compared with the contexts extraction through a concordancer / O contexto definit?rio ? a parte de um texto ou de um enunciado que fornece informa??o sobre um conceito, com base em seu uso. A extra??o de contextos definit?rios a partir de textos ? uma tarefa importante em v?rias aplica??es. Diversos trabalhos usam este recurso como aux?lio na constru??o de ontologias, no desenvolvimento de material de aux?lio ? tradu??o, na elabora??o de sistemas de perguntas e respostas, na cria??o de gloss?rios, dicion?rios, entre outros. Nesse sentido, este trabalho prop?e um conjunto de heur?sticas para fazer a extra??o autom?tica de contextos potencialmente definit?rios em textos de l?ngua portuguesa. Os resultados dessas heur?sticas foram avaliados por termin?logos. Os resultados mostram 35,1% de F-measure quando o conjunto de heuristicas foi aplicado a um corpus de Geologia Geral e 51,7% de F-measure quando aplicado a um corpus de Qu?mica Geral. Isso proporcionou uma redu??o, em ambos os corpus, de mais de 50% da quantidade de contextos para serem analisados pelo especialista, comparando-se com a extra??o de contextos em um concordanciador
Identifer | oai:union.ndltd.org:IBICT/oai:tede2.pucrs.br:tede/5206 |
Date | 15 March 2011 |
Creators | Wendt, Igor da Silveira |
Contributors | Vieira, Renata |
Publisher | Pontif?cia Universidade Cat?lica do Rio Grande do Sul, Programa de P?s-Gradua??o em Ci?ncia da Computa??o, PUCRS, BR, Faculdade de Inform?ca |
Source Sets | IBICT Brazilian ETDs |
Language | Portuguese |
Detected Language | English |
Type | info:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/masterThesis |
Format | application/pdf |
Source | reponame:Biblioteca Digital de Teses e Dissertações da PUC_RS, instname:Pontifícia Universidade Católica do Rio Grande do Sul, instacron:PUC_RS |
Rights | info:eu-repo/semantics/openAccess |
Relation | 1974996533081274470, 500, 600, 1946639708616176246 |
Page generated in 0.002 seconds