Made available in DSpace on 2015-03-05T13:53:43Z (GMT). No. of bitstreams: 0
Previous issue date: 27 / Nenhuma / Este trabalho apresenta estudos, com realização de experimentos e análise de
resultados, da aplicação de informações lingüísticas na etapa de pré-processamento no
processo de Mineração de Textos para as tarefas de Categorização e Agrupamento de
Documentos.
Usualmente, o pré-processamento utilizado no processo de Mineração de Textos
para estas tarefas consiste na remoção de termos irrelevantes (tais como, preposição,
artigos, pronomes, entre outros), normalização morfológica e seleção dos termos (ao
que denominamos baseado em métodos usuais). Propõe-se, ao longo deste trabalho, um
pré-processamento que faz o uso de informações lingüísticas, ou seja, um préprocessamento
baseado em combinações gramaticais, visando avaliar a repercussão do
uso dessas informações nos resultados de tarefas de Mineração de Textos.
Foram realizados diversos experimentos para a validação da abordagem
proposta junto à língua portuguesa. O corpus utilizado nos experimentos consiste de um
extrato do corpus NILC (Núcleo Inter
Identifer | oai:union.ndltd.org:IBICT/oai:www.repositorio.jesuita.org.br:UNISINOS/2195 |
Date | 27 February 2004 |
Creators | Silva, Cassiana Fagundes da |
Contributors | Vieira, Renata |
Publisher | Universidade do Vale do Rio do Sinos, Programa de Pós-Graduação em Computação Aplicada, UNISINOS, Brasil, Escola Politécnica |
Source Sets | IBICT Brazilian ETDs |
Language | Portuguese |
Detected Language | Portuguese |
Type | info:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/masterThesis |
Source | reponame:Repositório Institucional da UNISINOS, instname:Universidade do Vale do Rio dos Sinos, instacron:UNISINOS |
Rights | info:eu-repo/semantics/openAccess |
Page generated in 0.0021 seconds