A descoberta de conhecimento em bases de dados é uma área de pesquisa que tem crescido rapidamente, e cujo desenvolvimento tem. sido dirigido ao benefício das necessidades práticas. sociais e econômicas. entre outras. Entretanto. mesmo em bases de dados podem estar presentes campos importantes que não são considerados na análise, como aqueles preenchidos com informações textuais. Essas informações não estão presentes apenas em tabelas, mias também em diversos documentos que são disponibilizados e acessados através da Internet. Para tornar a descoberta de conhecimento em textos possível, tem-se associado estratégias de preparação/pré-proccssamento de textos e técnicas utilizadas no processo Data Mining. Essa associação vem sendo denominada de processo Text Mining. Tendo em vista a importância da preparação dos textos. neste trabalho foi projetado e construído um módulo de pré-processamento de textos, com a finalidade de tornar possível a realização do processo Text Mining considerando textos em português. Devido ao fato de que muitas estratégias e/ou ferramentas estarem disponíveis somente para o inglês, a possibilidade de realizar a descoberta de padrões em textos em português pode significar o alcance de novos horizontes era termos de oportunidades e informações desconhecidas. / The knowledge discovery in data bases is a research area that have been increasing quickly, and which development has been driven to the practical, social and economical needs. However. even data bases can have important fields that are not considered in the analysis. such as those which are fulfill with textual information. This information is not present only in tables. but also in several documents that are available through the Internet. To he possible the knowledge discovery in text. text preparation/preprocossing strategies are associated with technics used in the Data Mining process. This association have been called Text Mining. Considering the importance of texts preprocessing. in this work was planned and built a module of texts pre-processing with the objective to make possible the realization of the Text Mining process for Portuguese texts. Due to the fact that many strategies and tools are available only for English, the possibility of realize the pattern discovery in Portuguese texts come to be useful to reach new goals in terms of unknown opportunities and information.
Identifer | oai:union.ndltd.org:usp.br/oai:teses.usp.br:tde-19012018-144536 |
Date | 23 October 2001 |
Creators | Imamura, Cristiane Yae- Mi |
Contributors | Rezende, Solange Oliveira |
Publisher | Biblioteca Digitais de Teses e Dissertações da USP |
Source Sets | Universidade de São Paulo |
Language | Portuguese |
Detected Language | Portuguese |
Type | Dissertação de Mestrado |
Format | application/pdf |
Rights | Liberar o conteúdo para acesso público. |
Page generated in 0.0021 seconds