[pt] A busca orientada a idéia é um novo paradigma para
mecanismos de busca em
acervos compostos por arquivos de texto. Esse paradigma
visa resolver um problema
comum aos mecanismos de busca: exigir que o usuário
preveja as palavras contidas
nos documentos que possam conter a informação que procura,
impossibilitando-o,
assim, de se concentrar diretamente na informação
desejada. Buscando solucionar
esse problema, são propostas as bases lingüísticas para o
desenvolvimento de um
modelo teórico preliminar que acrescente dados semânticos
aos arquivos de texto.
Nesse modelo, a informação semântica de um texto é
representada através do que se
chamou de estrutura de conceitos. O principal intuito das
estruturas de conceitos é
representar de uma mesma maneira frases que expressem o
mesmo significado, ou
seja, as paráfrases apresentam a mesma estrutura de
conceitos. Serão expostos nesta
dissertação os primeiros elementos do modelo em suas
partes semântica, sintática e
textual, além da integração entre as mesmas. A dissertação
apresenta ainda um estudo
de caso a fim de exemplificar o desenvolvimento de uma
aplicação para busca de
arquivos de texto em que essa tecnologia seria usada. / [en] The idea-oriented search is a new pattern for search
engines whose databases
are composed by text files. This pattern sets out to solve
a usual problem for search
engines: demanding that users foresee which words are
contained in the desired
document, keeping them from focusing on the information
they are indeed seeking.
To solve this problem, the linguistic bases for the
development of a theoretical model
that can add semantical data to the text files are laid
down. In this model, the
semantical information of a text is represented by what
has been referred to as
structure of concepts. The main goal of the structure of
concepts is to give one single
representation to sentences that express the same meaning.
Thus, paraphrases present
the same structure of concepts. In this dissertation, the
first elements of this model are
exposed in its semantical, syntactic and textual parts.
Also present are the integration
of these elements. A small case study is presented as
well, with the intention of
illustrating the development of an application for text
files databases search engines
in which this technology is used.
Identifer | oai:union.ndltd.org:puc-rio.br/oai:MAXWELL.puc-rio.br:9070 |
Date | 27 September 2006 |
Creators | CAROLINA MONTE FERREIRA GONCALVES |
Contributors | VIOLETA DE SAN TIAGO DANTAS BARBOSA QUENTAL |
Publisher | MAXWELL |
Source Sets | PUC Rio |
Language | Portuguese |
Detected Language | English |
Type | TEXTO |
Page generated in 0.0017 seconds