A Recuperação de Informação por Similaridade (RIS) é um processo complexo que normalmente envolve bancos de dados volumosos e objetos em altas dimensões. Dois grupos do técnicas são amplamente utilizados para esse fim, Mapas Auto-Organizáveis (SOM Sdf-()rganizin(j Maps) e Métodos de Acesso (MA). Os dois grupos do técnicas apresentam limitações. A maioria dos SOM, especialmente os modelos derivados do mapa de Kohonen, utilizam quase que exclusivamente o processamento sequencial para encontrar a unidade vencedora. Por outro lado, tanto os Métodos de Acesso Espacial (MAE) quanto os Métodos de Acesso Métrico (MAM) não aproveitam o conhecimento gerado por consultas anteriores. (0111 o objetivo de resolver esses problemas, duas novas técnicas são propostas nesta tese. A primeira técnica está baseada em SOM e a segunda em MAE e MAM. Em primeiro lugar, para melhorar o desempenho de sistemas baseados em SOM, propoe-se a incorporação de MAE e MAM durante o treinamento, gerando-se as famílias denominadas SAM-SOM o MAM-SOM. Eni segundo lugar, os MAE e MAM foram aprimorados através da criação do módulo denominado PMAM, que é capaz de aproveitar o conhecimento gerado pelas consultas anteriores. A combinação do módulo PMAM com MAE e MAM deu origem às famílias MAE e MAM+. respectivamente. Como resultado deste trabalho ressalta-se que, tanto a família SAM-SOM quanto a MAM-SOM proporcionam uma melhora considerável em relação aos modelos de SOM tradicionais, os quais normalmente precisam de muito tempo de treinamento. Por outro lado. as famílias MAE+ e MAM+ têm a capacidade de reduzir, gradualmente. o número de operações necessárias para realizar uma consulta. Isto é possível porque o módulo PMAM permite reaproveitar o conhecimento gerado pelas consultas anteriores. / largo and complex Data Bases. Two groups of techniques are widely used for it, Self-Organizing Maps (SOM) and - Spatial Access Methods (SAM) and Metric Access Mothods (MAM). Howovor. l)oth groups of techniques present iniportant drawbacks. Most of SOM make intensivo use1 of sequential comparison to find winner units. On the other hand, Access Mothods do not take advantage of knowledge generated by previous queries. In order lo overeome t liese problenis. two novel techniques are proposed to improve the SIH process. The lirst technique is based 011 SOM and the second one 011 SAM and MAM. Firstly. SOM was used jointly with SAM and MAM in order to improve SOM based svstenis. produoing two now families of techniques narned SAMSOM and MAMSOM rospoet i volv. Seoondlv. SAM and MAM themselves were improved by the creation of PMAM, a phig-111 modulo whieh is iiseful to take advantage of knowledge acquired by previous queries 111 order lo speed up following queries. The coinbination of PMAM jointly with SAM and MAM produced MAE+ and MAM+ families of Access Methods. As the niaiii result. SAM-SOM and MAM-SOM families outperform considerably traditional SOM based systems which norrnally need a long time for training. Aditionally. MAE+ and MAM+ families are capable of reducing gradually the nuniber of operations needed to answer a query, as new queries are introduced. This is possible because PMAM allows thern to take advantage of knowledge generated by sucessivo queries.
Identifer | oai:union.ndltd.org:usp.br/oai:teses.usp.br:tde-20082015-105153 |
Date | 03 March 2004 |
Creators | Vargas, Ernesto Cuadros |
Contributors | Romero, Roseli Aparecida Francelin |
Publisher | Biblioteca Digitais de Teses e Dissertações da USP |
Source Sets | Universidade de São Paulo |
Language | Portuguese |
Detected Language | Portuguese |
Type | Tese de Doutorado |
Format | application/pdf |
Rights | Liberar o conteúdo para acesso público. |
Page generated in 0.0024 seconds