Global ETD Search

11	TM-tree : um método de acesso para consultas por similaridade Nadvorny, César Feijó January 2005 (has links) O armazenamento de grandes quantidades de informações em bases de dados cria a necessidade de se usar Métodos de Acesso a esses dados de uma forma mais eficiente do que uma busca linear. Dessa forma, diversos Métodos de Acesso vêm sendo propostos há décadas. Desde os mais simples Métodos de Acesso como árvores B até os mais sofisticados Métodos de Acesso Métrico tem-se o mesmo objetivo: a eficiência na consulta. Para cada tipo de dados, para cada tipo de consulta, existe uma diferente forma de acesso mais adequada. Se os dados puderem ser ordenados, pode-se usar uma àrvore B. Na busca por pequenas cadeias de caracteres, pode-se utilizar uma árvore de sufixos. Com a evoluçãocomputacional, não se quer armazenar apenas números ou pequenas seqüências de texto. Já existem diversas bases de dados muito mais complexas, como seqüências de sons, imagens ou até mesmo vídeos armazenados. A complexidade desse tipo de dados e do tipo de consulta feita em cima deles gerou a necessidade de novos Métodos de Acesso. Os chamados Métodos de Acesso Métrico são estruturas capazes de acessar dados bastante complexos, como arquivos multimídia, com uma boa eficiência. Esse tipo de estrutura vem sendo estudada há muitos anos, mas a primeira delas realmente eficaz foi a árvore M. Depois dela, vários outros Métodos de Acesso Métricos surgiram, como a árvore Slim, M2, M+, DF, DBM aprimorando sua estrutura básica Esse trabalho propõe a árvore TM, que inova a forma como os dados são indexados, aprimorando a árvore M. Essa nova estrutura, usa o espaço métrico para a busca dos dados, o que é feito por todos Métodos de Acesso Métricos. Mas sua inovação está na forma como os dados são indexados, usando-se um espaço novo também proposto nesse trabalho, o espaço distorcido. Experimentos mostram uma melhora significativa na eficiência da consulta tanto em quantidade de acesso a disco quando em custo de processamento. Armazenamento de dados Indexação Métricas : Similaridade
12	Desenvolvimento de operadores de agrupamento por similaridade em SGBD relacionais / Development of similarity group operators in Relational DBMS Laverde, Natan de Almeida 16 May 2018 (has links) O operador de agrupamento e as funções de agregação são as principais ferramentas utilizadas para sumarizar dados em um Sistema de Gerenciamento de Base de Dados Relacionais (SGBDR). O operador de agrupamento funciona criando partições nos dados utilizando comparações por identidade, e permite que sejam aplicadas funções de agregação que retornam um único valor representando o grupo como um todo. Entretanto, para dados métricos, agrupamento utilizando identidade tem pouca utilidade. Neste caso, adotar o conceito de similaridade é frequentemente uma abordagem mais promissora. A literatura apresenta alguns operadores que podem agrupar os dados utilizando similaridade. Todos eles utilizam um limiar de valor de distância para atribuir os elementos aos grupos. No entanto, estes operadores não obtêm resultados satisfatórios quando a distribuição dos dados apresenta variações significativas na densidade de objetos em diferentes regiões do espaço. Para alcançar melhores resultados nestas situações, propusemos um novo operador que atribui os grupos utilizando uma eleição envolvendo grupos já atribuídos. Também propusemos generalizações, para os operadores existentes e propostos, para trabalhar com uma quantidade de vizinhos mais próximos e aproximação dos vizinhos mais próximos ao invés de um limiar de distância. Para possibilitar a inclusão destes operadores em SGBDR, propusemos uma extensão à Structured Query Language (SQL) e novas funções de agregação. Implementamos estes operadores em nosso framework em C++ usando a biblioteca Arboretum. Para avaliar os métodos propostos, analisamos tanto qualidade dos resultados quanto tempo de execução, utilizando conjuntos de dados reais e sintéticos. Os operadores propostos alcançaram melhores resultados quanto à qualidade de resultados, e mantiveram os tempos de execução similares. Os operadores que utilizam aproximação aos vizinhos mais próximos produziram resultados de qualidade similar quando comparados aos operadores que utilizando os vizinhos mais próximos, podendo ser executados em menor tempo que estes. / The grouping operator and aggregation functions are the primary tools used to summarize data inside a Relational Database Management Systems (RDBMS). The grouping operator works creating partitions in data using identity comparisons, and allow applying aggregation functions that return a single value that represent the entire group. However, for metric data, grouping by identity is seldom useful. In this case, adopting the concept of the similarity is often a better approach. The literature presents few operators that can group data using similarity. All of them use a distance threshold value to assign the elements in groups. However, these operators do not achieve satisfactory results when the data distribution present a significant variation in the density of objects in different regions of the space. To achieve better results in these situations, we have proposed a novel operator that assign groups using an election involving already assigned groups. We also proposed generalizations to existing and proposed operators to work with an amount of nearest neighbors and approximate neighbors instead of a distance threshold. To support these operators in RDBMS, we propose an extension to Structured Query Language (SQL) and new aggregation functions. Our proposed algorithms can run the proposed and existing operators. We implemented these operators in our framework in C++ using Arboretum library. To evaluate the proposed methods, we assess both results quality and the execution time, using both real and synthetic datasets. The proposed operators achieved better results comparing the quality and maintained similar executing time. The operators that use the approximate nearest neighbors produced similar quality results comparing with the operators that use the exact neighbors and can execute faster than that. Agregação por similaridade Agrupamento por similaridade RDBMS SGBDR Similaridade Similarity Similarity aggregation Similarity group
13	Desenvolvimento de operadores de agrupamento por similaridade em SGBD relacionais / Development of similarity group operators in Relational DBMS Natan de Almeida Laverde 16 May 2018 (has links) O operador de agrupamento e as funções de agregação são as principais ferramentas utilizadas para sumarizar dados em um Sistema de Gerenciamento de Base de Dados Relacionais (SGBDR). O operador de agrupamento funciona criando partições nos dados utilizando comparações por identidade, e permite que sejam aplicadas funções de agregação que retornam um único valor representando o grupo como um todo. Entretanto, para dados métricos, agrupamento utilizando identidade tem pouca utilidade. Neste caso, adotar o conceito de similaridade é frequentemente uma abordagem mais promissora. A literatura apresenta alguns operadores que podem agrupar os dados utilizando similaridade. Todos eles utilizam um limiar de valor de distância para atribuir os elementos aos grupos. No entanto, estes operadores não obtêm resultados satisfatórios quando a distribuição dos dados apresenta variações significativas na densidade de objetos em diferentes regiões do espaço. Para alcançar melhores resultados nestas situações, propusemos um novo operador que atribui os grupos utilizando uma eleição envolvendo grupos já atribuídos. Também propusemos generalizações, para os operadores existentes e propostos, para trabalhar com uma quantidade de vizinhos mais próximos e aproximação dos vizinhos mais próximos ao invés de um limiar de distância. Para possibilitar a inclusão destes operadores em SGBDR, propusemos uma extensão à Structured Query Language (SQL) e novas funções de agregação. Implementamos estes operadores em nosso framework em C++ usando a biblioteca Arboretum. Para avaliar os métodos propostos, analisamos tanto qualidade dos resultados quanto tempo de execução, utilizando conjuntos de dados reais e sintéticos. Os operadores propostos alcançaram melhores resultados quanto à qualidade de resultados, e mantiveram os tempos de execução similares. Os operadores que utilizam aproximação aos vizinhos mais próximos produziram resultados de qualidade similar quando comparados aos operadores que utilizando os vizinhos mais próximos, podendo ser executados em menor tempo que estes. / The grouping operator and aggregation functions are the primary tools used to summarize data inside a Relational Database Management Systems (RDBMS). The grouping operator works creating partitions in data using identity comparisons, and allow applying aggregation functions that return a single value that represent the entire group. However, for metric data, grouping by identity is seldom useful. In this case, adopting the concept of the similarity is often a better approach. The literature presents few operators that can group data using similarity. All of them use a distance threshold value to assign the elements in groups. However, these operators do not achieve satisfactory results when the data distribution present a significant variation in the density of objects in different regions of the space. To achieve better results in these situations, we have proposed a novel operator that assign groups using an election involving already assigned groups. We also proposed generalizations to existing and proposed operators to work with an amount of nearest neighbors and approximate neighbors instead of a distance threshold. To support these operators in RDBMS, we propose an extension to Structured Query Language (SQL) and new aggregation functions. Our proposed algorithms can run the proposed and existing operators. We implemented these operators in our framework in C++ using Arboretum library. To evaluate the proposed methods, we assess both results quality and the execution time, using both real and synthetic datasets. The proposed operators achieved better results comparing the quality and maintained similar executing time. The operators that use the approximate nearest neighbors produced similar quality results comparing with the operators that use the exact neighbors and can execute faster than that. Agregação por similaridade Agrupamento por similaridade SGBDR Similaridade RDBMS Similarity Similarity aggregation Similarity group
14	Definition and computation of similarity operations between web-specific lexical items Sarmento, Luís António Diniz Fernandes de Morais January 2010 (has links) Tese de doutoramento. Engenharia Informática. Faculdade de Engenharia. Universidade do Porto. 2010 Relações de similaridade Estruturas lexicais Processamento de linguagem
15	Análise de similaridade entre escalares sobre uma Floresta Amazônica Zahn, Einara January 2016 (has links) Orientador : Prof. Nelson Luís da Costa Dias / Dissertação (mestrado) - Universidade Federal do Paraná, Setor de Tecnologia, Programa de Pós-Graduação em Engenharia Ambiental. Defesa: Curitiba, 15/03/2016 / Inclui referências : f. 84-90 / Resumo: Uma das ferramentas mais importantes da micrometeorologia é a Teoria de Similaridade de Monin-Obukhov (TSMO), cujas funções adimensionais descrevem a relação entre a concentração média dos escalares e os fluxos turbulentos na Camada Superficial da atmosfera. No entanto, a TSMO sofre muitas limitações dentro da Subcamada Rugosa, uma vez que suas funções universais não se aplicam nesta região, dificultando a tarefa de estimar fluxos turbulentos sobre florestas. Neste sentido, o presente estudo teve por objetivo realizar uma análise experimental em escalares (temperatura, dióxido de carbono e vapor d'água) medidos nos níveis de 39,4 e 81,6 m sobre uma floresta Amazônica (altura média de 40 m). Inicialmente o coeficiente de assimetria da velocidade vertical indicou que a Subcamada Rugosa exerce influência no escoamento sobre os dois níveis; na sequência, o desvio-padrão adimensional exibiu maior dispersão para os escalares do que para a velocidade vertical, que se adequou melhor à teoria. Menor grau de dispersão foi verificado para as funções de Monin-Obukhov classificadas de acordo com o ângulo solar zenital (Z), no qual verificou-se boa concordância com a TSMO em ângulos entre 0 e 20°. Conjectura-se que isso esteja relacionado à incidência solar e a "ativação/desativação" conjunta das fontes e sumidouros. Por fim, o Método Relaxado de Acumulação de Vórtices foi empregado, e os coeficientes de relaxamento para os três escalares mantiveram-se dentro da faixa indicada na literatura (0,51 - 0,62); além disso, mostraram-se maiores em 81,6 m do que em 39,4 m. Quando separados por ângulo zenital, novamente os resultados foram melhores na faixa 0_ < \|Z\| < 20_. De forma geral, a validade do desvio-padrão adimensional em ângulos zenitais pequenos foi o resultado mais proeminente desta análise, pois indica a possibilidade de calcular fluxos turbulentos via funções de Monin-Obukhov sobre florestas pelo menos nestes momentos do dia. Palavras-chave: Teoria de Similaridade de Monin-Obukhov, Subcamada Rugosa, Método Relaxado de Acumulação de Vórtices. / Abstract: One of the most important tools in micrometeorology is the Monin-Obukhov Similarity Theory (MOST), whose dimensionless functions describe the relationship between scalars' mean concentration and flux in the atmospheric surface layer. However, these functions are not valid in the canopy roughness sublayer region, making it difficult to estimate scalar fluxes above forests from concentration measurements. In this regard, the main goal of this study is to perform a similarity analysis of scalars (temperature, carbon dioxide and water vapor) measured at 39.4 and 81.6 m above the Amazon forest, in a region with mean canopy height of 40 m. The results of the vertical velocity skewness suggested that both heights are within the roughness sublayer. The nondimensional standard deviation showed more scattering for scalars than for vertical velocity, which follows the theory. Less scatter was found for the Monin-Obukhov functions classified by solar zenith angle (Z), where good accordance between MOST and Z was verified for angles between 0 and 20°. We conjecture that this is related to the low solar incidence and the combined "activation/deactivation" of sources and sinks . Finally, for the Relaxed Eddy Accumulation, the relaxation coefficients were found to be within the range indicated in the literature (0.51 - 0.62), and to be larger for 81.6 m than for 39.4 m. When classified by zenith angle, better results were found in the range 0_ < \|Z\| < 20_. In general, the nondimensional standard deviation validity for low zenith angles was the most prominent result in this research, because it allows us to calculate turbulent fluxes above forests using the universal functions at least in these moments of the day. Keywords: Monin-Obukhov Similarity Theory, Roughness Sublayer, Relaxed Eddy Accumulation. Troposfera Camada limite (Meteorologia) Similaridade (Física) Teses
16	Seleção de casos de teste baseada em similaridade de texto e cobertura de requisitos José de Santana, Ricson 31 January 2011 (has links) Made available in DSpace on 2014-06-12T15:58:14Z (GMT). No. of bitstreams: 2 arquivo3311_1.pdf: 1651244 bytes, checksum: d951f55ecc712adcb976dac6cac05133 (MD5) license.txt: 1748 bytes, checksum: 8a4605be74aa9ea9d79846c1fba20a33 (MD5) Previous issue date: 2011 / Com o objetivo de desenvolver software de qualidade, as empresas cada vez mais investem nas atividades de Testes de Software. No entanto, essa é uma atividade de custos elevados e que consome muito tempo. Assim, empresas de software e institutos de pesquisa têm investido na criação de ferramentas de geração automática de Casos de Testes a partir de especificações do software. Essas ferramentas têm por objetivo gerar suítes de teste que exercitem o código completo, a partir de combinações de passos de execução e resultados esperados. Contudo, essas ferramentas geralmente geram uma quantidade excessiva de Casos de Teste (CTs). Quando não há tempo ou recursos disponíveis para executar a suíte completa, os responsáveis pelos testes são obrigados a selecionar um subconjunto da suíte original, que possa ser executado no tempo disponível, porém garantindo a cobertura dos requisitos associados à suíte original. Este trabalho propõe uma estratégia de Seleção Automática de Casos de Testes que utiliza a similaridade de texto dos CTs como critério de seleção, preservando a cobertura de requisitos da suíte original. Foi implementado um protótipo que implementa essa estratégia, o Sim_TC. Esse sistema elimina os CTs que atingirem um limiar de similaridade textual determinado pelo analista responsável por testar o software, garantido sempre que os CTs eliminados tenham seus requisitos associados cobertos pelos Casos de Testes restantes. Experimentos realizados aplicaram o Sim_TC a duas suítes diferentes de casos de teste, a fim de comparar o desempenho da seleção manual versus automática. Nesses experimentos, o desempenho do protótipo foi bastante satisfatório, garantindo a cobertura de requisitos da suíte original. Esse protótipo deverá ser integrado à ferramenta TaRGeT, para geração automática de suítes de casos de teste a partir especificações de casos de uso Similaridade de texto
17	Distribuição e diversidade de leguminosae em áreas de Caatinga no Município de Mirandiba PE Córdula, Elisabeth 31 January 2008 (has links) Made available in DSpace on 2014-06-12T15:04:24Z (GMT). No. of bitstreams: 2 arquivo4331_1.pdf: 2513431 bytes, checksum: 38382b40f532440ccc321145ef0695b1 (MD5) license.txt: 1748 bytes, checksum: 8a4605be74aa9ea9d79846c1fba20a33 (MD5) Previous issue date: 2008 / Coordenação de Aperfeiçoamento de Pessoal de Nível Superior / A Família Leguminosae é a mais representativa da Caatinga, compreendendo cerca de um terço da riqueza de espécies catalogadas. Devido à importância das Leguminosae no bioma, foi realizado um inventário florístico no Município de Mirandiba-PE. A partir desta lista de espécies realizou-se o tratamento taxonômico e uma análise de similaridade desta flora com a de outras áreas do Nordeste brasileiro. Além disto, procurou-se estabelecer padrões morfológicos de tipos de frutos, sementes e embriões, com especial enfoque na plúmula, visando possibilitar a identificação de algumas das espécies endêmicas da caatinga. Foram realizadas excursões no período de março de 2006 a julho de 2007 para coleta de material botânico. As relações florísticas foram avaliadas pela análise de UPGMA e PCO a partir dos índices de similaridade de Sørensen. Foram registradas 75 espécies distribuídas em 39 gêneros representando cerca de 25 % das leguminosas já citadas para a caatinga. A análise de similaridade mostrou a formação de dois grupos distintos: O grupo [A] com similaridade de 20% foi estabelecido para as caatingas sobre solos arenosos. O grupo [B] com similaridade de 27% incluiu as caatingas sobre solos derivados do embasamento cristalino Pré-cambriano. Além destes, Cariri (PB) e Caruaru (PE) se mostraram isolados do restante das áreas com uma similaridade de 45%. Dentre as espécies registradas na área, 17 são endêmicas da caatinga, representando 25% do total. Catalogaram-se seis tipos de fruto, onde o tipo padrão foi o legume, freqüente em cerca de 60% das espécies. As sementes sem pleurograma predominaram em cerca de 75% das espécies endêmicas. O padrão de plúmula diferenciada em eófilos segmentados foi o mais comum. A síndrome de dispersão mais representada foi autocórica em mais de 50% das espécies. Os principais diásporos são as sementes Flora Similaridade Morfologia Frutos Sementes Embriões Dispersão.
18	Estudo de tochas de plasma através da teoria da similaridade Paredez Angeles, Pablo Jenner 30 April 2003 (has links) Orientador: Aruy Marotta / Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Fisica Gleb Wataghin / Made available in DSpace on 2018-08-03T08:04:27Z (GMT). No. of bitstreams: 1 ParedezAngeles_PabloJenner_M.pdf: 1168016 bytes, checksum: ad72f704ac1f0ed45d1f57e1e5147fd8 (MD5) Previous issue date: 2003 / Resumo: Nesta tese foram obtidas equações generalizadas para a característica tensão-corrente de umatocha de plasma de arco não transferido e de uma tocha de plasma de arco transferido, utilizando o método da Teoria da Similaridade. Para a tocha de arco não transferido, os dados experimentais foram obtidos para ar como gás plasmagênico e na faixa de correntes de 10 a 295 A. Para a tocha de arco transferido, os dados foram obtidos para argônio e faixa de correntes de 300 a 1500 A. A tocha de arco não transferido apresentou característica estática tensão-corrente descendente, enquanto a de arco transferido, a característica obtida foi dinâmica, com comportamento fortemente anômalo, com a presença de histerese, além de possuir ambos os ramos, o descendente e o ascendente. Os testes da tocha de arco transferido foram feitos num forno com paredes refratárias em atmosfera de argônio. Foram obtidas equações generalizadas tendo um, dois e três parâmetros adimensionais independentes, sendo a escolha da melhor equação generalizada baseada no coeficiente de correlação da regressão multilinear. O parâmetro adimensional da voltagem foi considerado como o parâmetro dependente. Em geral, para os parâmetros adimensionais independentes foram utilizados aqueles relacionados com as diversas modalidades de transferência da energia Joule do arco para outras modalidades de energia. Estas foram a convectiva, a radiativa, a turbulenta e a condutiva. As equações generalizadas obtidas para a tocha de arco não transferido apresentaram boa concordância para toda a faixa de dados experimentais. Já as equações para a tocha de arco transferido, devido à grande anomalia observada, foram limitadas à apenas a parte ascendente dos dados experimentais. O estudo experimental, realizado nesta tese pode contribuir para uma melhor compreensão dos fenômenos que ocorrem em tochas de plasma, como também, fornecer uma guia para a engenharia de projeto das tochas / Abstract: In this thesis, generalized equations for the voltage-current characteristics have been obtained for a non transferred arc plasma torch and for a transferred arc plasma torch, using the method of the Theory of the Similarity. For the non transferred arc plasma torch, the experimental data was obtained for air as the plasmagenic gas and for currents of 10 to 295 A. For the transferred arc torch, the experiments were carried out for argon and currents of 300 to 1500 A. The non transferred plasma torch showed a descending voltage-current static characteristic, while the transferred plasma torch, the characteristic was dynamic, with strong anomalous behavior, consisting of the presence of hysteresis, besides possessing both the branches, the descendant and the ascendant. The tests of the transferred torch were carried out in an oven with refractory walls in argon atmosphere. Generalized equations had been obtained having one, two and three independent nondimensional parameters, being the choice of the best generalized equation based in the coefficient of correlation of the multilinear regression. The dimensionless parameter of the voltage was considered as the dependent parameter. In general, for the independent nondimensional parameters have been used those related with the diverse modalities of transference of the Joule energy of the arc to other modalities of energy. These had been the convective one, the radiative, the turbulent and the conductive one. The generalized equations obtained for the non transferred torch showed good agreement for all the range of experimental data. However, the equations for the transferred arc torch, due to their great observed anomaly, had been limited only to the ascending part of the experimental data. The experimental study, carried out in this thesis, might contribute to a better understanding of the phenomena taking place in plasma torches, as well, to provide a guide for their engineering / Mestrado / Física / Mestre em Física Plasma (Gases ionizados) Jato de plasma Similaridade (Física)
19	Determinação dos parâmetros de uma seção de testes para o pressurizador do reator nuclear IRIS Silva, Mário Augusto Bezerra Da 31 January 2008 (has links) Made available in DSpace on 2014-06-12T23:14:55Z (GMT). No. of bitstreams: 2 arquivo8991_1.pdf: 1414598 bytes, checksum: a0048f7d94fd8003f93cace8834b5252 (MD5) license.txt: 1748 bytes, checksum: 8a4605be74aa9ea9d79846c1fba20a33 (MD5) Previous issue date: 2008 / Universidade Federal de Pernambuco / Um reator nuclear integral, modular e de média potência, conhecido como IRIS, encontra-se em fase de desenvolvimento pela Companhia Westinghouse e por centros de indústria e de pesquisa. Uma das principais características do reator IRIS é que a maior parte de seus componentes encontra-se no interior do vaso de pressão, minimizando a probabilidade de acidentes. Devido a essa configuração integral, não há um sistema de aspersão para homogeneização de boro, o que pode causar transitórios de potência. A homogeneização de boro deve, pois, ser investigada. O presente trabalho tem como objetivo estabelecer as condições sob as quais uma seção de testes deve ser construída para análise da dispersão do boro no pressurizador do reator IRIS. Através de uma nova metodologia de similaridade conhecida como Análise de Escala Fracional, os principais parâmetros de uma seção de testes são obtidos. Combinando-se a Análise de Escala Fracional com uma escala local do número de Froude densimétrico e um fator de escala volumétrica previamente estabelecido, obtêm-se as medidas dos orifícios de recirculação, da temperatura da água de entrada na seção de testes, do fator de escala temporal e da vazão de recirculação na seção de testes (modelo) para que esta represente, de maneira fiel, a distribuição de boro no pressurizador do reator IRIS (protótipo). Como comprovação da validade da metodologia empregada, soluções analíticas são utilizadas com base nos valores obtidos pela Análise de Escala Fracional e, quando os resultados simulados no modelo são comparados aos do protótipo, a concordância entre tais sistemas é absoluta. A potência térmica total também influencia na distribuição de boro no interior da seção, sendo tal potência determinada pelas leis de condensação no interior da região de vapor e de correlações para convecção livre, considerando-se, ainda, as frações necessárias para elevação da entalpia da água de recirculação e da formação de vapor Concentração de boro Similaridade Análise de Escala Fracional
20	Operadores binários para consulta de similaridade em banco de dados multimídia / Binary operators in multimidia data base Seraphim, Enzo 18 January 2006 (has links) Os atuais gerenciadores de banco de dados não são adequados para manipulação de dados complexos; e entre eles destacamos os dados multimídia que, para agilizar as consultas usam a operação de igualdade sobre as estruturas de indexação.Operações de igualdade são pouco utilizadas em operações que envolvem dados complexos, uma vez que, a existência de dois elementos extremamente iguais é rara. Uma classe de operadores que se adequa melhor para manipulação desses dados são os operadores por similaridade. Exemplo de operadores de seleção por similaridade são a consulta por abrangência (range queries) e consulta aos vizinhos mais próximos. Exemplificando, o operador de seleção aos vizinhos mais próximos responde a consultas como, ?selecione as cinco proteínas mais parecidas pelo alinhamento da proteína Sparc (responsável pelo câncer de pele)?. Existem muitos trabalhos desenvolvidos no sentido de prover operadores de seleção por similaridade envolvendo estruturas baseadas em árvores. Entretanto, poucos estudos têm sido realizados envolvendo a utilização de operadores diferentes da seleção, por exemplo, a junção. Um operador de junção compara pares de objetos de elementos pertencentes ao domínio dos dados, ao passo que um operador de seleção recebe uma constante para a comparação dos elementos. Podemos ter assim, três operadores de junção por similaridade: operadores de junção por abrangência, por vizinhos mais próximos e sobre os pares de vizinhos mais próximos. Exemplificando, uma consulta utilizando junção por abrangência responde a consultas do tipo: ?Selecione as proteínas contidas no vírus da Hepatite B que diferem em até duas unidades de alinhamento das contidas no vírus da Hepatite C?. Este trabalho apresenta um novo método de acesso métrico em extrema quantidade de dados bem como, formas de implementação das formas de junção em estruturas métricas / The present databases managers are not adequated for complex data manipulation and among them we point out the multimedia data that to speed up the query use the equality operation on the index structure. Equality operations are not much used in operations that involve complex data sence the presence of two elements extremely equal is rare. An operator class that better manipulates these data are the similarity operators. Selection operators by similarity are the range query and the nearest neighbors query. For example, the selection operator to the nearest neighbors answers the queries like: ?select five proteins more similar by the alignment of the Sparc protein (responsible for the skin cancer)?. There are many works developed to provide similarity by selection operators envvolving structures based in trees. However, few studies have been done involving the use of different operators selection, for example, the join. A join operator compares pairs of objects of the elements belonging to the domain of the data, whereas a selection operator receives a constant to make the comparison of the elements. We can have three similarity join operators: the range join operators, the nearest neighbor and the closest neighbors pair. For instance, a query using the range join answers these kind of queries: ?Select the proteins restrained in the Hepatitis B virus that differ up to two unities from the alignment of the protein found in the Heapatitis C virus?. This work presents a new metric access method with an extreme amount of data as well as implementations forms of the join in metric structures Estruturas métricas Indexação por similaridade Junção por similaridade Metric structures Similarity infex Similarity join

Search results