1 |
Hamming DHTe HCube : arquiteturas distribuídas para busca por similaridade / Hamming DHTand HCube : distributed architectures for similarity searchVillaça, Rodolfo da Silva, 1974- 23 August 2018 (has links)
Orientador: Maurício Ferreira Magalhães / Tese (doutorado) - Universidade Estadual de Campinas, Faculdade de Engenharia Elétrica e de Computação / Made available in DSpace on 2018-08-23T11:36:13Z (GMT). No. of bitstreams: 1
Villaca_RodolfodaSilva_D.pdf: 2446951 bytes, checksum: c6d907cab0de18a43fe707cae0e827a4 (MD5)
Previous issue date: 2013 / Resumo: Atualmente, a quantidade de dados disponíveis na Internet supera a casa dos Zettabytes (ZB), definindo um cenário conhecido na literatura como Big Data. Embora as soluções de banco de dados tradicionais sejam eficientes na busca e recuperação de um conteúdo específico e exato, elas são ineficientes nesse cenário de Big Data, visto que não foram projetadas para isso. Outra dificuldade é que esses dados são essencialmente não-estruturados e encontram-se diluídos em toda a vastidão da Internet. Desta forma, novas soluções de infraestruturas de bancos de dados são necessárias de modo a suportar a busca e recuperação de dados similares de maneira não exata, configurando-se a busca por similaridade, isto é, busca por grupos de dados que compartilham entre si alguma semelhança. Nesse cenário, a proposta desta tese é explorar a similaridade de Hamming existente entre identificadores de objetos gerados através da função Random Hyperplane Hashing. Essa característica presente nesses identificadores servirá de base para propostas de infra-estruturas distribuídas de armazenamento de dados capazes de suportar eficientemente a busca por similaridade. Nesta tese serão apresentadas a Hamming DHT, uma solução P2P baseada em redes sobrepostas, e o HCube, uma solução baseada em servidores para Data Center. As avaliações de ambas as soluções são apresentadas e mostram que elas são capazes de reduzir as distâncias entre conteúdos similares em ambientes distribuídos, o que contribui para o aumento da cobertura em cenários de busca por similaridade / Abstract: Nowadays, the amount of data available on the Internet is over Zettabytes (ZB). Such condition defines a scenario known in the literature as Big Data. Although traditional database solutions are very efficient for finding and retrieving a specific content, they are inefficient on Big Data scenario, since the great majority of such data is unstructured and scattered across the Internet. In this way, new databases are required in order to support queries capable of finding and recovering similar datasets, i.e., retrieving groups of data that share a common meaning. In order to handle such challenging scenario, the proposal in this thesis is to explore the Hamming similarity existent between content identifiers that are generated using the Random Hyperplane Hashing function. Such identifiers provide the basis for building distributed infrastructures that facilitate the similarity search. In this thesis, we present two different approaches: a P2P solution named Hamming DHT, and a Data Center solution named HCube. Evaluations of both solutions are presented and indicate that such solutions are capable of reducing the distance between similar content, improving the recall in a similarity search / Doutorado / Engenharia de Computação / Doutor em Engenharia Elétrica
|
2 |
Redes orientadas a conteúdo : uma abordagem no nível de enlace / Content oriented networking : a link layer approachAmbiel, Lisiane Maria Bannwart, 1962- 23 August 2018 (has links)
Orientadores: Maurício Ferreira Magalhães, Christian Rodolfo Esteve Rothenberg / Dissertação (mestrado) - Universidade Estadual de Campinas, Faculdade de Engenharia Elétrica e de Computação / Made available in DSpace on 2018-08-23T04:19:23Z (GMT). No. of bitstreams: 1
Ambiel_LisianeMariaBannwart_M.pdf: 4602800 bytes, checksum: 2d2a0d47c7410c9fd817dde52a62472d (MD5)
Previous issue date: 2013 / Resumo: As Redes Orientadas a Conteúdo (ROC) se apresentam como uma nova forma de pensar a Internet: mudam o paradigma de comunicação apresentando uma nova abordagem com base no conteúdo independente de sua localização. Esta dissertação propõe uma arquitetura de rede orientada a conteúdos no nível de enlace sem uso de qualquer esquema de endereçamento. Os Content Routers (CR) são à base desta arquitetura, responsáveis pelo armazenamento de dados e roteamento de pacotes diretamente no conteúdo. Diferente do ambiente IP, onde existe o conhecimento do endereço do provedor de conteúdo, a arquitetura proposta no nível de enlace requisita conteúdos através da inundação de mensagens de forma controlada. Um protótipo é desenvolvido para validação da arquitetura e é utilizado em alguns cenários comparando duas abordagens: IP/overlay e nível de enlace. Alguns cenários de uso da arquitetura de CRs em redes domiciliares também são avaliados. Os resultados sugerem que arquiteturas orientadas a conteúdo e sem uso do IP podem ser viáveis e interessantes para redes de menor escala, que se beneficiariam de uma arquitetura simples, sem necessidade de configuração e gerenciamento como ocorre na arquitetura TCP/IP / Abstract: Content Oriented Networking is a new way to think about networking by changing the communication paradigm to an approach where content becomes the basis in replace of network location identifiers. This thesis proposes content oriented network architecture at the link layer without the use of network addressing schemes. Content Routers (CR) are the basis for this architecture and are in charge of packet caching and routing directly on content names. Different from IP environments, where the destination address of the content source is known, the proposed linklevel architecture requests contents by controlled message flooding. The work includes a prototype implementation which is used in some scenarios comparing two approaches: IP/overlay and link layer. Scenarios using CR architecture in home networks are also evaluated. Results suggest that content oriented IP-less architecture may be interesting for small networks such as home networks that would benefit from the simplicity of such architecture, without configuration and management as required when using TCP/IP / Mestrado / Engenharia de Computação / Mestra em Engenharia Elétrica
|
Page generated in 0.1034 seconds