• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 294
  • 125
  • 14
  • 12
  • 8
  • 5
  • 3
  • 2
  • 1
  • 1
  • Tagged with
  • 524
  • 524
  • 176
  • 131
  • 127
  • 90
  • 88
  • 79
  • 68
  • 59
  • 57
  • 53
  • 51
  • 47
  • 46
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
321

[en] RECOMMENDER SYSTEM TO SUPPORT CHART CONSTRUCTIONS WITH STATISTICAL DATA / [pt] SISTEMA DE RECOMENDAÇÃO PARA APOIAR A CONSTRUÇÃO DE GRÁFICOS COM DADOS ESTATÍSTICOS

TAISSA ABDALLA FILGUEIRAS DE SOUSA 13 September 2013 (has links)
[pt] Pesquisas sobre visualização de dados estatísticos demonstram a necessidade de sistemas que apóiem tomadas da decisões e análises visuais. Constatando problemas de construção de visualizações por usuários inexperientes, nossa questão de pesquisa foi: Como apoiar usuários inexperientes na construção de visualizações eficientes com dados estatísticos? Assim, desenvolvemos ViSC, um sistema de recomendações que apóia a construção interativa de gráficos para visualizar dados estatísticos, através de uma série de recomendações baseadas nos dados selecionados e na interação do usuário com a ferramenta. O sistema explora uma ontologia de visualização para oferecer um conjunto de gráficos que ajudam a responder questões baseadas em informação relacionadas aos dados exibidos no gráfico. Percorrendo os gráficos recomendados através de suas questões relacionadas, o usuário implicitamente adquire conhecimento tanto do domínio quanto dos recursos de visualização que melhor representam os conceitos do domínio de interesse. Esta dissertação apresenta os problemas que motivaram a pesquisa, descreve a ferramenta ViSC e apresenta os resultados de uma pesquisa qualitativa realizada para avaliar ViSC. Para a avaliação, utilizamos o Método de Inspeção Semiótica (MIS) e o Retrospective Communicability Evaluation (RCE) — uma combinação do Método de Avaliação da Comunicabilidade (MAC) e Retrospective Think Aloud Protocol. Concentramo-nos em verificar como as recomendações influenciam na realização de uma tarefa e nas visualizações geradas para então endereçar nossa questão mais ampla. / [en] Research on statistical data visualization emphasizes the need for systems that assist in decision-making and visual analysis. Having found problems in chart construction by novice users, we decided to research the following question: How can we support novice users to create efficient visualizations with statistical data? Thus we, created ViSC, a recommender system that supports the interactive construction of charts to visualize statistical data by offering a series of recommendations based on the selected data and the user interaction with the tool. The system explores a visualization ontology to offer a set of graphs that help to answer information-based questions related to the current graph data. By traversing the recommended graphs through their related questions, the user implicitly acquires knowledge both on the domain and on visualization resources that better represent the domain concepts of interest. This dissertation presents the problems that motivated the research, describes the ViSC tool and presents the results of a qualitative study conducted to evaluate ViSC. We used two methods in our evaluation: the Semiotic Inspection Method (SIM) and the Retrospective Communicability Evaluation (RCE) — a combination of the Communicability Evaluation Method (CEM) and Retrospective Think Aloud Protocol. We first analyze how the questions influence the users traversal through the graph and, then, we address the broader question.
322

Visualização exploratória de dados volumétricos multivalorados variantes no tempo / Exploratory visualization of volumetric data multivalued time varying

Santos, Thiago Silva Reis 08 October 2012 (has links)
Simulações por computador permitem reduzir custo e, muitas vezes, realizar experimentos que na vida real seriam impraticáveis, ou por questões ambientais (explosões nucleares), ou por fatores que estão fora do controle do ser humano (colisões entre estrelas). Entretanto, e muito difícil manipular e analisar as centenas de gigabytes, ou mesmo terabytes, que tais simulações produzem como resultado. Os trabalhos que lidam com tais conjuntos de dados, tipicamente, empregam tanto técnicas de visualização científica como técnicas de visualização da informação, em geral refletindo o comportamento dos dados em um único instante de tempo. Entretanto, a análise da evolução temporal e a disponibilização de representações visuais integradas ainda é um grande desafio. Esse trabalho introduz diversas estratégias buscando tratar estes problemas, as quais tem em comum a utilização de projeções multidimensionais para apoiar a análise exploratória dos de dados, tanto em um instante de tempo específico, como ao longo da evolução temporal. O objetivo é favorecer a localização de grupos de elementos com comportamento similar e acompanhar sua evolução ao longo da simulação. Uma das estratégias introduzidas resume o comportamento temporal dos dados multidimensionais em uma única visualização, o que permite rastrear as entidades com comportamento similar e analisá-las ao longo da simulação / Computer simulations of physical phenomena allow reducing costs and studying behavior that would be unfeasible to observe in real life situations, either due to environmental limitations, e.g., a nuclear explosion, or due to factors that are beyond human control (e.g., collisions between stars). Millions of primitives (voxels, vertices or particle) may be required to accurately capture system behavior, thus generating very large data sets that are typically time-varying and multidimensional, as multiple simulation variables describe each primitive. Therefore, analyzing the hundreds of gigabytes or even terabytes resulting from these simulations remains a challenge. Current solutions that handle this type of data usually rely on Scientific or Information Visualization techniques, but typically revealing data behavior at a particular time instant. It remains a major challenge to provide visualizations capable of assisting analysts trying to inspect and understand behavior along the temporal domain. This work is an attempt in this direction, introducing several strategies to handle these problems. They have in common the use of multidimensional projection techniques to support exploratory analysis of simulation data, both at specic time instants and along the simulation as a whole. The goal is to favor the perception of groups of elements showing similar behavior and track their temporal evolution. One of the strategies introduced summarizes, in a single visual representation, the temporal behavior of the multidimensional data space, thus allowing analysts to identify and analyze the entities with similar behavior along the simulation
323

Visualisation de données dynamiques et complexes : des séries temporelles hiérarchiques aux graphes multicouches / Visualization of Dynamic and Complex Data : from Hierarchical Time Series to Multilayer Graphs

Cuenca Pauta, Erick 12 November 2018 (has links)
L'analyse de données de plus en plus complexes, volumineuses et issues de différentes sources (e.g. internet, médias sociaux, etc.) est une tâche difficile. Elle reste cependant cruciale dans de très nombreux domaines d'application. Elle implique, pour pouvoir en extraire des connaissances, de mieux comprendre la nature des données, leur évolution ou les nombreuses relations complexes qu'elles peuvent contenir. La visualisation d'informations s'intéresse aux méthodes de représentations visuelles et interactives permettant d'aider un utilisateur à extraire des connaissances. C'est dans ce contexte que se situe le travail présenté dans ce mémoire. Dans un premier temps, nous nous intéressons à la visualisation de longues séries temporelles hiérarchiques. Après avoir analysé les différentes approches existantes, nous présentons le système MultiStream permettant de visualiser, explorer et comparer l'évolution de séries organisées dans une structure hiérarchique. Nous illustrons son utilisation par deux exemples d'utilisation : émotions exprimées dans des médias sociaux et évolution des genres musicaux. Dans un second temps nous abordons la problématique de données complexes modélisées sous la forme de graphes multicouches (différentes types d'arêtes peuvent relier les n÷uds). Plus particulièrement nous nous intéressons au requêtage visuel de graphes volumineux en présentant VERTIGo un système qui permet de construire des requêtes, d'interroger un moteur spécifique, de visualiser/explorer les résultats à différentes niveaux de détail et de suggérer de nouvelles extensions de requêtes. Nous illustrons son utilisation à l'aide d'un graphe d'auteurs provenant de différentes communautés. / The analysis of data that is increasingly complex, large and from different sources (e.g. internet, social medias, etc.) is a dificult task. However, it remains crucial for many fields of application. It implies, in order to extract knowledge, to better understand the nature of the data, its evolution or the many complex relationships it may contain. Information visualization is about visual and interactive representation methods to help a user to extract knowledge. The work presented in this document takes place in this context. At first, we are interested in the visualization of large hierarchical time series. After analyzing the different existing approaches, we present the MultiStream system for visualizing, exploring and comparing the evolution of the series organized into a hierarchical structure. We illustrate its use by two examples: emotions expressed in social media and the evolution of musical genres. In a second time, we tackle the problem of complex data modeled in the form of multilayer graphs (different types of edges can connect the nodes). More specifically, we are interested in the visual querying of large graphs and we present VERTIGo, a system which makes it possible to build queries, to launch them on a specific engine, to visualize/explore the results at different levels of details and to suggest new query extensions. We illustrate its use with a graph of co-authors from different communities.
324

Concepção e implementação de um modelo de coordenação para uma plataforma de visualização exploratória / Conception and implementation of a coordination model for a exploratory visualiization platform

Moreno, Vilson 26 May 2006 (has links)
Técnicas de Visualização Exploratória acopladas a estratégias de interação podem ser muito úteis para apoiar processos de descoberta de conhecimento a partir de dados. Múltiplas visualizações de um mesmo conjunto de dados permitem observá-lo sob várias perspectivas, bem como explorar os pontos fortes e minimizar o efeito dos pontos fracos de técnicas específicas. Nesse contexto, é interessante que as múltiplas visualizações estejam coordenadas de forma que ações de interação executadas pelo usuário sobre uma delas possam ser propagadas para as demais durante as etapas exploratórias. Um aspecto complexo do projeto de ferramentas de visualização é justamente como acoplar representações visuais e controles interativos de maneira flexível. Esse projeto de mestrado abordou a concepção e implementação de um modelo de coordenação de ações capaz de tratar a coordenação entre múltiplas visualizações de forma genérica e flexível. Para isso, foram estudados alguns modelos de coordenação descritos na literatura e utilizados em Sistemas de Visualização de uso geral. O modelo proposto foi implementado no InfoVis, uma plataforma de software extensível que incorpora múltiplas técnicas de visualização exploratória, em desenvolvimento no ICMC-USP / Exploratory Visualization techniques in association with interaction techniques provide useful tools to support knowledge discovery processes from raw data. Multiple visualizations of the same data set allows users to observe the data from multiple perspectives, so as to make the most of the strengths of each technique, while minimizing their weaknesses. In this context, in exploratory processes it is interesting to coordinate the multiple visualizations, so that user interaction actions on one visualization are reflected in the remaining ones, thus reducing the cognitive load on the user. A complex aspect in the project of visualization tools is how to connect visual representations and interactive controls in a flexible way. This work approaches the conception and implementation of a coordination model capable of handling multiple visualizations in a generic and flexible manner. In order to accomplish this, some coordination models described in recent works in the literature and used in multi-purpose Visualization Systems were studied. The proposed model was implemented in InfoVis, an extensible software framework that incorporates multiple exploratory visualization techniques under development at the ICMC-USP
325

T?cnicas de visualiza??o de dados em gerenciamento de projetos de desenvolvimento de software : proposta de extens?o do PMBOK

Couto, J?lia Mara Colleoni 27 March 2018 (has links)
Submitted by PPG Ci?ncia da Computa??o (ppgcc@pucrs.br) on 2018-05-30T17:58:54Z No. of bitstreams: 1 JULIA_MARA _COLLEONI_COUTO_DIS.pdf: 14083152 bytes, checksum: 6cf58ce4aafa66a5dee5876f3807b23f (MD5) / Approved for entry into archive by Sheila Dias (sheila.dias@pucrs.br) on 2018-06-11T11:15:59Z (GMT) No. of bitstreams: 1 JULIA_MARA _COLLEONI_COUTO_DIS.pdf: 14083152 bytes, checksum: 6cf58ce4aafa66a5dee5876f3807b23f (MD5) / Made available in DSpace on 2018-06-11T11:24:23Z (GMT). No. of bitstreams: 1 JULIA_MARA _COLLEONI_COUTO_DIS.pdf: 14083152 bytes, checksum: 6cf58ce4aafa66a5dee5876f3807b23f (MD5) Previous issue date: 2018-03-27 / Although human brain stores image more easily than text, most of the tools we use when it comes to project management are based on textual reports, such as Microsoft Office files. The number of projects that fail is still large due to several reasons, among which is the lack of understanding of the project by the stakeholders. When it comes to software development, the uncertainties, ambiguities, and complexities inherent in these projects can amplify the chances of failures. Data visualization tools and techniques can help clarify understanding of the context and project details for stakeholders, reducing the risk of project failure and facilitating communication processes. The objective of this work is to identify what is used of visual management applied to project management, in general, and by projects of various types, and verify, among the results, what can be applied in software development project management, and how it can be done. The method designed for the study is composed of 4 phases: foundation, evaluation, compilation, and proposal. Throughout the research, a systematic literature mapping was developed, followed by a survey and a focus group, resulting in the main contribution of this work: the PMBoK (PMI project management practice guide) extension proposal, containing a process, data visualization tools and techniques that can be used as support by the manager and stakeholders in a software development project. / Apesar de o c?rebro humano armazenar imagens com maior facilidade do que texto, grande parte das ferramentas utilizadas quando se trata de gest?o de projetos ? baseada em relat?rios textuais, como arquivos do pacote Microsoft Office. Atualmente, ainda ? grande a quantidade de projetos que falham, devido a motivos diversos, dentre os quais est? o n?o entendimento do projeto por parte das partes envolvidas. Quando se trata de desenvolvimento de software, as incertezas, ambiguidades e complexidades inerentes a estes projetos podem amplificar as chances de falhas. As ferramentas e t?cnicas de visualiza??o de dados podem ajudar a esclarecer o entendimento do contexto e de detalhes do projeto para todas as partes envolvidas, reduzindo o risco de insucesso no projeto e facilitando os processos de comunica??o. O objetivo deste trabalho ? identificar o que ? utilizado de gest?o visual aplicada ao gerenciamento de projetos, de maneira geral e por projetos de diversos tipos, e verificar, dentre os resultados, o que pode ser aplicado no gerenciamento de projetos de desenvolvimento de software, e de que maneira isso pode ser feito. A metodologia desenhada para o estudo ? composta por 4 fases: fundamenta??o, compila??o, avalia??o e proposta. Ao longo da pesquisa foram desenvolvidos um mapeamento sistem?tico da literatura, seguido por uma survey e um focus group, resultando na principal contribui??o deste trabalho: a proposta de extens?o do PMBoK (o guia de pr?ticas de gerenciamento de projetos do PMI), contendo um processo, t?cnicas e ferramentas de visualiza??o de dados que podem ser utilizadas como apoio pelo gerente e demais partes envolvidas em um projeto de desenvolvimento de software.
326

tV DIGITAL e visualização de informações

Martins, Bianca 11 March 2011 (has links)
Made available in DSpace on 2016-03-22T17:26:45Z (GMT). No. of bitstreams: 1 Bianca_ ultima versao.pdf: 2310630 bytes, checksum: 2a5e16bab352789a9cfbaef41a6e91dd (MD5) Previous issue date: 2011-03-11 / The Information Visualization study area tries to represent through graphic visual representation, transmit information that allow a better understanding of a large amount of raw data. The use of Information Visualization Tools for Digital Television make to television viewers understand the values in a more intuitive way, query, and learn more about the analyzed systems. The purpose of this research is to make TV applications easier to learn, comprehend, understand, and manipulate the high amount of information that will be shown on the television screen through the terrestrial Brazilian Digital TV Standard. Inside this context there will be used, as start point, two classes of evaluation criterias defined by Luzzardi [LUZZARDI, 2003], as a way to facilitate the discovery of the main Usability issues encountered by the viewers. This research finishes with tests, conclusions, and future works / A Visualização de Informações é uma área que procura através de representações gráficas visuais, transmitir informações que permitam a melhor compreensão de um grande volume de dados em estado bruto. A utilização de ferramentas de visualização de informações voltadas para TV Digital poderá tornar possível aos telespectadores, compreender de forma intuitiva, consultar e aprender sobre os sistemas apresentados. O trabalho a ser apresentado tem como principal finalidade, tornar mais fácil ao usuário aprender, compreender, interpretar e manipular o grande volume de informações que serão exibidos em aplicativos televisivos através da TV Digital Terrestre. Dentro deste contexto, serão utilizados como base e ponto de partida, dois conjuntos de critérios de avaliação (heurísticas) definidos por Luzzardi [LUZZARDI, 2003], de modo a facilitar a descoberta dos principais problemas de usabilidade enfrentados pelos telespectadores da TV Digital. O trabalho é concluído com a realização de testes, apresentando conclusões e indicações de trabalhos futuros
327

Projeções multidimensionais para a análise de fluxos de dados / Multidimensional projections for data stream analysis

Neves, Tácito Trindade de Araújo Tiburtino 17 November 2016 (has links)
As técnicas de projeção multidimensional tornaram-se uma ferramenta de análise importante. Elas buscam mapear dados de um espaço multidimensional para um espaço visual, de menor dimensão, preservando as estruturas de distância ou de vizinhança no mapa visual produzido. Apesar dos recentes avanços, as técnicas existentes ainda apresentam deficiências que prejudicam a sua utilização como ferramentas exploratórias em certos domínios. Um exemplo está nos cenários streaming, nos quais os dados são produzidos e/ou coletados de forma contínua. Como a maioria das técnicas de projeção necessitam percorrer os dados mais de uma vez para produzir um layout final, e fluxos normalmente não podem ser carregados por completo em memória principal, a aplicação direta ou mesmo a adaptação das técnicas existentes em tais cenários é inviável. Nessa tese de doutorado é apresentado um novo modelo de projeção, chamado de Xtreaming, no qual as instâncias de dados são visitadas apenas uma vez durante o processo de projeção. Esse modelo é capaz de se adaptar a mudanças nos dados conforme eles são recebidos, atualizando o mapa visual para refletir as novas estruturas que surgem ao longo do tempo. Os resultados dos testes mostram que o Xtreaming é muito competitivo em termos de preservação de distâncias e tempo de execução se comparado com técnicas do estado-da-arte. Também é apresentada uma nova técnica de projeção multidimensional, chamada de User-assisted Projection Technique for Distance Information (UPDis), que foi projetada para permitir a intervenção do usuário exigindo apenas informações de distância entre as instâncias, e que é utilizada como parte do Xtreaming. Os resultados também mostram que a UPDis é tão rápida, precisa e flexível quanto as técnicas do estado-da-arte. / Multidimensional Projection techniques have become an important analytics tool. They map data from a multidimensional space into a visual space preserving the distance or neighborhood structures on the produced layout. Despite the recent advances, existing techniques still present drawbacks that impair their use as exploratory tools on certain domains. An example is the streaming scenario, in which data are captured or produced continuously. Since most projection techniques need to traverse the data more than once to produce a final layout, and streaming data typically cannot be completely loaded into the main memory, the direct use or even adaptation of the existing techniques in such scenarios is infeasible. In this dissertation, we present a novel projection model, called Xtreaming, wherein the data instances are visited only once during the projection process. This model is able to adapt itself to the changes in data as data is received, updating the visual layout to reflect the new structures that emerge over time. The tests show that Xtreaming is very competitive regarding distance preservation and running time when compared with state-of-the-art projection techniques. We also present a new multidimensional projection technique, called User-assisted Projection Technique for Distance Information (UPDis), that was designed to allow user intervention requiring only distance information between data instances. UPDis is used as part of the Xtreaming model. The results show that UPDis is as fast, accurate and flexible as state-of-the-art techniques.
328

Visual Analytics como ferramenta de auxílio ao processo de KDD : um estudo voltado ao pré-processamento

Cini, Glauber 29 March 2017 (has links)
Submitted by JOSIANE SANTOS DE OLIVEIRA (josianeso) on 2017-06-27T13:53:26Z No. of bitstreams: 1 Glauber Cini_.pdf: 2121004 bytes, checksum: c1f55ddc527cdaeb7ae3c224baea727a (MD5) / Made available in DSpace on 2017-06-27T13:53:26Z (GMT). No. of bitstreams: 1 Glauber Cini_.pdf: 2121004 bytes, checksum: c1f55ddc527cdaeb7ae3c224baea727a (MD5) Previous issue date: 2017-03-29 / Nenhuma / O Visual Analytics consiste na combinação de métodos inteligentes e automáticos com a capacidade de percepção visual do ser humano visando a extração do conhecimento de conjuntos de dados. Esta capacidade visual é apoiada por interfaces interativas como, sendo a de maior importância para este trabalho, a visualização por Coordenadas Paralelas. Todavia, ferramentas que disponham de ambos os métodos automáticos (KDD) e visuais (Coordenadas Paralelas) de forma genérica e integrada mostra-se primordial. Deste modo, este trabalho apresenta um modelo integrado entre o processo de KDD e o de Visualização de Informação utilizando as Coordenadas Paralelas com ênfase no make sense of data, ao ampliar a possibilidade de exploração dos dados ainda na etapa de pré-processamento. Para demonstrar o funcionamento deste modelo, um plugin foi desenvolvido sobre a ferramenta WEKA. Este módulo é responsável por ampliar as possibilidades de utilização da ferramenta escolhida ao expandir suas funcionalidades a ponto de conceitua-la como uma ferramenta Visual Analytics. Junto a visualização de Coordenadas Paralelas disponibilizada, também se viabiliza a interação por permutação das dimensões (eixos), interação por seleção de amostras (brushing) e possibilidade de detalhamento das mesmas na própria visualização. / Visual Analytics is the combination of intelligent and automatic methods with the ability of human visual perception aiming to extract knowledge from data sets. This visual capability is supported by interactive interfaces, considering the most important for this work, the Parallel Coordinates visualization. However, tools that have both automatic methods (KDD) and visual (Parallel Coordinates) in a generic and integrated way is inherent. Thus, this work presents an integrated model between the KDD process and the Information Visualization using the Parallel Coordinates with emphasis on the make sense of data, by increasing the possibility of data exploration in the preprocessing stage. To demonstrate the operation of this model, a plugin was developed on the WEKA tool. This module is responsible for expanding the possibilities of chosen tool by expanding its functionality to the point of conceptualizing it as a Visual Analytics tool. In addition to the delivered visualization of Parallel Coordinate, it is also possible to interact by permutation of the dimensions (axes), interaction by selection of samples (brushing) and possibility of detailing them in the visualization itself.
329

Mapeamento de dados multi-dimensionais - integrando mineração e visualização / Multidimensional data mapping - integrating mining and visualization

Paulovich, Fernando Vieira 07 October 2008 (has links)
As técnicas de projeção ou posicionamento de pontos no plano, que servem para mapear dados multi-dimensionais em espaços visuais, sempre despertaram grande interesse da comunidade de visualização e análise de dados por representarem uma forma útil de exploração baseada em relações de similaridade e correlação. Apesar disso, muitos problemas ainda são encontrados em tais técnicas, limitando suas aplicações. Em especial, as técnicas de projeção multi-dimensional de maior qualidade têm custo computacional proibitivo para grandes conjuntos de dados. Adicionalmente, problemas referentes à escalabilidade visual, isto é, à capacidade da metáfora visual empregada de representar dados de forma compacta e amigável, são recorrentes. Esta tese trata o problema da projeção multi-dimensional de vários pontos de vista, propondo técnicas que resolvem, até certo ponto, cada um dos problemas verificados. Também é fato que a complexidade e o tamanho dos conjuntos de dados indicam que a visualização deve trabalhar em conjunto com técnicas de mineração, tanto embutidas no processo de mapeamento, como por meio de ferramentas auxiliares de interpretação. Nesta tese incorporamos alguns aspectos de mineração integrados ao processo de visualização multi-dimensional, principalmente na aplicação de projeções para visualização de coleções de documentos, propondo uma estratégia de extração de tópicos. Como suporte ao desenvolvimento e teste dessas técnicas, foram criados diferentes sistemas de software. O principal inclui as técnicas desenvolvidas e muitas das técnicas clássicas de projeção, podendo ser usado para exploração de conjuntos de dados multi-dimensionais em geral, com funcionalidade adicional para mapeamento de coleções de documentos. Como principal contribuição desta tese propomos um entendimento mais profundo dos problemas encontrados nas técnicas de projeção vigentes e o desenvolvimento de técnicas de projeção (ou mapeamento) que são rápidas, tratam adequadamente a formação visual de grupos de dados altamente similares, separam satisfatoriamente esses grupos no layout, e permitem a exploração dos dados em vários níveis de detalhe / Projection or point placement techniques, useful for mapping multidimensional data into visual spaces, have always risen interest in the visualization and data analysis communities because they can support data exploration based on similarity or correlation relations. Regardless of that interest, various problems arise when dealing with such techniques, impairing their widespread application. In particularly the projections that yield highest quality layouts have prohibitive computational cost for large data sets. Additionally, there are issues regarding visual scalability, i.e., the capability of visually fit the individual points in the exploration space as the data set grows large. This thesis treats the problems of projections from various perspectives, presenting novel techniques that solve, to certain extent, several of the verified problems. It is also a fact that size and complexity of data sets suggest the integration of data mining capabilities into the visualization pipeline, both during the mapping process and as a tools to extract additional information after the data have been layed out. This thesis also add some aspects of mining to the multidimensional visualization process, mainly for the particular application of analysis of document collections, proposing and implementing an approach for topic extraction. As supporting tools for testing these techniques and comparing them to existing ones different software systems were written. The main one includes the techniques developed here as well as several of the classical projection and dimensional reduction techniques, and can be used for exploring various kinds of data sets, with addition functionality to support the mapping of document collections. This thesis contributes to the understanding of the projection or mapping problem and develops new techniques that are fast, treat adequately the visual formation of groups of highly related data items, separate those groups properly and allow exploration of data in various levels of detail
330

Projeção multidimensional aplicada a visualização de resultados de busca textual / Multidimensional projection applied to textual search results visualization

Nieto, Erick Mauricio Gómez 30 August 2012 (has links)
Usuários da Internet estão muito familiarizados que resultados de uma consulta sejam exibidos como uma lista ordenada de snippets. Cada snippet possui conteúdo textual que mostra um resumo do documento referido (ou página web) e um link para o mesmo. Esta representação tem muitas vantagens como, por exemplo, proporcionar uma navegação fácil e simples de interpretar. No entanto, qualquer usuário que usa motores de busca poderia reportar possivelmente alguma experiência de decepção com este modelo. Todavia, ela tem limitações em situações particulares, como o não fornecimento de uma visão geral da coleção de documentos recuperados. Além disso, dependendo da natureza da consulta - por exemplo, pode ser muito geral, ou ambígua, ou mal expressa - a informação desejada pode ser mal classificada, ou os resultados podem contemplar temas variados. Várias tarefas de busca seriam mais fáceis se fosse devolvida aos usuários uma visão geral dos documentos organizados de modo a refletir a forma como são relacionados, em relação ao conteúdo. Propomos uma técnica de visualização para exibir os resultados de consultas web que visa superar tais limitações. Ela combina a capacidade de preservação de vizinhança das projeções multidimensionais com a conhecida representação baseada em snippets. Essa visualização emprega uma projeção multidimensional para derivar layouts bidimensionais dos resultados da pesquisa, que preservam as relações de similaridade de texto, ou vizinhança. A similaridade é calculada mediante a aplicação da similaridade do cosseno sobre uma representação bag-of-words vetorial de coleções construídas a partir dos snippets. Se os snippets são exibidos diretamente de acordo com o layout derivado, eles se sobrepõem consideravelmente, produzindo uma visualização pobre. Nós superamos esse problema definindo uma energia funcional que considera tanto a sobreposição entre os snippets e a preservação da estrutura de vizinhanças como foi dada no layout da projeção. Minimizando esta energia funcional é fornecida uma representação bidimensional com preservação das vizinhanças dos snippets textuais com sobreposição mínima. A visualização transmite tanto uma visão global dos resultados da consulta como os agrupamentos visuais que refletem documentos relacionados, como é ilustrado em vários dos exemplos apresentados / Internet users are very familiar with the results of a search query displayed as a ranked list of snippets. Each textual snippet shows a content summary of the referred document (or web page) and a link to it. This display has many advantages, e.g., it affords easy navigation and is straightforward to interpret. Nonetheless, any user of search engines could possibly report some experience of disappointment with this metaphor. Indeed, it has limitations in particular situations, as it fails to provide an overview of the document collection retrieved. Moreover, depending on the nature of the query - e.g., it may be too general, or ambiguous, or ill expressed - the desired information may be poorly ranked, or results may contemplate varied topics. Several search tasks would be easier if users were shown an overview of the returned documents, organized so as to reflect how related they are, content-wise. We propose a visualization technique to display the results of web queries aimed at overcoming such limitations. It combines the neighborhood preservation capability of multidimensional projections with the familiar snippet-based representation by employing a multidimensional projection to derive two-dimensional layouts of the query search results that preserve text similarity relations, or neighborhoods. Similarity is computed by applying the cosine similarity over a bag-of-words vector representation of collection built from the snippets. If the snippets are displayed directly according to the derived layout they will overlap considerably, producing a poor visualization. We overcome this problem by defining an energy functional that considers both the overlapping amongst snippets and the preservation of the neighborhood structure as given in vii the projected layout. Minimizing this energy functional provides a neighborhood preserving two-dimensional arrangement of the textual snippets with minimum overlap. The resulting visualization conveys both a global view of the query results and visual groupings that reflect related results, as illustrated in several examples shown

Page generated in 0.1598 seconds