• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 10
  • Tagged with
  • 10
  • 10
  • 10
  • 8
  • 8
  • 8
  • 6
  • 6
  • 4
  • 4
  • 2
  • 2
  • 2
  • 2
  • 2
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
1

Explorando conjuntos de dados volumétricos multidimensionais variantes no tempo usando projeções / Exploring time-varying multidimensional volumetric datasets using projections

Cruz, Christian Jorge Daniel Wong 10 September 2012 (has links)
A área de visualização volumétrica engloba um conjunto de técnicas utilizadas na representação, manipulação e exibição de dados associados à região de um volume, possibilitando, assim, a exploração e melhor compreensão do interior de objetos de natureza tridimensional. Contudo, algumas limitações ainda são encontradas nessa área, como, por exemplo, a exploração de mais de um valor simultaneamente em conjuntos de dados volumétricos multivariados. Além desse desafio, outro objeto de grande interesse da comunidade científica é a exploração de volumes variantes no tempo. A complexidade nesse caso está em tratar ou processar uma quantidade muito grande de dados buscando descobrir propriedades, estruturas ou características que variam com o tempo. O presente trabalho propõe técnicas e abordagens, baseadas no conceito de projeções multidimensionais, visando dar apoio à análise de conjuntos volumétricos multivariados que variam no tempo. A primeira técnica proposta, denominada Fastmap*, possibilitou a projeção de espaços de alta dimensionalidade em fluxo contínuo. A segunda técnica apresentada, denominada RLNP, permitiu a projeção de dados por vizinhança mantendo a coerência temporal nos dados projetados, além de possuir a capacidade de projetar espaços de alta dimensão com um nível de stressbaixo. Também, propomos uma abordagem para a análise baseada em atributos, denominada Scatter Projection, que facilita a exploração focada em um atributo específico junto com a similaridade dos dados entre eles. Finalmente, propõe-se uma abordagem baseada na reprojeção de agrupamentos usando técnicas de seleção de atributos para tentar identificar melhor as estruturas internas do volume. Assim, o presente trabalho contribui no sentido de levantar e discutir limitações das técnicas disponíveis, e em seguida, buscar possibilidades de solução para tais questões, propondo técnicas e abordagens que possibilitam a exploração de grandes conjuntos de dados volumétricos multivariados, mantendo a coerência temporal / The area of volume visualization encompasses a set of techniques used for representation, manipulation and display of data associated with a region of a volume, thus enabling the exploration and understanding of the interior of three-dimensional objects. However, some limitations are still encountered in this area. For example, the simultaneous exploration of more than one value in multivariate volumetric datasets. Beyond this challenge, another issue of great interest to the scientific community is the exploration of time-varying volumes. The complexity of this case lies in treatment or processing of a very large amount of data, seeking to discover properties, structures, or characteristics that may vary in time. This work proposes techniques and approaches, based on the concept of multidimensional projections, in order to support multivariate volumetric analysis of time varying data sets. The first technique proposed, called Fastmap*, enables the projection of high dimensional streaming data. The second technique presented, called Recursive Laplacian-based Neiboorhood Projection, allows the projection of data sets based on neighborhoods, maintaining the temporal coherence in the projected data, besides having the ability to project highdimensional spaces with a low level of stress. Also, we propose an approach for the analysis of specific attributes, referred to as Scatter Projection, which facilitates the exploration focused on a specific attribute and on the similarity between them. Finally, we propose an approach based on reprojection of groups using feature selection techniques for better identification of internal structures of the volume. Thus, this study contributes towards surveying and discussing limitations of the area, and then seeks ways of solving these issues, proposing techniques and approaches that enable the exploration of multidimensional volumetric time varying data sets, maintaining the temporal coherence
2

Explorando conjuntos de dados volumétricos multidimensionais variantes no tempo usando projeções / Exploring time-varying multidimensional volumetric datasets using projections

Christian Jorge Daniel Wong Cruz 10 September 2012 (has links)
A área de visualização volumétrica engloba um conjunto de técnicas utilizadas na representação, manipulação e exibição de dados associados à região de um volume, possibilitando, assim, a exploração e melhor compreensão do interior de objetos de natureza tridimensional. Contudo, algumas limitações ainda são encontradas nessa área, como, por exemplo, a exploração de mais de um valor simultaneamente em conjuntos de dados volumétricos multivariados. Além desse desafio, outro objeto de grande interesse da comunidade científica é a exploração de volumes variantes no tempo. A complexidade nesse caso está em tratar ou processar uma quantidade muito grande de dados buscando descobrir propriedades, estruturas ou características que variam com o tempo. O presente trabalho propõe técnicas e abordagens, baseadas no conceito de projeções multidimensionais, visando dar apoio à análise de conjuntos volumétricos multivariados que variam no tempo. A primeira técnica proposta, denominada Fastmap*, possibilitou a projeção de espaços de alta dimensionalidade em fluxo contínuo. A segunda técnica apresentada, denominada RLNP, permitiu a projeção de dados por vizinhança mantendo a coerência temporal nos dados projetados, além de possuir a capacidade de projetar espaços de alta dimensão com um nível de stressbaixo. Também, propomos uma abordagem para a análise baseada em atributos, denominada Scatter Projection, que facilita a exploração focada em um atributo específico junto com a similaridade dos dados entre eles. Finalmente, propõe-se uma abordagem baseada na reprojeção de agrupamentos usando técnicas de seleção de atributos para tentar identificar melhor as estruturas internas do volume. Assim, o presente trabalho contribui no sentido de levantar e discutir limitações das técnicas disponíveis, e em seguida, buscar possibilidades de solução para tais questões, propondo técnicas e abordagens que possibilitam a exploração de grandes conjuntos de dados volumétricos multivariados, mantendo a coerência temporal / The area of volume visualization encompasses a set of techniques used for representation, manipulation and display of data associated with a region of a volume, thus enabling the exploration and understanding of the interior of three-dimensional objects. However, some limitations are still encountered in this area. For example, the simultaneous exploration of more than one value in multivariate volumetric datasets. Beyond this challenge, another issue of great interest to the scientific community is the exploration of time-varying volumes. The complexity of this case lies in treatment or processing of a very large amount of data, seeking to discover properties, structures, or characteristics that may vary in time. This work proposes techniques and approaches, based on the concept of multidimensional projections, in order to support multivariate volumetric analysis of time varying data sets. The first technique proposed, called Fastmap*, enables the projection of high dimensional streaming data. The second technique presented, called Recursive Laplacian-based Neiboorhood Projection, allows the projection of data sets based on neighborhoods, maintaining the temporal coherence in the projected data, besides having the ability to project highdimensional spaces with a low level of stress. Also, we propose an approach for the analysis of specific attributes, referred to as Scatter Projection, which facilitates the exploration focused on a specific attribute and on the similarity between them. Finally, we propose an approach based on reprojection of groups using feature selection techniques for better identification of internal structures of the volume. Thus, this study contributes towards surveying and discussing limitations of the area, and then seeks ways of solving these issues, proposing techniques and approaches that enable the exploration of multidimensional volumetric time varying data sets, maintaining the temporal coherence
3

Empregando técnicas de projeção multidimensional para transformação interativa de espaços de características / Employing multidimensional projection techniques for interactive transformation of features spaces

Mamani, Gladys Marleny Hilasaca 24 October 2012 (has links)
A tecnologia atual permite armazenar grandes quantidades de dados, no entanto sua exploração e compreensão resultam em um enorme desafio devido não só ao tamanho dos conjuntos produzidos mas também sua complexidade. Nesse sentido a visualização de informação vem se mostrando um recurso extremamente poderoso para ajudar a interpretar e extrair informação útil desse universo de dados. Dentre as abordagens existentes, as tecnicas de projeção multidimensional estão emergindo como um instrumento de visualização importante em aplicações que implicam a análise visual de dados de alta dimensão devido ao poder analítico que essas oferecem na exploração de relações de similaridade e correlação de dados abstratos. Contudo, os resultados obtidos por tais técnicas estão intimamente ligados à qualidade do espaço de características que descrevem os dados sendo processados. Se o espaço for bem formado e refletir as relações de similaridade esperadas por um usuário, os resultados nais serão satisfatórios. Caso contrário pouca utilidade terão as representações visuais geradas. Neste projeto de mestrado técnicas de projeção multidimensional são empregadas, para, não somente explorar conjuntos de dados multidimensionais, mas também para servir como um guia em um processo que visa \"moldar\" espaços de características. A abordagem proposta se baseia na combinação de projeções de amostras e mapeamentos locais, permitindo ao usuário de forma interativa transformar os atributos dos dados por meio da modicação dessas projeções. Mais especicamente, as novas relações de similaridade criadas pelo usuário na manipulação das projeções das amostras são propagadas para o espaço de característica que descreve os dados, transformando-o em um novo espaço que reflita essas relações, ou seja, o ponto de vista do usuário sobre as semelhanças e diferenças presentes nos dados. Resultados experimentais mostram que a abordagem desenvolvida nesse projeto pode com sucesso transformar espaços de características com base na manipulação da projeção de pequenas amostras, melhorando a coesão e separação de grupos. Com base no ferramental criado, um sistema de recuperação de imagens por conteúdo e sugerido, mostrando que a abordagem desenvolvida pode ser bastante útil nesse tipo de aplicação / Although the current technology allows storing large volumes of data, their exploration and understanding remains as challenges not only due to the size of the produced datasets but also their complexity. In this sense, the information visualization has proven to be an extremely powerful instrument to help users to interpret and extract useful information from this universe of data. Among the existing approaches, multidimensional projection techniques are emerging as an important visualization tool in applications involving visual analysis of high dimensional data due to the analytical power that these techniques oer in the exploitation of similarity relations and abstract data correlation. However, the results obtained by these techniques are closely tied to the quality of the feature space which describes the data being processed. If the space is well formed and reflect the similarity relations expected by an user, the nal results will be satisfactory. Otherwise, little utility will have the created visual representations. In this master\'s project, multidimensional projections techniques are employed not only to explore multidimensional data sets, but also to serve as a guide in a process that aims to \"mold\" features spaces. The proposed approach is based on the combination of projections of samples and local mappings, allowing the user to interactively transform the data attributes by modifying these projections. Specifically, the new similarity relations created by the user in manipulating the projections of the samples are propagated to the feature space that describes the data, transforming it into a new space that reflects these relationships, i.e., the point of view of the user about the similarities and dierences in the data. Experimental results show that the approach developed in this project can successfully transform feature spaces based on the manipulation of projections of small samples, improving the cohesion and separation of groups. Based on the created framework, a content-based image retrieval system is suggested, showing that the developed approach can be very useful in this type of application
4

Empregando técnicas de projeção multidimensional para transformação interativa de espaços de características / Employing multidimensional projection techniques for interactive transformation of features spaces

Gladys Marleny Hilasaca Mamani 24 October 2012 (has links)
A tecnologia atual permite armazenar grandes quantidades de dados, no entanto sua exploração e compreensão resultam em um enorme desafio devido não só ao tamanho dos conjuntos produzidos mas também sua complexidade. Nesse sentido a visualização de informação vem se mostrando um recurso extremamente poderoso para ajudar a interpretar e extrair informação útil desse universo de dados. Dentre as abordagens existentes, as tecnicas de projeção multidimensional estão emergindo como um instrumento de visualização importante em aplicações que implicam a análise visual de dados de alta dimensão devido ao poder analítico que essas oferecem na exploração de relações de similaridade e correlação de dados abstratos. Contudo, os resultados obtidos por tais técnicas estão intimamente ligados à qualidade do espaço de características que descrevem os dados sendo processados. Se o espaço for bem formado e refletir as relações de similaridade esperadas por um usuário, os resultados nais serão satisfatórios. Caso contrário pouca utilidade terão as representações visuais geradas. Neste projeto de mestrado técnicas de projeção multidimensional são empregadas, para, não somente explorar conjuntos de dados multidimensionais, mas também para servir como um guia em um processo que visa \"moldar\" espaços de características. A abordagem proposta se baseia na combinação de projeções de amostras e mapeamentos locais, permitindo ao usuário de forma interativa transformar os atributos dos dados por meio da modicação dessas projeções. Mais especicamente, as novas relações de similaridade criadas pelo usuário na manipulação das projeções das amostras são propagadas para o espaço de característica que descreve os dados, transformando-o em um novo espaço que reflita essas relações, ou seja, o ponto de vista do usuário sobre as semelhanças e diferenças presentes nos dados. Resultados experimentais mostram que a abordagem desenvolvida nesse projeto pode com sucesso transformar espaços de características com base na manipulação da projeção de pequenas amostras, melhorando a coesão e separação de grupos. Com base no ferramental criado, um sistema de recuperação de imagens por conteúdo e sugerido, mostrando que a abordagem desenvolvida pode ser bastante útil nesse tipo de aplicação / Although the current technology allows storing large volumes of data, their exploration and understanding remains as challenges not only due to the size of the produced datasets but also their complexity. In this sense, the information visualization has proven to be an extremely powerful instrument to help users to interpret and extract useful information from this universe of data. Among the existing approaches, multidimensional projection techniques are emerging as an important visualization tool in applications involving visual analysis of high dimensional data due to the analytical power that these techniques oer in the exploitation of similarity relations and abstract data correlation. However, the results obtained by these techniques are closely tied to the quality of the feature space which describes the data being processed. If the space is well formed and reflect the similarity relations expected by an user, the nal results will be satisfactory. Otherwise, little utility will have the created visual representations. In this master\'s project, multidimensional projections techniques are employed not only to explore multidimensional data sets, but also to serve as a guide in a process that aims to \"mold\" features spaces. The proposed approach is based on the combination of projections of samples and local mappings, allowing the user to interactively transform the data attributes by modifying these projections. Specifically, the new similarity relations created by the user in manipulating the projections of the samples are propagated to the feature space that describes the data, transforming it into a new space that reflects these relationships, i.e., the point of view of the user about the similarities and dierences in the data. Experimental results show that the approach developed in this project can successfully transform feature spaces based on the manipulation of projections of small samples, improving the cohesion and separation of groups. Based on the created framework, a content-based image retrieval system is suggested, showing that the developed approach can be very useful in this type of application
5

Projeções multidimensionais para a análise de fluxos de dados / Multidimensional projections for data stream analysis

Neves, Tácito Trindade de Araújo Tiburtino 17 November 2016 (has links)
As técnicas de projeção multidimensional tornaram-se uma ferramenta de análise importante. Elas buscam mapear dados de um espaço multidimensional para um espaço visual, de menor dimensão, preservando as estruturas de distância ou de vizinhança no mapa visual produzido. Apesar dos recentes avanços, as técnicas existentes ainda apresentam deficiências que prejudicam a sua utilização como ferramentas exploratórias em certos domínios. Um exemplo está nos cenários streaming, nos quais os dados são produzidos e/ou coletados de forma contínua. Como a maioria das técnicas de projeção necessitam percorrer os dados mais de uma vez para produzir um layout final, e fluxos normalmente não podem ser carregados por completo em memória principal, a aplicação direta ou mesmo a adaptação das técnicas existentes em tais cenários é inviável. Nessa tese de doutorado é apresentado um novo modelo de projeção, chamado de Xtreaming, no qual as instâncias de dados são visitadas apenas uma vez durante o processo de projeção. Esse modelo é capaz de se adaptar a mudanças nos dados conforme eles são recebidos, atualizando o mapa visual para refletir as novas estruturas que surgem ao longo do tempo. Os resultados dos testes mostram que o Xtreaming é muito competitivo em termos de preservação de distâncias e tempo de execução se comparado com técnicas do estado-da-arte. Também é apresentada uma nova técnica de projeção multidimensional, chamada de User-assisted Projection Technique for Distance Information (UPDis), que foi projetada para permitir a intervenção do usuário exigindo apenas informações de distância entre as instâncias, e que é utilizada como parte do Xtreaming. Os resultados também mostram que a UPDis é tão rápida, precisa e flexível quanto as técnicas do estado-da-arte. / Multidimensional Projection techniques have become an important analytics tool. They map data from a multidimensional space into a visual space preserving the distance or neighborhood structures on the produced layout. Despite the recent advances, existing techniques still present drawbacks that impair their use as exploratory tools on certain domains. An example is the streaming scenario, in which data are captured or produced continuously. Since most projection techniques need to traverse the data more than once to produce a final layout, and streaming data typically cannot be completely loaded into the main memory, the direct use or even adaptation of the existing techniques in such scenarios is infeasible. In this dissertation, we present a novel projection model, called Xtreaming, wherein the data instances are visited only once during the projection process. This model is able to adapt itself to the changes in data as data is received, updating the visual layout to reflect the new structures that emerge over time. The tests show that Xtreaming is very competitive regarding distance preservation and running time when compared with state-of-the-art projection techniques. We also present a new multidimensional projection technique, called User-assisted Projection Technique for Distance Information (UPDis), that was designed to allow user intervention requiring only distance information between data instances. UPDis is used as part of the Xtreaming model. The results show that UPDis is as fast, accurate and flexible as state-of-the-art techniques.
6

Projeções multidimensionais para a análise de fluxos de dados / Multidimensional projections for data stream analysis

Tácito Trindade de Araújo Tiburtino Neves 17 November 2016 (has links)
As técnicas de projeção multidimensional tornaram-se uma ferramenta de análise importante. Elas buscam mapear dados de um espaço multidimensional para um espaço visual, de menor dimensão, preservando as estruturas de distância ou de vizinhança no mapa visual produzido. Apesar dos recentes avanços, as técnicas existentes ainda apresentam deficiências que prejudicam a sua utilização como ferramentas exploratórias em certos domínios. Um exemplo está nos cenários streaming, nos quais os dados são produzidos e/ou coletados de forma contínua. Como a maioria das técnicas de projeção necessitam percorrer os dados mais de uma vez para produzir um layout final, e fluxos normalmente não podem ser carregados por completo em memória principal, a aplicação direta ou mesmo a adaptação das técnicas existentes em tais cenários é inviável. Nessa tese de doutorado é apresentado um novo modelo de projeção, chamado de Xtreaming, no qual as instâncias de dados são visitadas apenas uma vez durante o processo de projeção. Esse modelo é capaz de se adaptar a mudanças nos dados conforme eles são recebidos, atualizando o mapa visual para refletir as novas estruturas que surgem ao longo do tempo. Os resultados dos testes mostram que o Xtreaming é muito competitivo em termos de preservação de distâncias e tempo de execução se comparado com técnicas do estado-da-arte. Também é apresentada uma nova técnica de projeção multidimensional, chamada de User-assisted Projection Technique for Distance Information (UPDis), que foi projetada para permitir a intervenção do usuário exigindo apenas informações de distância entre as instâncias, e que é utilizada como parte do Xtreaming. Os resultados também mostram que a UPDis é tão rápida, precisa e flexível quanto as técnicas do estado-da-arte. / Multidimensional Projection techniques have become an important analytics tool. They map data from a multidimensional space into a visual space preserving the distance or neighborhood structures on the produced layout. Despite the recent advances, existing techniques still present drawbacks that impair their use as exploratory tools on certain domains. An example is the streaming scenario, in which data are captured or produced continuously. Since most projection techniques need to traverse the data more than once to produce a final layout, and streaming data typically cannot be completely loaded into the main memory, the direct use or even adaptation of the existing techniques in such scenarios is infeasible. In this dissertation, we present a novel projection model, called Xtreaming, wherein the data instances are visited only once during the projection process. This model is able to adapt itself to the changes in data as data is received, updating the visual layout to reflect the new structures that emerge over time. The tests show that Xtreaming is very competitive regarding distance preservation and running time when compared with state-of-the-art projection techniques. We also present a new multidimensional projection technique, called User-assisted Projection Technique for Distance Information (UPDis), that was designed to allow user intervention requiring only distance information between data instances. UPDis is used as part of the Xtreaming model. The results show that UPDis is as fast, accurate and flexible as state-of-the-art techniques.
7

Visualização de dados multidimensionais referenciados utilizando projeções multidimensionais e animação / Referenced multidimensional data visualization using multidimensional projections and animation

Neves, Tácito Trindade de Araújo Tiburtino 22 August 2011 (has links)
Ferramentas e técnicas de visualização promovem uma análise de dados mais efetiva pelo fato de explorar a capacidade humana na percepção de padrões, principalmente em representações gráficas. Muitos fenômenos são associados a algum tipo de referência, temporal ou geográfica, que pode oferecer informação importante quando são submetidos a processos de análise. Este trabalho aborda representações visuais de dados geradas por técnicas de projeção multidimensional, e propõe uma estratégia para o tratamento diferenciado das referências temporais ou geográficas presentes em conjuntos de dados, no processo de gerar uma projeção multidimensional. Foi proposta e implementada uma variação da técnica Least Square Projection (LSP) que evidencia a informação das referências e permite ao usuário interagir com os mapas visuais gerados, bem como diversas funcionalidades que auxiliam no processo de análise exploratória. A nova abordagem é ilustrada por meio de estudos de caso envolvendo bases de dados temporais e com referências geográficas, em que foi possível observar o comportamento global dos elementos, bem como comportamentos de elementos ou grupos de elementos de interesse. Limitações da estratégia proposta também são discutidas / Visualization tools and techniques promote more effective data analysis by exploiting the human visual perception capabilities in detecting patterns in graphical representations. Many phenomena generate data that include temporal or geographical references, which are likely to provide important information in data analysis procedures. This work addresses data visualizations generated with multidimensional projections, proposing a strategy to handle temporal and geographical references present in multidimensional data sets, when generating multidimensional projections. The Least Squares Projection (LSP) technique was extended to explicitly handle the reference information and represent it in the visual maps, and a set of supporting analysis functions have been implemented. The proposed approach is illustrated through case studies on multidimensional data sets, in which it was possible to observe the global behavior of the elements, as well as individual behavior of elements or groups of elements of interest
8

Visualização de dados multidimensionais referenciados utilizando projeções multidimensionais e animação / Referenced multidimensional data visualization using multidimensional projections and animation

Tácito Trindade de Araújo Tiburtino Neves 22 August 2011 (has links)
Ferramentas e técnicas de visualização promovem uma análise de dados mais efetiva pelo fato de explorar a capacidade humana na percepção de padrões, principalmente em representações gráficas. Muitos fenômenos são associados a algum tipo de referência, temporal ou geográfica, que pode oferecer informação importante quando são submetidos a processos de análise. Este trabalho aborda representações visuais de dados geradas por técnicas de projeção multidimensional, e propõe uma estratégia para o tratamento diferenciado das referências temporais ou geográficas presentes em conjuntos de dados, no processo de gerar uma projeção multidimensional. Foi proposta e implementada uma variação da técnica Least Square Projection (LSP) que evidencia a informação das referências e permite ao usuário interagir com os mapas visuais gerados, bem como diversas funcionalidades que auxiliam no processo de análise exploratória. A nova abordagem é ilustrada por meio de estudos de caso envolvendo bases de dados temporais e com referências geográficas, em que foi possível observar o comportamento global dos elementos, bem como comportamentos de elementos ou grupos de elementos de interesse. Limitações da estratégia proposta também são discutidas / Visualization tools and techniques promote more effective data analysis by exploiting the human visual perception capabilities in detecting patterns in graphical representations. Many phenomena generate data that include temporal or geographical references, which are likely to provide important information in data analysis procedures. This work addresses data visualizations generated with multidimensional projections, proposing a strategy to handle temporal and geographical references present in multidimensional data sets, when generating multidimensional projections. The Least Squares Projection (LSP) technique was extended to explicitly handle the reference information and represent it in the visual maps, and a set of supporting analysis functions have been implemented. The proposed approach is illustrated through case studies on multidimensional data sets, in which it was possible to observe the global behavior of the elements, as well as individual behavior of elements or groups of elements of interest
9

Um estudo sobre o papel de medidas de similaridade em visualização de coleções de documentos / A study on the role of similarity measures in visual text analytics

Salazar, Frizzi Alejandra San Roman 27 September 2012 (has links)
Técnicas de visualização de informação, tais como as que utilizam posicionamento de pontos baseado na similaridade do conteúdo, são utilizadas para criar representações visuais de dados que evidenciem certos padrões. Essas técnicas são sensíveis à qualidade dos dados, a qual, por sua vez, depende de uma etapa de pré-processamento muito influente. Esta etapa envolve a limpeza do texto e, em alguns casos, a detecção de termos e seus pesos, bem como a definição de uma função de (dis)similaridade. Poucos são os estudos realizados sobre como esses cálculos de (dis)similaridade afetam a qualidade das representações visuais geradas para dados textuais. Este trabalho apresenta um estudo sobre o papel das diferentes medidas de (dis)similaridade entre pares de textos na geração de mapas visuais. Nos concentramos principalmente em dois tipos de funções de distância, aquelas computadas a partir da representação vetorial do texto (Vector Space Model (VSM)) e em medidas de comparação direta de strings textuais. Comparamos o efeito na geração de mapas visuais com técnicas de posicionamento de pontos, utilizando as duas abordagens. Para isso, foram utilizadas medidas objetivas para comparar a qualidade visual dos mapas, tais como Neighborhood Hit (NH) e Coeficiente de Silhueta (CS). Descobrimos que ambas as abordagens têm pontos a favor, mas de forma geral, o VSM apresentou melhores resultados quanto à discriminação de classes. Porém, a VSM convencional não é incremental, ou seja, novas adições à coleção forçam o recálculo do espaço de dados e das dissimilaridades anteriormente computadas. Nesse sentido, um novo modelo incremental baseado no VSM (Incremental Vector Space Model (iVSM)) foi considerado em nossos estudos comparativos. O iVSM apresentou os melhores resultados quantitativos e qualitativos em diversas configurações testadas. Os resultados da avaliação são apresentados e recomendações sobre a aplicação de diferentes medidas de similaridade de texto em tarefas de análise visual, são oferecidas / Information visualization techniques, such as similarity based point placement, are used for generating of visual data representation that evidence some patterns. These techniques are sensitive to data quality, which depends of a very influential preprocessing step. This step involves cleaning the text and in some cases, detecting terms and their weights, as well as definiting a (dis)similarity function. There are few studies on how these (dis)similarity calculations aect the quality of visual representations for textual data. This work presents a study on the role of the various (dis)similarity measures in generating visual maps. We focus primarily on two types of distance functions, those based on vector representations of the text (Vector Space Model (VSM)) and measures obtained from direct comparison of text strings, comparing the effect on the visual maps obtained with point placement techniques with the two approaches. For this, objective measures were employed to compare the visual quality of the generated maps, such as the Neighborhood Hit and Silhouette Coefficient. We found that both approaches have strengths, but in general, the VSM showed better results as far as class discrimination is concerned. However, the conventional VSM is not incremental, i.e., new additions to the collection force the recalculation of the data space and dissimilarities previously computed. Thus, a new model based on incremental VSM (Incremental Vector Space Model (iVSM)) has been also considered in our comparative studies. iVSM showed the best quantitative and qualitative results in several of the configurations considered. The evaluation results are presented and recommendations on the application of different similarity measures for text analysis tasks visually are provided
10

Um estudo sobre o papel de medidas de similaridade em visualização de coleções de documentos / A study on the role of similarity measures in visual text analytics

Frizzi Alejandra San Roman Salazar 27 September 2012 (has links)
Técnicas de visualização de informação, tais como as que utilizam posicionamento de pontos baseado na similaridade do conteúdo, são utilizadas para criar representações visuais de dados que evidenciem certos padrões. Essas técnicas são sensíveis à qualidade dos dados, a qual, por sua vez, depende de uma etapa de pré-processamento muito influente. Esta etapa envolve a limpeza do texto e, em alguns casos, a detecção de termos e seus pesos, bem como a definição de uma função de (dis)similaridade. Poucos são os estudos realizados sobre como esses cálculos de (dis)similaridade afetam a qualidade das representações visuais geradas para dados textuais. Este trabalho apresenta um estudo sobre o papel das diferentes medidas de (dis)similaridade entre pares de textos na geração de mapas visuais. Nos concentramos principalmente em dois tipos de funções de distância, aquelas computadas a partir da representação vetorial do texto (Vector Space Model (VSM)) e em medidas de comparação direta de strings textuais. Comparamos o efeito na geração de mapas visuais com técnicas de posicionamento de pontos, utilizando as duas abordagens. Para isso, foram utilizadas medidas objetivas para comparar a qualidade visual dos mapas, tais como Neighborhood Hit (NH) e Coeficiente de Silhueta (CS). Descobrimos que ambas as abordagens têm pontos a favor, mas de forma geral, o VSM apresentou melhores resultados quanto à discriminação de classes. Porém, a VSM convencional não é incremental, ou seja, novas adições à coleção forçam o recálculo do espaço de dados e das dissimilaridades anteriormente computadas. Nesse sentido, um novo modelo incremental baseado no VSM (Incremental Vector Space Model (iVSM)) foi considerado em nossos estudos comparativos. O iVSM apresentou os melhores resultados quantitativos e qualitativos em diversas configurações testadas. Os resultados da avaliação são apresentados e recomendações sobre a aplicação de diferentes medidas de similaridade de texto em tarefas de análise visual, são oferecidas / Information visualization techniques, such as similarity based point placement, are used for generating of visual data representation that evidence some patterns. These techniques are sensitive to data quality, which depends of a very influential preprocessing step. This step involves cleaning the text and in some cases, detecting terms and their weights, as well as definiting a (dis)similarity function. There are few studies on how these (dis)similarity calculations aect the quality of visual representations for textual data. This work presents a study on the role of the various (dis)similarity measures in generating visual maps. We focus primarily on two types of distance functions, those based on vector representations of the text (Vector Space Model (VSM)) and measures obtained from direct comparison of text strings, comparing the effect on the visual maps obtained with point placement techniques with the two approaches. For this, objective measures were employed to compare the visual quality of the generated maps, such as the Neighborhood Hit and Silhouette Coefficient. We found that both approaches have strengths, but in general, the VSM showed better results as far as class discrimination is concerned. However, the conventional VSM is not incremental, i.e., new additions to the collection force the recalculation of the data space and dissimilarities previously computed. Thus, a new model based on incremental VSM (Incremental Vector Space Model (iVSM)) has been also considered in our comparative studies. iVSM showed the best quantitative and qualitative results in several of the configurations considered. The evaluation results are presented and recommendations on the application of different similarity measures for text analysis tasks visually are provided

Page generated in 0.1085 seconds