Spelling suggestions: "subject:"multidimensional""
11 |
Uma abordagem de visualização híbrida para apoiar a exploração de conjuntos de dados / A hybrid visualization approach to support the exploration of data setsSilva, Lenon Fachiano 22 January 2018 (has links)
Submitted by Lenon Fachiano (lenon_fachiano@hotmail.com) on 2018-05-09T17:37:15Z
No. of bitstreams: 1
abntex2-LenonFachiano.pdf: 5626662 bytes, checksum: e8f64d248c338cf11e9e65b08961374f (MD5) / Approved for entry into archive by Elza Mitiko Sato null (elzasato@ibilce.unesp.br) on 2018-05-09T17:50:40Z (GMT) No. of bitstreams: 1
silva_lf_me_sjrp_int.pdf: 5626662 bytes, checksum: e8f64d248c338cf11e9e65b08961374f (MD5) / Made available in DSpace on 2018-05-09T17:50:40Z (GMT). No. of bitstreams: 1
silva_lf_me_sjrp_int.pdf: 5626662 bytes, checksum: e8f64d248c338cf11e9e65b08961374f (MD5)
Previous issue date: 2018-01-22 / Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES) / Técnicas de visualização têm sido largamente utilizadas na exploração de conjuntos de dados. Uma estratégia comum é empregar diferentes técnicas para facilitar a investigação, permitindo que o usuário tenha diferentes perspectivas de um mesmo conjunto de dados. Nessas situações, um mecanismo de coordenação auxilia o usuário na troca de contexto entre diferentes visões. Adicionalmente, uma estratégia adotada por algumas abordagens é a de combinar diferentes técnicas de visualização em uma única visão, criando uma visualização híbrida. Este trabalho apresenta o desenvolvimento de uma abordagem de visualização híbrida que utiliza uma técnica de visualização para destacar o relacionamento entre instâncias com outra técnica de visualização para destacar o relacionamento entre atributos. Como resultado, foi obtida uma metodologia de combinação de técnicas que apoia o processo de exploração de conjuntos de dados multidimensionais e auxilia no entendimento do espaço de característica, permitindo a detecção de fronteiras compartilhadas entre agrupamentos e a resolução de problemas de rotulação. / Visualization Techniques have been widely used in the exploration of datasets. A common strategy is to employ different techniques to facilitate research, allowing the user to have different perspectives from the same dataset. In these situations, a coordination mechanism helps the user in the exchange of context between different visions. In addition, a strategy adopted by some approaches is to combine different visualizations into a single view, creating a hybrid visualization. This paper shows the development of a hybrid visualization approach that uses a visualization technique to highlight the relationship between instances with another to highlight the relationship between attributes. This approach supports the process of exploring multidimensional datasets and assists in understanding the featuring space, allowing the detection of shared boundaries between groupings and the resolution of labeling problems. As a result, a methodology combining techniques was developed that supports the process of exploring multidimensional data sets and helps in understanding the characteristic space, allowing the detection of shared boundaries between groupings and the resolution of labeling problems.
|
12 |
Visualizing multidimensional data similarities: improvements and applications / Visualizando similaridades em dados multidimensionais: melhorias e aplicaçõesRenato Rodrigues Oliveira da Silva 05 December 2016 (has links)
Multidimensional datasetsare increasingly more prominent and important in data science and many application domains. Such datasets typically consist of a large set of observations, or data points, each which is described by several measurements, or dimensions. During the design of techniques and tools to process such datasets, a key component is to gather insights into their structure and patterns, a goal which is targeted by multidimensional visualization methods. Structures and patterns of high-dimensional data can be described, at a core level, by the notion of similarity of observations. Hence, to visualize such patterns, we need effective and efficient ways to depict similarity relations between a large number of observations, each having a potentially large number of dimensions. Within the realm of multidimensional visualization methods, two classes of techniques exist projections and similarity trees which effectively capture similarity patterns and also scale well to the number of observations and dimensions of the data. However, while such techniques show similarity patterns, understanding and interpreting these patterns in terms of the original data dimensions is still hard. This thesis addresses the development of visual explanatory techniques for the easy interpretation of similarity patterns present in multidimensional projections and similarity trees, by several contributions. First, we proposemethodsthat make the computation of similarity treesefficient for large datasets, and also allow their visual explanation on a multiscale, or several levels of detail. We also propose ways to construct simplified representations of similarity trees, thereby extending their visual scalability even further. Secondly, we propose methods for the visual explanation of multidimensional projections in terms of automatically detected groups of related observations which are also automatically annotated in terms of their similarity in the high-dimensional data space. We show next how these explanatory mechanismscan be adapted to handle both static and time-dependent multidimensional datasets. Our proposed techniques are designed to be easy to use, work nearly automatically, handle any typesof quantitativemultidimensional datasets and multidimensional projection techniques, and are demonstrated on a variety of real-world large datasets obtained from image collections, text archives, scientific measurements, and software engineeering. / Conjuntos de dados multidimensionais são cada vez mais proeminentes e importantes em data science e muitos domínios de aplicação. Esses conjuntos de dados são tipicamente constituídos de um grande número de observações, ou objetos, cada qual descrito por várias medidas, ou dimensões. Durante o projeto de técnicas e ferramentas para processar tais dados, um dos focos principais é prover meios para análise e levantamento de hipóteses a partir das principais estruturas e padrões. Esse objetivo é perseguido por métodos de visualização multidimensional. Estruturas e padrões em dados multidimensionais podem ser descritos, em linhas gerais, pela noção de similaridade das observações. Portanto, para visualizar esses padrões, precisamos de meios efetivos e eficientes para retratar relações de similaridade dentre um grande número de observações, que potencialmente possuem um grande número de dimensões cada. No contexto dos métodos de visualização multidimensional, existem duas categorias de técnicas projeções e árvores de similaridade que efetivamente capturam padrões de similaridade e oferecem boa escalabilidade, tanto para o número de observações e quanto de dimensões. No entanto, embora essas técnicas exibam padrões de similaridade, o entendimento e interpretação desses padrões, em termos das dimensões originais dos dados, ainda é difícil. O trabalho desenvolvido nessa tese visa o desenvolvimento de técnicas explicativas para a fácil interpretação de padrões de similaridade presentes em projeções multidimensionais e árvores de similaridade. Primeiro, propomos métodos que possibilitam a computação eficiente de árvores de similaridade para grandes conjuntos de dados, e também a sua explicação visual em multiescala, ou seja, em vários níveis de detalhe. Também propomos modos de construir representações simplificadas de árvores de similaridade, e desse modo estender ainda mais a sua escalabilidade visual. Segundo, propomos métodos para explicar visualmente projeções multidimensionais em termos de grupos de observações relacionadas, detectadas e anotadas automaticamente para explicitar aspectos de sua similaridade no espaço de alta dimensionalidade. Mostramos em seguida como esses mecanismos explicativos podem ser adaptados para lidar com dados de natureza estática e dependentes no tempo. Nossas técnicas sã construídas visando fácil utilização, funcionamento semi automático, aplicação em quaisquer tipos de dados multidimensionais quantitativos e quaisquer técnicas de projeção multidimensional. Demonstramos a sua utilização em uma variedade de conjuntos de dados reais, obtidos a partir de coleções de imagens, arquivos textuais, medições científicas e de engenharia de software.
|
13 |
Empregando técnicas de projeção multidimensional para transformação interativa de espaços de características / Employing multidimensional projection techniques for interactive transformation of features spacesGladys Marleny Hilasaca Mamani 24 October 2012 (has links)
A tecnologia atual permite armazenar grandes quantidades de dados, no entanto sua exploração e compreensão resultam em um enorme desafio devido não só ao tamanho dos conjuntos produzidos mas também sua complexidade. Nesse sentido a visualização de informação vem se mostrando um recurso extremamente poderoso para ajudar a interpretar e extrair informação útil desse universo de dados. Dentre as abordagens existentes, as tecnicas de projeção multidimensional estão emergindo como um instrumento de visualização importante em aplicações que implicam a análise visual de dados de alta dimensão devido ao poder analítico que essas oferecem na exploração de relações de similaridade e correlação de dados abstratos. Contudo, os resultados obtidos por tais técnicas estão intimamente ligados à qualidade do espaço de características que descrevem os dados sendo processados. Se o espaço for bem formado e refletir as relações de similaridade esperadas por um usuário, os resultados nais serão satisfatórios. Caso contrário pouca utilidade terão as representações visuais geradas. Neste projeto de mestrado técnicas de projeção multidimensional são empregadas, para, não somente explorar conjuntos de dados multidimensionais, mas também para servir como um guia em um processo que visa \"moldar\" espaços de características. A abordagem proposta se baseia na combinação de projeções de amostras e mapeamentos locais, permitindo ao usuário de forma interativa transformar os atributos dos dados por meio da modicação dessas projeções. Mais especicamente, as novas relações de similaridade criadas pelo usuário na manipulação das projeções das amostras são propagadas para o espaço de característica que descreve os dados, transformando-o em um novo espaço que reflita essas relações, ou seja, o ponto de vista do usuário sobre as semelhanças e diferenças presentes nos dados. Resultados experimentais mostram que a abordagem desenvolvida nesse projeto pode com sucesso transformar espaços de características com base na manipulação da projeção de pequenas amostras, melhorando a coesão e separação de grupos. Com base no ferramental criado, um sistema de recuperação de imagens por conteúdo e sugerido, mostrando que a abordagem desenvolvida pode ser bastante útil nesse tipo de aplicação / Although the current technology allows storing large volumes of data, their exploration and understanding remains as challenges not only due to the size of the produced datasets but also their complexity. In this sense, the information visualization has proven to be an extremely powerful instrument to help users to interpret and extract useful information from this universe of data. Among the existing approaches, multidimensional projection techniques are emerging as an important visualization tool in applications involving visual analysis of high dimensional data due to the analytical power that these techniques oer in the exploitation of similarity relations and abstract data correlation. However, the results obtained by these techniques are closely tied to the quality of the feature space which describes the data being processed. If the space is well formed and reflect the similarity relations expected by an user, the nal results will be satisfactory. Otherwise, little utility will have the created visual representations. In this master\'s project, multidimensional projections techniques are employed not only to explore multidimensional data sets, but also to serve as a guide in a process that aims to \"mold\" features spaces. The proposed approach is based on the combination of projections of samples and local mappings, allowing the user to interactively transform the data attributes by modifying these projections. Specifically, the new similarity relations created by the user in manipulating the projections of the samples are propagated to the feature space that describes the data, transforming it into a new space that reflects these relationships, i.e., the point of view of the user about the similarities and dierences in the data. Experimental results show that the approach developed in this project can successfully transform feature spaces based on the manipulation of projections of small samples, improving the cohesion and separation of groups. Based on the created framework, a content-based image retrieval system is suggested, showing that the developed approach can be very useful in this type of application
|
14 |
Explanatory visualization of multidimensional prejections / Visualização explanatória de projeções multidimensionaisRafael Messias Martins 11 March 2016 (has links)
Visual analytics tools play an important role in the scenario of big data solutions, combining data analysis and interactive visualization techniques in effective ways to support the incremental exploration of large data collections from a wide range of domains. One particular challenge for visual analytics is the analysis of multidimensional datasets, which consist of many observations, each being described by a large number of dimensions, or attributes. Finding and understanding data-related patterns present in such spaces, such as trends, correlations, groups of related observations, and outliers, is hard. Dimensionality reduction methods, or projections, can be used to construct low (two or three) dimensional representations of high-dimensional datasets. The resulting representation can then be used as a proxy for the visual interpretation of the high-dimensional space to efficiently and effectively support the above-mentioned data analysis tasks. Projections have important advantages over other visualization techniques for multidimensional data, such as visual scalability, high degree of robustness to noise and low computational complexity. However, a major obstacle to the effective practical usage of projections relates to their difficult interpretation. Two main types of interpretation challenges for projections are studied in this thesis. First, while projection techniques aim to preserve the so-called structure of the original dataset in the final produced layout, and effectively achieve the proxy effect mentioned earlier, they may introduce a certain amount of errors that influence the interpretation of their results. However, it is hard to convey to users where such errors occur in the projection, how large they are, and which specific data-interpretation aspects they affect. Secondly, interpreting the visual patterns that appear in the projection space is far from trivial, beyond the projections ability to show groups of similar observations. In particular, it is hard to explain these patterns in terms of the meaning of the original data dimensions. In this thesis we focus on the design and development of novel visual explanatory techniques to address the two interpretation challenges of multidimensional projections outlined above. We propose several methods to quantify, classify, and visually represent several types of projection errors, and how their explicit depiction helps interpreting data patterns. Next we show how projections can be visually explained in terms of the highdimensional data attributes, both in a global and a local way. Our proposals are designed to be easily added, and used with, any projection technique, and in any application context using such techniques. Their added value is demonstrated by presenting several exploration scenarios involving various types of multidimensional datasets, ranging from measurements, scientific simulations, software quality metrics, software system structure, and networks. / Ferramentas de análise visual desempenham um papel importante no cenário de soluções para grandes volumes de dados (big data), combinando análise de dados e técnicas interativas de visualização de forma eficaz para apoiar a exploração incremental de coleções de dados em diversos domínios. Um desafio importante em análise visual é a exploração de conjuntos de dados multidimensionais, que consistem em muitas observações, sendo cada uma descrita por um grande número de dimensões, ou atributos. Encontrar e compreender os padrões presentes em tais espaços, tais como tendências, correlações, grupos de observações relacionadas e valores extremos, é difícil. Técnicas de redução de dimensionalidade ou projeções são utilizadas para construir, a partir de conjuntos de dados multidimensionais, representações de duas ou três dimensões que podem então ser utilizadas com substitutas do espaço original para sua interpretação visual, apoiando de forma eficiente as tarefas de análise de dados acima mencionadas. Projeções apresentam vantagens importantes sobre outras técnicas de visualização para dados multidimensionais, tais como escalabilidade visual, resistência a ruídos e baixa complexidade computacional. No entanto, um grande obstáculo para o uso prático de projeções vem da sua difícil interpretação. Dois principais tipos de desafios de interpretação de projeções são estudados nesta tese. Em primeiro lugar, mesmo que as técnicas de projeção tenham como objetivo preservar, na representação final, a estrutura do conjunto de dados original, elas podem introduzir uma certa quantidade de erros que influenciam a interpretação dos seus resultados. No entanto, é difícil transmitir aos usuários onde tais erros ocorrem na projeção, quão severos eles são e que aspectos específicos da interpretação dos dados eles afetam. Em segundo lugar, interpretar os padrões visuais que aparecem em uma projeção, além da percepção de grupos de observações semelhantes, está longe de ser trivial. Em particular, é difícil explicar tais padrões em termos do significado das dimensões dos dados originais. O trabalho desenvolvido nesta tese concentra-se no projeto e desenvolvimento de novas técnicas visuais explicativas para lidar com os dois desafios de interpretação de projeções multidimensionais descritos acima. São propostos alguns métodos para quantificar, classificar e representar visualmente diversos tipos de erros de projeção, e é descrito como essas representações explícitas ajudam na interpretação dos padrões dos dados. Além disso, também são propostas técnicas visuais para explicar projeções em termos dos atributos dos dados multidimensionais, tanto de forma global quanto local. As propostas apresentadas foram concebidas para serem facilmente incorporadas e usadas com qualquer técnica de projeção e em qualquer contexto de aplicação. As contribuições são demonstradas pela apresentação de vários cenários de exploração, envolvendo vários tipos de conjuntos de dados multidimensionais, desde medições e simulações científicas até métricas de qualidade de software, estruturas de sistema de software e redes.
|
15 |
Seleção de características apoiada por mineração visual de dados / Feature selection supported by visual data miningBotelho, Glenda Michele 17 February 2011 (has links)
Devido ao crescimento do volume de imagens e, consequentemente, da grande quantidade e complexidade das características que as representam, surge a necessidade de selecionar características mais relevantes que minimizam os problemas causados pela alta dimensionalidade e correlação e que melhoram a eficiência e a eficácia das atividades que utilizarão o conjunto de dados. Existem diversos métodos tradicionais de seleção que se baseiam em análises estatísticas dos dados ou em redes neurais artificiais. Este trabalho propõe a inclusão de técnicas de mineração visual de dados, particularmente, projeção de dados multidimensionais, para apoiar o processo de seleção. Projeção de dados busca mapear dados de um espaço m-dimensional em um espaço p-dimensional, p < m e geralmente igual a 2 ou 3, preservando ao máximo as relações de distância existentes entre os dados. Tradicionalmente, cada imagem é representada por um ponto e pontos projetados próximos uns aos outros indicam agrupamentos de imagens que compartilham as mesmas propriedades. No entanto, este trabalho propõe a projeção de características. Dessa forma, ao selecionarmos apenas algumas amostras de cada agrupamento da projeção, teremos um subconjunto de características, configurando um processo de seleção. A qualidade dos subconjuntos de características selecionados é avaliada comparando-se as projeções obtidas para estes subconjuntos com a projeção obtida com conjunto original de dados. Isto é feito quantitativamente, por meio da medida de silhueta, e qualitativamente, pela observação visual da projeção. Além da seleção apoiada por projeção, este trabalho propõe um aprimoramento no seletor de características baseado no cálculo de saliências de uma rede neural Multilayer Perceptron. Esta alteração, que visa selecionar características mais discriminantes e reduzir a quantidade de cálculos para se obter as saliências, utiliza informações provenientes dos agrupamentos de características, de forma a alterar a topologia da rede neural em que se baseia o seletor. Os resultados mostraram que a seleção de características baseada em projeção obtém subconjuntos capazes de gerar novas projeções com qualidade visual satisfatória. Em relação ao seletor por saliência proposto, este também gera subconjuntos responsáveis por altas taxas de classificação de imagens e por novas projeções com bons valores de silhueta / Due to the ever growing amount of digital images and, consequently, the quantity and complexity of your features, there has been a need to select the most relevant features so that not only problems caused by high dimensional data sets, correlated features can be minimized, and also the efficiency of the tasks that may employ such features can be enhanced. Many feature selection methods are based on statistical analysis or neural network approaches. This work proposes the addition of visual data mining techniques, particularly multidimensional data projection approaches, to aid the feature selection process. Multidimensional data projection seeks to map a m-dimensional data space onto a p-dimensional space, so that p < m, usually 2 or 3, while preserving distance relationship among data instances. Traditionally, each image is represented by a point, and points projected close to each other indicate clusters of images which share a common properties. However, this work proposes the projection of features. Hence, if we select only a few samples of each cluster of features from the projection, we will end up with a subset of features, revealing a feature selection process. The quality of the feature subset may be assessed by comparing such projections with those obtained with the original data set. This can be achieved either quantitatively, by means of silhouette measures, or qualitatively, by means of visual inspection of the projection. As well as the projection based feature selection, this work proposes an enhancement in the Multilayer Perceptron salience based feature selector. This enhancement, whose aim is to perfect the selection of more discriminant features at the expenses of less computing power, employs information from feature clusters, so as to change the topology of the neural network on which the selector is based. Results have shown that projection-based feature selection produces subsets capable of generating new data projections of satisfactory visual quality. As for the proposed salience-based selector, new subsets with high image classification rates and good silhouette measures have been reported
|
16 |
Análise espaço-temporal de data streams multidimensionais / Spatio-temporal analysis in multidimensional data streamsNunes, Santiago Augusto 06 April 2015 (has links)
Fluxos de dados são usualmente caracterizados por grandes quantidades de dados gerados continuamente em processos síncronos ou assíncronos potencialmente infinitos, em aplicações como: sistemas meteorológicos, processos industriais, tráfego de veículos, transações financeiras, redes de sensores, entre outras. Além disso, o comportamento dos dados tende a sofrer alterações significativas ao longo do tempo, definindo data streams evolutivos. Estas alterações podem significar eventos temporários (como anomalias ou eventos extremos) ou mudanças relevantes no processo de geração da stream (que resultam em alterações na distribuição dos dados). Além disso, esses conjuntos de dados podem possuir características espaciais, como a localização geográfica de sensores, que podem ser úteis no processo de análise. A detecção dessas variações de comportamento que considere os aspectos da evolução temporal, assim como as características espaciais dos dados, é relevante em alguns tipos de aplicação, como o monitoramento de eventos climáticos extremos em pesquisas na área de Agrometeorologia. Nesse contexto, esse projeto de mestrado propõe uma técnica para auxiliar a análise espaço-temporal em data streams multidimensionais que contenham informações espaciais e não espaciais. A abordagem adotada é baseada em conceitos da Teoria de Fractais, utilizados para análise de comportamento temporal, assim como técnicas para manipulação de data streams e estruturas de dados hierárquicas, visando permitir uma análise que leve em consideração os aspectos espaciais e não espaciais simultaneamente. A técnica desenvolvida foi aplicada a dados agrometeorológicos, visando identificar comportamentos distintos considerando diferentes sub-regiões definidas pelas características espaciais dos dados. Portanto, os resultados deste trabalho incluem contribuições para a área de mineração de dados e de apoio a pesquisas em Agrometeorologia. / Data streams are usually characterized by large amounts of data generated continuously in synchronous or asynchronous potentially infinite processes, in applications such as: meteorological systems, industrial processes, vehicle traffic, financial transactions, sensor networks, among others. In addition, the behavior of the data tends to change significantly over time, defining evolutionary data streams. These changes may mean temporary events (such as anomalies or extreme events) or relevant changes in the process of generating the stream (that result in changes in the distribution of the data). Furthermore, these data sets can have spatial characteristics such as geographic location of sensors, which can be useful in the analysis process. The detection of these behavioral changes considering aspects of evolution, as well as the spatial characteristics of the data, is relevant for some types of applications, such as monitoring of extreme weather events in Agrometeorology researches. In this context, this project proposes a technique to help spatio-temporal analysis in multidimensional data streams containing spatial and non-spatial information. The adopted approach is based on concepts of the Fractal Theory, used for temporal behavior analysis, as well as techniques for data streams handling also hierarchical data structures, allowing analysis tasks that take into account the spatial and non-spatial aspects simultaneously. The developed technique has been applied to agro-meteorological data to identify different behaviors considering different sub-regions defined by the spatial characteristics of the data. Therefore, results from this work include contribution to data mining area and support research in Agrometeorology.
|
17 |
PCA-tree: uma proposta para indexação multidimensional / PCA-Tree: a multidimensional access method proposalBernardina, Philipe Dalla 15 June 2007 (has links)
Com o vislumbramento de aplicações que exigiam representações em espaços multidimensionais, surgiu a necessidade de desenvolvimento de métodos de acessos eficientes a estes dados representados em R^d. Dentre as aplicações precursoras dos métodos de acessos multidimensionais, podemos citar os sistemas de geoprocessamento, aplicativos 3D e simuladores. Posteriormente, os métodos de acessos multidimensionais também apresentaram-se como uma importante ferramenta no projeto de classificadores, principalmente classificadores pelos vizinhos mais próximos. Com isso, expandiu-se o espaço de representação, que antes se limitava no máximo a quatro dimensões, para dimensionalidades superiores a mil. Dentre os vários métodos de acesso multidimensional existentes, destaca-se uma classe de métodos baseados em árvores balanceadas com representação em R^d. Estes métodos constituem evoluções da árvore de acesso unidimenisonal B-tree e herdam várias características deste último. Neste trabalho, apresentamos alguns métodos de acessos dessa classe de forma a ilustrar a idéia central destes algoritmos e propomos e implementamos um novo método de acesso, a PCA-tree. A PCA-tree utiliza uma heurística de quebra de nós baseada na extração da componente principal das amostras a serem divididas. Um hiperplano que possui essa componente principal como seu vetor normal é definido como o elemento que divide o espaço associado ao nó. A partir dessa idéia básica geramos uma estrutura de dados e algoritmos que utilizam gerenciamento de memória secundária como a B-tree. Finalmente, comparamos o desempenho da PCA-tree com o desempenho de alguns outros métodos de acesso da classe citada, e apresentamos os prós e contras deste novo método de acesso através de análise de resultados práticos. / The advent of applications demanding the representation of objects in multi-dimensional spaces fostered the development of efficient multi-dimensional access methods. Among some early applications that required multi-dimensional access methods, we can cite geo-processing systems, 3D applications and simulators. Later on, multi-dimensional access methods also became important tools in the design of classifiers, mainly of those based on nearest neighbors technique. Consequently, the dimensionality of the spaces has increased, from earlier at most four to dimensionality larger than a thousand. Among several multi-dimensional access methods, the class of approaches based on balanced tree structures with data represented in Rd has received a lot of attention. These methods constitute evolues from the B-tree for unidimensional accesses, and inherit several of its characteristics. In this work, we present some of the access methods based on balanced trees in order to illustrate the central idea of these algorithms, and we propose and implement a new multi-dimensional access method, which we call PCA-tree. It uses an heuristic to break nodes based on the principal component of the sample to be divided. A hyperplane, whose normal is the principal component, is defined as the one that will split the space represented by the node. From this basic idea we define the data structure and the algorithms for the PCA-tree employing secondary memory management, as in B-trees. Finally, we compare the performance of the PCA-tree with the performance of other methods in the cited class, and present advantages and disadvantages of the proposed access method through analysis of experimental results.
|
18 |
Comunicação e educação ambiental na construção de sentidos urbanosFalcão, Sandra Pereira 23 September 2013 (has links)
Trata-se de investigação sobre fluxos comunicacionais urbanos de cunho ambiental, em busca dos \'trânsitos discursivos multidimensionais\' (CITELLI, 2012) operados nessa interface em direção à proatividade do cidadão. Multirreferencial é o lastro teórico sobre o qual nos apoiamos, incluindo saberes da Comunicação, da Educação e da Ciência Ambiental, com destaque para Citelli (2004, 2006, 2007, 2008, 2011, 2012), Orozco Gómez (2006), Martín- Barbero (2003, 2009), Soares (2000, 2011), Castells (2003, 2011), Matos (2006, 2009, 2011), Jacobi (2000, 2008, 2010), Loureiro (2004, 2007, 2008), Berna (2010), Pontuchska e Krasilchik (2006), Ribeiro (2004) e Novicki (2002, 2007). Nosso objetivo geral é verificar e analisar os fluxos comunicacionais que conferem (ou não) permeabilidade à Comunicação Ambiental, com vista à construção de sentido e ação afirmativa em região paulistana com problemas ambientais (o distrito Vila Medeiros, São Paulo, capital). O método de Lopes (2004, 2005, 2010) para pesquisa em Comunicação, com seus níveis e fases, associado a contribuições do método Estudo do Meio (Pontuchska, 2011) conduzem o trabalho. A recolha de dados de campo se deu por meio de observação direta e registro fotográfico in loco, entrevistas com servidores públicos municipais vinculados às áreas ambiental e de Saúde Pública na região, bem como por meio de questionários aplicados aos moradores do referido distrito. Trabalhamos, quanto aos respondentes dos questionários, com uma amostra estratificada e não probabilística, constituída de 179 sujeitos de pesquisa: 57 adultos, 62 jovens do ensino médio e 60 jovens do ensino fundamental. Os resultados apontam para: a) lacunas em diversos fluxos de comunicação envolvendo o poder público e os cidadãos, os cidadãos entre si e os cidadãos e as demais instituições/entidades no lócus de pesquisa; b) necessidade de empoderamento dos cidadãos para questionar representações sedimentadas que funcionam como motor-reverso face às urgências de cuidado ambiental urbano verificadas no distrito analisado. / This research treats about urban communications flows environment-related, searching for the \'multidimensional discursive transits\' (CITELLI, 2012) that operate in this interface, seeking for the proactivity of the citizen. Multireferential is the theoretical coverage on which we support , including knowledge of Communication, Education and Environmental Science , highlights for Citelli (2004, 2006, 2007, 2008, 2011, 2012), Orozco Gómez (2006), Martín-Barbero (2003,2009), Soares (2000, 2001), Castells (2003, 2011), Matos (2006, 2009, 2011), Jacobi (2000, 2008, 2010), Loureiro (2004, 2007, 2008), Berna (2010), Pontuchska e Krasilchik (2006), Ribeiro (2004) e Novicki (2002, 2007). Our general objective is verify and analyze the communicational flows that gives (or not) permeability to the Environmental Communication, aiming the construction of meaning and affirmative action on São Paulo´s region with environmental problems (Vila Medeiros´s District, São Paulo, capital). The Lopes´s method (2004, 2005, 2010) for researches about Communication, with their levels and phases, associated with the contributions of Study of the Environment Method (Pontuchska, 2011) leads the study. The collection of the field data was through direct observation and photographic record in loco, interviews with municipal public servants bound with the environmental areas and Public Health in the region, well as through questionnaires, applied to the residents of the referred district. We work with regard to the respondents, with a non probabilistic stratified sample, constituted of 179 research subjects: 57 adults, 62 high school students and 60 elementary school students. The results points to a) gaps in various communication flows involving the government and the citizens, the citizens themselves and the citizens and the others institutions/entities in the locus of the research; b) need of empowerment of the citizens for questioning public representations sedimented that works as reverse-motor in view of the urgencies of urban environmental care verified on the analyzed district.
|
19 |
Projeções multidimensionais para a análise de fluxos de dados / Multidimensional projections for data stream analysisNeves, Tácito Trindade de Araújo Tiburtino 17 November 2016 (has links)
As técnicas de projeção multidimensional tornaram-se uma ferramenta de análise importante. Elas buscam mapear dados de um espaço multidimensional para um espaço visual, de menor dimensão, preservando as estruturas de distância ou de vizinhança no mapa visual produzido. Apesar dos recentes avanços, as técnicas existentes ainda apresentam deficiências que prejudicam a sua utilização como ferramentas exploratórias em certos domínios. Um exemplo está nos cenários streaming, nos quais os dados são produzidos e/ou coletados de forma contínua. Como a maioria das técnicas de projeção necessitam percorrer os dados mais de uma vez para produzir um layout final, e fluxos normalmente não podem ser carregados por completo em memória principal, a aplicação direta ou mesmo a adaptação das técnicas existentes em tais cenários é inviável. Nessa tese de doutorado é apresentado um novo modelo de projeção, chamado de Xtreaming, no qual as instâncias de dados são visitadas apenas uma vez durante o processo de projeção. Esse modelo é capaz de se adaptar a mudanças nos dados conforme eles são recebidos, atualizando o mapa visual para refletir as novas estruturas que surgem ao longo do tempo. Os resultados dos testes mostram que o Xtreaming é muito competitivo em termos de preservação de distâncias e tempo de execução se comparado com técnicas do estado-da-arte. Também é apresentada uma nova técnica de projeção multidimensional, chamada de User-assisted Projection Technique for Distance Information (UPDis), que foi projetada para permitir a intervenção do usuário exigindo apenas informações de distância entre as instâncias, e que é utilizada como parte do Xtreaming. Os resultados também mostram que a UPDis é tão rápida, precisa e flexível quanto as técnicas do estado-da-arte. / Multidimensional Projection techniques have become an important analytics tool. They map data from a multidimensional space into a visual space preserving the distance or neighborhood structures on the produced layout. Despite the recent advances, existing techniques still present drawbacks that impair their use as exploratory tools on certain domains. An example is the streaming scenario, in which data are captured or produced continuously. Since most projection techniques need to traverse the data more than once to produce a final layout, and streaming data typically cannot be completely loaded into the main memory, the direct use or even adaptation of the existing techniques in such scenarios is infeasible. In this dissertation, we present a novel projection model, called Xtreaming, wherein the data instances are visited only once during the projection process. This model is able to adapt itself to the changes in data as data is received, updating the visual layout to reflect the new structures that emerge over time. The tests show that Xtreaming is very competitive regarding distance preservation and running time when compared with state-of-the-art projection techniques. We also present a new multidimensional projection technique, called User-assisted Projection Technique for Distance Information (UPDis), that was designed to allow user intervention requiring only distance information between data instances. UPDis is used as part of the Xtreaming model. The results show that UPDis is as fast, accurate and flexible as state-of-the-art techniques.
|
20 |
Comunicação e educação ambiental na construção de sentidos urbanosSandra Pereira Falcão 23 September 2013 (has links)
Trata-se de investigação sobre fluxos comunicacionais urbanos de cunho ambiental, em busca dos \'trânsitos discursivos multidimensionais\' (CITELLI, 2012) operados nessa interface em direção à proatividade do cidadão. Multirreferencial é o lastro teórico sobre o qual nos apoiamos, incluindo saberes da Comunicação, da Educação e da Ciência Ambiental, com destaque para Citelli (2004, 2006, 2007, 2008, 2011, 2012), Orozco Gómez (2006), Martín- Barbero (2003, 2009), Soares (2000, 2011), Castells (2003, 2011), Matos (2006, 2009, 2011), Jacobi (2000, 2008, 2010), Loureiro (2004, 2007, 2008), Berna (2010), Pontuchska e Krasilchik (2006), Ribeiro (2004) e Novicki (2002, 2007). Nosso objetivo geral é verificar e analisar os fluxos comunicacionais que conferem (ou não) permeabilidade à Comunicação Ambiental, com vista à construção de sentido e ação afirmativa em região paulistana com problemas ambientais (o distrito Vila Medeiros, São Paulo, capital). O método de Lopes (2004, 2005, 2010) para pesquisa em Comunicação, com seus níveis e fases, associado a contribuições do método Estudo do Meio (Pontuchska, 2011) conduzem o trabalho. A recolha de dados de campo se deu por meio de observação direta e registro fotográfico in loco, entrevistas com servidores públicos municipais vinculados às áreas ambiental e de Saúde Pública na região, bem como por meio de questionários aplicados aos moradores do referido distrito. Trabalhamos, quanto aos respondentes dos questionários, com uma amostra estratificada e não probabilística, constituída de 179 sujeitos de pesquisa: 57 adultos, 62 jovens do ensino médio e 60 jovens do ensino fundamental. Os resultados apontam para: a) lacunas em diversos fluxos de comunicação envolvendo o poder público e os cidadãos, os cidadãos entre si e os cidadãos e as demais instituições/entidades no lócus de pesquisa; b) necessidade de empoderamento dos cidadãos para questionar representações sedimentadas que funcionam como motor-reverso face às urgências de cuidado ambiental urbano verificadas no distrito analisado. / This research treats about urban communications flows environment-related, searching for the \'multidimensional discursive transits\' (CITELLI, 2012) that operate in this interface, seeking for the proactivity of the citizen. Multireferential is the theoretical coverage on which we support , including knowledge of Communication, Education and Environmental Science , highlights for Citelli (2004, 2006, 2007, 2008, 2011, 2012), Orozco Gómez (2006), Martín-Barbero (2003,2009), Soares (2000, 2001), Castells (2003, 2011), Matos (2006, 2009, 2011), Jacobi (2000, 2008, 2010), Loureiro (2004, 2007, 2008), Berna (2010), Pontuchska e Krasilchik (2006), Ribeiro (2004) e Novicki (2002, 2007). Our general objective is verify and analyze the communicational flows that gives (or not) permeability to the Environmental Communication, aiming the construction of meaning and affirmative action on São Paulo´s region with environmental problems (Vila Medeiros´s District, São Paulo, capital). The Lopes´s method (2004, 2005, 2010) for researches about Communication, with their levels and phases, associated with the contributions of Study of the Environment Method (Pontuchska, 2011) leads the study. The collection of the field data was through direct observation and photographic record in loco, interviews with municipal public servants bound with the environmental areas and Public Health in the region, well as through questionnaires, applied to the residents of the referred district. We work with regard to the respondents, with a non probabilistic stratified sample, constituted of 179 research subjects: 57 adults, 62 high school students and 60 elementary school students. The results points to a) gaps in various communication flows involving the government and the citizens, the citizens themselves and the citizens and the others institutions/entities in the locus of the research; b) need of empowerment of the citizens for questioning public representations sedimented that works as reverse-motor in view of the urgencies of urban environmental care verified on the analyzed district.
|
Page generated in 0.0775 seconds