Spelling suggestions: "subject:"dados multidimensional""
11 |
Técnicas de projeção para identificação de grupos e comparação de dados multidimensionais usando diferentes medidas de similaridade / Projection techniques for group identification and multidimensional data comparison by using different similarity measuresPaulo Joia Filho 14 October 2015 (has links)
Técnicas de projeção desempenham papel importante na análise e exploração de dados multidimensionais, já que permitem visualizar informações muitas vezes ocultas na alta dimensão. Esta tese explora o potencial destas técnicas para resolver problemas relacionados à: 1) identificação de agrupamentos e 2) busca por similaridade em dados multidimensionais. Para identificação de agrupamentos foi desenvolvida uma técnica de projeção local e interativa que, além de projetar dados com ótima preservação de distâncias, permite que o usuário modifique o layout da projeção, agrupando um número reduzido de amostras representativas no espaço visual, de acordo com suas características. Os mapeamentos produzidos tendem a seguir o layout das amostras organizadas pelo usuário, facilitando a organização dos dados e identificação de agrupamentos. Contudo, nem sempre é possível selecionar ou agrupar amostras com base em suas características visuais de forma confiável, principalmente quando os dados não são rotulados. Para estas situações, um novo método para identificação de agrupamentos baseado em projeção foi proposto, o qual opera no espaço visual, garantindo que os grupos obtidos não fiquem fragmentados durante a visualização. Além disso, é orientado por um mecanismo de amostragem determinístico, apto a identificar instâncias que representam bem o conjunto de dados como um todo e capaz de operar mesmo em conjuntos de dados desbalanceados. Para o segundo problema: busca por similaridade em dados multidimensionais, uma família de métricas baseada em classes foi construída para projetar os dados, com o objetivo de minimizar a dissimilaridade entre pares de objetos pertencentes à mesma classe e, ao mesmo tempo, maximizá-la para objetos pertencentes a classes distintas. As métricas classes-específicas são avaliadas no contexto de recuperação de imagens com base em conteúdo. Com o intuito de aumentar a precisão da família de métricas classes-específicas, outra técnica foi desenvolvida, a qual emprega a teoria dos conjuntos fuzzy para estimar um valor de incerteza que é transferido para a métrica, aumentando sua precisão. Os resultados confirmam a efetividade das técnicas desenvolvidas, as quais representam significativa contribuição na tarefa de identificação de grupos e busca por similaridade em dados multidimensionais. / Projection techniques play an important role in multidimensional data analysis and exploration, since they allow to visualize information frequently hidden in high-dimensional spaces. This thesis explores the potential of those techniques to solve problems related to: 1) clustering and 2) similarity search in multidimensional data. For clustering data, a local and interactive projection technique capable of projecting data with effective preservation of distances was developed. This one allows the user to manipulate a reduced number of representative samples in the visual space so as to better organize them. The final mappings tend to follow the layout of the samples organized by the user, therefore, the user can interactively steer the projection. This makes it easy to organize and group large data sets. However, it is not always possible to select or group samples visually, in a reliable manner, mainly when handling unlabeled data. For these cases, a new clustering method based on multidimensional projection was proposed, which operates in the visual space, ensuring that clusters are not fragmented during the visualization. Moreover, it is driven by a deterministic sampling mechanism, able to identify instances that are good representatives for the whole data set. The proposed method is versatile and robust when dealing with unbalanced data sets. For the second problem: similarity search in multidimensional data, we build a family of class-specific metrics to project data. Such metrics were tailored to minimize the dissimilarity measure among objects from the same class and, simultaneously to maximize the dissimilarity among objects in distinct classes. The class-specific metrics are assessed in the context of content-based image retrieval. With the aim of increasing the precision of the class-specific metrics, another technique was developed. This one, uses the fuzzy set theory to estimate a degree of uncertainty, which is embedded in the metric, increasing its precision. The results confirm the effectiveness of the developed techniques, which represent significant contributions for clustering and similarity search in multidimensional data.
|
12 |
Transdisciplinary and inter-relationships between evaluation and development of asynchronous learning through university course participants narratives in discussion forums / Transdisciplinaridade e inter-relaÃÃes entre avaliaÃÃo e desenvolvimento da aprendizagem assÃncrona atravÃs de narrativas de cursistas universitÃrios em fÃruns de discussÃoMaria Iracema Pinho de Sousa 10 December 2015 (has links)
CoordenaÃÃo de AperfeiÃoamento de Pessoal de NÃvel Superior / Entre as mudanÃas globais enfrentadas nas pouco mais de trÃs Ãltimas dÃcadas, destacam-se as maneiras como a informaÃÃo, no espaÃo digital e na Web, à acessada, inter-relacionada e ressignificada, no aspecto da construÃÃo de novos conhecimentos e saberes. Estas mudanÃas estÃo significativamente vinculadas à quebra de paradigmas e crises entre as Ãreas de conhecimento. Neste cenÃrio, a sociedade enfrenta uma inesperada corrida de rÃpidas transformaÃÃes, fusÃes e nascimento de novas Ãreas de conhecimento interdisciplinares, carreando o processo educacional para uma contÃnua e desafiante crise. Progressivamente, o uso pedagÃgico das TIC ocupa os espaÃos da outrora educaÃÃo conservadora presencial e instrucionista, outorgando cenÃrios favorecedores à integraÃÃo pedagÃgica entre: as mÃdias, o construtivismo, a autonomia, a criatividade e o aprender juntos. Nas prÃximas dÃcadas, decorrerÃo mudanÃas significativas nas propostas de avaliaÃÃo, notadamente voltadas para o desenvolvimento da aprendizagem colaborativa, em espaÃos assÃncronos, o que suscita profundas reflexÃes, concernentes Ãs transposiÃÃes teÃrico-metodolÃgicas e prÃticas, que incidirÃo sobre a ressignificaÃÃo e relaÃÃes entre o desenvolvimento da aprendizagem e sua avaliaÃÃo. A presente investigaÃÃo, de carÃter qualitativo e de pesquisa-aÃÃo, se insere no cenÃrio do desenvolvimento de atividades pedagÃgicas colaborativas, expressas por narrativas, postadas em FÃruns de discussÃo, durante o transcurso de uma disciplina de InformÃtica na EducaÃÃo, ofertada presencialmente pelo Departamento de Fundamentos da EducaÃÃo da FACED/UFC, em que majoritariamente participaram estudantes de graduaÃÃo. A proposta didÃtica da disciplina se baseia nos pressupostos da teoria da aprendizagem significativa ausubeliana, no mapeamento cognitivo, na visÃo de Okada, e no estar junto virtual, segundo Valente e Almeida. Foram escolhidos dois de seus FÃruns temÃticos disciplinares, que abordavam as temÃticas de estudo: o uso pedagÃgico de mapas conceituais e pressupostos da avaliaÃÃo formativa da aprendizagem, numa visÃo construtivista (AUSUBEL, FERNANDES, MASETTO, PERRONOUD, ZABALA). Parte do referencial teÃrico da Tese permeia a avaliaÃÃo na forma clÃssica e contribuiÃÃes nÃo clÃssicas, que apontam para a necessidade de se repensar a avaliaÃÃo, numa Ãtica do construtivismo e da aprendizagem assÃncrona. Os conjuntos de narrativas, postados pelos estudantes, sÃo constituÃdos por dados multidimensionais fortemente entrelaÃados, que foram mapeados e analisados, sob a forma de categorias, à luz do referencial teÃrico e objetivos adotados na Tese, sob o foco da anÃlise textual discursiva (MORAES, GALIAZZI) e da anÃlise qualitativa de dados multidimensionais, fazendo-se o uso do software CHIC (ALMOULOUD, PRADO, VALENTE). Em seguida, partindo-se de uma Ãrvore de similaridade, gerada pelo CHIC, foram estabelecidas inter-relaÃÃes hierÃrquicas e relacionais, entre as categorias, organizadas em trÃs eixos temÃticos, e as narrativas dos cursistas, de modo a analisar, numa Ãtica do referencial teÃrico da Tese, como se desenvolve a aprendizagem e como a avaliaÃÃo, qualitativa e formativa, pode estar associada ao desenvolvimento da aprendizagem. Da anÃlise multidimensional das narrativas dos cursistas, numa Ãtica transdisciplinar, emergiram indÃcios preliminares de inter-relaÃÃes hierÃrquicas e relacionais, entre os trÃs campos de conhecimentos desenvolvimento da aprendizagem, avaliaÃÃo e saberes pedagÃgicos e tecnolÃgicos, e as aÃÃes pedagÃgicas vivenciadas nos FÃruns TelEduc, que questionam se repensar os pressupostos da avaliaÃÃo da aprendizagem e a convergÃncia dos futuros caminhos das prÃticas pedagÃgicas e avaliativas. / Among the global challenges, FACED during the last three decades, it is important to point
out the different ways how the information, in the digital space and on the Web, is accessed,
interrelated, in order to give a new meaning, according the aspect of building new
knowledges. These changes are meaningful linked to paradigms break and crises between the
areas of knowledge. In this scenario, the human society faces an unexpected rush of rapid
transformations, mergers and birth of new areas of interdisciplinary knowledge, leading the
educational process for continuous and challenging crisis. Progressively, the pedagogical use
of ICT occupies the space of the once classroom and instructional conservative education,
favoring granting scenarios to the pedagogical integration of: media, constructivism,
autonomy, creativity and learning together. In the coming decades, it will take significant
changes in the proposal evaluation, notably focused on the development of collaborative
learning in asynchronous spaces, which raises profound reflections, concerning the theoretical
and methodological and practice transpositions, which will focus on redefining and
relationships between learning development and its assessment. This research, that is
qualitative and action research, is included in the scenario of the development of collaborative
educational activities, expressed by narratives, posted in the TelEduc discussion Forums,
during the development of activities on a course of informatics in Education, offered by the
Department of Education Foundations of FACED/UFC, where mostly attended graduate
students. The didactic proposal of the course is based on the assumptions of the theory of
Ausubel‟s meaningful learning, cognitive mapping, in Okada's vision, and on the learning
together in the virtual space, according to Valente and Almeida. Two of his disciplinary
thematic forums were chosen which addressed the topics of study: the educational use of
concept maps and assumptions of formative assessment of learning, according the
constructivist view (AUSUBEL; FERNANDES; MASETTO; PERRENOUD; ZABALA).
Part of the Thesis theoretical framework permeates the assessment in a classical view and
non-classical contributions, what point out to the need to rethink the assessment in a
perspective of constructivism and asynchronous learning. The sets of narratives, posted by
students, are made up of multidimensional data strongly intertwined, which were mapped and
analyzed in the form of categories. This is done based on the theoretical framework and
objectives adopted in this Thesis, from the perspective of the discursive textual analysis
(MORAES; GALIAZZI) and the multi-dimensional analysis for qualitative data, making the
use of software CHIC (ALMEIDA; ALMOULOUD; VALENTE). Then, starting from a
similarity tree, generated by CHIC, hierarchical and relational interrelationships have been
established between the categories, organized into three themes, and the narratives of the
course participants. This is done in order to analyze, in a perspective of the theoretical
framework of the Thesis, how learning can be developed and how the assessment, qualitative
and formative, may be associated with the learning development. From the multidimensional
analysis of the narratives of the course participants, and according a transdisciplinary
perspective, it was emerged preliminary evidence of hierarchical and relational
interrelationships, between the knowledge fields learning development, assessment and
technological pedagogical content knowledge, and the collaborative pedagogical actions,
experienced in the TelEduc Forums, that induce to rethink the assumptions of the assessment
of learning and the future possibles ways of the pedagogical and assessment practices.
|
13 |
Aceleração de uma variação do problema k-nearest neighbors / Acceleration of a variation of the K-nearest neighbors problemMorais Neto, Jorge Peixoto de 29 January 2014 (has links)
Submitted by Luciana Ferreira (lucgeral@gmail.com) on 2014-11-25T13:07:50Z
No. of bitstreams: 2
Dissertação - Jorge Peixoto de Morais Neto - 2014.pdf: 1582808 bytes, checksum: 3115f942e2c8a9cf83601835af3af1c5 (MD5)
license_rdf: 23148 bytes, checksum: 9da0b6dfac957114c6a7714714b86306 (MD5) / Approved for entry into archive by Luciana Ferreira (lucgeral@gmail.com) on 2014-11-25T14:42:09Z (GMT) No. of bitstreams: 2
Dissertação - Jorge Peixoto de Morais Neto - 2014.pdf: 1582808 bytes, checksum: 3115f942e2c8a9cf83601835af3af1c5 (MD5)
license_rdf: 23148 bytes, checksum: 9da0b6dfac957114c6a7714714b86306 (MD5) / Made available in DSpace on 2014-11-25T14:42:09Z (GMT). No. of bitstreams: 2
Dissertação - Jorge Peixoto de Morais Neto - 2014.pdf: 1582808 bytes, checksum: 3115f942e2c8a9cf83601835af3af1c5 (MD5)
license_rdf: 23148 bytes, checksum: 9da0b6dfac957114c6a7714714b86306 (MD5)
Previous issue date: 2014-01-29 / Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - CAPES / Let M be a metric space and let P be a subset of M. The well known k-nearest neighbors
problem (KNN) consists in finding, given q 2 M, the k elements of P with are closest to
q according to the metric of M. We discuss a variation of KNN for a particular class of
pseudo-metric spaces, described as follows. Let m 2 N be a natural number and let d be
the Euclidean distance in Rm. Given p 2 Rm:
p := (p1; : : : ; pm)
let C (p) be the set of the m rotations of p’s coordinates:
C (p) := f(p1; : : : ; pm); (p2; : : : ; pm; p1); : : : ; (pm; p1; : : : ; pm1)g
we define the special distance de as:
de(p;q) := min
p02C (p)
d(p0;q):
de is a pseudo-metric, and (Rm;de) is a pseudo-metric space. The class of pseudo-metric
spaces under discussion is
f(Rm;de) j m 2 N:g
The brute force approach is too costly for instances of practical size. We present a more
efficient solution employing parallelism, the FFT (fast Fourier transform) and the fast
elimination of unfavorable training vectors.We describe a program—named CyclicKNN
—which implements this solution.We report the speedup of this program over serial brute
force search, processing reference datasets. / Seja M um espaço métrico e P um subconjunto de M. O conhecido problema k vizinhos
mais próximos (k-neareast neighbors, KNN) consiste em encontrar, dado q 2 M, os k
elementos de P mais próximos de q conforme a métrica de M. Abordamos uma variação
do problema KNN para uma classe particular de espaços pseudo-métricos, descrita a
seguir. Seja m 2 N um natural e seja d a distância euclidiana em Rm. Dado um vetor
p 2 Rm:
p := (p1; : : : ; pm)
seja C (p) o conjunto das m rotações das coordenadas de p:
C (p) := f(p1; : : : ; pm); (p2; : : : ; pm; p1); : : : ; (pm; p1; : : : ; pm1)g
definimos a distância especial de como:
de(p;q) := min
p02C (p)
d(p0;q):
de é uma pseudo-métrica, e (Rm;de) é um espaço pseudo-métrico. A classe de espaços
pseudo-métricos abordada é
(Rm;de) j m 2 N:
A solução por força bruta é cara demais para instâncias de tamanho prático. Nós apresentamos
uma solução mais eficiente empregando paralelismo, a FFT (transformada rápida
de Fourier) e a eliminação rápida de vetores de treinamento desfavoráveis. Desenvolvemos
um programa—chamado CyclicKNN—que implementa essa solução. Reportamos
o speedup desse programa em comparação com a força bruta sequencial, processando
bases de dados de referência.
|
Page generated in 0.0843 seconds