Spelling suggestions: "subject:"mineração dde dados."" "subject:"mineração dee dados.""
71 |
Seleção eficiente de conformações de receptor flexível em simulações de docagem molecularMachado, Karina dos Santos January 2011 (has links)
Made available in DSpace on 2013-08-07T18:42:55Z (GMT). No. of bitstreams: 1
000432221-Texto+Completo-0.pdf: 7126072 bytes, checksum: 4f9458bc22424532f20fd0c85208b5c7 (MD5)
Previous issue date: 2011 / Drug Development is one of the biggest challenges of current science since it deals with a process involving time and high costs. One of the most interesting problems in this area is the conformation and energy prediction between ligand and target proteins (or receptors) interaction, where such interaction is evaluated through molecular docking. It is very common to make simplifications such as to treat the receptor structure as rigid during a molecular docking. However, proteins are inherently flexible, and its flexibility is essential for its function. The inclusion of receptor flexibility in docking experiments is not a trivial task, since the allowance of mobility to some receptor atoms implies in an exponential increase in the numbers of degrees of freedom to be considered. Nowadays there are a variety of alternatives to treat this problem, as such the one chosen for this work: to consider the receptors explicit flexibility through a series of molecular docking simulations, using in each one, one different conformation (or snapshot) from a dynamic trajectory, generated by a molecular dynamic simulation (MD). This method execution, however, has the disadvantage of being very time-consuming. In doing so, the aim of this work is to contribute to the selection of receptors conformations in order to execute docking experiments faster, still taking into account the fully receptors flexibility. Besides, this work introduces new methodologies to analyze receptor-ligand interaction in this kind of docking simulations. To achieve this, it is applied a Knowledge Discovery in Databases (KDD) process. The first step required the development of a database, called FReDD. Such a database store detailed information about the receptors and its conformations, ligands and molecular docking results. From the data stored on FReDD, it was possible to apply different data mining techniques. The first set of experiments was performed with the J48 classification algorithm. The second one was executed using M5P regression algorithm, where despite the interesting results, the application of the induced models directly on snapshot selection seems to be not promising. Finally, clustering experiments were executed with 10 different algorithms with a variety of inputs. For these clustering algorithms, we developed different similarity functions where the final results, combined with the P-MIA data pattern, allowed the effective reduction in the amount of docking experiments to be performed. / O desenvolvimento de fármacos é um dos grandes desafios da ciência atual por se tratar de um processo onde os custos e o tempo envolvido são elevados. Um dos problemas mais interessantes nessa área é a predição da conformação e da energia envolvida na interação entre ligantes e suas proteínas-alvo ou receptores. É nos experimentos de docagem molecular que essa interação é avaliada. É muito comum que durante a docagem molecular se façam simplificações onde o receptor é tratado como rígido. Porém, proteínas são inerentemente sistemas flexíveis e essa flexibilidade é essencial para a sua função. A inclusão da flexibilidade do receptor em experimentos de docagem molecular não é uma tarefa trivial, pois, para permitir mobilidade a certos átomos do receptor, há um aumento exponencial do número de graus de liberdade a serem considerados. Há atualmente diversas alternativas para contornar esse problema, entre elas, a que se optou neste trabalho: considerar a flexibilidade explícita do receptor por meio da execução de uma série de simulações de docagem molecular, utilizando em cada um deles uma conformação diferente da trajetória dinâmica do receptor, gerada por uma simulação por dinâmica molecular (DM). Um dos maiores problemas desse método é o tempo necessário para executá-lo. Sendo assim, o objetivo desse trabalho é contribuir para a seleção de conformações do receptor de forma a acelerar a execução de experimentos de docagem molecular com o receptor completamente flexível. Além do mais, o trabalho apresenta novas metodologias para a análise da interação receptor-ligante em simulações de docagem deste tipo. Para alcançar esses objetivos, é aplicado um processo de descoberta de conhecimento.A primeira etapa consistiu no desenvolvimento de um banco de dados para armazenar informações detalhadas sobre o receptor e suas conformações, ligantes e experimentos de docagem molecular, chamado FReDD. Com os dados organizados no FReDD, foi possível a aplicação de diferentes técnicas de mineração de dados. O primeiro conjunto de experimentos foi realizado utilizando o algoritmo de classificação J48. O segundo conjunto de experimentos foi executado com o algoritmo de regressão M5P, onde apesar de resultados interessantes, a utilização direta para seleção de conformações em futuros experimentos de docagem molecular não se mostrou promissora. Finalmente, foram executados os experimentos de agrupamento com 10 diferentes algoritmos, com entradas variadas. Para os algoritmos de agrupamento foram desenvolvidas diferentes funções de similaridade onde os resultados finais utilizados em conjunto com o padrão de dados P-MIA permitiu a redução efetiva da quantidade de experimentos de docagem.
|
72 |
Uma arquitetura para suporte à mineração de dados paralela e distribuída em ambientes de computação de alto desempenhoBernardi, Élder Francisco Fontana January 2010 (has links)
Made available in DSpace on 2013-08-07T18:42:56Z (GMT). No. of bitstreams: 1
000431852-Texto+Completo-0.pdf: 1120851 bytes, checksum: 164e0d72a540ab33502e807a748407b1 (MD5)
Previous issue date: 2010 / In this paper, we present an architecture to support the execution of data mining applications on high performance computing environments such as clusters, SMP and grids. This architecture automates the process of parallel applications sizing, presenting tools for automatic construction of parallel tasks, automatic scheduling, managing and execution of these applications on high performance computing environments. The mechanisms created for executing mining applications make it possible to explore both data and instruction parallelism. The main contributions of this work are the organization of the proposed architecture and the creation of an algorithm for mapping parallel data mining applications on heterogeneous computational environments. The support of multi-core resources is taken on account. Furthermore, we present the parallelization of a data mining algorithm for regression. / Este trabalho apresenta uma arquitetura para suporte à execução de tarefas de mineração de dados em ambientes de computação de alto desempenho, tais como: clusters, máquinas SMP e grades. Esta arquitetura automatiza o processo de dimensionamento da aplicação paralela, criando ferramentas para a construção automática de tarefas, mapeamento, gerência e execução dessas aplicações nos recursos computacionais disponíveis. Os mecanismos criados para a execução de aplicações de mineração possibilitam a combinação do paralelismo do fluxo de dados e de instruções. Como contribuição do trabalho, destaca-se a organização da arquitetura proposta e a criação de um algoritmo para mapeamento de aplicações de mineração paralelas em ambientes computacionais heterogêneos. Enfatiza-se o suporte ao aproveitamento de recursos com múltiplos núcleos de processamento (multi-cores). Além disso, apresenta-se a paralelização de um algoritmo de mineração de dados para regressão.
|
73 |
Gestão de métricas e indicadores de doenças em saúde bucal suportado por um ambiente de descoberta de conhecimento em banco de dadosBlomberg, Luciano Costa January 2010 (has links)
Made available in DSpace on 2013-08-07T18:43:37Z (GMT). No. of bitstreams: 1
000423037-Texto+Completo-0.pdf: 1478944 bytes, checksum: d2974fba2b6145147b3c83b7003075fb (MD5)
Previous issue date: 2010 / Although the last epidemiological survey (BRAZIL, 2006) reveal a significant improvement in oral health status of the Brazilian population in the last two decades, oral diseases still require large financial investments by the federal government. This study aims to develop and document a computational approach (Knowledge Discovery in Database Process) capable of managing large volumes of data and producing more comprehensible models to support the decision making process and the formulation of improved oral health policies, as well as making new teaching and research activities in the area viable. Therefore, we analyze a sample of data concerning the dental records of 598 low-income patients, treated with one unit of PUCRS linked to the SUS (Unified Health System). The main result of this work, we identified opportunities for data mining for the extraction of predictive models applied to the analysis of periodontal diseases, malocclusion and indicators of dental caries. / Embora o último levantamento epidemiológico (BRASIL, 2006) revele uma sensível melhora na condição bucal da população brasileira nas últimas duas décadas, patologias bucais ainda demandam grandes investimentos financeiros por parte do governo federal. Este trabalho tem como objetivo desenvolver e documentar uma abordagem computacional (Knowledge Discovery in Database) capaz de gerenciar grandes volumes de dados e produzir modelos mais compreensíveis para o suporte à tomada de decisão, formulação de melhores políticas de saúde bucal, bem como a viabilização de novas atividades de ensino e pesquisa na área. Para tanto, analisamos uma amostra de dados referente às fichas odontológicas de 598 pacientes de baixa renda, atendidos junto a uma unidade da PUCRS vinculada ao SUS (Sistema Único de Saúde). Como principal resultado deste trabalho, identificamos oportunidades de data mining pela extração de modelos preditivos aplicados à análise de patologias periodontais, má-oclusão e indicadores de cárie dentária.
|
74 |
3D-Tri: um algoritmo de indução de árvore de regressão para propriedades tridimensionais - um estudo sobre dados de docagem molecular considerando a flexibilidade do receptorWinck, Ana Trindade January 2012 (has links)
Made available in DSpace on 2013-08-07T18:43:30Z (GMT). No. of bitstreams: 1
000436381-Texto+Completo-0.pdf: 5238803 bytes, checksum: ca22d61f2fb4075e277ed531aee231ce (MD5)
Previous issue date: 2012 / With the growth of biological experiments, solving and analyzing the massive amount of data being generated has been one of the challenges in bioinformatics, where one important research area is the rational drug design (RDD). The interaction between biological macromolecules called receptors, and small molecules called ligands, is the fundamental principle of RDD. In in-silico molecular docking experiments it is investigated the best bind and conformation of a ligand into a receptor. A docking result can be discriminated by a continue value called Free Energy of Binding (FEB). We are attempting on mining data from molecular docking results, aiming at selecting promising receptor conformations to the next docking experiments. In this sense, we have developed a comprehensive repository to store our molecular docking data. Having such repository, we were able to apply preprocessing strategies on the stored data and submit them to different data mining tasks. Among the techniques applied, the most promising results were obtained with regression model trees. Although we have already addressed important issues and achieved significant results, there are some properties in these experiments turning it difficult to properly select conformations. Hence, a strategy was proposed considering the three-dimensional (3D) properties of the receptor conformations, to predict FEB. This thesis presents the 3D-Tri, a novel algorithm able to handle and treat spatial coordinates in a x, y,z format, and induce a tree that predicts FEB value by representing such properties. The algorithm uses such coordinates to split a node in two parts, where the edges evaluate whether the atom being tested by the node is part of a given interval [(xi, xf );(yi, yf );(zi, zf )], where i indicates the initial position of the coordinate, and f its final position. The induced model can help a domain specialist to select promising conformations, based on the region of the atoms in the model, to perform new molecular docking experiments. / Com o avanço nos experimentos biológicos, a manipulação e análise do grande volume de dados sendo gerados por esses experimentos têm sido um dos desafios em bioinformática, onde uma importante área de pesquisa é o desenho racional de fármacos (RDD - Rational Drug Desing). A interação entre macromoléculas biológicas, chamadas de receptores, e pequenas moléculas, chamadas ligantes, é o princípio fundamental do RDD. É em experimentos in silico de docagem molecular que se investiga o melhor encaixe e conformação de um ligante em uma cavidade do receptor. O resultado de um experimento de docagem pode ser avaliado a partir de um valor contínuo de energia livre de ligação (FEB - Free Energy of Binding). Tem-se empregado esforços em minerar dados de resultados de docagem molecular, com o objetivo de selecionar conformações relevantes para reduzir o tempo de futuros experimentos de docagem. Nesse sentido, foi desenvolvido um repositório para armazenar todos os dados a respeito desses experimentos, em nível de detalhe. Com esse repositório, os dados foram devidamente pré-processados e submetidos a diferentes tarefas de mineração de dados. Dentre as técnicas aplicadas, a que apresentou-se mais promissora para o tipo de dados sendo utilizado foi árvore de decisão para regressão. Apesar dos resultados alcançados por esses experimentos serem promissores, existem algumas propriedades nos experimentos que dificultam a efetiva seleção de conformações. Dessa forma, propõe-se uma estratégia que considera as propriedades tridimensionais (3D) do receptor para predizer o valor de FEB. Assim, nesta Tese é apresentado o 3D-Tri, um algoritmo de indução de árvore de regressão que considera essas propriedades 3D, onde essas propriedades são definidas como atributos no formato x, y,z. O algoritmo proposto faz uso dessas coordenadas para dividir um nodo em duas partes, onde o átomo sendo testado para o nodo é avaliado em termos de sua posição em um bloco [(xi, xf );(yi, yf );(zi, zf )] que melhor represente sua posição no espaço, onde i indica a posição inicial de uma coordenada, e f indica a posição final. O modelo induzido pode ser útil para um especialista de domínio para selecionar conformações promissoras do receptor, tendo como base as regiões dos átomos que aparecem no modelo e que indicam melhores valores de FEB.
|
75 |
Algoritmos genéticos para seleção de atributos em problemas de classificação de processos de negócioBasgalupp, Márcio Porto January 2007 (has links)
Made available in DSpace on 2013-08-07T18:43:30Z (GMT). No. of bitstreams: 1
000399894-Texto+Completo-0.pdf: 2578031 bytes, checksum: 13c49dacd5dde6e8b24f2ef51ae6b87a (MD5)
Previous issue date: 2007 / A business process defines a set of activities along with their possible execution flows and their necessary resources. Business Intelligence (BI) projects have been show the importance of the data mining techniques to analysis, prediction and optimization of business processes. One of the most important data mining’s tasks is classification, which aims, by a training dataset or a set of training instances, the induction of a predictive model capable to associate each instance to its respective class or category. In the business process context, the aim of classification task is to understand the causes of certain behaviors and to generate models to predict the behavior and performance of these processes. Practical problem in pattern classification and knowledge discovery tasks require the selection of predictive attribute sets in order to represent the patterns which will be classified. This is because the presence of irrelevant and redundant attributes may damage the quality of classification models. When leading with business processes classification, it is recommended the use of feature selection, due to the large possible amount of attributes may be necessary to characterize a process. In addition to the attributes that are directly related to the process, it must also considered other attributes related to each process activity. Thus, this work aims the use of multiobjective genetic algorithms for feature selection upon business processes’ classification problems. The obtained results were satisfactory, considering that the criteria aimed to be optimized were improved. Specific business process domain problems were detected. These problems appears due to the presence of alternative paths and execution order of the processes flow tasks. Although those problems are not considered in the present work, we presented possible solutions to be adopted in future studies. / Um processo de negócio define um conjunto de atividades junto com os seus possíveis fluxos de execução e recursos necessários. Trabalhos da área de Business Intelligence (BI) têm destacado o papel da mineração de dados como instrumento facilitador da análise, previsão e otimização de processos de negócio. Uma das tarefas mais utilizadas da mineração de dados é a classificação, cujo objetivo é, dado um conjunto de dados ou instâncias de treino, induzir um modelo preditivo capaz de associar a cada instância sua classe ou categoria. Espera-se que este modelo seja bem sucedido na classificação de novas instâncias. No contexto de processos de negócio, o uso da classificação tem como objetivo entender as causas de determinados comportamentos e gerar modelos de predição do comportamento e do desempenho dos processos. Problemas práticos de classificação de padrões e descoberta de conhecimento requerem a seleção de subconjuntos de atributos preditivos para representar os padrões a serem classificados, pois a presença de atributos preditivos irrelevantes, redundantes ou em grande quantidade pode prejudicar a qualidade do modelo de classificação. Em classificação de processos de negócio, é bastante interessante a utilização de seleção de atributos, visto que a quantidade de atributos que caracterizam um processo pode ser enorme. Além dos atributos diretamente relacionados a uma instância de processo, também devem ser considerados os atributos pertencentes às atividades contidas neste processo. Assim, este trabalho propõe a utilização de algoritmos genéticos multiobjetivos para seleção de atributos em problemas de classificação de processos de negócio. Os resultados obtidos foram considerados satisfatórios, visto que os critérios utilizados na função de fitness, ou seja, os critérios a serem otimizados, foram melhorados. Problemas específicos do domínio de processos de negócio foram detectados. Esses problemas surgem em virtude da presença de caminhos alternativos e ordem de execução das atividades nos fluxos de processos. Embora tais problemas não sejam tratados no presente trabalho, são apresentadas possíveis soluções a serem abordadas em trabalhos futuros.
|
76 |
Desenvolvimento de um modelo de mineração de dados educacionais para identificar a ocorrência de colaboração onlineMoraes Neto, Antonio Justiniano de 17 March 2016 (has links)
Dissertação (mestrado)—Universidade de Brasília, Faculdade de Educação, Programa de Pós-Graduação em Educação, 2016. / Submitted by Fernanda Percia França (fernandafranca@bce.unb.br) on 2016-05-19T15:50:22Z
No. of bitstreams: 1
2016_AntonioJustinianodeMoraesNeto.pdf: 3330543 bytes, checksum: 7b9de4d5f8c78be622c950726dc170ed (MD5) / Approved for entry into archive by Marília Freitas(marilia@bce.unb.br) on 2016-05-26T16:55:41Z (GMT) No. of bitstreams: 1
2016_AntonioJustinianodeMoraesNeto.pdf: 3330543 bytes, checksum: 7b9de4d5f8c78be622c950726dc170ed (MD5) / Made available in DSpace on 2016-05-26T16:55:41Z (GMT). No. of bitstreams: 1
2016_AntonioJustinianodeMoraesNeto.pdf: 3330543 bytes, checksum: 7b9de4d5f8c78be622c950726dc170ed (MD5) / A Educação Profissional e Tecnológica (EPT) oferece a possibilidade de elevação da escolaridade para os trabalhadores, aumentando as chances de inserção e de ascensão cidadãs na sociedade contemporânea. A Educação a Distância (EAD) permite mais flexibilidade de tempo para que o trabalhador possa realizar seus estudos em momentos diferenciados da forma como são ofertados os cursos presenciais. Nesse contexto ocorre o consequente crescimento dos cursos da EPT oferecidos a distância, nos quais a aprendizagem colaborativa permite a construção do conhecimento de forma coletiva, propiciando o estreitamento das relações em Ambiente Virtual de Aprendizagem (AVA). Esta pesquisa propõe um modelo de Mineração de Dados Educacionais (EDM) para identificar a ocorrência de colaboração online em cursos a distância de EPT, adotando procedimentos metodológicos da EDM e de estudo de caso em pesquisa educacional. A análise dos dados coletados leva a concluir que o modelo de EDM proposto nesta pesquisa identifica ocorrências de colaboração online nos cursos pesquisados, contribuindo para a prática pedagógica de adoção da aprendizagem colaborativa online no âmbito da EAD praticada na EPT. Ao mesmo tempo esta pesquisa indica novas áreas de investigação a partir do modelo de EDM proposto a fim de permitir sua ampliação, como a análise semântica para identificar níveis de maior ou menor percentual de colaboração, o desenvolvimento de uma topologia da colaboração que identifique o número de interações entre estudantes e professor sobre um mesmo tema de discussão e outras mais. ________________________________________________________________________________________________ ABSTRACT / Technological and Professional Education (Portuguese acronym: EPT) offers the possibility for workers to raise their educational level, increasing the chances of integration and social ascension in contemporary society. Distance Education (Portuguese acronym: EAD) allows more time flexibility for the student to undertake his studies in different moments of those offered in classroom courses. EPT courses flourish in this context, allowing the collective knowledge construction through collaborative learning. This leads to the relations strengthening in the Virtual Learning Environment (Portuguese acronym: AVA). This research proposes a model of Educational Data Mining (EDM) aimed to identify the occurrence of online collaboration in distance learning EPT courses through methodological procedures of EDM and educational research case studies. The performed data analysis leads to the conclusion that the proposed model is capable of indicating online collaboration among the researched courses’ students. In addition, the verified results further contribute to the pedagogical practice of online collaborative learning adoption within the EAD practiced in EPT. At the same time, this research indicates new areas for research to allow the proposed data mining model’s expansion, such as the use of semantic analysis to identify levels of collaboration (greater or lesser), or the development of a collaboration topology which identifies the amount of interactions between students and teachers on the same discussion topic and others.
|
77 |
Extrator de termos para criação de mapas conceituaisDalmolin, Luiz Claudio Duarte 25 October 2012 (has links)
Dissertação (mestrado) - Universidade Federal de Santa Catarina, Centro Tecnológico, Programa de Pós-Graduação em Ciência da Computação, Florianópolis, 2010. / Made available in DSpace on 2012-10-25T00:51:45Z (GMT). No. of bitstreams: 1
278054.pdf: 2763537 bytes, checksum: 761ccdc8c89d06e0c2db71a56bd0beb4 (MD5) / Este trabalho consiste no desenvolvimento de um método para extração de termos que podem ser utilizados para a criação de mapas conceituais. O método é fundamentado em técnicas linguísticas e estatísticas para a extração de palavras-chave que podem ser usadas para originar esses tipos de mapas. Parte do método compreende um algoritmo de mineração de texto que, a partir de um conjunto de documentos selecionados pelo usuário, é capaz de extrair termos que podem ser qualificados como conceitos. Esse algoritmo pode também obter conectores semânticos entre conceitos, formando uma proposição válida sobre o tema dos documentos cadastrados. Para aplicar as funcionalidades propostas no método, foi concebida a ferramenta MapXtractor. Esta ferramenta implementa o método de extração, permite a edição de mapas conceituais, a vinculação de objetos de aprendizagem aos conceitos e o controle de acesso aos mapas. Os resultados obtidos com a utilização desse método demonstram quantitativamente e qualitativamente a superioridade da utilização de técnicas híbridas de extração de termos em relação às técnicas estatísticas para extração de termos, quando se trata da criação de mapas conceituais. / This work consists in a development of a term extraction method to create conceptual maps. This method is based in linguistic and statistics techniques to extract keywords that can be used to build conceptual maps. A part of this method is compose by a textmining algorithm which is able to extract concepts from a set of documents, selected or created by an user. This algorithm also can extract semantic connectors between two concepts becoming a valid proposition in the documents' subject . To apply the features propose on the method a tool called MapXtractor was developed. This tool implements the extraction method, allows editing concept maps and link learning objects to concepts, and the access controls to the concept maps. The results show the qualitative and quantitative superiority of hybrid techniques over statistical techniques to term extraction when applied to concept map building.
|
78 |
Um Modelo de descoberta de conhecimento inerente à evolução temporal dos relacionamentos entre elementos textuaisBovo, Alessandro Botelho 25 October 2012 (has links)
Tese (doutorado) - Universidade Federal de Santa Catarina, Centro Tecnológico, Programa de Pós-Graduação em Engenharia e Gestão do Conhecimento, Florianópolis, 2011 / Made available in DSpace on 2012-10-25T21:06:31Z (GMT). No. of bitstreams: 1
290620.pdf: 2825568 bytes, checksum: 9be8be63fe404cee4f1b376e58cc501d (MD5) / Há algum tempo tem sido observado e discutido o aumento expressivo na quantidade de informação produzida e publicada pelo mundo. Se por um lado essa situação propicia muitas oportunidades de uso dessa informação para a tomada de decisão, por outro, lança muitos desafios em como armazenar, recuperar e transformar essa informação em conhecimento. Umas das formas de descoberta de conhecimento que tem atraído atenção de pesquisadores é a análise dos relacionamentos presentes nas informações disponíveis. Não obstante, devido à grande velocidade de criação de novos conteúdos a dimensão tempo torna-se uma propriedade intrínseca e relevante presente nestas fontes de informação. Assim, o objetivo é desenvolver um modelo para descoberta de conhecimento a partir de informações não estruturadas analisando a evolução dos relacionamentos entre os elementos textuais ao longo do tempo. O modelo proposto é dividido por fases, assim como os modelos tradicionais de descoberta de conhecimento. As fases deste modelo são: configuração dos temas de análise, identificação das ocorrências dos conceitos, correlação e correlação temporal, associação e associação temporal, criação do repositório de temas de análise, e tarefas intensivas em conhecimento, com ênfase nos relacionamentos diretos e indiretos entre os conceitos do domínio. A demonstração de viabilidade é realizada por meio de um protótipo baseado no modelo proposto e sua aplicação em um estudo de caso. É realizada também uma análise comparativa do modelo proposto com outros modelos de descoberta de conhecimento em textos.
|
79 |
Uma abordagem de visualização híbrida para apoiar a exploração de conjuntos de dados /Silva, Lenon Fachiano. January 2018 (has links)
Orientador: Danilo Medeiros Eler / Banca: José Gustavo de Souza Paiva / Banca: Almir Olivette Artero / Resumo: Técnicas de visualização têm sido largamente utilizadas na exploração de conjuntos de dados. Uma estratégia comum é empregar diferentes técnicas para facilitar a investigação, permitindo que o usuário tenha diferentes perspectivas de um mesmo conjunto de dados. Nessas situações, um mecanismo de coordenação auxilia o usuário na troca de contexto entre diferentes visões. Adicionalmente, uma estratégia adotada por algumas abordagens é a de combinar diferentes técnicas de visualização em uma única visão, criando uma visualização híbrida. Este trabalho apresenta o desenvolvimento de uma abordagem de visualização híbrida que utiliza uma técnica de visualização para destacar o relacionamento entre instâncias com outra técnica de visualização para destacar o relacionamento entre atributos. Como resultado, foi obtida uma metodologia de combinação de técnicas que apoia o processo de exploração de conjuntos de dados multidimensionais e auxilia no entendimento do espaço de característica, permitindo a detecção de fronteiras compartilhadas entre agrupamentos e a resolução de problemas de rotulação / Abstract: Visualization Techniques have been widely used in the exploration of datasets. A common strategy is to employ different techniques to facilitate research, allowing the user to have different perspectives from the same dataset. In these situations, a coordination mechanism helps the user in the exchange of context between different visions. In addition, a strategy adopted by some approaches is to combine different visualizations into a single view, creating a hybrid visualization. This paper shows the development of a hybrid visualization approach that uses a visualization technique to highlight the relationship between instances with another to highlight the relationship between attributes. This approach supports the process of exploring multidimensional datasets and assists in understanding the featuring space, allowing the detection of shared boundaries between groupings and the resolution of labeling problems. As a result, a methodology combining techniques was developed that supports the process of exploring multidimensional data sets and helps in understanding the characteristic space, allowing the detection of shared boundaries between groupings and the resolution of labeling problems / Mestre
|
80 |
Uma avaliação das interações de alunos em atividades colaborativas apoiadas em técnicas de mineração para identificação de parâmetros para análise de desempenhoPadilha, Thereza Patrícia Pereira January 2005 (has links)
Tese (doutorado) - Universidade Federal de Santa Catarina, Centro Tecnológico, Programa de Pós-Graduação em Ciência da Computação. / Made available in DSpace on 2013-07-16T02:12:03Z (GMT). No. of bitstreams: 0Bitstream added on 2013-07-16T19:52:06Z : No. of bitstreams: 1
221659.pdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) / A facilidade de comunicação introduzida pelo avanço das redes de comunicação tem viabilizado o desenvolvimento de vários ambientes de aprendizado colaborativo para a Educação a Distância via Internet. Esse avanço tem possibilitado a interação síncrona e assíncrona entre os participantes (aluno-aluno ou aluno-professor), independentemente de tempo e local. Um importante tópico de pesquisa relacionado com os ambientes de aprendizado colaborativo diz respeito à análise das interações dos alunos na execução das atividades. Muitas interações de alunos no aprendizado colaborativo podem ser capturadas e armazenadas num banco de dados para análises futuras. Entretanto, a extração de informações úteis nesse banco é quase impossível sem o uso de técnicas de mineração. Este trabalho propõe um modelo de análise das interações dos alunos que integra técnicas de mineração de textos e de dados para identificar o desempenho de colaboração. Dentre as interações analisadas, existem índices quantitativos, que fornecem um aspecto numérico das interações realizadas e índices qualitativos, que representam aspectos cognitivos e sociais das interações. A técnica de mineração de textos atua como uma forma alternativa para categorizar as intenções dos alunos em interações textuais de acordo com a taxonomia de Soller. A técnica de mineração de dados, por sua vez, encontra padrões de classificação para a construção de relatórios de desempenho em três níveis de detalhamento: inter-grupos, grupos e alunos. O modelo proposto foi incorporado ao ambiente de aprendizado colaborativo RESOLVE que dispõe das ferramentas de comunicação chat, editor de texto, votação e agenda para a resolução de problemas. A arquitetura, os aspectos da implementação e as interfaces desse ambiente são apresentados. Experimentos, com dez grupos de três pessoas cada, foram realizados para verificar a viabilidade do modelo, que se mostrou eficiente para auxiliar o professor no acompanhamento das atividades desempenhadas pelos alunos.
|
Page generated in 0.1041 seconds