Spelling suggestions: "subject:"mineração dde dados - computação"" "subject:"mineração dde dados - omputação""
81 |
Análise de logs de interação em ambiente educacional corporativo via mineração de dados educacionaisCoelho, Vinícius Coutinho Guimarães 26 June 2016 (has links)
Dissertação (mestrado)—Universidade de Brasília, Faculdade de Tecnologia, Departamento de Engenharia Elétrica, 2017. / Submitted by Raquel Almeida (raquel.df13@gmail.com) on 2017-07-19T12:53:21Z
No. of bitstreams: 1
2017_ViniciusCoutinhoGuimaraesCoelho.pdf: 3055767 bytes, checksum: b5e5c1ad4931705eb6af54774f0aec8e (MD5) / Approved for entry into archive by Raquel Viana (raquelviana@bce.unb.br) on 2017-09-15T16:04:19Z (GMT) No. of bitstreams: 1
2017_ViniciusCoutinhoGuimaraesCoelho.pdf: 3055767 bytes, checksum: b5e5c1ad4931705eb6af54774f0aec8e (MD5) / Made available in DSpace on 2017-09-15T16:04:19Z (GMT). No. of bitstreams: 1
2017_ViniciusCoutinhoGuimaraesCoelho.pdf: 3055767 bytes, checksum: b5e5c1ad4931705eb6af54774f0aec8e (MD5)
Previous issue date: 2017-09-15 / A Mineração de Dados Educacionais (do inglês, Educational Data Mining - EDM) tem sido uma ferramenta crucial para a melhora da Educação a Distância (EAD), permitindo, por exemplo, a identificação de características de participantes, a análise preditiva de desempenho bem como o reconhecimento dos tipos e padrões de aprendizado. A literatura científica apresenta uma vasta quantidade de trabalhos relacionados a ambientes educacionais de Instituições de Ensino Superior. Entretanto, tais ambientes possuem um modelo pedagógico com características específicas comuns a cursos de graduação e pós-graduação. Neste trabalho de mestrado, é proposto um modelo de aplicação de técnicas de EDM para um Ambiente Virtual de Aprendizagem (AVA) corporativo, de âmbito governamental. Foram gerados dados referentes aos logs de interação de cerca de 70 mil alunos em 45 turmas de 7 cursos na modalidade a distância da Escola Nacional de Administração Pública (Enap), entre 2015 e 2016. Por meio de técnicas de classificação usando árvores de decisão, verifica-se o relacionamento entre as interações realizadas pelos alunos ao longo do curso e as notas finais obtidas. Foi utilizada uma metodologia de agrupamento dos dados de interação divididos em semanas, com o intuito de viabilizar possíveis intervenções antes do término dos cursos. Foi possível concluir que o modelo proposto alcançou bons resultados quando comparados à literatura específica e que foi capaz de gerar indicadores relacionados aos perfis de interação dos alunos, que são passíveis de utilização para o combate às taxas de evasão e reprovação, nos cursos a distância ofertados por uma instituição corporativa governamental de ensino. / Educational Data Mining has been a crucial tool for the improvement of Distance Education, allowing, for example, the identification of characteristics of participants, predictive performance analysis as well as the recognition of learning types and patterns. The scientific literature shows a vast amount of work related to educational environments of Higher Education Institutions. However, such environments have a pedagogical model with specific characteristics common to undergraduate and postgraduate courses. In this master's work, a model of application of EDM techniques for a corporate Virtual Learning Environment (VLE) is proposed, , of governmental scope. Data were generated for interaction logs of about 70 thousand students in 45 classes of 7 courses in the distance modality of the National School of Public Administration (Enap) between 2015 and 2016. Through classification techniques using decision trees, relationship between the interactions carried out by the students along the course and the final grades obtained is verified. A methodology was used to group the interaction data divided into weeks, in order to enable possible interventions before the end of the courses. It was possible to conclude that the proposed model achieved good results when compared to the specific literature and it was able to generate indicators related to the students interaction profiles, which can be used to combat dropout and failure rates in distance courses offered in governmental educational institution.
|
82 |
Mineração de dados como suporte à detecção de lavagem de dinheiroPaula, Ebberth Lopes de 15 December 2016 (has links)
Dissertação (mestrado)—Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, 2016. / Submitted by Albânia Cézar de Melo (albania@bce.unb.br) on 2017-01-25T14:49:59Z
No. of bitstreams: 1
2016_EbberthLopesdePaula.pdf: 3248212 bytes, checksum: 8a9dd24ed5ebc93ba3f6fc1b9bba4411 (MD5) / Approved for entry into archive by Thayse Natália Cantanhede Santos(thaysesantos@bce.unb.br) on 2017-02-15T20:28:24Z (GMT) No. of bitstreams: 1
2016_EbberthLopesdePaula.pdf: 3248212 bytes, checksum: 8a9dd24ed5ebc93ba3f6fc1b9bba4411 (MD5) / Made available in DSpace on 2017-02-15T20:28:24Z (GMT). No. of bitstreams: 1
2016_EbberthLopesdePaula.pdf: 3248212 bytes, checksum: 8a9dd24ed5ebc93ba3f6fc1b9bba4411 (MD5) / Este trabalho apresenta o uso de técnicas de mineração de dados para detecção de empresas exportadoras brasileiras suspeitas de operarem exportações fictícias e conseqüente incorrência no crime de lavagem de dinheiro. A partir de estudos de aprendizagem de máquina com algoritmos supervisionados, foi desenvolvido um modelo capaz de classificar empresas suspeitas de operarem exportações fictícias. Em paralelo, foram desenvolvidos ainda estudos não supervisionados com Deep Learning Autoencoder e identificado um padrão de relacionamento entre os atributos numéricos representativos dos dados econômicos, mercantis, tributários e sociais das empresas que permitem a identificação de anomalias em dados de outras empresas. As empresas identificadas a partir do modelo supervisionado proposto neste trabalho foram submetidas à área específica de fiscalização aduaneira dentro da RFB e julgadas aptas a integrarem a programação de seleção para fiscalizações no ano de 2017. A metodologia desenvolvida, seus resultados e sua aplicabilidade foram divulgadas a todos escritórios de pesquisa e investigação da RFB por meio de Informação de Pesquisa e Investigação (IPEI). Um estudo de caso apresentando a metodologia aqui desenvolvida está previsto para ocorrer no 1o Encontro Nacional da RedeLab de 2017. Melhorias futuras a este trabalho incluem a detecção de anomalias e classificação de suspeição na exportação com maior granularidade dos dados, permitindo a sua identificação independente da empresa: por exemplo, a partir de transações, por rotas de produtos ou por tipo de mercadoria. / This research presents the use of data mining techniques to detect brazilian exporting companies suspected of operating dummy exports and consequently incurring the crime of money laundering. Based on studies involving supervised analyzes, a model was developed capable of classifying companies suspected of operating dummy exports. Based on studies with Deep Learning Autoencoder, a pattern of relationship was identified between the numerical attributes representative of the economic and tax data of the companies. From this pattern, is possible to identify anomalies in data of another companies. The companies identified in this study were submitted to the specific area of customs supervision and found fit to integrate the selection schedule for inspections in the year 2017. The technique developed was disclosed to all investigation offices of the RFB through a document called IPEI. A case study presenting the methodology developed is expected to take place at the first national meeting of RedeLab 2017. Future improvements to this work include detection of anomalies and classification of export suspicious with greater granularity of the data, allowing them to be identified independently of the company: for example from transactions, product routes and by commodity type.
|
83 |
Técnicas baseadas em grafos para priorização de investigações policiais de fraudes bancárias eletrônicas / Techniques based on graph for prioritisation investigations fraud cops banking electronicPatrocínio, Álex Moreira do 09 December 2016 (has links)
Dissertação (mestrado)—Universidade de Brasília, Faculdade de Tecnologia, Departamento de Engenharia Elétrica, 2016. / Submitted by Camila Duarte (camiladias@bce.unb.br) on 2017-02-08T14:03:25Z
No. of bitstreams: 1
2016_AlexMoreiradoPatrocínio.pdf: 12525561 bytes, checksum: 54fc7d3d4f41b7c4c4e02ca6f0e392fd (MD5) / Approved for entry into archive by Raquel Viana(raquelviana@bce.unb.br) on 2017-04-19T21:22:19Z (GMT) No. of bitstreams: 1
2016_AlexMoreiradoPatrocínio.pdf: 12525561 bytes, checksum: 54fc7d3d4f41b7c4c4e02ca6f0e392fd (MD5) / Made available in DSpace on 2017-04-19T21:22:19Z (GMT). No. of bitstreams: 1
2016_AlexMoreiradoPatrocínio.pdf: 12525561 bytes, checksum: 54fc7d3d4f41b7c4c4e02ca6f0e392fd (MD5) / Ao longo dos últimos anos, a Polícia Federal do Brasil (PF) vem concentrando esforços para elucidar crimes de fraudes bancárias praticados contra a empresa pública e instituição financeira da Caixa Econômica Federal (CAIXA). A elucidação desses crimes é uma atribuição da PF, prevista na Constituição Federal do Brasil em seu artigo 144 § 1º. A abordagem proposta neste trabalho, denominada Kraken, é aprimorar o modelo de investigação existente utilizando-se de grafos e da análise de vínculos para auxiliar às técnicas de investigação da PF. O Kraken trata, em específico, de investigações contra fraudes eletrônicas relativas a transferência de valores entre contas bancárias. Para aplicar a abordagem do Kraken, foi necessária a criação de um ferramental que processe toda a informação contida na Base Nacional de Fraudes Bancárias Eletrônicas (BNFBE) e a transforme em grafos conexos, que representem os atores e seus relacionamentos (vínculos) na ação delitiva desse tipo de fraude. Para a realização desse trabalho tivemos acesso a um conjunto dos dados da BNFBE. O objetivo desse ferramental é servir como uma Interface Gráfica (IG) para que o investigador Policial Federal possa verificar os resultados do processamento da abordagem do Kraken em um formato de tabela, onde cada registro represente um grafo referente a um conjunto de atores e vínculos envolvidos na ação delitiva. É na IG do Kraken que o Policial Federal consegue reordenar a tabela que contém as investigações/grafos em ordem decrescente de métricas objetivas, como: quantidade de vítimas, pessoas beneficiadas e valor total das fraudes existentes em cada grafo gerado pelo Kraken. A principal hipótese é que com o reordenamento dos grafos, baseado nessas métricas objetivas, possa-se priorizar as investigações criminais a serem analisadas pela PF. A IG permite selecionar um grafo específico da tabela para ser exportado e visualizado no Analyst´s Notebook da IBM. Com a abordagem do Kraken e sua IG, espera-se diminuir a necessidade de interferência humana (investigador policial) nos relatórios de análise dos crimes e, consequentemente, acelerar as investigações da PF. / Over the last few years the Federal Police of Brazil (PF) has concentrated efforts to elucidate crimes of bank fraud committed against Caixa Econômica Federal (CAIXA) a public company and financial institution. The elucidation of these crimes is an attribution of the PF, provided for in the Federal Constitution of Brazil in its article 144 § 1º. The approach presented in this work, denominated Kraken, proposes to improve the existing research model, using graphs and link analysis, to assist in the investigation techniques of the PF. Kraken deals in particular with investigations into electronic fraud involving transfer of securities between bank accounts. In order to apply Kraken's approach it was necessary to create a tool to process all the information contained in the National Electronic Banking Fraud Database (BNFBE) and to transform it into related graphs that represent the actors and their relationships (links) in the criminal act of this type of fraud. For this work we had access to a set of BNFBE data. The objective of this tool is to serve as a Graphic Interface (IG) so that the Federal Police investigator can verify the results of the processing of the Kraken approach in a table format, where each record represents a graph referring to a set of actors and movements involved in the crime scene. In Kraken's IG the Federal Police officer can rearrange the table containing the investigations / graphs in descending order of objective metrics such as: number of victims, persons who have profited from crime and total value of frauds in each graph generated by Kraken. The main hypothesis is that with the rearrangement of the graphs, based on these objective metrics, it is possible to prioritize the criminal investigations to be analyzed by the PF. The IG allows to select a specific graph of the table to be exported and viewed on IBM's Analyst's Notebook. With the approach of Kraken and its IG, it is hoped that the need for human interference (police investigator) will be reduced in the crime analysis reports and, consequently, further accelerate investigations in the PF.
|
84 |
Inteligência artificial aplicada à melhoria da acurácia do mapeamento de redes de drenagemBueno, Luis Fernando January 2016 (has links)
Orientador : Prof. Dr. Tony Vinicius Moreira Sampaio / Tese (doutorado) - Universidade Federal do Paraná, Setor de Ciências da Terra, Programa de Pós-Graduação em Geografia. Defesa: Curitiba, 11/08/2016 / Inclui referências : fls. 133-148 / Área de concentração / Resumo: Mapeamentos das redes de drenagens vem sendo conduzidos, inicialmente a partir de interpretação visual de imagens, depois com auxilio de algoritmos para extração automática. Em detrimento da melhora na resolução espacial das imagens e na variedade dos algoritmos disponíveis, cada um deles com estratégia diferente para a geração dos canais de drenagem, a acurácia dos mapeamentos ainda e um problema recorrente. Nesta pesquisa avaliou-se o potencial de aplicação de técnicas de inteligência artificial no processo de extração automática de redes de drenagem, visando melhorar acurácia do mapeamento. Um banco de dados espaciais foi construído, e reuniu dados oriundos do Modelo Digital de Elevação - MDE, parâmetros morfométricos, imagens SAR e SPOT 5, geologia, geomorfologia, hidrogeologia e solo. Uma Rede Neural Artificial - RNA foi criada para classificar amostras nas classes drenagem e não drenagem. A RNA, do tipo perceptron multicamadas com algoritmo de retropropagação de erros (backpropagation), foi definida com uma camada de entrada com 42 neurônios (quando usadas todas as variáveis possíveis), três camadas escondidas com 119 neurônios e uma camada de saída. A rede foi treinada a partir de quatro conjuntos de dados, e os testes realizados a partir de outros 16 conjuntos distintos de testes contendo amostras diferentes daquelas usadas no treinamento. Percebeu-se que a RNA foi mais eficiente na classificação dos conjuntos de dados com pixel de 2,5 metros, quando foram usadas na camada de entrada da rede todas as variáveis disponíveis e a camada de saída continha apenas duas classes (drenagem e não drenagem). Neste caso, a acurácia total ficou sempre acima de 68%. Foram identificados canais de primeira ordem que não constavam na base cartográfica de referencia. A melhoria da acurácia temática e da completude foi observada, atestando que mineração de dados e RNA podem efetivamente contribuir na melhoria dos mapeamentos.
Palavras-chave: Mineração de dados. Redes Neurais Artificiais. Hidrologia. Cartografia. Qualidade de Dados Geoespaciais. / Abstract: Mapping of drainage networks have been performed using visual interpretation of images, at first, then with the assist of automatic extraction algorithms. The limitation of spatial resolution of the available images and the diversity of available algorithms with different approaches in generating drainage channels, the accuracy level of this kind of mapping is still a frequent problem. This research evaluated the potential application of artificial intelligence techniques in auto-extracting process of drainage networks, in order to improve the mapping accuracy. A spatial database was built using data from: the Digital Elevation Model - DEM, morphometric parameters, SAR and SPOT 5 images, geology, geomorphology, hydrogeology and soil. An Artificial Neural Network - ANN was created to classify samples in classes of drainage and non-drainage. The multilayer perceptron ANN, with error back propagation algorithm, was set with one input layer with 42 neurons (when all possible variables were used), three hidden layers of 119 neurons and an output layer. The network was trained from four datasets, and tests from 16 other distinct sets of tests with different samples from those used in training. The ANN was more efficient in classification of datasets with 2.5 meters pixels when all available variables were used in the network's input layer and the output layer had only two classes (drainage and non-drainage). Following this scenario, the overall accuracy has been always above 68%. First order draining channels were identified where nothing was described in the base map reference. The improvement of thematic accuracy was observed, confirming data mining and RNA as an effective way to contribute to the improvement of this sort of mapping. Key-words: Data Mining. Artificial Neural Networks. Mapping. Hidrology. Cartography. Geoespatial Data Quality.
|
85 |
Pós-processamento de padrões para identificação de beneficiários de alto custo em operadoras de saúdeEscobar, Leandro Fabian Almeida January 2015 (has links)
Orientadora : Profª. Drª. Deborah Ribeiro Carvalho / Dissertação (mestrado) - Universidade Federal do Paraná, Setor de Ciências Sociais Aplicadas, Programa de Pós-Graduação em Ciência, Gestão e Tecnologia da Informação. Defesa: Curitiba, 26/03/2015 / Inclui referências : fls. 85-88 / Área de concentraçâo: Gestão da Informação e do conhecimento / Resumo: As operadoras de saúde armazenam grandes volumes de dados sobre procedimentos realizados por seus beneficiários e, na mesma medida que criam valiosas oportunidades, também geram dificuldades em analisar e interpretar os padrões contidos em tais bases de dados. A Mineração de Dados pode constituir uma alternativa para compensar tal deficiência, mas sua adoção e uso cotidiano no suporte à decisão na área da Saúde ainda são baixos. O problema de pesquisa abordado se relaciona ao baixo uso do processo de descoberta de conhecimento (KDD) na área e questiona-se até que ponto é possível fomentar sua adoção na rotina dos especialistas em Saúde. Assim, este trabalho apresenta um modelo que fomente o uso do KDD na rotina da gestão em Saúde, mediante a identificação de beneficiários de alto custo em operadoras de Saúde, avaliando sua aceitação junto a especialistas na área. Foram identificados os pontos de atenção recomendados na literatura para uso efetivo dos resultados do KDD na Saúde, o modelo foi elaborado e um protótipo foi desenvolvido com a capacidade de obter padrões e pós processálos, obentendo padrões de sequência de janelas temporais. Sua aceitação foi avaliada junto aos especialistas, tendo atingido 78% de aceitação. Destaca-se que todos os especialistas envolvidos concordam que o modelo é aplicável à sua rotina de trabalho. Conclui-se que a associação dos pontos de atenção para o uso da Mineração de Dados na Saúde e a atenção a requisitos específicos dos especialistas, mediante o desenvolvimento de um modelo que facilite a obtenção e a exploração em padrões minerados, se mostrou capaz de fomentar o uso do KDD na rotina em Saúde. Palavras chave: Descoberta de conhecimento; Mineração de Dados, Apoio à decisão em Saúde. / Abstract: Health insurance companies store large amounts of data on procedures performed over its beneficiaries and to the same extent that create valuable opportunities also lead to difficulties in analyzing and interpreting the standards contained in such databases. Data mining can be an alternative to compensate for this deficiency, but their adoption and use in everyday decision support in healthcare are still low. The research problem addressed is related to the low use of knowledge Discovery in data bases process (KDD) in the area and wonders to what extent it is possible to foster its adoption in experts routine. So, this researche presents a model that promotes the use of KDD in the routine management in Health, by identifying high-cost beneficiaries and evaluating its acceptance by the experts. Points of attention for the use of Data Mining in Health were identified in the literature for effective use of the results of KDD. A model and a prototype were developed with the capability of discovering patterns and post process into sequential and time frames patterns. Its acceptance was evaluated with the experts, reaching 78% of acceptance. It is noteworthy that all the experts involved agree that the model is applicable to their daily work. We conclude that the association of points of attention for the use of Data Mining in Health and attention to specific requirements of experts, by developing a model to facilitate the obtaining and exploring mined patterns, has been shown to promote the use of KDD in routine Health. Keywords: Knowledge discovery; Data Mining, Decision Support in Health.
|
86 |
Uma metodologia para a criação de etiqueta de qualidade no contexto de descoberta de conhecimento em bases de dadosGóes, Anderson Roges Teixeira 26 November 2012 (has links)
Resumo
|
87 |
Mineração multirrelacional de regras de associação em grandes bases de dadosOyama, Fernando Takeshi [UNESP] 22 February 2010 (has links) (PDF)
Made available in DSpace on 2014-06-11T19:29:40Z (GMT). No. of bitstreams: 0
Previous issue date: 2010-02-22Bitstream added on 2014-06-13T20:39:07Z : No. of bitstreams: 1
oyama_ft_me_sjrp.pdf: 1107324 bytes, checksum: 0977db2af1589dece4aa46b5882d84d6 (MD5) / O crescente avanço e a disponibilidade de recursos computacionais viabilizam o armazenamento e a manipulação de grandes bases de dados. As técnicas típicas de mineração de dados possibilitam a extração de padrões desde que os dados estejam armazenados em uma única tabela. A mineração de dados multirrelacional, por sua vez, apresenta-se como uma abordagem mais recente que permite buscar padrões provenientes de múltiplas tabelas, sendo indicada para a aplicação em bases de dados relacionais. No entanto, os algoritmos multirrelacionais de mineração de regras de associação existentes tornam-se impossibilitados de efetuar a tarefa de mineração em grandes volumes de dados, uma vez que a quantia de memória exigida para a conclusão do processamento ultrapassa a quantidade disponível. O objetivo do presente trabalho consiste em apresentar um algoritmo multirrelacional de extração de regras de associação com o foco na aplicação em grandes bases de dados relacionais. Para isso, o algoritmo proposto, MR-RADIX, apresenta uma estrutura denominada Radix-tree que representa comprimidamente a base de dados em memória. Além disso, o algoritmo utiliza-se do conceito de particionamento para subdividir a base de dados, de modo que cada partição possa ser processada integralmente em memória. Os testes realizados demonstram que o algoritmo MR-RADIX proporciona um desempenho superior a outros algoritmos correlatos e, ainda, efetua com êxito, diferentemente dos demais, a mineração de regras de associação em grandes bases de dados. / The increasing spread and availability of computing resources make feasible storage and handling of large databases. Traditional techniques of data mining allows the extraction of patterns provided that data is stored in a single table. The multi- relational data mining presents itself as a more recent approach that allows search patterns from multiple tables, indicated for use in relational databases. However, the existing multi-relational association rules mining algorithms become unable to make mining task in large data, since the amount of memory required for the completion of processing exceed the amount available. The goal of this work is to present a multi- relational algorithm for extracting association rules with focus application in large relational databases. For this the proposed algorithm MR-RADIX presents a structure called Radix-tree that represents compressly the database in memory. Moreover, the algorithm uses the concept of partitioning to subdivide the database, so that each partition can be processed entirely in memory. The tests show that the MR-RADIX algorithm provides better performance than other related algorithms, and also performs successfully, unlike others, the association rules mining in large databases.
|
88 |
Uma abordagem usando visualização de software como apoio à refatoração para aspectos /Delfim, Fernanda Madeiral. January 2013 (has links)
Orientador: Rogério Eduardo Garcia / Banca: Fabiano Cutigi Ferrari / Banca: Marcelo de Almeida Maia / Resumo: A evolução de sistemas de software existentes para a tecnologia orientada a aspectos tem como primeiro passo a mineração de aspectos, que visa a identificar interesses transversais em código fonte, para serem encapsulados em aspectos. Diversas técnicas têm sido propostas para a mineração de aspectos, mas ainda com deficiências. Uma das causas dessas deficiências apontada na literatura é a apresentação inadequada dos resultados obtidos por tais técnicas. A Visualização de Software pode ser utilizada para analisar, interpretar e combinar resultados de técnicas de mineração de aspectos, sendo os resultados apresentados juntamente com características de programa. Neste trabalho é apresentada uma abordagem visual de múltiplas visões coordenadas com o propósito de prover um ambiente para a apresentação dos resultados gerados por técnicas de mineração de aspectos, para melhorar a compreensão do usuário ao analisá-los para futura refatoração para aspectos. As múltiplas visões coordenadas são utilizadas para permitir a análise: das associações baseadas em chamadas de métodos, em nível de classe e de método, permitindo a visualização da frequência de chamadas das unidades baseada na métrica fan-in; das dependências de controle e de dados entre instruções de programa; da estrutura de programa; de como conjuntos de instruções (fatias) são compostos em diversas classes; e do bytecode. O foco é investigar se a visualização contribui na compreensão de programas por meio dos resultados gerados usando as técnicas fatiamento de programa e análise de fan-in, propostas para minerar aspectos, de maneira complementar. Uma ferramenta de visualização de software, nomeada SoftV is4CA (Software Visualization for Code Analysis), foi desenvolvida para apoiar a abordagem visual proposta. O estudo preliminar mostrou que o modelo de coordenação proposto apoia a análise pela exploração de diferentes níveis de ... / Abstract: The evolution of existing software systems to aspect-oriented technology has as first step the aspect mining, which aims to identify crosscutting concerns in source code to be encapsulated into aspects. Several techniques have been proposed for aspect mining, but still with shortcomings. One cause of these shortcomings pointed out in the literature is inadequate presentation of the results obtained by these techniques. Software Visualization can be used to analyze, interpret and combine results of aspect mining techniques, being the results presented with program characteristics. This work presents a visual approach of multiple coordinated views in order to provide an environment for the presentation of the results generated by aspect mining techniques, as well as to improve the understanding of the user to analyze them for future refactoring to aspects. The multiple coordinated views are used to allow the analysis: of associations based on method calls, at class and method levels, allowing visualization of the units call frequency based on fan-in metric; of the control and data dependencies between program instructions; of the program structure; of how instruction sets (slices) are composed in several classes; and of bytecode. The focus is to investigate whether visualization helps in program comprehension by the results generated using program slicing and fan-in analysis techniques, proposals for mining aspects in a complementary way. A software visualization tool, named SoftV is4CA (Software Visualization for Code Analysis), was developed to support the proposed visual approach. The preliminary study showed that the proposed coordination model supports the analysis by exploration of different levels of details / Mestre
|
89 |
Mineração multirrelacional de regras de associação em grandes bases de dados /Oyama, Fernando Takeshi. January 2010 (has links)
Orientador: Carlos Roberto Valêncio / Banca: Cristina Dutra de Aguiar Ciferri / Banca: Rogéria Cristiane Gratão de Souza / Resumo: O crescente avanço e a disponibilidade de recursos computacionais viabilizam o armazenamento e a manipulação de grandes bases de dados. As técnicas típicas de mineração de dados possibilitam a extração de padrões desde que os dados estejam armazenados em uma única tabela. A mineração de dados multirrelacional, por sua vez, apresenta-se como uma abordagem mais recente que permite buscar padrões provenientes de múltiplas tabelas, sendo indicada para a aplicação em bases de dados relacionais. No entanto, os algoritmos multirrelacionais de mineração de regras de associação existentes tornam-se impossibilitados de efetuar a tarefa de mineração em grandes volumes de dados, uma vez que a quantia de memória exigida para a conclusão do processamento ultrapassa a quantidade disponível. O objetivo do presente trabalho consiste em apresentar um algoritmo multirrelacional de extração de regras de associação com o foco na aplicação em grandes bases de dados relacionais. Para isso, o algoritmo proposto, MR-RADIX, apresenta uma estrutura denominada Radix-tree que representa comprimidamente a base de dados em memória. Além disso, o algoritmo utiliza-se do conceito de particionamento para subdividir a base de dados, de modo que cada partição possa ser processada integralmente em memória. Os testes realizados demonstram que o algoritmo MR-RADIX proporciona um desempenho superior a outros algoritmos correlatos e, ainda, efetua com êxito, diferentemente dos demais, a mineração de regras de associação em grandes bases de dados. / Abstract: The increasing spread and availability of computing resources make feasible storage and handling of large databases. Traditional techniques of data mining allows the extraction of patterns provided that data is stored in a single table. The multi- relational data mining presents itself as a more recent approach that allows search patterns from multiple tables, indicated for use in relational databases. However, the existing multi-relational association rules mining algorithms become unable to make mining task in large data, since the amount of memory required for the completion of processing exceed the amount available. The goal of this work is to present a multi- relational algorithm for extracting association rules with focus application in large relational databases. For this the proposed algorithm MR-RADIX presents a structure called Radix-tree that represents compressly the database in memory. Moreover, the algorithm uses the concept of partitioning to subdivide the database, so that each partition can be processed entirely in memory. The tests show that the MR-RADIX algorithm provides better performance than other related algorithms, and also performs successfully, unlike others, the association rules mining in large databases. / Mestre
|
90 |
Metodologia de mineração de dados para ambientes educacionais online / Data mining methodology for online educational environmentsFalci Júnior, Geraldo Ramos 17 August 2018 (has links)
Orientador: Ivan Luiz Marques Ricarte / Dissertação (mestrado) - Universidade Estadual de Campinas, Faculdade de Engenharia Elétrica e de Computação / Made available in DSpace on 2018-08-17T16:59:53Z (GMT). No. of bitstreams: 1
FalciJunior_GeraldoRamos_M.pdf: 698385 bytes, checksum: 02542ffd87be662788d4f79b80ba9a7a (MD5)
Previous issue date: 2010 / Resumo: Educação a distância populariza-se como meio prático de ensino com a expansão de recursos computacionais e da Internet. Apesar disto, ela traz dificuldades ao educador para compreender as necessidades de suas classes. A análise do uso desses Sistemas de Gerência de Aprendizado a distância por meio de técnicas de mineração de dados é uma forma de obter informações relevantes que permitam ao educador observar essas necessidades e modificar seus cursos de acordo. O objetivo deste trabalho é elaborar uma metodologia de trabalho que permita abordar problemas dessa natureza de forma objetiva e flexível, facilitando identificar potenciais problemas na análise e pontos de retorno adequados para correção e retomada do processo. Um conjunto de etapas é elaborado para compor esta metodologia e em seguida colocado à prova com um conjunto de dados reais obtidos através da instância do TIDIA-Ae utilizada pela UNICAMP como auxiliar às aulas presenciais. Os resultados mostram a eficácia do método proposto e permitiram a observação de diversos problemas devido à maneira de utilização do sistema por alunos e professores / Abstract: Computer-based distance education is becoming popular as computational resources and the Internet expand. Nevertheless, educators may have difficulties to understand the necessities of his classes and therefore improve their courses. Usage analysis of these distance Learning Management Systems through data mining techniques is a way of obtaining relevant information that allow the educator to observe some of the classes' needs and modify his courses accordingly. The goal of the work described in this thesis is to elaborate a methodology to allow tackling problems of this nature in an objective and flexible way, easing the identification of potential problems in the analysis and adequate points of feedback to correct and retake the process. A sequence of steps is elaborated to constitute this methodology and test it with real data obtained from the instance of TIDIA-Ae used by UNICAMP as an auxiliary to classes in campus. The results show the efficiency of the proposed method, though some problems surfaced on these results originated from the way the system is employed by students and teachers / Mestrado / Engenharia de Computação / Mestre em Engenharia Elétrica
|
Page generated in 0.1133 seconds