Global ETD Search

1	Comitê de classiﬁcadores em bases de dados transacionais desbalanceadas com seleção de características baseada em padrões minerados Campos, Camila Maria 29 January 2016 (has links) Submitted by Renata Lopes (renatasil82@gmail.com) on 2017-05-30T14:42:33Z No. of bitstreams: 1 camilamariacampos.pdf: 929528 bytes, checksum: ebea02fc47981edfa166a24d9c1d7be2 (MD5) / Approved for entry into archive by Adriana Oliveira (adriana.oliveira@ufjf.edu.br) on 2017-05-30T15:36:24Z (GMT) No. of bitstreams: 1 camilamariacampos.pdf: 929528 bytes, checksum: ebea02fc47981edfa166a24d9c1d7be2 (MD5) / Made available in DSpace on 2017-05-30T15:36:24Z (GMT). No. of bitstreams: 1 camilamariacampos.pdf: 929528 bytes, checksum: ebea02fc47981edfa166a24d9c1d7be2 (MD5) Previous issue date: 2016-01-29 / CAPES - Coordenação de Aperfeiçoamento de Pessoal de Nível Superior / Os resultados dos problemas de classiﬁcação por regras de associação sofrem grande inﬂuência da estrutura dos dados que estão sendo utilizados. Uma diﬁculdade na área é a resolução de problemas de classiﬁcação quando se trata de bases de dados desbalanceadas. Assim, o presente trabalho apresenta um estudo sobre desbalanceamento em bases de dados transacionais, abordando os principais métodos utilizados na resolução do problema de desbalanceamento. Além disso, no que tange ao desbalanceamento, este trabalho propõe um modelo para realizar o balanceamento entre classes, sendo realizados experimentos com diferentes mé- todos de balanceamento e métodos ensemble, baseados em comitê de classiﬁcadores. Tais experimentos foram realizados em bases transacionais e não transacionais com o intuito de validar o modelo proposto e melhorar a predição do algoritmo de classiﬁcação por regras de associação. Bases de dados não transacionais também foram utilizadas nos ex perimentos, com o objetivo de veriﬁcar o comportamento do modelo proposto em tais bases. Outro fator importante no processo de classiﬁcação é a dimensão da base de dados que, quando muito grande, pode comprometer o desempenho dos classiﬁcadores. Neste traba lho, também é proposto um modelo de seleção de características baseado na classiﬁcação por regras de associação. Para validar o modelo proposto, também foram realizados ex- perimentos aplicando diferentes métodos de seleção nas bases de dados. Os resultados da classiﬁcação obtidos utilizando as bases contendo as características selecionadas pelos me- todos, foram comparados para validar o modelo proposto, tais resultados apresentaram-se satisfatórios em relação aos demais métodos de seleção. / The results of Classiﬁcation Based on Associations Rules (CBA) are greatly inﬂuenced by the used data structure. A diﬃculty in this area is solving classiﬁcation problems when it comes to unbalanced databases. Thus, this paper presents a study of unbalance in transactional and non-transactional databases, addressing the main methods used to solve the unbalance problem. In addition, with respect to the unbalance problem, this paper proposes a model to reach the balance between classes, conducting experiments with diﬀerent methods of balancing and ensemble methods based on classiﬁers committee. These experiments were performed in transactional and non-transactional databases, in order to validate the proposed model and improve Classiﬁcation Based on Associations Rules prediction. Another important factor in the classiﬁcation process is database dimensionality, be cause when too large, it can compromise the classiﬁers performance. In this work, it is also proposed a feature selection model based on the rules of CBA. Aiming to validate this model, experiments were also performed applying diﬀerent features selection methods in the databases.The classiﬁcation results obtained using the bases containing the features selected by the methods were compared to validate the proposed model, these results were satisfactory in comparison with other methods of selection. Mineração dados Regra de associação Classiﬁcação Balanceamento em bases de dados Seleção de características Data Mining Association Rule Classification Balancing Database Feature Selection
2	Penalized Graph Partitioning based Allocation Strategy for Database-as-a-Service Systems Kiefer, Tim, Habich, Dirk, Lehner, Wolfgang 16 September 2022 (has links) Databases as a service (DBaaS) transfer the advantages of cloud computing to data management systems, which is important for the big data era. The allocation in a DBaaS system, i.e., the mapping from databases to nodes of the infrastructure, influences performance, utilization, and cost-effectiveness of the system. Modeling databases and the underlying infrastructure as weighted graphs and using graph partitioning and mapping algorithms yields an allocation strategy. However, graph partitioning assumes that individual vertex weights add up (linearly) to partition weights. In reality, performance does usually not scale linearly with the amount of work due to contention on the hardware, on operating system resources, or on DBMS components. To overcome this issue, we propose an allocation strategy based on penalized graph partitioning in this paper. We show how existing algorithms can be modified for graphs with non-linear partition weights, i.e., vertex weights that do not sum up linearly to partition weights. We experimentally evaluate our allocation strategy in a DBaaS system with 1,000 databases on 32 nodes. info:eu-repo/classification/ddc/004 ddc:004

Search results

Comitê de classiﬁcadores em bases de dados transacionais desbalanceadas com seleção de características baseada em padrões minerados

Penalized Graph Partitioning based Allocation Strategy for Database-as-a-Service Systems