• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 324
  • 232
  • 51
  • 27
  • 23
  • 23
  • 4
  • 4
  • 3
  • 3
  • 2
  • 2
  • 2
  • 2
  • 2
  • Tagged with
  • 808
  • 139
  • 127
  • 120
  • 102
  • 98
  • 80
  • 77
  • 72
  • 70
  • 69
  • 69
  • 64
  • 63
  • 61
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
171

Álgebra linear: secções cônicas e aplicações / Irregular bin packing considering loading balancing

Pereira, Robson Edvaldo da Silva 30 June 2017 (has links)
Neste trabalho desenvolvemos o estudo da álgebra linear, secções cônicas e aplicações. Apresentamos os conceitos mais importantes da álgebra linear, estudando os espaços vetorias, subespaços vetoriais, matriz de mudança de base, transformações lineares e produto interno. O principal resultado do trabalho é o teorema espectral que fornece ferramentas para se estudar as secções cônicas não elementares, ou seja, aquelas nas quais uma parábola, elipse ou hipérbole são apresentadas com seus eixos não paralelos aos eixos coordenados do plano cartesiano. Uma vez de posse deste teorema é mostrado um processo prático no qual transformamos uma equação ax2 +bxy +cy2 +dx +ey + g = 0 na equação k1 (x\')2 + k2 (y\')2 + (dx1 + ey1) x\' + (dx2 + ey2) y\' + g = 0 sem o termo misto xy, onde após a eliminação deste, podemos deduzir a equação da cônica identificando assim esta curva. Apresentamos exemplos de cônicas com eixos paralelos e não paralelos aos coordenados do plano cartesiano e utilizamos o software geogebra para visualização. Também discutimos algumas aplicações das cônicas como trajetória de corpos celestes (planeta Terra e um cometa), princípio de reflexão da parábola mostrando o porquê das antenas e dos captadores de ondas sonoras serem parabólicos. Demonstramos um teorema que denominei de identificador de uma curva cônica pois com ele é possível classificar a cônica sem realizar o processo prático, apenas para isso identificamos através da equação ax2 +bxy + cy2 +dx + ey +g = 0, quais os valores de a;b e c e feito isto calculamos o discriminante b2 - 4ac, analisamos os sinais e a nulidade, ou seja, se é maior que zero, menor que zero ou igual a zero, assim é possível classificar a cônica. / The paper develops the study of linear algebra, conic sections and applications. I present the most important concepts of linear algebra, studying vector spaces, vector subspaces, base change matrix, linear transformations, internal product. The main result of the work is the spectral theorem, which provides tools to study the non-elementary conic sections, that is, those in which a parabola, ellipse or hyperbola are presented with their axes not parallel to the cartesian planes coordinate axes. Using this theorem we show a practical process in which we transform an equation ax2 +bxy + cy2 +dx +ey +g = 0 into the equation k1 (x\')2 +k2 (y\')2 + (dx1 +ey1) x\' (dx2 + ey2) y\' +g = 0 without the mixed term xy, where after its elimination we can deduce the conic equation thus identifying the curve we are looking for. I present examples of conic with parallel and non-parallel axes to the coordinates of the Cartesian plane and use the geogebra software for visualization. I discuss some applications of the conic as a trajectory of celestial bodies (planet Earth and a comet), principle of reflection of parabola showing why the antennas and sound wave pickups are parabolics. I demonstrate a theorem that I named the identifier of a conic curve, with it it is possible to classify the conic without realizing the practical process only for this. I identify through the equation ax2 +bxy + cy2 +dx + ey + g = 0, what are the values of a;b, and c and, with this done, I compute the discriminant b2 - 4ac and analyze the signs and the nullity, that is, if it is greater than zero, less than zero or equal to zero, therefore is possible to classify the conic.
172

Programação de múltiplos cross-docks com múltiplas docas / Multiple cross-docks with multiple docks scheduling

Tenório, Pâmella Sátiko Miyazaki 01 July 2016 (has links)
Cadeias de suprimentos podem ter operações seguindo diferentes estratégias de distribuição e a utilização de cada uma dessas estratégias pode resultar em diferentes operações e custos. A estratégia de cross-docking auxilia na redução dos custos de distribuição de produtos, consolidando cargas, e a redução de tempo e custos de armazenamento, uma vez que o tempo máximo de estoque permitido pela estratégia é de cerca de 24 horas. O objetivo deste trabalho é apresentar um modelo para o problema de cross-docking, em que cargas são entregues e reorganizadas de forma a atender a outras cargas que são coletadas e garantir que as janelas de tempo para início das operações sejam atendidas. Devido à falta de instâncias para o problema disponíveis na literatura, buscou-se gerar um benchmark e disponibilizá-las à comunidade científica. Uma vez que o problema é de difícil solução exata, um método heurístico para a resolução do problema foi desenvolvido. Os resultados mostraram que o modelo proposto resulta em boas soluções quando comparado ao modelo da literatura. O estudo de calibração do software IBM CPLEX mostrou que a calibração dos parâmetros pode resultar em melhores soluções e, por fim, a matheurística se mostrou competitiva com o CPLEX, principalmente para cenários em que a proporção de entregas e coletas diverge. / Supply chains may have operations which follow different distribution strategies and each one of these strategies may result in different operations and costs. The Cross-docking strategy helps to reduce the products distribution costs by consolidating loads and reducing storage costs as the maximum inventory time is approximately 24 hours. The aim of this research is to present a model for the cross-docking problem where loads are delivered and reorganized so as to cater for other loads that are collected and ensure that time windows are respected. Due to the lack of instances available in the literature, a benchmark was generated and was made available to the scientific community. As the problem is difficult to obtain the exact solution, a heuristic method was developed. The results showed that the proposed model has good solutions when compared to the literature model. A study of the IBM CPLEX software showed that tuning can result in better solutions and the matheuristcs was competitive with the software, mainly in scenarios where deliveries and pickups are very different.
173

Geração de colunas para problemas de corte em duas fases / Column generation for two starge cutting stock problems

Leão, Aline Aparecida de Souza 02 March 2009 (has links)
O Problema da Mochila Compartimentada é uma extensão do Problema da Mochila, em que os itens solicitados são divididos em classes, de modo que a mochila deve ser subdividida em compartimentos, os quais têm capacidades limitadas e são carregados com itens da mesma classe. Além disso, a construção de um compartimento tem um custo fixo e ocasiona uma perda no espaço da mochila. O objetivo consiste em maximizar a soma dos valores dos itens, descontado o custo fixo de inclusão de compartimentos. Neste trabalho, são abordados dois métodos de solução. A primeira abordagem é uma heurística, que consiste na combinação de duas heurísticas da literatura. A segunda abordagem é o método Geração de Colunas, que além de fornecer um novo limitante superior para o Problema da Mochila Compartimentada, ao final do método o problema mestre foi resolvido com as variáveis definidas como inteiras, obtendo uma solução factível. Em ambos os métodos, o modelo não-linear é decomposto em dois modelos lineares, no qual, um gera compartimentos e o outro os seleciona. Os resultados obtidos com as duas abordagens foram comparados com um limitante superior e se mostraram bastante satisfatórios / The Compartmentalized Knapsack Problem is an extension of the classical Knapsack Problem, where the ordered items are partitioned into classes, in such way that the knapsack must be divided into compartments, each one having limited capacity. In addition, the building of a compartment has a fixed cost and involves a loss of the overall capacity. The objective is to maximize the sum of the items utility value, minus the fixed costs of the compartments. This dissertation presents two solving methods. The first approach is a heuristic method, which is a combination of two heuristics from the literature. The second approach is a Column Generation method, that apart from it gives a new upper bound to the Compartmentalized Knapsack Problem, in the end of the method the master problem was solved with the variables defined as integer, that supplies a feasible solution. In both methods, the mathematical non linear model is decomposed into two linear models, one generates the compartments, and the other selects them to compose the knapsack. The results obtained with these two approaches were compared with an upper bound and they showed very efficient
174

Programação de tarefas em um flow shop. / Flow shop job\' scheduling

Souza, Eduardo Cordeiro de 22 May 2009 (has links)
Este trabalho trata de um problema de programação de tarefas em ambiente flow shop com algumas características específicas que, juntas, o diferenciam dos problemas usuais. Há N tarefas a serem processadas por M máquinas independentes e cada tarefa tem seu roteiro particular ao longo da oficina (shop), não passando necessariamente por todas as máquinas; cada tarefa deve ser concluída dentro de um respectivo intervalo de tempo, designado de janela de tempo, e há punições por adiantamento e atraso na conclusão da tarefa. O desempenho da programação é medido pela soma das punições por adiantamento e atraso. Trata-se de um problema de natureza combinatória, pertencente à classe NP-Difícil, para o qual, no limite, há (N !)^M alternativas. Neste trabalho, propõe-se um modelo matemático para representação do problema; para sua resolução é utilizado o pacote de programação linear mista inteira CPLEX; dada a dificuldade da obtenção de solução exata para as instâncias maiores, são propostas heurísticas para resolução do problema. São apresentados também procedimentos combinados, utilizando uma solução inicial gerada por heurística e o modelo matemático, quer usando a estrutura geral de ramificação do CPLEX, quer usando a técnica de ramificação local (Local Branching). / This study focuses a job scheduling problem in a flow shop with some specific features, which, all together, make it different from the usual flow shop scheduling problems. There are N jobs to be processed in M different machines and each job has a particular route, skipping, eventually, one or more machines; each job should be finished within a time interval, called time window, and there are penalties for earliness and tardiness. This is a combinatorial problem for which, in the extreme case, there are (N!)^M solutions, belonging to NP-Hard class. In this study, a mathematical model is proposed for representing the problem; the CPLEX solver is used for solving the mixed integer linear problem obtained. Given the computational complexity of the model, heuristic procedures are proposed in order to solve large- scale instances of this problem. Combined procedures, using an initial solution obtained by a proposed heuristic and the mathematical model, either using the general branching procedure of CPLEX or a specific local branching procedure, are also shown.
175

Heurísticas para o problema de distribuição com estoques geridos pelo fornecedor. / Heuristics for the vendor managed inventory problem.

Znamensky, Andrei 20 October 2006 (has links)
O presente trabalho aborda o sistema logístico usualmente denominado Vendor Managed Inventory (VMI), no qual o fornecedor controla e coordena as decisões de reabastecimento, sendo responsável por manter os estoques de seus clientes dentro de limites fixados de antemão. O modelo proposto incorpora ainda as decisões relativas à produção e manutenção de estoque por parte do fornecedor, além da utilização de frota heterogênea na distribuição, e busca a minimização dos custos totais do sistema. Quatro heurísticas de duas etapas são propostas para a resolução do problema abordado. A primeira etapa, comum a todas as heurísticas, baseia-se em uma heurística recentemente publicada na literatura e fornece uma solução inicial viável, utilizada como ponto de partida para a etapa de melhoria subsequente, na qual é utilizada a metaheurística busca tabu ou busca em vizinhança variável. As heurísticas propostas foram avaliadas em um conjunto de teste, sendo obtidos resultados melhores que os reportados na literatura em todas as instâncias testadas. Dentre as estratégias de solução avaliadas, destaca-se a heurística baseada em busca tabu com diversificação, que demonstrou ser superior às demais heurísticas propostas. Os resultados obtidos indicam ainda que, no caso da frota disponível ser heterogênea, é vantajosa a utilização de uma adaptação do procedimento de obtenção da solução inicial, como forma de privilegiar a utilização de veículos de maior eficiência. / This thesis deals with the logistic system usually called Vendor Managed Inventory (VMI). In this system the supplier controls and coordinates the supply decisions and is responsible for keeping the inventory of each of his clients within predetermined minimum and maximum levels. Heterogeneous fleet and production/stocking decisions at the supplier are considered as well, and the proposed model seeks to minimize the total system cost. Four two-stage heuristics are proposed for this problem. The first stage consists in an adaptation of a heuristic found in the bibliography, which provides an initial viable solution that will be improved in the second stage by means of the metaheuristics tabu search or variable neighborhood search. The proposed heuristics were tested on a set of benchmark instances with improvements found on the best known results in all of the tested instances. The obtained results indicate that the tabu search based heuristic with diversification strategy is clearly superior to the other proposed heuristics and that a better fleet utilization can be obtained in the case of heterogeneous fleet by a simple improvement in the first stage, that favors the selection of more efficient vehicles.
176

Tomada de decisão, heurísticas e vieses na análise das demonstrações contábeis / Decision making, Heuristics and biases in financial dtatement analysis

Cazzari, Roberto Bomgiovani 22 December 2016 (has links)
Essa tese foi desenvolvida com vistas a responder ao seguinte problema de pesquisa:as heurísticas e os vieses influenciam o processo decisório dos indivíduos quando confrontados com demonstrações financeiras e contábeis publicadas pelas empresas? Baseando-se na Prospect Theory de Kahneman e Tversky, buscou-se verificar como as heurísticas da ancoragem, representatividade e disponibilidade geravam vieses e influenciavam o modo como os usuários tomam suas decisões utilizando informações de cunho contábil e financeiro. Para tanto, foram submetidos questionários contendo situações de decisão junto aos estudantes de graduação da Faculdade de Economia, Administração e Contabilidade da Universidade de São Paulo e aos analistas profissionais de uma grande instituição financeira brasileira. 369 estudantes e 55 analistas responderam o questionário proposto. Para evitar com que os resultados pudessem não ser confiáveis, nenhum dos respondentes sabiam que o questionário buscava identificar vieses no processo de tomada de decisão. Para os colaboradores, foi exposto que a pesquisa versava sobre o processo de tomada de decisão com base na divulgação de informações contábeis e financeiras, sem fazer qualquer menção ao estudo das finanças comportamentais ou vieses. Os resultados obtidos divergiram quando foram comparados os dois públicos estudados nessa tese: analistas de mercado de capitais e estudantes de uma das melhores faculdades de negócio do Brasil. Os resultados sugeriram que o uso da heurística da ancoragem não se mostrou significativa nem para os analistas e nem para os estudantes. Entretanto, o uso da heurística da disponibilidade se mostrou estatisticamente significativa, assim como a presença da noção de correlação ilusória e o efeito isolamento. Por sua vez, o efeito reflexão e a não observação da regressão à média foram percebidos somente na amostra composta pelos analistas profissionais da instituição financeira. Finalmente, o uso da heurística da representatividade só teve efeito estatístico na presença dos alunos. / This thesis has been developed in order to answer the following research problem: the heuristics and biases influence the decision-making process of individuals when faced with financial and accounting statements published by the companies? Based on the Prospect Theory of Kahneman and Tversky, this research sought to determine how the heuristics of anchoring and adjustment, representativeness and availability generated biases and influenced how users make decisions using accounting and financial nature information. To this end, questionnaires containing decision situations were submitted to undergraduate students of the School of Economics, Business and Accounting of the University of São Paulo and the professional analysts of a large Brazilian financial institution. 369 students and 55 analysts answered the proposed questionnaire. To avoid that the results could not be trusted, none of the respondents knew that the questionnaire sought to identify biases in the decision-making process. It was explained that the survey questionnaire was about the decision-making process based on the disclosure of accounting and financial information, without making any mention of the study of behavioral biases. The results diverged when both public studied were compared in this thesis: capital market analysts and students of one of the best business schools in Brazil. The results suggested that the use of the anchoring and adjustment heuristic was not significant neither for the analysts and neither for the students. However, the use of the availability heuristic was statistically significant, as the presence of the concept of illusory correlation and the isolation effect. In turn, the reflection effect and no observation of regression to the mean were perceived only in the sample of the professional analysts of the financial institution. Finally, the use of the representativeness heuristic only had statistical effect in the student\'s sample.
177

Métodos heurísticos para o problema de dimensionamento de lotes multiestágio com limitação de capacidade / Heuristic methods to the multilevel capacitated lot-sizing problem

Furlan, Marcos Mansano 04 May 2011 (has links)
O problema de dimensionamento de lotes determina um plano de produção que apoia às tomadas de decisões, a médio prazo, em meios industriais. Este plano de produção indica as quantidades de cada item que devem ser produzidas em cada período do horizonte de planejamento, de acordo com um objetivo dado e satisfazendo a demanda dos clientes. Diversos métodos de solução foram propostas na literatura, considerando a dificuldade de solução de algumas classes de problemas e a necessidade de métodos que gerem soluções de alta qualidade em um tempo computacional adequado. Neste trabalho, abordamos heurísticas baseadas na formulação matemática (LP-and-fix, relax-and-fix e fix-and-optimize), uma metaheurística (algoritmo de abelhas) e dois métodos híbridos, utilizados na solução de dois problemas distintos de dimensionamento de lotes multiestá- gio com limitação de capacidade. Consideramos também, a utilização de três formulações da literatura, para verificar a influência de cada uma sobre as abordagens de solução verificadas. Os resultados computacionais demonstraram que os métodos baseados na formulação matemática do problema se mostraram eficientes, mas limitados normalmente a ótimos locais, enquanto os métodos híbridos puderam superar estes ótimos locais, utilizando conceitos da metaheurística algoritmo de abelhas para isto. Além disso, pudemos verificar a influência de uma formulação \"forte\" sobre as soluções geradas pelas abordagens de solução, demonstrando que métodos baseados em relaxação linear conseguem obter maiores vantagens deste tipo de formulação, mas outras abordagens podem ou não obter estas vantagens, dependendo do problema abordado / The lot-sizing problem determines a production plan, which supports the decision making, in the medium term, at the industrial environment. This production plan indicates the amounts of each item to be produced in each period of the planning horizon, according to a given objective and satisfying customer\'s demand. Diverse solution methods have been proposed in the literature, considering the difficulty of solving some problem classes and the need of methods to generate solutions quickly. In this work, we develop matheuristics (LP-and-fix, relax-and-fix and fix-and-optimize), one metaheuristic (bees algorithm) and two hybrid methods, used to solve two different multilevel capacitated lot-sizing problems. We also consider the use of three different formulations of the literature to verify the influence of each one on the solutions approaches. The computational results show that the matheuristics proved to be efficient, but usually limited to local optima, while the hybrid methods could escape from these local optima, using concepts of bees algorithm to do this. Additionally, we test the effect of a tight formulation on the solutions approaches, demonstrating that LP-based heuristics can obtain further advantages from this type of formulation, but other approaches can take these advantages, depending on the problem addressed
178

Resolução de um problema de corte de itens irregulares aplicado à indústria / Resolution of a cutting problem of irregular items used in industry

Jorge, Alfredo Rogerio 14 March 2016 (has links)
Nos problemas de corte de itens irregulares, temos um conjunto de itens menores que devem ser alocados em objetos maiores (recipientes) de forma que estes estejam inteiramente contidos no recipiente e não se sobreponham. Neste trabalho, resolvemos um problema de corte e empacotamento de uma indústria que confecciona aventais e forros de luva, no qual deseja-se alocar uma lista de itens dentro de recipientes retangulares utilizando a menor quantidade de recipientes possível e minimizando o comprimento utilizado em cada recipiente. Para isto, utilizamos métodos exatos e heurísticos adaptados para o corte de aventais e forros de luva, com o objetivo de obter soluções de alta qualidade. Foram realizados experimentos computacionais que comprovaram a eficiência dos métodos de solução presentes neste trabalho. / In nesting problems, we have a set of small items that must be allocated into larger objects (containers) so that they are fully contained within the container and do not overlap. In this work, an apron and gloves lining industry cutting problem is solved, in which we want to allocate a list of items into rectangular containers using the smallest quantity of containers and minimizing the length used in each container. For this, we used exact and heuristic methods adapted for cutting aprons and glove liners, in order to obtain high quality solutions. Computational tests were performed and they show the efficiency of the solving methods presented in this work.
179

Geração de colunas para problemas de corte em duas fases / Column generation for two starge cutting stock problems

Aline Aparecida de Souza Leão 02 March 2009 (has links)
O Problema da Mochila Compartimentada é uma extensão do Problema da Mochila, em que os itens solicitados são divididos em classes, de modo que a mochila deve ser subdividida em compartimentos, os quais têm capacidades limitadas e são carregados com itens da mesma classe. Além disso, a construção de um compartimento tem um custo fixo e ocasiona uma perda no espaço da mochila. O objetivo consiste em maximizar a soma dos valores dos itens, descontado o custo fixo de inclusão de compartimentos. Neste trabalho, são abordados dois métodos de solução. A primeira abordagem é uma heurística, que consiste na combinação de duas heurísticas da literatura. A segunda abordagem é o método Geração de Colunas, que além de fornecer um novo limitante superior para o Problema da Mochila Compartimentada, ao final do método o problema mestre foi resolvido com as variáveis definidas como inteiras, obtendo uma solução factível. Em ambos os métodos, o modelo não-linear é decomposto em dois modelos lineares, no qual, um gera compartimentos e o outro os seleciona. Os resultados obtidos com as duas abordagens foram comparados com um limitante superior e se mostraram bastante satisfatórios / The Compartmentalized Knapsack Problem is an extension of the classical Knapsack Problem, where the ordered items are partitioned into classes, in such way that the knapsack must be divided into compartments, each one having limited capacity. In addition, the building of a compartment has a fixed cost and involves a loss of the overall capacity. The objective is to maximize the sum of the items utility value, minus the fixed costs of the compartments. This dissertation presents two solving methods. The first approach is a heuristic method, which is a combination of two heuristics from the literature. The second approach is a Column Generation method, that apart from it gives a new upper bound to the Compartmentalized Knapsack Problem, in the end of the method the master problem was solved with the variables defined as integer, that supplies a feasible solution. In both methods, the mathematical non linear model is decomposed into two linear models, one generates the compartments, and the other selects them to compose the knapsack. The results obtained with these two approaches were compared with an upper bound and they showed very efficient
180

On the automatic design of decision-tree induction algorithms / Sobre o projeto automático de algoritmos de indução de árvores de decisão

Rodrigo Coelho Barros 06 December 2013 (has links)
Decision-tree induction is one of the most employed methods to extract knowledge from data. There are several distinct strategies for inducing decision trees from data, each one presenting advantages and disadvantages according to its corresponding inductive bias. These strategies have been continuously improved by researchers over the last 40 years. This thesis, following recent breakthroughs in the automatic design of machine learning algorithms, proposes to automatically generate decision-tree induction algorithms. Our proposed approach, namely HEAD-DT, is based on the evolutionary algorithms paradigm, which improves solutions based on metaphors of biological processes. HEAD-DT works over several manually-designed decision-tree components and combines the most suitable components for the task at hand. It can operate according to two different frameworks: i) evolving algorithms tailored to one single data set (specific framework); and ii) evolving algorithms from multiple data sets (general framework). The specific framework aims at generating one decision-tree algorithm per data set, so the resulting algorithm does not need to generalise beyond its target data set. The general framework has a more ambitious goal, which is to generate a single decision-tree algorithm capable of being effectively applied to several data sets. The specific framework is tested over 20 UCI data sets, and results show that HEAD-DTs specific algorithms outperform algorithms like CART and C4.5 with statistical significance. The general framework, in turn, is executed under two different scenarios: i) designing a domain-specific algorithm; and ii) designing a robust domain-free algorithm. The first scenario is tested over 35 microarray gene expression data sets, and results show that HEAD-DTs algorithms consistently outperform C4.5 and CART in different experimental configurations. The second scenario is tested over 67 UCI data sets, and HEAD-DTs algorithms were shown to be competitive with C4.5 and CART. Nevertheless, we show that HEAD-DT is prone to a special case of overfitting when it is executed under the second scenario of the general framework, and we point to possible alternatives for solving this problem. Finally, we perform an extensive experiment for evaluating the best single-objective fitness function for HEAD-DT, combining 5 classification performance measures with three aggregation schemes. We evaluate the 15 fitness functions in 67 UCI data sets, and the best of them are employed to generate algorithms tailored to balanced and imbalanced data. Results show that the automatically-designed algorithms outperform CART and C4.5 with statistical significance, indicating that HEAD-DT is also capable of generating custom algorithms for data with a particular kind of statistical profile / Árvores de decisão são amplamente utilizadas como estratégia para extração de conhecimento de dados. Existem muitas estratégias diferentes para indução de árvores de decisão, cada qual com suas vantagens e desvantagens tendo em vista seu bias indutivo. Tais estratégias têm sido continuamente melhoradas por pesquisadores nos últimos 40 anos. Esta tese, em sintonia com recentes descobertas no campo de projeto automático de algoritmos de aprendizado de máquina, propõe a geração automática de algoritmos de indução de árvores de decisão. A abordagem proposta, chamada de HEAD-DT, é baseada no paradigma de algoritmos evolutivos. HEAD-DT evolui componentes de árvores de decisão que foram manualmente codificados e os combina da forma mais adequada ao problema em questão. HEAD-DT funciona conforme dois diferentes frameworks: i) evolução de algoritmos customizados para uma única base de dados (framework específico); e ii) evolução de algoritmos a partir de múltiplas bases (framework geral). O framework específico tem por objetivo gerar um algoritmo por base de dados, de forma que o algoritmo projetado não necessite de poder de generalização que vá além da base alvo. O framework geral tem um objetivo mais ambicioso: gerar um único algoritmo capaz de ser efetivamente executado em várias bases de dados. O framework específico é testado em 20 bases públicas da UCI, e os resultados mostram que os algoritmos específicos gerados por HEAD-DT apresentam desempenho preditivo significativamente melhor do que algoritmos como CART e C4.5. O framework geral é executado em dois cenários diferentes: i) projeto de algoritmo específico a um domínio de aplicação; e ii) projeto de um algoritmo livre-de-domínio, robusto a bases distintas. O primeiro cenário é testado em 35 bases de expressão gênica, e os resultados mostram que o algoritmo gerado por HEAD-DT consistentemente supera CART e C4.5 em diferentes configurações experimentais. O segundo cenário é testado em 67 bases de dados da UCI, e os resultados mostram que o algoritmo gerado por HEAD-DT é competitivo com CART e C4.5. No entanto, é mostrado que HEAD-DT é vulnerável a um caso particular de overfitting quando executado sobre o segundo cenário do framework geral, e indica-se assim possíveis soluções para tal problema. Por fim, é realizado uma análise detalhada para avaliação de diferentes funções de fitness de HEAD-DT, onde 5 medidas de desempenho são combinadas com três esquemas de agregação. As 15 versões são avaliadas em 67 bases da UCI e as melhores versões são utilizadas para geração de algoritmos customizados para bases balanceadas e desbalanceadas. Os resultados mostram que os algoritmos gerados por HEAD-DT apresentam desempenho preditivo significativamente melhor que CART e C4.5, em uma clara indicação que HEAD-DT também é capaz de gerar algoritmos customizados para certo perfil estatístico dos dados de classificação

Page generated in 0.0823 seconds