• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 37
  • 20
  • Tagged with
  • 57
  • 57
  • 50
  • 11
  • 11
  • 10
  • 10
  • 9
  • 9
  • 8
  • 8
  • 7
  • 7
  • 7
  • 7
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
1

[en] QUANTUM-INSPIRED EVOLUTIONARY ALGORITHMS FOR PROBLEMS BASED ON NUMERICAL REPRESENTATION / [pt] ALGORITMOS EVOLUTIVOS COM INSPIRAÇÃO QUÂNTICA PARA PROBLEMAS COM REPRESENTAÇÃO NUMÉRICA

ANDRE VARGAS ABS DA CRUZ 25 September 2007 (has links)
[pt] Desde que foram propostos como método de otimização, os algoritmos evolutivos têm sido usados com sucesso para resolver problemas complexos nas mais diversas áreas como, por exemplo, o projeto automático de circuitos e equipamentos, planejamento de tarefas, engenharia de software e mineração de dados, entre tantos outros. Este sucesso se deve, entre outras coisas, ao fato desta classe de algoritmos não necessitar de formulações matemáticas rigorosas a respeito do problema que se deseja otimizar, além de oferecer um alto grau de paralelismo no processo de busca. No entanto, alguns problemas são computacionalmente custosos no que diz respeito à avaliação das soluções durante o processo de busca, tornando a otimização por algoritmos evolutivos um processo lento para situações onde se deseja uma resposta rápida do algoritmo (como por exemplo, problemas de otimização online). Diversas maneiras de se contornar este problema, através da aceleração da convergência para boas soluções, foram propostas, entre as quais destacam-se os Algoritmos Culturais e os Algoritmos Co-Evolutivos. No entanto, estes algoritmos ainda têm a necessidade de avaliar muitas soluções a cada etapa do processo de otimização. Em problemas onde esta avaliação é computacionalmente custosa, a otimização pode levar um tempo proibitivo para alcançar soluções ótimas. Este trabalho propõe um novo algoritmo evolutivo para problemas de otimização numérica (Algoritmo Evolutivo com Inspiração Quântica usando Representação Real - AEIQ- R), inspirado no conceito de múltiplos universos da física quântica, que permite realizar o processo de otimização com um menor número de avaliações de soluções. O trabalho apresenta a modelagem deste algoritmo para a solução de problemas benchmark de otimização numérica, assim como no treinamento de redes neurais recorrentes em problemas de aprendizado supervisionado de séries temporais e em aprendizado por reforço em tarefas de controle. Os resultados obtidos demonstram a eficiência desse algoritmo na solução destes tipos de problemas. / [en] Since they were proposed as an optimization method, the evolutionary algorithms have been successfully used for solving complex problems in several areas such as, for example, the automatic design of electronic circuits and equipments, task planning and scheduling, software engineering and data mining, among many others. This success is due, among many other things, to the fact that this class of algorithms does not need rigorous mathematical formulations regarding the problem to be optimized, and also because it offers a high degree of parallelism in the search process. However, some problems are computationally intensive when it concerns the evaluation of solutions during the search process, making the optimization by evolutionary algorithms a slow process for situations where a quick response from the algorithm is desired (for instance, in online optimization problems). Several ways to overcome this problem, by speeding up convergence time, were proposed, including Cultural Algorithms and Coevolutionary Algorithms. However, these algorithms still have the need to evaluate many solutions on each step of the optimization process. In problems where this evaluation is computationally expensive, the optimization might take a prohibitive time to reach optimal solutions. This work proposes a new evolutionary algorithm for numerical optimization problems (Quantum- Inspired Evolutionary Algorithm for Problems based on Numerical Representation - QIEA-R), inspired in the concept of quantum superposition, which allows the optimization process to be carried on with a smaller number of evaluations. The work presents the modelling for this algorithm for solving benchmark numerical optimization problems, and for training recurrent neural networks in supervised learning and reinforcement learning. The results show the good performance of this algorithm in solving these kinds of problems.
2

[en] A CHARACTERIZATION OF TESTABLE GRAPH PROPERTIES IN THE DENSE GRAPH MODEL / [pt] UMA CARACTERIZAÇÃO DE PROPRIEDADES TESTÁVEIS NO MODELO DE GRAFOS DENSOS

FELIPE DE OLIVEIRA 19 June 2023 (has links)
[pt] Consideramos, nesta dissertação, a questão de determinar se um grafo tem uma propriedade P, tal como G é livre de triângulos ou G é 4- colorível. Em particular, consideramos para quais propriedades P existe um algoritmo aleatório com probabilidades de erro constantes que aceita grafos que satisfazem P e rejeita grafos que são epsilon-longe de qualquer grafo que o satisfaça. Se, além disso, o algoritmo tiver complexidade independente do tamanho do grafo, a propriedade é dita testável. Discutiremos os resultados de Alon, Fischer, Newman e Shapira que obtiveram uma caracterização combinatória de propriedades testáveis de grafos, resolvendo um problema em aberto levantado em 1996. Essa caracterização diz informalmente que uma propriedade P de um grafo é testável se e somente se testar P pode ser reduzido a testar a propriedade de satisfazer uma das finitas partições Szemerédi. / [en] We consider, in this thesis, the question of determining if a graph has a property P such as G is triangle-free or G is 4-colorable. In particular, we consider for which properties P there exists a random algorithm with constant error probabilities that accept graphs that satisfy P and reject graphs that are epsilon-far from any graph that satisfies it. If, in addition, the algorithm has complexity independent of the size of the graph, the property is called testable. We will discuss the results of Alon, Fischer, Newman, and Shapira that obtained a combinatorial characterization of testable graph properties, solving an open problem raised in 1996. This characterization informally says that a graph property P is testable if and only if testing P can be reduced to testing the property of satisfying one of finitely many Szemerédi-partitions.
3

[en] CENTRAL PATH ALGORITHMS FOR LINEAR PROGRAMMING / [pt] ALGORITMOS DE TRAJETÓRIA CENTRAL PARA PROGRAMAÇÃO LINEAR

MARCUS MAGNO FERNANDES TORTORELLI 21 December 2006 (has links)
[pt] Neste trabalho estudamos os algoritmos de Pontos Interiores para programação Linear. Publicados após o Algoritmo de Karmarkar. Que seguem, de algum modo, a Trajetória Central. São considerados tanto algoritmos Primais quanto Primais-Duais e também verificadas a eficácia da aplicação da metodologia de busca bidirecional. Estes métodos foram implementados e testados resolvendo um conjunto de problemas gerados aleatoriamente. Através da comparação dos resultados analisamos o desempenho das diferentes metodologias. / [en] We study here the Interior Points Algorithms for Linear Programming, developed after Karmarkar s Algorithm, which follow the Central Path. Both Primal and Primal-dual Algorithms are considered and also the efficiency of applying a bidirecional Search procedure is verified. These methods were implemented and tested solving a set of randomly generated problems. Comparing these results we analyze the performance of the methodologies.
4

[en] FRACTINAL FREQUENCY REUSE AND EVALUATION OF SCHEDULING ALGORITHMS IN FEMTOCELLS LTE / [pt] REUSO DE FREQUÊNCIA FRACIONÁRIO E AVALIAÇÃO DE ALGORITMOS DE AGENDAMENTO EM FEMTO-CÉLULAS LTE

RICARDO APOLINARIO CALZADA CORREA 22 January 2015 (has links)
[pt] O desenvolvimento de ambientes femto-celulares traz um considerável aumento geral na capacidade de sistemas heterogêneos, porque a distância entre o transmissor e receptor é pequena em comparação ao clássico desenvolvimento macro-celular. Mas as aplicações e serviços que estão vindo, precisam de ainda mais capacidade. Na procura desse ganho na capacidade, se criam técnicas e procedimentos que trabalham principalmente na camada física e MAC. Entre elas temos o reuso de frequência unitário, o qual não se logra explodir toda a capacidade do sistema, por isso implementamos o reuso de frequência fracionário que encara diretamente os problemas de interferência co-layer (entre femto-estações) e cross-layer (entre macro e femto estações). Este reuso fracionário de frequência se da só a nível de femto-estações, deixando à macro-estação que utilize toda a banda de frequência atribuída para a macro-célula. Os claros resultados obtidos no nível do SINR, mostram as melhoras. Tomando como base a plataforma anterior de reuso fracionário, analisamos as estrategias de programação do recurso frente a uma aplicação de vídeo. As estrategias pesquisadas são classificadas em: aquelas que tomam em consideração a qualidade do canal e aquelas que além da qualidade do canal consideram dentro da sua métrica requerimentos QoS, em especial o retardo máximo. Estas ultimas são as mais adequadas quando se opera com aplicações de tempo real (vídeo conferência e VoIP). Para contemplar a faixa de funcionamento das melhoras obtidas, todos os cenários de simulação foram sometidos a três intensidades de trafego (leve, médio e pesado). Medidas feitas da vazão, retardo, perda de pacotes e níveis de justiça na repartição mostram os benefícios do efeito combinado do reuso fracionário como o algoritmo de programação utilizado. Com os resultados obtidos fazemos uma escolha do padrão de reuso mais adequado junto com o algoritmo que proporcionam o melhor rendimento, dependendo do cenário (familiares ou empresariais) e da aplicação a utilizar. / [en] The development of femtocells environments brings a considerable increase in the capacity of the heterogeneous systems, because the distance between the transmitter and the receptor is smaller than the classic macrocell development. But the applications and services that are coming need more capacity yet. Looking for that gain of capacity, has been created techniques and methods that work mainly in the physical and MAC layer. Among them, the unitary frequency reuse, that does not achieve to exploit all the system s capacity. Hence we have implemented the fractional frequency reuse that aim directly the problems of co-layer interference (Between femto base stations) and cross-layer interference (Between macro and femto base stations). This fractional reuse of frequency is only among femto-stations, leaving the macro-station that use all the frequency band given for the macro cell. The bright results obtained in the SINR level show the improvements. Based on previous platform of fractional reuse, we analyze the scheduling strategies of the resource with a video application. The studied strategies are classified in: those that consider the quality of the channel and those that beyond the quality of channel consider QoS requirements in its metric, specially the maximum delay time. The last are more adequate when operating with video applications in real time (Video conference, VoIP). To see the operating range of the obtained improvements, all the simulation scenarios were submitted to three intensities of traffic (light, medium and heavy). Measurements of throughput, delay, packet loss ratio and fair levels in the distribution show the benefits of the joint effects of the fractional reuse as the scheduling algorithm used. With the obtained results, we do a selection of the more adequate reuse pattern together with the algorithm that provides the best performance, depending of the scenario (home or business environment) and the applications to use.
5

[en] THE OPTIMIZATION OF PETROLEUM FIELD EXPLORATION ALTERNATIVES USING EVOLUTIONARY COMPUTATION / [pt] OTIMIZAÇÃO DE ALTERNATIVAS PARA DESENVOLVIMENTO DE CAMPO DE PETRÓLEO UTILIZANDO COMPUTAÇÃO EVOLUCIONÁRIA

LUCIANA FALETTI ALMEIDA 21 May 2003 (has links)
[pt] Esta dissertação investiga um sistema baseado em algoritmos genéticos e algoritmos culturais, aplicado ao processo de desenvolvimento de um campo de petróleo. O desenvolvimento de um campo de petróleo consiste, neste caso, da disposição de poços num reservatório petrolífero, já conhecido e delimitado, que permita maximizar o Valor Presente Líquido. Uma disposição de poços define a quantidade e posição de poços produtores e injetores e do tipo de poço (horizontalou vertical) a serem empregados no processo de exploração. O objetivo do trabalho é avaliar o desempenho de Algoritmos Genéticos e Algoritmos Culturais como métodos de apoio à decisão na otimização de alternativas de produção em reservatórios petrolíferos. Determinar a localização de novos poços de petróleo em um reservatório é um problema complexo que depende de propriedades do reservatório e critérios econômicos, entre outros fatores. Para que um processo de otimização possa ser aplicado nesse problema, é necessário definir uma função objetivo a ser minimizada ou maximizada pelo processo. No problema em questão, a função objetivo a ser maximizada é o Valor Presente Líquido (VPL). Para se estabelecer o VPL, subtrai-se os gastos com a exploração do valor correspondente ao volume de petróleo estimado da reserva. Devido à complexidade do perfil de produção de petróleo, exige-se a utilização de simuladores de reservatório para esta estimativa. Deste modo, um simulador de reservatórios é parte integrante da função de avaliação. O trabalho de pesquisa foi desenvolvido em quatro etapas: um estudo sobre a área de exploração de petróleo; um estudo dos modelos da inteligência computacional empregados nesta área; a definição e implementação de um modelo genético e cultural para o desenvolvimento de campo petrolífero e o estudo de caso. O estudo sobre a área de exploração de campo de petróleo envolveu a teoria necessária para a construção da função objetivo. No estudo sobre as técnicas de inteligência computacional definiu-se os conceitos principais sobre Algoritmo Genético e Algoritmo Cultural empregados nesta dissertação. A modelagem de um Algoritmo Genético e Cultural constitui no emprego dos mesmos, para que dado um reservatório petrolífero, o sistema tenha condições de reconhecê-lo e desenvolvê-lo, ou seja, encontrar a configuração (quantidade, localização e tipo de poços) que atinja um maior Valor Presente Líquido. Os resultados obtidos neste trabalho indicam a viabilidade da utilização de Algoritmos Genéticos e Algoritmos Culturais no desenvolvimento de campos de petróleo. / [en] This dissertation investigates a system based in genetic algorithms and cultural algorithms, applied to the development process of a petroleum field. The development of a petroleum field consists in the placement of wells in an already known and delimited petroleum reservoir, which allows maximizing the Net Present Value. A placement of wells defines the quantity and position of the producing wells, the injecting wells, and the wells type (horizontal or vertical) to be used in the exploration process. The objective of this work is to evaluate the performance of Genetic Algorithms and Cultural Algorithms as decision support methods on the optimization of production alternatives in petroleum reservoirs. Determining the new petroleum wells location in a reservoir is a complex problem that depends on the properties of the reservoir and on economic criteria, among other factors. In order to an optimization process to be applied to this problem, it s necessary to define a target function to be minimized or maximized by the process. In the given problem, the target function to be maximized is the Net Present Value (NPV). In order to establish the NPV, the exploration cost correspondent to the estimated reservoir petroleum volume is deducted. The complexity of the petroleum s production profile implies on the use of reservoirs simulators for this estimation. In this way, a reservoir simulator is an integrant part of the evaluation function. The research work was developed in four phases: a study about the petroleum exploration field; a study about the applied computational intelligence models in this area; the definition and implementation of a genetic and cultural model for the development of petroliferous fields and the case study. The study about the petroleum exploration field involved all the necessary theory for the building of the target function. In the study about the computational intelligence techniques, the main concepts about the Genetic Algorithms and Cultural Algorithms applied in this dissertation were defined. The modeling of Genetic and Cultural Algorithms consisted in applying them so that, given a petroleum reservoir, the system is capable of evolve and find configurations (quantity, location and wells type) that achieve greater Net Present Values. The results obtained in this work, indicate that the use of Genetic Algorithms and Cultural Algorithms in the development of petroleum fields is a promising alternative.
6

[en] EMOTIONS IN PLOTS WITH NON-DETERMINISTIC PLANNING FOR INTERACTIVE STORYTELLING / [pt] EMOÇÕES EM ENREDOS COM PLANEJAMENTO NÃO-DETERMINÍSTICO PARA NARRAÇÃO INTERATIVA

FABIO ARAUJO GUILHERME DA SILVA 25 April 2016 (has links)
[pt] Narração interativa é uma forma de entretenimento digital em que os usuários participam do processo de compor e dramatizar uma história. Nesse contexto, a determinação do comportamento dos personagens de acordo com as suas preferências individuais pode ser uma maneira interessante de gerar histórias plausíveis, onde os personagens agem de forma crível. Diversidade de histórias e oportunidades de interação são requisitos fundamentais a serem considerados ao se projetar tais aplicações. Esta tese propõe a criação de uma arquitetura e de um protótipo para a geração e dramatização de enredos interativos não determinísticos, utilizando um modelo de emoções que não só sirva para guiar as ações dos personagens apresentadas pelo algoritmo de geração de planos, mas que também influencie a participação dos usuários. Além disso, para melhorar a qualidade e nível de diversidade das histórias, os personagens devem ser capazes de evoluir em termos de seus traços de personalidade durante o desenrolar da trama, como um reflexo dos eventos que realizam ou a que são expostos. / [en] Interactive storytelling is a form of digital entertainment in which users participate in the process of composing and dramatizing a story. In this context, determining the characters behaviour according to their individual preferences can be an interesting way of generating plausible stories where the characters act in a believable manner. Diversity of stories and opportunities for interaction are key requirements to be considered when designing such applications. This thesis proposes the creation of an architecture and a prototype for the generation and dramatization of interactive nondeterministic plots, using a model of emotions that not only serves to guide the actions of the characters presented by the plan generation algorithm, but also influences the participation of the users. Also, to improve the quality and diversity level of the stories, characters must be able to evolve in terms of their personality traits as the plot unfolds, as a reflection of the events they perform or are exposed to.
7

[en] A STUDY ON UNIT-DEMAND AUCTIONS / [pt] UM ESTUDO SOBRE LEILÕES DE DEMANDA UNITÁRIA

MARCELO ALBUQUERQUE FERNANDES MAS 27 October 2006 (has links)
[pt] Este trabalho se concentra no desenvolvimento de mecanismos de leilões reveladores aleatorizados que buscam maximizar simultaneamente a receita e a eficiência econômica, ou função social, de leilões de demanda unitária. Em um leilão de demanda unitária, um conjunto de k bens é leiloado para um conjunto de n consumidores, com a restrição de que nenhum consumidor pode comprar mais de um bem. É apresentado um arcabouço para o desenvolvimento de mecanismos reveladores aleatorizados de complexidade polinomial derivados do mecanismo de Vickrey-Clarke- Groves, ou VCG. Ao invés de utilizar preços de reserva, estas variantes do VCG utilizam como parâmetro o número de bens que devem ser efetivamente vendidos. Os mecanismos se diferenciam entre si pela maneira como é feito o cálculo do número de bens que devem ser vendidos e permitem um balanço interessante entre receita e eficiência econômica, ao mesmo tempo que melhoram os resultados teóricos alcançados para o problema de Leilões de Demanda Unitária. / [en] This work focuses on the development of randomized truthful mechanisms that seek to maximize both the revenue and the economic efficiency, or social welfare, of unit-demand auctions. In a unit-demand auction a set of k items is auctioned to a set of n consumers and no consumer can purchase more than one item. A framework is presented for devising polynomial-time randomized truthful mechanisms that are based on a new variant of the Vickrey-Clarke-Groves (VCG) mechanism. Instead of using reserve prices, this variant of VCG uses the number of objects that we wish to sell as a parameter. The mechanisms obtained differ er from each other in the way they select the number of items to be sold and allow an interesting trade-off between revenue and economic effciency, while improving upon the stateof- the-art results for the Unit-Demand Auction problem (09).
8

[en] IMPROVED APPROXIMATIONS FOR THE K-HOTLINK ASSIGNMENT PROBLEM AND FOR BINARY SEARCHING IN TREES / [pt] ALGORITMOS APROXIMATIVOS PARA O PROBLEMA DE ATRIBUIÇÃO DE HOTLINKS E PARA BUSCA BINÁRIA EM ÁRVORES

MARCO SERPA MOLINARO 07 July 2008 (has links)
[pt] Neste trabalho, apresentamos algoritmos aproximativos para dois problemas de otimização em árvores. Na primeira parte, consideramos o Problema de Atribuição de k-Hotlinks. Seja G= (V,E) um grafo direcionado acíclico representando um web site, onde nós correspondem a páginas e arcos correspondem a hyperlinks. Nesse contexto, hotlink são definidos como atalhos (novos arcos) adicionados às páginas de G de modo a reduzir o tempo gasto pelos usuários para alcançarem as informações desejadas. Neste trabalho consideramos o problema onde G é uma árvore enraizada e o objetivo é minimizar o tempo médio gasto pelos usuários atribuindo no máximo k hotlinks a cada nó. Para a versão mais estudada desse problema onde no máximo um hotlink pode ser atribuído a cada nó, provamos a existência de um FPTAS. Isso representa uma significante melhora em relação ao algoritmo com aproximação constante obtido recentemente em [Jacobs, WADS 2007]. Além disso, desenvolvemos o primeiro algoritmo com aproximação constante para a versão mais geral onde k hotlinks podem ser atribuídos a cada nó. Na segunda parte deste trabalho, consideramos o problema de computar estratégias eficientes para realizar buscas em árvores. Como uma generalização da tradicional busca binária em listas ordenadas, suponha que se deseja encontrar um nó específico (porém desconhecido) de uma árvore realizando consultas em seus arcos, onde cada consulta indica a extremidade do arco mais próxima ao nó desejado. Dada a probabilidade de cada nó ser aquele procurado, o objetivo é computar uma estratégia de busca que minimize o número esperado de consultas. Aplicações práticas desse problema incluem sincronização de file systems e testes de software. Apresentamos um algoritmo linear que obtém a primeira aproximação constante para esse problema. Isso representa uma melhora significativa em relação à O(log n)-aproximação anterior. / [en] Here we present a study on two optimization problems in trees: the k- Hotlink Assignment Problem and the problem of Binary Searching in Trees. As a result, we obtain improved approximation algorithms for both problem. The k-Hotlink Assignment Problem can be defined as follows. Let G = (V,E) be a directed acyclic graph representing a web site, where nodes correspond to pages and arcs to hyperlinks. In this context, hotlinks are defined as shortcuts (new arcs) added to web pages of G in order to reduce the time spent by users to reach their desired information. Here we consider the problem where G is a rooted directed tree and the goal is minimizing the expected time spent by users by assigning at most k hotlinks to each node. For the most studied version of this problem where at most one hotlink can be assigned from each node, we prove the existence of an FPTAS, improving upon the constant factor algorithm recently obtained in [Jacobs, WADS 2007]. In addition, we develop the first constant factor approximation algorithm for the most general version where k hotlinks can be assigned from each node. In the second part of this work, we consider the problem of computing efficient strategies for searching in trees. As a generalization of the classical binary search for ordered lists, suppose one wishes to find a (unknown) specific node of a tree by asking queries to its arcs, where each query indicates the endpoint closer to the desired node. Given the likelihood of each node being the one searched, the objective is to compute a search strategy that minimizes the expected number of queries. Practical applications of this problem include file system synchronization and software testing. Here we present a linear time algorithm which is the first constant factor approximation for this problem. This represents a significant improvement over previous O(log n)-approximation.
9

[en] ON THE SIMULTANEOUS MINIMIZATION OF WORST TESTING COST AND EXPECTED TESTING COST WITH DECISION TREES / [pt] MINIMIZAÇÃO SIMULTÂNEA DO PIOR CUSTO E DO CUSTO MÉDIO EM ÁRVORES DE DECISÃO

ALINE MEDEIROS SAETTLER 25 January 2017 (has links)
[pt] O problema de minimizar o custo de avaliar uma função discreta lendo sequencialmente as suas variáveis é um problema que surge em diversas aplicações, entre elas sistemas de diagnóstico automático e aprendizado ativo. Neste problema, cada variável da função está associada a um custo, que se deve pagar para checar o seu valor. Além disso, pode existir uma distribuição de probabilidades associadas aos pontos onde a função está definida. A maioria dos trabalhos nesta área se concentra ou na minimização do custo máximo ou na minimização do custo esperado gasto para avaliar a função. Nesta dissertação, mostramos como obter uma Ômicron logaritmo de N aproximação em relação à minimização do pior custo (a melhor aproximação possível assumindo que P é diferente de NP). Nós também mostramos um procedimento polinomial para avaliar uma função otimizando simultaneamente o pior custo e o custo esperado. / [en] The problem of minimizing the cost of evaluating a discrete function by sequentially reading its variables is a problem that arises in several applications, among them automatic diagnosis design and active learning. In this problem, each variable of the function is associated with a cost, that we have to pay in order to check its value. In addition, there may exist a probability distribution associated with the points where the function is defined. Most of the work in the area has focussed either on the minimization of the maximum cost or on the minimization of the expected cost spent to evaluate the function. In this dissertation, we show how to obtain an Ômicron logarithm of N approximation with respect to the worst case minimization (the best possible approximation under the assumption that P is different from NP). We also show a polynomial time procedure for evaluate a function that simultaneously optimizes both the worst and the expected costs.
10

[pt] ALGORITMOS DE APROXIMAÇÃO PARA ÁRVORES DE DECISÃO / [en] APPROXIMATION ALGORITHMS FOR DECISION TREES

ALINE MEDEIROS SAETTLER 13 December 2021 (has links)
[pt] A construção de árvores de decisão é um problema central em diversas áreas da ciência da computação, por exemplo, teoria de banco de dados e aprendizado computacional. Este problema pode ser visto como o problema de avaliar uma função discreta, onde para verificar o valor de cada variável da função temos que pagar um custo, e os pontos onde a função está definida estão associados a uma distribuição de probabilidade. O objetivo do problema é avaliar a função minimizando o custo gasto (no pior caso ou no caso médio). Nesta tese, apresentamos quatro contribuições relacionadas a esse problema. A primeira é um algoritmo que alcança uma aproximação de O(log(n)) em relação a tanto o custo esperado quanto ao pior custo. A segunda é um método que combina duas árvores, uma com pior custo W e outra com custo esperado E, e produz uma árvore com pior custo de no máximo (1+p)W e custo esperado no máximo (1/(1-e-p))E, onde p é um parâmetro dado. Nós também provamos que esta é uma caracterização justa do melhor trade-off alcançável, mostrando que existe um número infinito de instâncias para as quais não podemos obter uma árvore de decisão com tanto o pior custo menor que (1 + p)OPTW(I) quanto o custo esperado menor que (1/(1 - e - p))OPTE(I), onde OPTW(I) (resp. OPTE(I)) denota o pior custo da árvore de decisão que minimiza o pior custo (resp. custo esperado) para uma instância I do problema. A terceira contribuição é um algoritmo de aproximação de O(log(n)) para a minimização do pior custo para uma variante do problema onde o custo de ler uma variável depende do seu valor. Nossa última contribuição é um algoritmo randomized rounding que, dada uma instância do problema (com um inteiro adicional (k > 0) e um parâmetro 0 < e < 1/2, produz uma árvore de decisão oblivious com custo no máximo (3/(1 - 2e))ln(n)OPT(I) e que produz no máximo (k/e) erros, onde OPT(I) denota o custo da árvore de decisão oblivious com o menor custo entre todas as árvores oblivious para a instância I que produzem no máximo k erros de classificação. / [en] Decision tree construction is a central problem in several areas of computer science, for example, data base theory and computational learning. This problem can be viewed as the problem of evaluating a discrete function, where to check the value of each variable of the function we have to pay a cost, and the points where the function is defined are associated with a probability distribution. The goal of the problem is to evaluate the function minimizing the cost spent (in the worst case or in expectation). In this Thesis, we present four contributions related to this problem. The first one is an algorithm that achieves an O(log(n)) approximation with respect to both the expected and the worst costs. The second one is a procedure that combines two trees, one with worst costW and another with expected cost E, and produces a tree with worst cost at most (1+p)W and expected cost at most (1/(1-e-p))E, where p is a given parameter. We also prove that this is a sharp characterization of the best possible trade-off attainable, showing that there are infinitely many instances for which we cannot obtain a decision tree with both worst cost smaller than (1+p)OPTW(I) and expected cost smaller than (1/(1-e-p))OPTE(I), where OPTW(I) (resp. OPTE(I)) denotes the cost of the decision tree that minimizes the worst cost (resp. expected cost) for an instance I of the problem. The third contribution is an O(log(n)) approximation algorithm for the minimization of the worst cost for a variant of the problem where the cost of reading a variable depends on its value. Our final contribution is a randomized rounding algorithm that, given an instance of the problem (with an additional integer k > 0) and a parameter 0 < e < 1/2, builds an oblivious decision tree with cost at most (3/(1 - 2e))ln(n)OPT(I) and produces at most (k/e) errors, where OPT(I) denotes the cost of the oblivious decision tree with minimum cost among all oblivious decision trees for instance I that make at most k classification errors.

Page generated in 0.0624 seconds