1 |
[en] QUANTUM-INSPIRED EVOLUTIONARY ALGORITHMS FOR PROBLEMS BASED ON NUMERICAL REPRESENTATION / [pt] ALGORITMOS EVOLUTIVOS COM INSPIRAÇÃO QUÂNTICA PARA PROBLEMAS COM REPRESENTAÇÃO NUMÉRICAANDRE VARGAS ABS DA CRUZ 25 September 2007 (has links)
[pt] Desde que foram propostos como método de otimização, os
algoritmos
evolutivos têm sido usados com sucesso para resolver
problemas complexos
nas mais diversas áreas como, por exemplo, o projeto
automático de circuitos
e equipamentos, planejamento de tarefas, engenharia de
software e mineração
de dados, entre tantos outros. Este sucesso se deve, entre
outras coisas, ao fato
desta classe de algoritmos não necessitar de formulações
matemáticas rigorosas
a respeito do problema que se deseja otimizar, além de
oferecer um alto grau
de paralelismo no processo de busca. No entanto, alguns
problemas são computacionalmente
custosos no que diz respeito à avaliação das soluções
durante o
processo de busca, tornando a otimização por algoritmos
evolutivos um processo
lento para situações onde se deseja uma resposta rápida do
algoritmo (como por
exemplo, problemas de otimização online). Diversas
maneiras de se contornar
este problema, através da aceleração da convergência para
boas soluções, foram
propostas, entre as quais destacam-se os Algoritmos
Culturais e os Algoritmos
Co-Evolutivos. No entanto, estes algoritmos ainda têm a
necessidade de avaliar
muitas soluções a cada etapa do processo de otimização. Em
problemas onde
esta avaliação é computacionalmente custosa, a otimização
pode levar um tempo
proibitivo para alcançar soluções ótimas. Este trabalho
propõe um novo algoritmo
evolutivo para problemas de otimização numérica (Algoritmo
Evolutivo
com Inspiração Quântica usando Representação Real - AEIQ-
R), inspirado no
conceito de múltiplos universos da física quântica, que
permite realizar o processo
de otimização com um menor número de avaliações de
soluções. O trabalho
apresenta a modelagem deste algoritmo para a solução de
problemas benchmark
de otimização numérica, assim como no treinamento de redes
neurais
recorrentes em problemas de aprendizado supervisionado de
séries temporais e
em aprendizado por reforço em tarefas de controle. Os
resultados obtidos demonstram
a eficiência desse algoritmo na solução destes tipos de
problemas. / [en] Since they were proposed as an optimization method, the
evolutionary algorithms
have been successfully used for solving complex problems
in several
areas such as, for example, the automatic design of
electronic circuits and equipments,
task planning and scheduling, software engineering and
data mining,
among many others. This success is due, among many other
things, to the fact
that this class of algorithms does not need rigorous
mathematical formulations
regarding the problem to be optimized, and also because it
offers a high degree of
parallelism in the search process. However, some problems
are computationally
intensive when it concerns the evaluation of solutions
during the search process,
making the optimization by evolutionary algorithms a slow
process for situations
where a quick response from the algorithm is desired (for
instance, in online optimization
problems). Several ways to overcome this problem, by
speeding up
convergence time, were proposed, including Cultural
Algorithms and Coevolutionary
Algorithms. However, these algorithms still have the need
to evaluate
many solutions on each step of the optimization process.
In problems where
this evaluation is computationally expensive, the
optimization might take a prohibitive
time to reach optimal solutions. This work proposes a new
evolutionary
algorithm for numerical optimization problems (Quantum-
Inspired Evolutionary
Algorithm for Problems based on Numerical Representation -
QIEA-R),
inspired in the concept of quantum superposition, which
allows the optimization
process to be carried on with a smaller number of
evaluations. The work presents
the modelling for this algorithm for solving benchmark
numerical optimization
problems, and for training recurrent neural networks in
supervised learning and
reinforcement learning. The results show the good
performance of this algorithm
in solving these kinds of problems.
|
2 |
[en] A CHARACTERIZATION OF TESTABLE GRAPH PROPERTIES IN THE DENSE GRAPH MODEL / [pt] UMA CARACTERIZAÇÃO DE PROPRIEDADES TESTÁVEIS NO MODELO DE GRAFOS DENSOSFELIPE DE OLIVEIRA 19 June 2023 (has links)
[pt] Consideramos, nesta dissertação, a questão de determinar se um grafo
tem uma propriedade P, tal como G é livre de triângulos ou G é 4-
colorível. Em particular, consideramos para quais propriedades P existe um
algoritmo aleatório com probabilidades de erro constantes que aceita grafos que
satisfazem P e rejeita grafos que são epsilon-longe de qualquer grafo que o satisfaça.
Se, além disso, o algoritmo tiver complexidade independente do tamanho
do grafo, a propriedade é dita testável. Discutiremos os resultados de Alon,
Fischer, Newman e Shapira que obtiveram uma caracterização combinatória de
propriedades testáveis de grafos, resolvendo um problema em aberto levantado
em 1996. Essa caracterização diz informalmente que uma propriedade P de
um grafo é testável se e somente se testar P pode ser reduzido a testar a
propriedade de satisfazer uma das finitas partições Szemerédi. / [en] We consider, in this thesis, the question of determining if a graph has a
property P such as G is triangle-free or G is 4-colorable. In particular,
we consider for which properties P there exists a random algorithm with
constant error probabilities that accept graphs that satisfy P and reject graphs
that are epsilon-far from any graph that satisfies it. If, in addition, the algorithm
has complexity independent of the size of the graph, the property is called
testable. We will discuss the results of Alon, Fischer, Newman, and Shapira
that obtained a combinatorial characterization of testable graph properties,
solving an open problem raised in 1996. This characterization informally says
that a graph property P is testable if and only if testing P can be reduced to
testing the property of satisfying one of finitely many Szemerédi-partitions.
|
3 |
[en] CENTRAL PATH ALGORITHMS FOR LINEAR PROGRAMMING / [pt] ALGORITMOS DE TRAJETÓRIA CENTRAL PARA PROGRAMAÇÃO LINEARMARCUS MAGNO FERNANDES TORTORELLI 21 December 2006 (has links)
[pt] Neste trabalho estudamos os algoritmos de Pontos Interiores para programação Linear. Publicados após o Algoritmo de Karmarkar. Que seguem, de algum modo, a Trajetória Central. São considerados tanto algoritmos Primais quanto Primais-Duais e também verificadas a eficácia da aplicação da metodologia de busca bidirecional. Estes métodos foram implementados e testados resolvendo um conjunto de problemas gerados aleatoriamente. Através da comparação dos resultados analisamos o desempenho das diferentes metodologias. / [en] We study here the Interior Points Algorithms for Linear Programming, developed after Karmarkar s Algorithm, which follow the Central Path. Both Primal and Primal-dual Algorithms are considered and also the efficiency of applying a bidirecional Search procedure is verified. These methods were implemented and tested solving a set of randomly generated problems. Comparing these results we analyze the performance of the methodologies.
|
4 |
[en] FRACTINAL FREQUENCY REUSE AND EVALUATION OF SCHEDULING ALGORITHMS IN FEMTOCELLS LTE / [pt] REUSO DE FREQUÊNCIA FRACIONÁRIO E AVALIAÇÃO DE ALGORITMOS DE AGENDAMENTO EM FEMTO-CÉLULAS LTERICARDO APOLINARIO CALZADA CORREA 22 January 2015 (has links)
[pt] O desenvolvimento de ambientes femto-celulares traz um considerável aumento geral na capacidade de sistemas heterogêneos, porque a distância entre o transmissor e receptor é pequena em comparação ao clássico desenvolvimento macro-celular. Mas as aplicações e serviços que estão vindo, precisam de ainda mais capacidade. Na procura desse ganho na capacidade, se criam técnicas e procedimentos que trabalham principalmente na camada física e MAC. Entre elas temos o reuso de frequência unitário, o qual não se logra explodir toda a capacidade do sistema, por isso implementamos o reuso de frequência fracionário que encara diretamente os problemas de interferência co-layer (entre femto-estações) e cross-layer (entre macro e femto estações). Este reuso fracionário de frequência se da só a nível de femto-estações, deixando à macro-estação que utilize toda a banda de frequência atribuída para a macro-célula. Os claros resultados obtidos no nível do SINR, mostram as melhoras. Tomando como base a plataforma anterior de reuso fracionário, analisamos as estrategias de programação do recurso frente a uma aplicação de vídeo. As estrategias pesquisadas são classificadas em: aquelas que tomam em consideração a qualidade do canal e aquelas que além da qualidade do canal consideram dentro da sua métrica requerimentos QoS, em especial o retardo máximo. Estas ultimas são as mais adequadas quando se opera com aplicações de tempo real (vídeo conferência e VoIP). Para contemplar a faixa de funcionamento das melhoras obtidas, todos os cenários de simulação foram sometidos a três intensidades de trafego (leve, médio e pesado). Medidas feitas da vazão, retardo, perda de pacotes e níveis de justiça na repartição mostram os benefícios do efeito combinado do reuso fracionário como o algoritmo de programação utilizado. Com os resultados obtidos fazemos uma escolha do padrão de reuso mais adequado junto com o algoritmo que proporcionam o melhor rendimento, dependendo do cenário (familiares ou empresariais) e da aplicação a utilizar. / [en] The development of femtocells environments brings a considerable increase in the capacity of the heterogeneous systems, because the distance between the transmitter and the receptor is smaller than the classic macrocell development. But the applications and services that are coming need more capacity yet. Looking for that gain of capacity, has been created techniques and methods that work mainly in the physical and MAC layer. Among them, the unitary frequency reuse, that does not achieve to exploit all the system s capacity. Hence we have implemented the fractional frequency reuse that aim directly the problems of co-layer interference (Between femto base stations) and cross-layer interference (Between macro and femto base stations). This fractional reuse of frequency is only among femto-stations, leaving the macro-station that use all the frequency band given for the macro cell. The bright results obtained in the SINR level show the improvements. Based on previous platform of fractional reuse, we analyze the scheduling strategies of the resource with a video application. The studied strategies are classified in: those that consider the quality of the channel and those that beyond the quality of channel consider QoS requirements in its metric, specially the maximum delay time. The last are more adequate when operating with video applications in real time (Video conference, VoIP). To see the operating range of the obtained improvements, all the simulation scenarios were submitted to three intensities of traffic (light, medium and heavy). Measurements of throughput, delay, packet loss ratio and fair levels in the distribution show the benefits of the joint effects of the fractional reuse as the scheduling algorithm used. With the obtained results, we do a selection of the more adequate reuse pattern together with the algorithm that provides the best performance, depending of the scenario (home or business environment) and the applications to use.
|
5 |
[en] THE OPTIMIZATION OF PETROLEUM FIELD EXPLORATION ALTERNATIVES USING EVOLUTIONARY COMPUTATION / [pt] OTIMIZAÇÃO DE ALTERNATIVAS PARA DESENVOLVIMENTO DE CAMPO DE PETRÓLEO UTILIZANDO COMPUTAÇÃO EVOLUCIONÁRIALUCIANA FALETTI ALMEIDA 21 May 2003 (has links)
[pt] Esta dissertação investiga um sistema baseado em algoritmos
genéticos e algoritmos culturais, aplicado ao processo de
desenvolvimento de um campo de petróleo.
O desenvolvimento de um campo de petróleo consiste, neste
caso, da disposição de poços num reservatório petrolífero,
já conhecido e delimitado, que permita maximizar o Valor
Presente Líquido. Uma disposição de poços define a
quantidade e posição de poços produtores e injetores e do
tipo de poço (horizontalou vertical) a serem empregados no
processo de exploração.
O objetivo do trabalho é avaliar o desempenho de Algoritmos
Genéticos e Algoritmos Culturais como métodos de apoio à
decisão na otimização de alternativas de produção em
reservatórios petrolíferos.
Determinar a localização de novos poços de petróleo em um
reservatório é um problema complexo que depende de
propriedades do reservatório e critérios econômicos, entre
outros fatores. Para que um processo de otimização possa ser
aplicado nesse problema, é necessário definir uma função
objetivo a ser minimizada ou maximizada pelo processo. No
problema em questão, a função objetivo a ser maximizada é o
Valor Presente Líquido (VPL). Para se estabelecer o VPL,
subtrai-se os gastos com a exploração do valor
correspondente ao volume de petróleo estimado da reserva.
Devido à complexidade do perfil de produção de petróleo,
exige-se a utilização de simuladores de reservatório para
esta estimativa. Deste modo, um simulador de reservatórios
é parte integrante da função de avaliação.
O trabalho de pesquisa foi desenvolvido em quatro etapas:
um estudo sobre a área de exploração de petróleo; um estudo
dos modelos da inteligência computacional empregados nesta
área; a definição e implementação de um modelo genético e
cultural para o desenvolvimento de campo petrolífero e o
estudo de caso.
O estudo sobre a área de exploração de campo de petróleo
envolveu a teoria necessária para a construção da função
objetivo.
No estudo sobre as técnicas de inteligência computacional
definiu-se os conceitos principais sobre Algoritmo Genético
e Algoritmo Cultural empregados nesta dissertação.
A modelagem de um Algoritmo Genético e Cultural constitui
no emprego dos mesmos, para que dado um reservatório
petrolífero, o sistema tenha condições de reconhecê-lo e
desenvolvê-lo, ou seja, encontrar a configuração
(quantidade, localização e tipo de poços) que atinja um
maior Valor Presente Líquido.
Os resultados obtidos neste trabalho indicam a viabilidade
da utilização de Algoritmos Genéticos e Algoritmos
Culturais no desenvolvimento de campos de petróleo. / [en] This dissertation investigates a system based in genetic algorithms and cultural algorithms, applied to the
development process of a petroleum field. The development of a petroleum field consists in the placement of wells in an already known and delimited petroleum reservoir, which allows maximizing the Net Present Value. A placement of wells defines the quantity and position of the producing wells, the injecting wells,
and the wells type (horizontal or vertical) to be used in the exploration process. The objective of this work is to evaluate the performance of Genetic Algorithms and Cultural Algorithms as decision support methods on the optimization of production alternatives in petroleum reservoirs. Determining the new petroleum wells location in a reservoir is a complex problem that depends on the properties of the reservoir and on economic criteria, among other factors. In order to an optimization process to be applied to this problem, it s necessary to define a target function to be minimized or maximized by the process. In the given problem, the target function to be maximized is the Net Present Value (NPV). In order to establish the NPV, the exploration cost correspondent to the estimated reservoir petroleum volume is deducted. The complexity of
the petroleum s production profile implies on the use of reservoirs simulators for this estimation. In this way, a reservoir simulator is an integrant part of the evaluation function. The research work was developed in four phases: a study about the petroleum exploration field; a study about the applied computational intelligence models in this area; the definition and implementation of a genetic and cultural model for the development of petroliferous fields and the case study. The study about the petroleum exploration field involved all the necessary theory for the building of the target function. In the study about the computational intelligence techniques, the main concepts about the Genetic Algorithms and Cultural Algorithms applied in this dissertation were defined. The modeling of Genetic and Cultural Algorithms consisted in applying them so that, given a petroleum reservoir, the system is capable of evolve and find configurations (quantity, location and wells type) that achieve greater Net Present Values. The results obtained in this work, indicate that the use of Genetic Algorithms and Cultural Algorithms in the
development of petroleum fields is a promising alternative.
|
6 |
[en] EMOTIONS IN PLOTS WITH NON-DETERMINISTIC PLANNING FOR INTERACTIVE STORYTELLING / [pt] EMOÇÕES EM ENREDOS COM PLANEJAMENTO NÃO-DETERMINÍSTICO PARA NARRAÇÃO INTERATIVAFABIO ARAUJO GUILHERME DA SILVA 25 April 2016 (has links)
[pt] Narração interativa é uma forma de entretenimento digital em que os usuários participam do processo de compor e dramatizar uma história. Nesse contexto, a determinação do comportamento dos personagens de acordo com as suas preferências individuais pode ser uma maneira interessante de gerar histórias plausíveis, onde os personagens agem de forma crível. Diversidade de histórias e oportunidades de interação são requisitos fundamentais a serem considerados ao se projetar tais aplicações. Esta tese propõe a criação de uma arquitetura e de um protótipo para a geração e dramatização de enredos interativos não determinísticos, utilizando um modelo de emoções que não só sirva para guiar as ações dos personagens apresentadas pelo algoritmo de geração de planos, mas que também influencie a participação dos usuários. Além disso, para melhorar a qualidade e nível de diversidade das histórias, os personagens devem ser capazes de evoluir em termos de seus traços de personalidade durante o desenrolar da trama, como um reflexo dos eventos que realizam ou a que são expostos. / [en] Interactive storytelling is a form of digital entertainment in which users participate in the process of composing and dramatizing a story. In this context, determining the characters behaviour according to their individual preferences can be an interesting way of generating plausible stories where the characters act in a believable manner. Diversity of stories and opportunities for interaction are key requirements to be considered when designing such applications. This thesis proposes the creation of an architecture and a prototype for the generation and dramatization of interactive nondeterministic plots, using a model of emotions that not only serves to guide the actions of the characters presented by the plan generation algorithm, but also influences the participation of the users. Also, to improve the quality and diversity level of the stories, characters must be able to evolve in terms of their personality traits as the plot unfolds, as a reflection of the events they perform or are exposed to.
|
7 |
[en] A STUDY ON UNIT-DEMAND AUCTIONS / [pt] UM ESTUDO SOBRE LEILÕES DE DEMANDA UNITÁRIAMARCELO ALBUQUERQUE FERNANDES MAS 27 October 2006 (has links)
[pt] Este trabalho se concentra no desenvolvimento de
mecanismos de leilões reveladores aleatorizados que buscam
maximizar simultaneamente a receita e a eficiência
econômica, ou função social, de leilões de demanda
unitária. Em um leilão de demanda unitária, um conjunto de
k bens é leiloado para um conjunto de n consumidores, com
a restrição de que nenhum consumidor pode comprar mais de
um bem. É apresentado um arcabouço para o desenvolvimento
de mecanismos reveladores aleatorizados de complexidade
polinomial derivados do mecanismo de Vickrey-Clarke-
Groves, ou VCG. Ao invés de utilizar preços de reserva,
estas variantes do VCG utilizam como parâmetro o número de
bens que devem ser efetivamente vendidos. Os mecanismos se
diferenciam entre si pela maneira como é feito o cálculo
do número de bens que devem ser vendidos e permitem um
balanço interessante entre receita e eficiência econômica,
ao mesmo tempo que melhoram os resultados teóricos
alcançados para o problema de Leilões de Demanda Unitária. / [en] This work focuses on the development of randomized
truthful mechanisms
that seek to maximize both the revenue and the economic efficiency, or
social welfare, of unit-demand auctions. In a unit-demand
auction a set of
k items is auctioned to a set of n consumers and no
consumer can purchase
more than one item. A framework is presented for devising
polynomial-time
randomized truthful mechanisms that are based on a new
variant of the
Vickrey-Clarke-Groves (VCG) mechanism. Instead of using
reserve prices,
this variant of VCG uses the number of objects that we
wish to sell as
a parameter. The mechanisms obtained differ er from each
other in the way
they select the number of items to be sold and allow an
interesting trade-off
between revenue and economic effciency, while improving
upon the stateof-
the-art results for the Unit-Demand Auction problem (09).
|
8 |
[en] IMPROVED APPROXIMATIONS FOR THE K-HOTLINK ASSIGNMENT PROBLEM AND FOR BINARY SEARCHING IN TREES / [pt] ALGORITMOS APROXIMATIVOS PARA O PROBLEMA DE ATRIBUIÇÃO DE HOTLINKS E PARA BUSCA BINÁRIA EM ÁRVORESMARCO SERPA MOLINARO 07 July 2008 (has links)
[pt] Neste trabalho, apresentamos algoritmos aproximativos para
dois problemas de otimização em árvores. Na primeira parte,
consideramos o Problema de Atribuição de k-Hotlinks. Seja G=
(V,E) um grafo direcionado acíclico representando um web
site, onde nós correspondem a páginas e arcos correspondem
a hyperlinks. Nesse contexto, hotlink são definidos como
atalhos (novos arcos) adicionados às páginas de G de modo a
reduzir o tempo gasto pelos usuários para alcançarem as
informações desejadas. Neste trabalho consideramos o
problema onde G é uma árvore enraizada e o objetivo é
minimizar o tempo médio gasto pelos usuários atribuindo no
máximo k hotlinks a cada nó. Para a versão mais estudada
desse problema onde no máximo um hotlink pode ser atribuído
a cada nó, provamos a existência de um FPTAS. Isso
representa uma significante melhora em relação ao algoritmo
com aproximação constante obtido recentemente em [Jacobs,
WADS 2007]. Além disso, desenvolvemos o primeiro algoritmo
com aproximação constante para a versão mais geral onde k
hotlinks podem ser atribuídos a cada nó. Na segunda parte
deste trabalho, consideramos o problema de computar
estratégias eficientes para realizar buscas em árvores.
Como uma generalização da tradicional busca binária em
listas ordenadas, suponha que se deseja encontrar um nó
específico (porém desconhecido) de uma árvore realizando
consultas em seus arcos, onde cada consulta indica a
extremidade do arco mais próxima ao nó desejado. Dada a
probabilidade de cada nó ser aquele procurado, o objetivo é
computar uma estratégia de busca que minimize o número
esperado de consultas. Aplicações práticas desse problema
incluem sincronização de file systems e testes de software.
Apresentamos um algoritmo linear que obtém a primeira
aproximação constante para esse problema. Isso representa
uma melhora significativa em relação à O(log n)-aproximação
anterior. / [en] Here we present a study on two optimization problems in
trees: the k-
Hotlink Assignment Problem and the problem of Binary
Searching in Trees.
As a result, we obtain improved approximation algorithms
for both problem.
The k-Hotlink Assignment Problem can be defined as follows.
Let G =
(V,E) be a directed acyclic graph representing a web site,
where nodes
correspond to pages and arcs to hyperlinks. In this
context, hotlinks are
defined as shortcuts (new arcs) added to web pages of G in
order to reduce
the time spent by users to reach their desired information.
Here we consider
the problem where G is a rooted directed tree and the goal
is minimizing the
expected time spent by users by assigning at most k
hotlinks to each node.
For the most studied version of this problem where at most
one hotlink
can be assigned from each node, we prove the existence of
an FPTAS,
improving upon the constant factor algorithm recently
obtained in [Jacobs,
WADS 2007]. In addition, we develop the first constant
factor approximation
algorithm for the most general version where k hotlinks can
be assigned from
each node.
In the second part of this work, we consider the problem of
computing efficient
strategies for searching in trees. As a generalization of
the classical
binary search for ordered lists, suppose one wishes to find
a (unknown) specific
node of a tree by asking queries to its arcs, where each
query indicates
the endpoint closer to the desired node. Given the
likelihood of each node
being the one searched, the objective is to compute a
search strategy that
minimizes the expected number of queries. Practical
applications of this
problem include file system synchronization and software
testing. Here we
present a linear time algorithm which is the first constant
factor approximation
for this problem. This represents a significant improvement
over
previous O(log n)-approximation.
|
9 |
[en] ON THE SIMULTANEOUS MINIMIZATION OF WORST TESTING COST AND EXPECTED TESTING COST WITH DECISION TREES / [pt] MINIMIZAÇÃO SIMULTÂNEA DO PIOR CUSTO E DO CUSTO MÉDIO EM ÁRVORES DE DECISÃOALINE MEDEIROS SAETTLER 25 January 2017 (has links)
[pt] O problema de minimizar o custo de avaliar uma função discreta lendo sequencialmente as suas variáveis é um problema que surge em diversas aplicações, entre elas sistemas de diagnóstico automático e aprendizado ativo. Neste problema, cada variável da função está associada a um custo, que se deve pagar para checar o seu valor. Além disso, pode existir uma distribuição de probabilidades associadas aos pontos onde a função está definida. A maioria dos trabalhos nesta área se concentra ou na minimização do custo máximo ou na minimização do custo esperado gasto para avaliar a função. Nesta dissertação, mostramos como obter uma Ômicron logaritmo de N aproximação em relação à minimização do pior custo (a melhor aproximação possível assumindo que P é diferente de NP). Nós também mostramos um procedimento polinomial para avaliar uma função otimizando simultaneamente o pior custo e o custo esperado. / [en] The problem of minimizing the cost of evaluating a discrete function by sequentially reading its variables is a problem that arises in several applications, among them automatic diagnosis design and active learning. In this problem, each variable of the function is associated with a cost, that we have to pay in order to check its value. In addition, there may exist a probability distribution associated with the points where the function is defined. Most of the work in the area has focussed either on the minimization of the maximum cost or on the minimization of the expected cost spent to evaluate the function. In this dissertation, we show how to obtain an Ômicron logarithm of N approximation with respect to the worst case minimization (the best possible approximation under the assumption that P is different from NP). We also show a polynomial time procedure for evaluate a function that simultaneously optimizes both the worst and the expected costs.
|
10 |
[pt] ALGORITMOS DE APROXIMAÇÃO PARA ÁRVORES DE DECISÃO / [en] APPROXIMATION ALGORITHMS FOR DECISION TREESALINE MEDEIROS SAETTLER 13 December 2021 (has links)
[pt] A construção de árvores de decisão é um problema central em diversas áreas da ciência da computação, por exemplo, teoria de banco de dados e aprendizado computacional. Este problema pode ser visto como o problema de avaliar uma função discreta, onde para verificar o valor de cada variável da função temos que pagar um custo, e os pontos onde a função está definida estão associados a uma distribuição de probabilidade. O objetivo do problema é avaliar a função minimizando o custo gasto (no pior caso ou no caso médio). Nesta tese, apresentamos quatro contribuições relacionadas a esse problema. A
primeira é um algoritmo que alcança uma aproximação de O(log(n)) em relação a tanto o custo esperado quanto ao pior custo. A segunda é um método que combina duas árvores, uma com pior custo W e outra com custo esperado E, e produz uma árvore com pior custo de no máximo (1+p)W e custo esperado no
máximo (1/(1-e-p))E, onde p é um parâmetro dado. Nós também provamos que esta é uma caracterização justa do melhor trade-off alcançável, mostrando que existe um número infinito de instâncias para as quais não podemos obter uma árvore de decisão com tanto o pior custo menor que (1 + p)OPTW(I)
quanto o custo esperado menor que (1/(1 - e - p))OPTE(I), onde OPTW(I) (resp. OPTE(I)) denota o pior custo da árvore de decisão que minimiza o pior custo (resp. custo esperado) para uma instância I do problema. A terceira contribuição é um algoritmo de aproximação de O(log(n)) para a minimização
do pior custo para uma variante do problema onde o custo de ler uma variável depende do seu valor. Nossa última contribuição é um algoritmo randomized rounding que, dada uma instância do problema (com um inteiro adicional (k > 0) e um parâmetro 0 < e < 1/2, produz uma árvore de decisão oblivious
com custo no máximo (3/(1 - 2e))ln(n)OPT(I) e que produz no máximo (k/e) erros, onde OPT(I) denota o custo da árvore de decisão oblivious com o menor custo entre todas as árvores oblivious para a instância I que produzem no máximo k erros de classificação. / [en] Decision tree construction is a central problem in several areas of computer science, for example, data base theory and computational learning. This problem can be viewed as the problem of evaluating a discrete function, where to check the value of each variable of the function we have to pay a cost, and the points where the function is defined are associated with a probability distribution. The goal of the problem is to evaluate the function minimizing the cost spent (in the worst case or in expectation). In this Thesis, we present four contributions related to this problem. The first one is an algorithm that achieves an O(log(n)) approximation with respect to both the expected and the worst costs. The second one is a procedure that combines two trees, one with worst costW and another with expected cost E, and produces a tree with worst cost at most (1+p)W and expected cost at most (1/(1-e-p))E, where p is a given parameter. We also prove that this is a sharp characterization of the best possible trade-off attainable, showing that there are infinitely many instances for which we cannot obtain a decision tree with both worst cost smaller than
(1+p)OPTW(I) and expected cost smaller than (1/(1-e-p))OPTE(I), where OPTW(I) (resp. OPTE(I)) denotes the cost of the decision tree that minimizes the worst cost (resp. expected cost) for an instance I of the problem. The third contribution is an O(log(n)) approximation algorithm for the minimization
of the worst cost for a variant of the problem where the cost of reading a variable depends on its value. Our final contribution is a randomized rounding algorithm that, given an instance of the problem (with an additional integer k > 0) and a parameter 0 < e < 1/2, builds an oblivious decision tree with
cost at most (3/(1 - 2e))ln(n)OPT(I) and produces at most (k/e) errors, where OPT(I) denotes the cost of the oblivious decision tree with minimum cost among all oblivious decision trees for instance I that make at most k classification errors.
|
Page generated in 0.0461 seconds