111 |
Essays in dynamic behaviorViefers, Paul 04 December 2014 (has links)
Diese Dissertation behandelt sowohl die Theorie, als auch beobachtetes Verhalten in Stoppproblemen. In einem Stoppproblem, beobachtet ein Agent die Entwicklung eines stationären, stochastischen Prozesses über die Zeit. Zu jedem Zeitpunkt genießt der Agent das Recht den Prozess zu stoppen, um eine Auszahlung einzustreichen die Funktion des gegenwärtigen und der vergangenen Realisationen des Prozesses sind. Das Ziel des Agenten ist es den Stoppzeitpunkt so zu wählen, dass die erwartete Auszahlung oder der erwartete Verlust durch Stoppen maximiert bzw. minimiert wird. Stoppprobleme dieser Art konstituieren können als die einfachsten, jedoch wirklich dynamischen Entscheidungsprobleme in der ökonomischen Theorie angesehen werden Das erste Kapitel legt neue theoretische Resultate hinsichtlich der optimalen Stoppstrategien unter Erwartungsnutzentheorie, sog. gain-loss utilities und Bedauerungspräferenzen vor. Das zweite Kapitel behandelt sodann die Ergebnisse eines Laborexperiments in dem die theoretischen Vorhersagen getestet werden. Kapitel drei beschäftigt sich mit der Situation in der die Agenten nicht vollständig über Wahrscheinlichkeiten für künftige Ereignisse informiert sind, d.h. es herrscht Ambiguität. / This dissertation is concerned with theory and behavior in stopping problems. In a stopping problem an agent or individual observes the realization of some exogenous and stationary stochastic process over time. At every point in time, she has the right or the once-only option to stop the process in order to earn a function of the past and current values of the process. The agent''s objective then is to choose the point in time to exercise the option in order to maximize an expected reward or to minimize an expected loss. Such problems constitute the most rudimentary, yet truly dynamic class of choice problems that is studied in economics. The first chapter provides new theoretical results about optimal stopping both under expected utility, as well as gain-loss utility and regret preferences. The second chapter presents a laboratory experiment that tests several of the theoretical predictions about behavior made in the first chapter. The third chapter is concerned with stopping behavior in a setting, where the probability law that drives the observed process is not perfectly known to the decision maker, i.e. there is ambiguity.
|
112 |
The Agnostic's Response to Climate Deniers: Price Carbon!van der Ploeg, Frederick, Rezai, Armon 09 1900 (has links) (PDF)
With the election of President Trump, climate deniers feel emboldened and moved from the fringes to the centre of global policy making. We study how an agnostic approach to policy, based on Pascal's wager and allowing for subjective prior probability beliefs about whether climate deniers are right, prices carbon. Using the DICE integrated assessment model, we find that assigning a 10% chance of climate deniers being correct lowers the global price on carbon in 2020 only marginally: from $21 to $19 per ton of carbon dioxide if policymakers apply "Nordhaus discounting" and from $91 to $84 per ton of carbon dioxide if they apply "Stern discounting". Agnostics' reflection of remaining scientific uncertainty leaves climate policy essentially unchanged. The robustness of an ambitious climate policy also follows from using the max-min or the min-max regret principle. Letting the coefficient of relative ambiguity aversion vary from zero, corresponding to expected utility analysis, to infinity, corresponding to the max-min principle, we show how policy makers deal with fundamental climate model uncertainty if they are prepared to assign prior probabilities to different views of the world being correct. Allowing for an ethical discount rate and a higher market discount rate and for a wide range of sensitivity exercises including damage uncertainty, we show that pricing carbon is the robust response under rising climate scepticism. / Series: Ecological Economic Papers
|
113 |
Sur la notion d'optimalité dans les problèmes de bandit stochastique / On the notion of optimality in the stochastic multi-armed bandit problemsMénard, Pierre 03 July 2018 (has links)
Cette thèse s'inscrit dans les domaines de l'apprentissage statistique et de la statistique séquentielle. Le cadre principal est celui des problèmes de bandit stochastique à plusieurs bras. Dans une première partie, on commence par revisiter les bornes inférieures sur le regret. On obtient ainsi des bornes non-asymptotiques dépendantes de la distribution que l'on prouve de manière très simple en se limitant à quelques propriétés bien connues de la divergence de Kullback-Leibler. Puis, on propose des algorithmes pour la minimisation du regret dans les problèmes de bandit stochastique paramétrique dont les bras appartiennent à une certaine famille exponentielle ou non-paramétrique en supposant seulement que les bras sont à support dans l'intervalle unité, pour lesquels on prouve l'optimalité asymptotique (au sens de la borne inférieure de Lai et Robbins) et l'optimalité minimax. On analyse aussi la complexité pour l'échantillonnage séquentielle visant à identifier la distribution ayant la moyenne la plus proche d'un seuil fixé, avec ou sans l'hypothèse que les moyennes des bras forment une suite croissante. Ce travail est motivé par l'étude des essais cliniques de phase I, où l'hypothèse de croissance est naturelle. Finalement, on étend l'inégalité de Fano qui contrôle la probabilité d'évènements disjoints avec une moyenne de divergences de Kullback-leibler à des variables aléatoires arbitraires bornées sur l'intervalle unité. Plusieurs nouvelles applications en découlent, les plus importantes étant une borne inférieure sur la vitesse de concentration de l'a posteriori Bayésien et une borne inférieure sur le regret pour un problème de bandit non-stochastique. / The topics addressed in this thesis lie in statistical machine learning and sequential statistic. Our main framework is the stochastic multi-armed bandit problems. In this work we revisit lower bounds on the regret. We obtain non-asymptotic, distribution-dependent bounds and provide simple proofs based only on well-known properties of Kullback-Leibler divergence. These bounds show in particular that in the initial phase the regret grows almost linearly, and that the well-known logarithmic growth of the regret only holds in a final phase. Then, we propose algorithms for regret minimization in stochastic bandit models with exponential families of distributions or with distribution only assumed to be supported by the unit interval, that are simultaneously asymptotically optimal (in the sense of Lai and Robbins lower bound) and minimax optimal. We also analyze the sample complexity of sequentially identifying the distribution whose expectation is the closest to some given threshold, with and without the assumption that the mean values of the distributions are increasing. This work is motivated by phase I clinical trials, a practically important setting where the arm means are increasing by nature. Finally we extend Fano's inequality, which controls the average probability of (disjoint) events in terms of the average of some Kullback-Leibler divergences, to work with arbitrary unit-valued random variables. Several novel applications are provided, in which the consideration of random variables is particularly handy. The most important applications deal with the problem of Bayesian posterior concentration (minimax or distribution-dependent) rates and with a lower bound on the regret in non-stochastic sequential learning.
|
114 |
Essais sur les jugements et la prise de décision des consommateurs en situation d'incertitudeLaporte, Sandra 08 July 2010 (has links) (PDF)
La thèse étudie, dans des situations concrètes caractérisées par l'incertitude, plusieurs facteurs qui influencent les jugements de probabilités et les décisions. Les deux premiers essais portent sur la décision de participer à une loterie dont le nombre de participants est inconnu. La décision n'est pas influencée par le nombre de prix, c'est-à-dire le nombre de gagnants qui seront récompensés (Essai 1), alors qu'elle l'est par la similarité avec les gagnants précédents, un facteur logiquement non pertinent (Essai 2). L'insensibilité des consommateurs au nombre de prix découle de l'effet combiné de la faible évaluabilité de cet attribut et de la prise de décision sans estimation de probabilité. La similarité avec les gagnants précédents augmente l'intention de participer en raison du biais de " Hot Hand " interpersonnelle : les consommateurs pensent que leurs chances de gagner le prochain tirage sont plus élevées quand ils sont semblables aux gagnants précédents que quand ils sont dissemblables. L'essai final montre comment le fait de regretter une décision avant que ses conséquences soient connues peut conduire à être optimiste sur ces conséquences, pourvu que l'importance de cette décision pour la personne reste limitée
|
115 |
Impact des gains ou pertes non réalisés sur les rentabilités des actions : théories et tests dans un cadre théorique alternatif d'utilité / Impact of the unrealized gain or loss on stock returns : theory and tests in an alternative utility frameworkLi, Shoujun 03 June 2016 (has links)
Cette thèse applique la théorie des prospects et la théorie du regret à l’étude sur la performance des actions et à expliquer une anomalie du marché connue appelé l’effet momentum. Cette thèse propose un modèle théorique qui lie les facteurs comportementaux à la performance des actions et à l’effet momentum, et ensuite réalise des tests empiriques pour examiner le modèle théorique. Dans le chapitre 2, le modèle est établi sur un concept des gains/pertes potentiels, qui indiquent si un investisseur se trouve actuellement dans une situation gagnante ou perdante. Ensuite, le modèle montre que les investisseurs sont très réticents à vendre leurs stocks dans une situation des grands gains ou des grandes pertes. Les chapitres 3 et 4 effectuent des tests empiriques sur le modèle des gains/pertes potentiels. L'échantillon des tests comprend tous les stocks de NYSE et l'AMEX de l’année 1982 à 2012. Les tests sont en mesure de confirmer l'influence des gains/pertes potentiels sur les rendements des actions. En outre, une stratégie de coût nul d’Extrémité moins Moyen (EMM), basée sur le modèle théorique, est documentée pour être rentable après contrôlée pour des risques. Dans le chapitre 5, le modèle des gains/pertes potentiels est développé dans une version dynamique. Il suggère que l'influence des gains/pertes potentiels pourrait persister pendant une période de intermédiaire à long terme, et génère une tendance à la hausse de la performance pour les actions avec un grand gain/perte potentiel. Les tests empiriques dans ce chapitre se concentrent sur l'évolution de série temporelle des rendements. Les tests montrent que les actions avec un grand gain/perte potentiel ont une plus forte tendance à la hausse. Le chapitre 6 applique les résultats du chapitre précédent pour expliquer l'effet momentum. La tendance à la hausse correspond à une auto-corrélation positive des rendements, ce qui est l'une des sources qui contribuent au profit de momentum. Les tests empiriques dans ce chapitre regardent la similitude entre la stratégie de momentum et les gains/pertes potentiels, et examinent également la corrélation entre le profit de momentum et le profit de la stratégie EMM. Les tests montrent que des gains/pertes potentiels pourraient contribuer à l'effet momentum, mais ne sont pas la seule source. L'effet momentum peut être le résultat d'une combinaison de plusieurs facteurs complexes. / This dissertation applies the prospect theory and the regret theory to the study on the stock performance and to explain one well-known market anomaly called the momentum effect. The dissertation proposes a theoretical model that links the behavior factors to stock performance and the momentum effect, and performed empirical test to examine the theoretical model. In chapter 2, the model is established on the concept of the potential gain/loss, which indicates if an investor is currently at a winning or a losing position. The model then shows that the investors are highly reluctant to sell their stocks in a large gain or in a large loss situation. The chapter 3 and 4 perform empirical tests on the model of potential gain/loss. The test sample includes all stocks in NYSE and AMEX from 1982 to 2012. The tests are able to confirm the influence of the potential gain/loss on stock returns. Moreover, a zero-cost Extremity minus Middle (EMM) strategy based on the theoretical model is documented to be profitable after controlling for risks. In chapter 5, the model of potential gain/loss is developed into a dynamic version. It suggests that the influence of a potential gain/loss could persist over an intermediate to long term, and generates an upward trend in performance for stocks with large potential gain/loss. The empirical tests in this chapter focus on the time serial evolution of returns. The tests show that stocks with large potential gain/loss have a stronger upward trend. The chapter 6 applies the results from the previous chapter to explain the momentum effect. The upward trend corresponds to a positive return autocorrelation, which is one of the sources that contribute to the momentum profit. The empirical tests in this chapter look into the similarity between the momentum strategy and the potential gain/loss, and also examine the correlation between the momentum profit and the profit from the EMM strategy. Tests show that the potential gain/loss could contribute to the momentum effect, but is not the only source. The momentum effect could be a result of a combination of many complex factors.
|
116 |
Řešení koncovek ve velkých hrách s neúplnou informací jako je např. Poker / Solving Endgames in Large Imperfect-Information Games such as PokerHa, Karel January 2016 (has links)
Title: Solving Endgames in Large Imperfect-Information Games such as Poker Author: Bc. Karel Ha Department: Department of Applied Mathematics Supervisor: doc. Mgr. Milan Hladík, Ph.D., Department of Applied Mathematics Abstract: Endgames have a distinctive role for players. At the late stage of games, many aspects are finally clearly defined, deeming exhaustive analysis tractable. Specialised endgame handling is rewarding for games with perfect information (e.g., Chess databases pre-computed for entire classes of endings, or dividing Go board into separate independent subgames). An appealing idea would be to extend this approach to imperfect-information games such as the famous Poker: play the early parts of the game, and once the subgame becomes feasible, calculate an ending solution. However, the problem is much more complex for imperfect information. Subgames need to be generalized to account for information sets. Unfortunately, such a generalization cannot be solved straightaway, as it does not generally preserve optimality. As a consequence, we may end up with a far more exploitable strategy. There are currently three techniques to deal with this challenge: (a) disregard the problem entirely; (b) use a decomposition technique, which sadly retains only the same quality; (c) or formalize improvements of...
|
117 |
Contrôle optimal de quelques phénomènes de diffusion en domaines pollués / Pointwise optimal control for some diffusion phenomena in polluted areaMahoui, Sihem 01 July 2018 (has links)
Dans ce travail, on s'intéresse à l'analyse mathématique et au contrôle optimal pour des problèmes de diffusion relevant de certains domaines comme l'écologie ou l'environnement et comportant des termes de pollution inconnus en général. De plus, on souhaite agir sur le système en un seul point du domaine considéré pour des raisons de coût. La modélisation de ces problèmes se traduit généralement par un système de type parabolique avec donnée manquante (initiale ou aux limites) représentant la pollution, et où l'on introduit une fonction de contrôle de ce système. La méthode suivie pour résoudre ces problèmes est celle du contrôle à moindres regrets développée par J.-L. Lions et bien adaptée aux problèmes à données manquantes.Plus précisément, on est concerné par des problèmes de type parabolique qui décrivent la diffusion d'un fluide (eau) contaminé dans un domaine (une lagune ou un estuaire) par une pollution ayant son origine sur une partie du bord. De plus, on considère que la fonction source (le contrôle) est localisée en un point, c'est ce qu'on appelle le contrôle ponctuel. On cherche alors le (ou les) contrôle(s) qui peuvent améliorer la situation au lieu de la laisser à l'abandon (sans contrôle).Les solutions ne sont pas des fonctions régulières et ne peuvent être considérées qu'au sens faible. Deux méthodes sont utilisées: la première est la méthode de transposition de Lions-Magenes, détaillée au chapitre 3 de la thèse, et la deuxième méthode consiste à régulariser la masse de Dirac (le support du contrôle est un point) présentée au chapitre4. Pour les deux méthodes, on montre l'existence d'une solution faible et on établit un système d'optimalité singulier (SOS) du contrôle ponctuel à moindres regrets.Un dernier chapitre est consacré aux schémas numériques associés au problème de contrôle ponctuel à moindres regrets, où l'on obtient des estimations d'erreur par la méthode des éléments finis. / In this thesis, we are interested in mathematical analysis and optimal control of diffusion problems where there are pollution terms. In addition, we want to act on the system in a single point of the domain for cost reasons. The systems being studied are parabolic with missing (initial or boundary) data representing pollution, where we introduce a control function. The method of low-regret control of J.-L. Lions, used here for the first time to the pointwise control, seems to be well suited. We then look for the control which can improve the situation instead of doing nothing (no control).Solutions are not regular functions and can only be considered in the weak sense. Two methods are used here: the first one is the method of transposition of Lions-Magenes, detailed in Chapter 3 of the thesis, and the second method consists in regularizing the Dirac mass, presented in chapter 4. Each one of the two methods offers a new point of view. In particular, the functional spaces where the existence of a solution is obtained are different. For both methods, however, a singular optimality system is established for the low-regret pointwise control.A final chapter is devoted to the numerical schemes associated to the low-regret pointwise optimal control, where we obtain error estimates using finite elements method (FEM).
|
118 |
DECENTRALIZED PRICE-DRIVEN DEMAND RESPONSE IN SMART ENERGY GRIDZibo Zhao (5930495) 14 January 2021 (has links)
<div>
<div>
<div>
<p>Real-time pricing (RTP) of electricity for consumers has long been argued to be
crucial for realizing the many envisioned benefits of demand flexibility in a smart
grid. However, many details of how to actually implement a RTP scheme are still
under debate. Since most of the organized wholesale electricity markets in the US
implement a two-settlement mechanism, with day-ahead electricity price forecasts
guiding financial and physical transactions in the next day and real-time ex post
prices settling any real-time imbalances, it is a natural idea to let consumers respond
to the day-ahead prices in real-time. However, if such an idea is not controlled
properly, the inherent closed-loop operation may lead consumers to all respond in
the same fashion, causing large swings of real-time demand and prices, which may
jeopardize system stability and increase consumers’ financial risks.
</p><p><br></p>
<p>To overcome the potential uncertainties and undesired demand peak caused by
“selfish” behaviors by individual consumers under RTP, in this research, we develop a fully decentralized price-driven demand response (DR) approach under game-
theoretical frameworks. In game theory, agents usually make decisions based on their
belief about competitors’ states, which needs to maintain a large amount of knowledge and thus can be intractable and implausible for a large population. Instead,
we propose using regret-based learning in games by focusing on each agent’s own
history and utility received. We study two learning mechanisms: bandit learning
with incomplete information feedback, and low regret learning with full information
feedback. With the learning in games, we establish performance guarantees for each individual agent (i.e., regret minimization) and the overall system (i.e., bounds on
price of anarchy).</p><p><br></p></div></div></div><div><div><div>
<p>In addition to the game-theoretical framework for price-driven demand response,
we also apply such a framework for peer-to-peer energy trading auctions. The market-
based approach can better incentivize the development of distributed energy resources
(DERs) on demand side. However, the complexity of double-sided auctions in an
energy market and agents’ bounded rationality may invalidate many well-established
theories in auction design, and consequently, hinder market development. To address
these issues, we propose an automated bidding framework based on multi-armed
bandit learning through repeated auctions, and is aimed to minimize each bidder’s
cumulative regret. We also use such a framework to compare market outcomes of
three different auction designs.
</p>
</div>
</div>
</div>
|
119 |
Varför en kärlek för lyx och eftersmak av ånger? : En kvalitativ studie om drivande skäl för lyxkonsumtion och dess förhållande till ånger för unga svenska medborgareKheder, Sara, Alp, Ümran January 2020 (has links)
In recent years, luxury consumption has expanded and grown significantly in comparison to past years. Today luxury is more accessible by society than ever before. Various studies have shown and proven how luxury consumption tends to have negative effects on individuals. The negative circumstances that emerge as consequences can be of cognitive character, but also in the form of financial, personal, social and/or professional problems, debt, and compulsive purchases. In addition to these findings, recent studies have also shown that people are ready to compromise in a variety of ways such as saving more money, working overtime, or withdrawing from essential expenses. For these various reasons, the purpose of this study is to identify possible experienced motives that can work as reasons for luxury consumption amongst the young Swedish population. Furthermore, this study aims to examine regret in relation to this type of consumption. The literature review of this study covers subjects of cognitive dissonance, regret theory, possessions and the extended self and the motives hedonic, symbolic and instrumental. The research method applied in this study is of a qualitative character. The data collection was executed through the use of semi structured interviews where a total number of fifteen young Swedish individuals chose to participate. The results of this study reveal that luxury consumption can be based on the hedonic motive where pleasure, joy, satisfaction or reaching a desired goal are common reasons. Moreover, the results of this study also reveal that luxury consumption can be based on the symbolic motive, where individuals desire to symbolise/express themselves, impress others, seek confirmation, to fit in and/or follow hidden norms in society. Furthermore, luxury is desired for the pure quality, where the high price of luxury products equals higher perceived quality. Moreover, regret in this type of consumption is regularly occurring. The reasons for regret can be caused by the product itself, by comparison to other possible alternatives or because of impulsive/compulsive/stressful decisions. This feeling of regret can exist in the form of cognitive dissonance, that is a feeling of discomfort for a small number of participants. For a larger number of participants, the feelings are separated, where regret is a more rough and painful feeling. Solutions to suppress these feelings are through giving away the products to be used, persuade the mind that the purchase is deserved, or to shed a positive light at the purchase by looking at it as additional knowledge/ experience. / Under de senaste åren konsumeras lyx mer, och har blivit mer tillgängligt för allmänheten i jämförelse till tidigare år. Ett flertal studier har visat på hur lyxkonsumtion tenderar att ha negativa effekter på individer. De negativa omständigheterna som framträder som konsekvenser av lyxkonsumtion kan vara av en kognitiv karaktär, men även i form av finansiella, personliga, sociala och/eller professionella problem, skuldsättning, och kompulsiva köp. Dessutom visar studier även att människor är redo att kompromissa på olika sätt som att spara mer pengar, jobba övertid eller att utebliva nödvändiga utgifter. För dessa diverse anledningar är syftet med denna studie att identifiera möjliga upplevda drivkrafter för lyxkonsumtion för det unga svenska samhället. Vidare ämnar studien även att undersöka ånger i förhållande till denna typ av konsumtion. Teorigenomgången för denna studie behandlar ämnen om kognitiv dissonans, regret theory, ägodelar och det förlängda jaget samt motiven hedonic, symbolic samt instrumentell. Empiriinsamlingen skedde genom en kvalitativ forskningsmetod som i sin tur bestod av femton semistrukturerade intervjuer med svenska ungdomar som lyxkonsumerar. Resultaten av denna studie visar på att lyxkonsumtion kan ske med anledning av hedonistiska aspekter där glädje, nöje, tillfredsställelse eller en avklarad målsättning var vanligt förekommande anledningar. Fortsättningsvis visar studien även att symboliska motiv var en vanlig drivkraft för lyxkonsumtion, där individer strävar efter att symbolisera/uttrycka sig, imponera på andra, få bekräftelse, passa in i samhället samt följa osynliga normer. Utöver detta var lyx eftersträvat på grund av kvalitet, där höga priset av lyxprodukter förutsätter högre upplevd kvalitet. Avslutningsvis påvisar resultaten av denna studie att ånger inom denna typ av konsumtion är vanligt förekommande. Orsakerna för ånger kan bero på själva produkten, på jämförelse av produkten med andra alternativ eller på grund av impulsiva/kompulsiva/hastiga beslut. Känslan av ånger kan vidare vara i form av en kognitiv dissonans, som i sin tur betecknas som en känsla av obehag av en liten del av deltagarna i denna studie. För en större del av deltagarna var känslorna åtskilda, där ånger var en grövre och mer smärtsam känsla. Lösningar för att dämpa detta obehag är genom att ge bort produkten för användning, övertala sig själv att köpet är förtjänat, eller genom att omvandla köpet till ytterligare erfarenhet/lärdom.
|
120 |
Path-dependent Risk Measures - Theory and ApplicationsMöller, Philipp Maximilian 12 January 2021 (has links)
No description available.
|
Page generated in 0.0388 seconds