Spelling suggestions: "subject:"8trategic classification"" "subject:"estrategic classification""
1 |
Performative prediction : expanding theoretical horizonsMofakhami, Mehrnaz 07 1900 (has links)
Cette thèse aborde certaines des limitations du cadre de la prédiction performative, qui consiste à apprendre des modèles influençant les données qu’ils sont censés prédire. Je propose des solutions pour repousser les limites de ce cadre, en explorant et en identifiant de nouveaux domaines où son application peut être étendue. La thèse est structurée en trois chapitres, comme décrit ci-après.
Le Chapitre 1 offre un aperçu complet du cadre de la prédiction performative, y compris une vue d’ensemble détaillée de la notation préliminaire (Section 1.1) et des concepts nécessaires à la compréhension du cadre, y compris les concepts de solution (Section 1.2) et l’algorithme de Minimisation de Risque Répété (Section 1.3). La notation de ce chapitre est tirée de l’article original sur la prédiction performative afin de garantir une compréhension fondamentale. De plus, la Section 1.4 introduit la relation entre la prédiction performative et les inégalités variationnelles, qui seront abordées plus en détail au Chapitre 3.
Le Chapitre 2 présente la contribution principale de cette thèse, en analysant le cadre de la prédiction performative en présence de réseaux neuronaux avec une fonction de perte non convexe. L’accent est mis sur la recherche de classificateurs performativement stables, c’est-à-dire optimaux pour la distribution de données qu’ils induisent. Ce chapitre introduit de nouvelles hypothèses et des garanties de convergence significativement plus fortes pour la méthode RRM (Section 2.3). Ces garanties sont les premières à démontrer l’applicabilité de RRM aux réseaux neuronaux, qui sont difficiles à analyser en raison de leur non-convexité. En guise d’illustration, nous introduisons une procédure de rééchantillonnage qui modélise des changements de distribution réalistes et montrons qu’elle satisfait nos hypothèses (Section 2.4). Nous étayons notre théorie en montrant qu’il est possible d’apprendre des classificateurs performativement stables avec des réseaux neuronaux faisant des prédictions sur des données réelles qui changent selon notre procédure proposée (Section 2.5). Ce travail représente une étape cruciale pour combler le fossé entre la prédiction performative théorique et les applications pratiques.
Le Chapitre 3 conclut la thèse en résumant les principales conclusions et contributions et en esquissant de futures directions de recherches. Notamment, il explore l’utilisation des inégalités variationnelles pour aborder et surmonter une limitation significative des travaux antérieurs qui régissent la force des effets performatifs. Cette recherche vise à étendre l’analyse à des scénarios avec des effets performatifs importants et à élargir l’applicabilité du cadre, ouvrant la voie à des solutions plus complètes dans la prédiction performative. / This thesis addresses some of the limitations in the framework of performative prediction, which involves learning models that influence the data they intend to predict. I provide solutions to push the boundaries of this framework, exploring and identifying new domains where its application can be extended. The thesis is structured into three chapters, as described in the following.
Chapter 1 offers a comprehensive background on the framework of performative prediction, including a detailed overview of the preliminary notation (Section 1.1) and concepts necessary for understanding the framework, including the solution concepts (Section 1.2) and the Repeated Risk Minimization algorithm (Section 1.3). The notation in this chapter is sourced from the original performative prediction paper to ensure a foundational understanding. Furthermore, Section 1.4 introduces the relationship between performative prediction and variational inequalities, which will be further discussed in Chapter 3.
Chapter 2 introduces the main contribution of this thesis, analyzing the performative prediction framework in the presence of neural networks with non-convex loss functions. The focus is on finding classifiers that are performatively stable, meaning they are optimal for the data distribution they induce. This chapter introduces new assumptions and significantly stronger convergence guarantees for the RRM method (Section 2.3). These guarantees are the first to demonstrate the applicability of RRM to neural networks, which are challenging to analyze due to their non-convexity. As an illustration, we introduce a resampling procedure that models realistic distribution shifts and show that it satisfies our assumptions (Section 2.4). We support our theory by showing that one can learn performative stable classifiers with neural networks making predictions about real data that shift according to our proposed procedure (Section 2.5). This work represents a critical step towards bridging the gap between theoretical performative prediction and practical applications.
Chapter 3 concludes the thesis by summarizing the key findings and contributions and outlining future research directions. Notably, it explores leveraging variational inequalities to address and overcome a significant limitation in prior work that governs the strength of performative effects. This research aims to extend the analysis to scenarios with large performative effects and broaden the framework’s applicability, paving the way for more comprehensive solutions in performative prediction.
|
Page generated in 0.1241 seconds