Global ETD Search

Return to search

Renormalization group theory, scaling laws and deep learning

The question of the possibility of intelligent machines is fundamentally intertwined with the machines’ ability to reason. Or not. The developments of the recent years point in a completely different direction : What we need is simple, generic but scalable algorithms that can keep learning on their own. This thesis is an attempt to find theoretical explanations to the findings of recent years where empirical evidence has been presented in support of phase transitions in neural networks, power law behavior of various entities, and even evidence of algorithmic universality, all of which are beautifully explained in the context of statistical physics, quantum field theory and statistical field theory but not necessarily in the context of deep learning where no complete theoretical framework is available.

Inspired by these developments, and as it turns out, with the overly ambitious goal of providing a solid theoretical explanation of the empirically observed power laws in neu- ral networks, we set out to substantiate the claims that renormalization group theory may be the sought-after theory of deep learning which may explain the above, as well as what we call algorithmic universality. / La question de la possibilité de machines intelligentes est intimement liée à la capacité de ces machines à raisonner. Ou pas. Les développements des dernières années indiquent une direction complètement différente : ce dont nous avons besoin sont des algorithmes simples, génériques mais évolutifs qui peuvent continuer à apprendre de leur propre chef. Cette thèse est une tentative de trouver des explications théoriques aux constatations des dernières années où des preuves empiriques ont été présentées en faveur de transitions de phase dans les réseaux de neurones, du comportement en loi de puissance de diverses entités, et même de l'universialité algorithmique, tout cela étant parfaitement expliqué dans le contexte de la physique statistique, de la théorie quantique des champs et de la théorie statistique des champs, mais pas nécessairement dans le contexte de l'apprentissage profond où aucun cadre théorique complet n'est disponible. Inspiré par ces développements, et comme il s'avère, avec le but ambitieux de fournir une explication théorique solide des lois de puissance empiriquement observées dans les réseaux de neurones, nous avons entrepris de étayer les affirmations selon lesquelles la théorie du groupe de renormalisation pourrait être la théorie recherchée de l'apprentissage profond qui pourrait expliquer cela, ainsi que ce que nous appelons l'universialité algorithmique.

http://hdl.handle.net/1866/27943

Renormalization Group Theory

Scaling laws

Deep Learning

Artificial Neural Networks

Statistical Field Theory

Quantum Field Theory

Quantum Mechanics

Hopfield Networks

Théorie du Groupe de Renormalisation

Les Lois d'échelle

Apprentissage Profond

Réseaux de Neurones Artificiels

Théorie Statistique des Champs

Théorie Quantique des Champs

Mécanique Quantique

Réseaux Hopfield

Identifer	oai:union.ndltd.org:umontreal.ca/oai:papyrus.bib.umontreal.ca:1866/27943
Date	08 1900
Creators	Haggi Mani, Parviz
Contributors	Rish, Irina
Source Sets	Université de Montréal
Language	English
Detected Language	French
Type	thesis, thèse
Format	application/pdf

Page generated in 0.0027 seconds

Renormalization group theory, scaling laws and deep learning

Description

Links & Downloads

Tags

Additional Fields