Global ETD Search

Return to search

Sample efficient reinforcement learning for biological sequence design

L’apprentissage par renforcement profond a mené à de nombreux résultats prometteurs dans
l’apprentissage des jeux vidéo à partir de pixels, dans la robotique pour l’apprentissage de
compétences généralisables et dans les soins de santé pour l’apprentissage de traitement
dynamiques. Un obstacle demeure toutefois: celui du manque d’efficacité dans le nombre
d’échantillons nécessaires pour obtenir de bons résultats. Pour résoudre ce problème, notre
objectif est d’améliorer l’efficacité de l’apprentissage en améliorant les capacité d’acquisition
de nouvelles données, un problème d’exploration. L’approche proposée consiste à :
(1) Apprendre un ensemble diversifié d’environments (donnant lieu à un changement de
dynamique)
(2) Apprendre une politique capable de mieux s’adapter aux changements dans l’envi-
ronnement, à l’aide du méta-apprentissage.
Cette méthode peut avoir des impacts bénéfiques dans de nombreux problèmes du
monde réel tels que la découverte de médicaments, dans laquelle nous sommes confrontés
à un espace d’actions très grand. D’autant plus, la conception de nouvelles substances
thérapeutiques qui sont fonctionnellement intéressantes nécessite une exploration efficace
du paysage de la recherche. / Deep reinforcement learning has led to promising results in learning video games from pixels,
robotics for learning generalizable skills, and healthcare for learning dynamic treatments.
However, an obstacle remains the lack of efficiency in the number of samples required to
achieve good results. To address this problem, our goal is to improve sample efficiency by
improving the ability to acquire new data, an issue of exploration. The proposed approach
is to:
(1) Learn a diverse set of environments (resulting in a change of dynamics)
(2) earn a policy that can better adapt to changes in the environment using meta-learning
This method can benefit many real-world problems, such as drug discovery, where we
face a large action space. Furthermore, designing new therapeutic substances that are
functionally interesting requires efficient exploration of the research landscape

http://hdl.handle.net/1866/32229

Reinforcement Learning

Biological Sequence Design

Bayesian Optimization

Apprentissage par Renforcement

Optimisation Bayésienne

Conception de Séquences Biologiques

Identifer	oai:union.ndltd.org:umontreal.ca/oai:papyrus.bib.umontreal.ca:1866/32229
Date	08 1900
Creators	Nouri, Padideh
Contributors	Bacon, Pierre-Luc
Source Sets	Université de Montréal
Language	English
Detected Language	French
Type	thesis, thèse
Format	application/pdf

Page generated in 0.0024 seconds

Sample efficient reinforcement learning for biological sequence design

Description

Links & Downloads

Tags

Additional Fields