• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 40
  • 12
  • 4
  • 1
  • Tagged with
  • 57
  • 13
  • 10
  • 9
  • 9
  • 8
  • 6
  • 6
  • 6
  • 6
  • 6
  • 6
  • 6
  • 5
  • 5
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
51

L’impact de l’inhibition de l’aldostérone sur l’homéostasie du glucose et le risque de diabète chez les patients atteints d’insuffisance cardiaque

Korol, Sandra 12 1900 (has links)
Le système rénine-angiotensine-aldostérone est impliqué dans la physiopathologie de l’insuffisance cardiaque (IC). L’inhibition de l’aldostérone par les antagonistes du récepteur aux minéralocorticoïdes (ARM), la spironolactone et l’éplérénone, est associée à une réduction de morbidité et mortalité. Or, la spironolactone est un antagoniste non sélectif, avec des effets hors-cibles sur d’autres récepteurs stéroïdiens. Des données suggèrent qu’elle pourrait avoir un effet défavorable sur l’homéostasie du glucose, avec une augmentation en hémoglobine glyquée (HbA1c), un marqueur de contrôle du glucose à long terme. Au contraire, l’éplérénone semble exercer un effet neutre. Les objectifs de cette thèse de doctorat sont les suivants : 1) Assembler toutes les connaissances dans la littérature au sujet de l’effet glycémique des ARM; 2) Évaluer le risque de développement de diabète avec la spironolactone chez les patients IC; 3) Analyser si la spironolactone peut moduler l’effet glycémique d’autres médicaments utilisés en IC; 4) Comparer la spironolactone à l’éplérénone sur des marqueurs de glucose chez les patients IC avec dérèglements glycémiques. Quatre projets ont été effectués afin de répondre à ces questions. Premièrement, une revue systématique a permis d’identifier toutes les études publiées contenant de l’information sur l’effet glycémique des ARM. Les résultats étaient hétérogènes, mais ont suggéré que l’effet est dépendant de la pathologie et serait potentiellement néfaste dans les maladies à haut risque d’évènements cardiovasculaires. Une méta-analyse d’études en diabète indique que l’effet à long terme serait non significatif. Le deuxième projet utilise une cohorte de patients IC de bases de données administratives entre 1995 et 2009 (suivi jusqu’en 2010). Nous n’avons pas détecté d’association significative entre l’utilisation de la spironolactone et le risque de diabète. Par contre, l’étude a démontré qu’un âge plus jeune, la digoxine, et les corticostéroïdes augmentent le risque de diabète. Le troisième projet est une sous-étude d’une étude clinique CANDIID-II (Effect of ACE inhibitor alone versus ACE inhibitor plus high dose candesartan on BNP, immune markers, inflammatory status, and urinary kinins in patients with symptomatic left ventricular systolic dysfunction) chez des patients IC traités avec un inhibiteur de l’enzyme de conversion à l’angiotensine et le candésartan, antagoniste du récepteur à l’angiotensine II. Ces classes pharmacologiques ont des effets bénéfiques sur la glycémie. En comparant les patients traités aussi avec la spironolactone versus les patients sans ARM, nous n’avons pas trouvé que la spironolactone module l’effet bénéfique du candésartan sur le métabolisme du glucose. Le dernier projet consiste d’une étude prospective, multicentrique, randomisée, contrôlée à double-insu : SNOW (A comparison of the effects of selective and non selective mineralocorticoid antagonism on glucose homeostasis and lipid profile of heart failure patients with glucose intolerance or type 2 diabetes). Elle compare, pendant 16 semaines, la spironolactone à l’éplérénone sur des marqueurs glycémiques, notamment, l’HbA1c, chez 62 patients IC avec diabète de type II ou intolérance au glucose. Aucune différence significative n’a été observée entre les groupes. En résumé, les résultats de cette thèse indiquent que les ARM ne présentent pas de risque de détérioration du contrôle du glucose sur une durée modérée à longue en IC. / The renin-angiotensin-aldosterone system is involved in the pathophysiology of heart failure (HF). The inhibition of aldosterone by mineralocorticoid receptor antagonists (MRAs), spironolactone and eplerenone, is associated with a reduction in morbidity and mortality. However, spironolactone is a non selective antagonist, with off-target effects on other steroid receptors. There is some evidence suggesting that it may have an unfavorable effect on glucose homeostasis, with an increase in glycated hemoglobin (HbA1c), a marker of long-term glucose control. On the contrary, eplerenone seems to exert a neutral effect. The objectives of this doctoral thesis were the following: 1) Compile all current knowledge in the literature on the subject of MRAs’ glycemic effects; 2) Evaluate the risk of developing diabetes with spironolactone in HF patients; 3) Analyze if spironolactone may modulate the glycemic effects of other medications used in HF; 4) Compare spironolactone to eplerenone on markers of glucose control in HF patients with glycemic disorders. Four projects were conducted in order to meet these objectives. Firstly, a systematic review allowed us to identify all published studies containing information on MRAs’ glycemic effects. The literature search yielded heterogenous results; however, it suggested that the effect was disease-specific and would be potentially harmful in diseases with a high risk of cardiovascular events. A meta-analysis of studies in diabetes insinuated that the effect is non significant on a long-term basis. The second project uses a cohort of HF patients from administrative databases between 1995 and 2009 (follow-up till 2010). We did not detect a significant association between the use of spironolactone and the risk of diabetes. On the other hand, the study demonstrated that younger age, digoxin, and corticosteroids increase the risk of diabetes. The third project is a substudy of a clinical trial CANDIID-II (Effect of ACE inhibitor alone versus ACE inhibitor plus high dose candesartan on BNP, immune markers, inflammatory status, and urinary kinins in patients with symptomatic left ventricular systolic dysfunction) among HF patients treated with an angiotensin converting enzyme inhibitor and candesartan, an angiotensin II receptor blocker. These pharmacological classes have beneficial effects on glycemia. By comparing patients also treated with spironolactone versus patients without an MRA, we did not find that spironolactone alters the effect of candesartan on glucose metabolism. The last project consisted of a prospective, multicenter, randomized, controlled, double-blind trial: SNOW (A comparison of the effects of selective and non selective mineralocorticoid antagonism on glucose homeostasis and lipid profile of heart failure patients with glucose intolerance or type 2 diabetes). It compares, for 16 weeks, spironolactone to eplerenone on glycemic markers, notably, HbA1c, among 62 HF patients with type II diabetes or glucose intolerance. There was no significant difference between groups. In summary, the research results from this thesis reveal that, in HF, MRAs do not present additional risks of deterioration in glucose control over a moderate to long period.
52

Mécanismes pharmacologiques fondamentaux des antagonistes des récepteurs couplés aux protéines G exprimés en cellules Sf9

Labrecque, Jean 02 1900 (has links)
Thèse numérisée par la Direction des bibliothèques de l'Université de Montréal. / Les récepteurs couplés aux protéines G sont la porte d'entrée de plusieurs signaux hormonaux. L'activation de ses récepteurs par des ligands agonistes induit une cascade métabolique qui implique des transducteurs (protéine G) et des effecteurs (enzymes) qui produiront en fin de compte l'intégration de la réponse physiologique. Plusieurs ligands des récepteurs sont de puissants agents thérapeutiques. L'étude des mécanismes d'action de ces ligands est donc très importante en pharmacologie. Jusqu'à présent le rôle et surtout l'efficacité des ligands agonistes étaient bien établis, alors que les activités des antagonistes demeuraient fortement associées à la présence de l'agoniste pour laquelle l'antagoniste compétitionne l'interaction avec le récepteur. Ce concept est maintenant remis en question avec l'observation de nouvelles propriétés indépendantes de la présence de l'agoniste. Afin de démontrer la validité d'un concept d'une activité des antagonistes indépendante des agonistes, nous avons étudié trois nouvelles propriétés pharmacologiques des antagonistes du récepteur sérotoninergique 5-HT2cde rat exprimés en cellules Sf19. Ces nouvelles activités des antagonistes du récepteur sont : l'activité agoniste inverse, la sous-régulation atypique ainsi que la sensibilisation fonctionnelle de la réponse du récepteur 5-HT2c. Nos résultats indiquent que les antagonistes de ce récepteur inhibent l'activation spontanée du récepteur, réduisent la densité de sites de liaison et sensibilisent la réponse fonctionnelle du récepteur. Les mécanismes associés à la sous-régulation atypique et la sensibilisation fonctionnelle demeurent, cependant, des modèles mathématiques nous permettent de prédire l'action des agonistes et des agonistes inverses (antagonistes). Afin de nous familiariser avec le modèle étendu à complexe ternaire, nous avons également étudier l'effet du précouplage fonctionnel (interaction récepteur/protéine G) sur la liaison des agonistes inverses du récepteur Al de l'adénosine exprimé en cellules Sf9. Nos résultats suggèrent que les propriétés pharmacologiques des agonistes inverses sont affectées par l'interaction récepteur/protéine G de manière opposée aux agonistes. Les nouvelles propriétés des antagonistes décrites dans ce manuscrit auront assurément une grande importance dans l'étude du mécanisme d'action et dans le développement de nouveaux agents thérapeutiques.
53

Prédiction et génération de données structurées à l'aide de réseaux de neurones et de décisions discrètes

Dutil, Francis 08 1900 (has links)
No description available.
54

Le lien entre les cognitions, la victimisation sexuelle et la coercition sexuelle chez les femmes et les hommes universitaires

Bruno, Valérie 01 1900 (has links)
Le mouvement féministe des années 1970 et 1980 a engendré des changements sociaux profonds en Amérique du Nord, notamment en ce qui a trait aux agressions sexuelles. Ces changements sociaux se sont traduits, à partir de 1983, par des modifications législatives importantes au Canada. Les études ayant suivi ces changements ont examiné la coercition sexuelle dans la population non délinquante. Une des conclusions notables de ces études est l’existence d’un chiffre noir important en ce qui concerne les agressions sexuelles. En effet, les études réalisées dans les années 1980 ne tenaient pas compte des femmes en tant qu’agresseurs, car le phénomène était perçu comme étant typiquement masculin. Ce n’est qu’à partir des années 1990 qu’un intérêt se forme concernant la coercition sexuelle commise par les femmes. Il est alors révélé que certaines attitudes et croyances soutiennent l’agression sexuelle tant chez les femmes que chez les hommes. Des similitudes sont également établies entre la coercition sexuelle des femmes et des hommes. Peu d’études existent sur la prévalence de la coercition sexuelle en considérant autant les femmes que les hommes comme agresseurs potentiels. Il est important d’examiner les attitudes et croyances par rapport à la coercition sexuelle dans la population non délinquante au Québec indépendamment du genre. Pour ce faire, nous avons construit un sondage en ligne via l’outil Survey Monkey. Ce sondage comprend quatre mesures afin d’examiner les attitudes en lien avec les croyances erronées entourant le viol, l’hostilité envers les femmes, l’acceptation de la violence interpersonnelle, ainsi que les croyances antagonistes et le conservatisme sexuel. Un cinquième instrument a été utilisé afin de mesurer les expériences sexuelles de victimisation et de coercition. L’échantillon comprend 354 étudiants(es) de l’Université de Montréal provenant de diverses associations étudiantes. Les principaux résultats montrent que les femmes rapportent moins de croyances antagonistes que les hommes. Toutefois, il n’y a aucune différence entre les femmes et les hommes en ce qui concerne les croyances erronées entourant le viol, l’hostilité envers les femmes, l’acceptation de la violence interpersonnelle, les croyances antagonistes et le conservatisme sexuel. En ce qui concerne les comportements sexuels, les femmes rapportent davantage de victimisation sexuelle que les hommes. Peu de coercition sexuelle est rapportée tant par les femmes que les hommes. Par contre, les hommes affirment avoir commis plus de coercition sexuelle que les femmes. Les résultats montrent aussi que l’hostilité envers les femmes prédit la victimisation sexuelle chez les femmes. Par ailleurs, les croyances erronées entourant le viol prédisent les comportements sexuels coercitifs chez les femmes alors que le conservatisme sexuel prédit la coercition sexuelle chez les hommes. En outre, les résultats montrent que la victimisation sexuelle prédit les comportements sexuels coercitifs tant chez les femmes que chez les hommes. / Feminist movements in the 1970s and 1980s brought about profound social changes in North America, such as the occurrence of sexual assaults. These social changes were translated into legislative modifications in Canada, as of 1983. The studies following these changes examined sexual coercion in non-delinquent populations. One of the notable conclusions of these studies is the existence of a significant dark figure with respect to sexual assaults. Indeed, studies done in the 1980s did not take into account female aggressors, as the phenomenon was perceived to be typically one attributed to males. Academic interest in sexual coercion committed by females is rooted in studies published in the 1990s. It was revealed that certain attitudes and beliefs are associated with the trivialization of sexual assault in women and in men. Similarities were also established between sexual coercion committed by males and females. Little studies on the prevalence of sexual coercion have considered both men and women as potential aggressors. It is important to examine the attitudes and beliefs related to sexual coercion in the non-delinquent populations of Quebec. An online survey was conducted using Survey Monkey. This survey contained four measures to examine attitudes associated to erroneous beliefs regarding rape, hostility against females, tolerance of interpersonal violence, as well as antagonistic beliefs and sexual conservatism. A fifth instrument was used to measure sexual experiences, both in terms of victimization and coercion. The sample contained 354 students of the Université de Montréal coming from various student associations. The main results showed that females report less antagonistic beliefs than males. However, no differences were found between females and males regarding rape myth acceptance, hostility toward women, acceptance of interpersonal violence, adversarial sexual beliefs and sexual conservatism. In terms of sexual behaviors, females reported more sexual victimization than males. Little sexual coercion was reported in females and males. Results, however, showed that males had committed more sexual coercion than females. Additionally, it was found that hostility towards women predicted sexual victimization in females. Further, erroneous beliefs on rape predicted coercive sexual behaviors in women, whereas sexual conservatism predicted sexual coercion in women. Finally, sexual victimization predicted coercive sexual behaviors in both females and males.
55

Multi-player games in the era of machine learning

Gidel, Gauthier 07 1900 (has links)
Parmi tous les jeux de société joués par les humains au cours de l’histoire, le jeu de go était considéré comme l’un des plus difficiles à maîtriser par un programme informatique [Van Den Herik et al., 2002]; Jusqu’à ce que ce ne soit plus le cas [Silveret al., 2016]. Cette percée révolutionnaire [Müller, 2002, Van Den Herik et al., 2002] fût le fruit d’une combinaison sophistiquée de Recherche arborescente Monte-Carlo et de techniques d’apprentissage automatique pour évaluer les positions du jeu, mettant en lumière le grand potentiel de l’apprentissage automatique pour résoudre des jeux. L’apprentissage antagoniste, un cas particulier de l’optimisation multiobjective, est un outil de plus en plus utile dans l’apprentissage automatique. Par exemple, les jeux à deux joueurs et à somme nulle sont importants dans le domain des réseaux génératifs antagonistes [Goodfellow et al., 2014] ainsi que pour maîtriser des jeux comme le Go ou le Poker en s’entraînant contre lui-même [Silver et al., 2017, Brown andSandholm, 2017]. Un résultat classique de la théorie des jeux indique que les jeux convexes-concaves ont toujours un équilibre [Neumann, 1928]. Étonnamment, les praticiens en apprentissage automatique entrainent avec succès une seule paire de réseaux de neurones dont l’objectif est un problème de minimax non-convexe et non-concave alors que pour une telle fonction de gain, l’existence d’un équilibre de Nash n’est pas garantie en général. Ce travail est une tentative d'établir une solide base théorique pour l’apprentissage dans les jeux. La première contribution explore le théorème minimax pour une classe particulière de jeux non-convexes et non-concaves qui englobe les réseaux génératifs antagonistes. Cette classe correspond à un ensemble de jeux à deux joueurs et a somme nulle joués avec des réseaux de neurones. Les deuxième et troisième contributions étudient l’optimisation des problèmes minimax, et plus généralement, les inégalités variationnelles dans le cadre de l’apprentissage automatique. Bien que la méthode standard de descente de gradient ne parvienne pas à converger vers l’équilibre de Nash de jeux convexes-concaves simples, il existe des moyens d’utiliser des gradients pour obtenir des méthodes qui convergent. Nous étudierons plusieurs techniques telles que l’extrapolation, la moyenne et la quantité de mouvement à paramètre négatif. La quatrième contribution fournit une étude empirique du comportement pratique des réseaux génératifs antagonistes. Dans les deuxième et troisième contributions, nous diagnostiquons que la méthode du gradient échoue lorsque le champ de vecteur du jeu est fortement rotatif. Cependant, une telle situation peut décrire un pire des cas qui ne se produit pas dans la pratique. Nous fournissons de nouveaux outils de visualisation afin d’évaluer si nous pouvons détecter des rotations dans comportement pratique des réseaux génératifs antagonistes. / Among all the historical board games played by humans, the game of go was considered one of the most difficult to master by a computer program [Van Den Heriket al., 2002]; Until it was not [Silver et al., 2016]. This odds-breaking break-through [Müller, 2002, Van Den Herik et al., 2002] came from a sophisticated combination of Monte Carlo tree search and machine learning techniques to evaluate positions, shedding light upon the high potential of machine learning to solve games. Adversarial training, a special case of multiobjective optimization, is an increasingly useful tool in machine learning. For example, two-player zero-sum games are important for generative modeling (GANs) [Goodfellow et al., 2014] and mastering games like Go or Poker via self-play [Silver et al., 2017, Brown and Sandholm,2017]. A classic result in Game Theory states that convex-concave games always have an equilibrium [Neumann, 1928]. Surprisingly, machine learning practitioners successfully train a single pair of neural networks whose objective is a nonconvex-nonconcave minimax problem while for such a payoff function, the existence of a Nash equilibrium is not guaranteed in general. This work is an attempt to put learning in games on a firm theoretical foundation. The first contribution explores minimax theorems for a particular class of nonconvex-nonconcave games that encompasses generative adversarial networks. The proposed result is an approximate minimax theorem for two-player zero-sum games played with neural networks, including WGAN, StarCrat II, and Blotto game. Our findings rely on the fact that despite being nonconcave-nonconvex with respect to the neural networks parameters, the payoff of these games are concave-convex with respect to the actual functions (or distributions) parametrized by these neural networks. The second and third contributions study the optimization of minimax problems, and more generally, variational inequalities in the context of machine learning. While the standard gradient descent-ascent method fails to converge to the Nash equilibrium of simple convex-concave games, there exist ways to use gradients to obtain methods that converge. We investigate several techniques such as extrapolation, averaging and negative momentum. We explore these techniques experimentally by proposing a state-of-the-art (at the time of publication) optimizer for GANs called ExtraAdam. We also prove new convergence results for Extrapolation from the past, originally proposed by Popov [1980], as well as for gradient method with negative momentum. The fourth contribution provides an empirical study of the practical landscape of GANs. In the second and third contributions, we diagnose that the gradient method breaks when the game’s vector field is highly rotational. However, such a situation may describe a worst-case that does not occur in practice. We provide new visualization tools in order to exhibit rotations in practical GAN landscapes. In this contribution, we show empirically that the training of GANs exhibits significant rotations around Local Stable Stationary Points (LSSP), and we provide empirical evidence that GAN training converges to a stable stationary point, which is a saddle point for the generator loss, not a minimum, while still achieving excellent performance.
56

Advances in generative models for dynamic scenes

Castrejon Subira, Lluis Enric 05 1900 (has links)
Les réseaux de neurones sont un type de modèle d'apprentissage automatique (ML) qui résolvent des tâches complexes d'intelligence artificielle (AI) sans nécessiter de représentations de données élaborées manuellement. Bien qu'ils aient obtenu des résultats impressionnants dans des tâches nécessitant un traitement de la parole, d’image, et du langage, les réseaux de neurones ont encore de la difficulté à résoudre des tâches de compréhension de scènes dynamiques. De plus, l’entraînement de réseaux de neurones nécessite généralement de nombreuses données annotées manuellement, ce qui peut être un processus long et coûteux. Cette thèse est composée de quatre articles proposant des modèles génératifs pour des scènes dynamiques. La modélisation générative est un domaine du ML qui étudie comment apprendre les mécanismes par lesquels les données sont produites. La principale motivation derrière les modèles génératifs est de pouvoir, sans utiliser d’étiquettes, apprendre des représentations de données utiles; c’est un sous-produit de l'approximation du processus de génération de données. De plus, les modèles génératifs sont utiles pour un large éventail d'applications telles que la super-résolution d'images, la synthèse vocale ou le résumé de texte. Le premier article se concentre sur l'amélioration de la performance des précédents auto-encodeurs variationnels (VAE) pour la prédiction vidéo. Il s’agit d’une tâche qui consiste à générer les images futures d'une scène dynamique, compte tenu de certaines observations antérieures. Les VAE sont une famille de modèles à variables latentes qui peuvent être utilisés pour échantillonner des points de données. Comparés à d'autres modèles génératifs, les VAE sont faciles à entraîner et ont tendance à couvrir tous les modes des données, mais produisent souvent des résultats de moindre qualité. En prédiction vidéo, les VAE ont été les premiers modèles capables de produire des images futures plausibles à partir d’un contexte donné, un progrès marquant par rapport aux modèles précédents car, pour la plupart des scènes dynamiques, le futur n'est pas une fonction déterministe du passé. Cependant, les premiers VAE pour la prédiction vidéo produisaient des résultats avec des artefacts visuels visibles et ne fonctionnaient pas sur des ensembles de données réalistes complexes. Dans cet article, nous identifions certains des facteurs limitants de ces modèles, et nous proposons pour chacun d’eux une solution pour en atténuer l'impact. Grâce à ces modifications, nous montrons que les VAE pour la prédiction vidéo peuvent obtenir des résultats de qualité nettement supérieurs par rapport aux références précédentes, et qu'ils peuvent être utilisés pour modéliser des scènes de conduite autonome. Dans le deuxième article, nous proposons un nouveau modèle en cascade pour la génération vidéo basé sur les réseaux antagonistes génératifs (GAN). Après le succès des VAE pour prédiction vidéo, il a été démontré que les GAN produisaient des échantillons vidéo de meilleure qualité pour la génération vidéo conditionnelle à des classes. Cependant, les GAN nécessitent de très grandes tailles de lots ainsi que des modèles de grande capacité, ce qui rend l’entraînement des GAN pour la génération vidéo coûteux computationnellement, à la fois en termes de mémoire et en temps de calcul. Nous proposons de scinder le processus génératif en une cascade de sous-modèles, chacun d'eux résolvant un problème plus simple. Cette division nous permet de réduire considérablement le coût computationnel tout en conservant la qualité de l'échantillon, et nous démontrons que ce modèle peut s'adapter à de très grands ensembles de données ainsi qu’à des vidéos de haute résolution. Dans le troisième article, nous concevons un modèle basé sur le principe qu'une scène est composée de différents objets, mais que les transitions de trame (également appelées règles dynamiques) sont partagées entre les objets. Pour mettre en œuvre cette hypothèse de modélisation, nous concevons un modèle qui extrait d'abord les différentes entités d'une image. Ensuite, le modèle apprend à mettre à jour la représentation de l'objet d'une image à l'autre en choisissant parmi différentes transitions possibles qui sont toutes partagées entre les différents objets. Nous montrons que, lors de l'apprentissage d'un tel modèle, les règles de transition sont fondées sémantiquement, et peuvent être appliquées à des objets non vus lors de l'apprentissage. De plus, nous pouvons utiliser ce modèle pour prédire les observations multimodales futures d'une scène dynamique en choisissant différentes transitions. Dans le dernier article nous proposons un modèle génératif basé sur des techniques de rendu 3D qui permet de générer des scènes avec plusieurs objets. Nous concevons un mécanisme d'inférence pour apprendre les représentations qui peuvent être rendues avec notre modèle et nous optimisons simultanément ce mécanisme d'inférence et le moteur de rendu. Nous montrons que ce modèle possède une représentation interprétable dans laquelle des changements sémantiques appliqués à la représentation de la scène sont rendus dans la scène générée. De plus, nous montrons que, suite au processus d’entraînement, notre modèle apprend à segmenter les objets dans une scène sans annotations et que la représentation apprise peut être utilisée pour résoudre des tâches de compréhension de scène dynamique en déduisant la représentation de chaque observation. / Neural networks are a type of Machine Learning (ML) models that solve complex Artificial Intelligence (AI) tasks without requiring handcrafted data representations. Although they have achieved impressive results in tasks requiring speech, image and language processing, neural networks still struggle to solve dynamic scene understanding tasks. Furthermore, training neural networks usually demands lots data that is annotated manually, which can be an expensive and time-consuming process. This thesis is comprised of four articles proposing generative models for dynamic scenes. Generative modelling is an area of ML that investigates how to learn the mechanisms by which data is produced. The main motivation for generative models is to learn useful data representations without labels as a by-product of approximating the data generation process. Furthermore, generative models are useful for a wide range of applications such as image super-resolution, voice synthesis or text summarization. The first article focuses on improving the performance of previous Variational AutoEncoders (VAEs) for video prediction, which is the task of generating future frames of a dynamic scene given some previous occurred observations. VAEs are a family of latent variable models that can be used to sample data points. Compared to other generative models, VAEs are easy to train and tend to cover all data modes, but often produce lower quality results. In video prediction VAEs were the first models that were able to produce multiple plausible future outcomes given a context, marking an advancement over previous models as for most dynamic scenes the future is not a deterministic function of the past. However, the first VAEs for video prediction produced results with visible visual artifacts and could not operate on complex realistic datasets. In this article we identify some of the limiting factors for these models, and for each of them we propose a solution to ease its impact. With our proposed modifications, we show that VAEs for video prediction can obtain significant higher quality results over previous baselines and that they can be used to model autonomous driving scenes. In the second article we propose a new cascaded model for video generation based on Generative Adversarial Networks (GANs). After the success of VAEs in video prediction, GANs were shown to produce higher quality video samples for class-conditional video generation. However, GANs require very large batch sizes and high capacity models, which makes training GANs for video generation computationally expensive, both in terms of memory and training time. We propose to split the generative process into a cascade of submodels, each of them solving a smaller generative problem. This split allows us to significantly reduce the computational requirements while retaining sample quality, and we show that this model can scale to very large datasets and video resolutions. In the third article we design a model based on the premise that a scene is comprised of different objects but that frame transitions (also known as dynamic rules) are shared among objects. To implement this modeling assumption we design a model that first extracts the different entities in a frame, and then learns to update the object representation from one frame to another by choosing among different possible transitions, all shared among objects. We show that, when learning such a model, the transition rules are semantically grounded and can be applied to objects not seen during training. Further, we can use this model for predicting multimodal future observations of a dynamic scene by choosing different transitions. In the last article we propose a generative model based on 3D rendering techniques that can generate scenes with multiple objects. We design an inference mechanism to learn representations that can be rendered with our model and we simultaneously optimize this inference mechanism and the renderer. We show that this model has an interpretable representation in which semantic changes to the scene representation are shown in the output. Furthermore, we show that, as a by product of the training process, our model learns to segment the objects in a scene without annotations and that the learned representation can be used to solve dynamic scene understanding tasks by inferring the representation of each observation.
57

Towards meaningful and data-efficient learning : exploring GAN losses, improving few-shot benchmarks, and multimodal video captioning

Huang, Gabriel 09 1900 (has links)
Ces dernières années, le domaine de l’apprentissage profond a connu des progrès énormes dans des applications allant de la génération d’images, détection d’objets, modélisation du langage à la réponse aux questions visuelles. Les approches classiques telles que l’apprentissage supervisé nécessitent de grandes quantités de données étiquetées et spécifiques à la tâches. Cependant, celles-ci sont parfois coûteuses, peu pratiques, ou trop longues à collecter. La modélisation efficace en données, qui comprend des techniques comme l’apprentissage few-shot (à partir de peu d’exemples) et l’apprentissage self-supervised (auto-supervisé), tentent de remédier au manque de données spécifiques à la tâche en exploitant de grandes quantités de données plus “générales”. Les progrès de l’apprentissage profond, et en particulier de l’apprentissage few-shot, s’appuient sur les benchmarks (suites d’évaluation), les métriques d’évaluation et les jeux de données, car ceux-ci sont utilisés pour tester et départager différentes méthodes sur des tâches précises, et identifier l’état de l’art. Cependant, du fait qu’il s’agit de versions idéalisées de la tâche à résoudre, les benchmarks sont rarement équivalents à la tâche originelle, et peuvent avoir plusieurs limitations qui entravent leur rôle de sélection des directions de recherche les plus prometteuses. De plus, la définition de métriques d’évaluation pertinentes peut être difficile, en particulier dans le cas de sorties structurées et en haute dimension, telles que des images, de l’audio, de la parole ou encore du texte. Cette thèse discute des limites et des perspectives des benchmarks existants, des fonctions de coût (training losses) et des métriques d’évaluation (evaluation metrics), en mettant l’accent sur la modélisation générative - les Réseaux Antagonistes Génératifs (GANs) en particulier - et la modélisation efficace des données, qui comprend l’apprentissage few-shot et self-supervised. La première contribution est une discussion de la tâche de modélisation générative, suivie d’une exploration des propriétés théoriques et empiriques des fonctions de coût des GANs. La deuxième contribution est une discussion sur la limitation des few-shot classification benchmarks, certains ne nécessitant pas de généralisation à de nouvelles sémantiques de classe pour être résolus, et la proposition d’une méthode de base pour les résoudre sans étiquettes en phase de testing. La troisième contribution est une revue sur les méthodes few-shot et self-supervised de détection d’objets , qui souligne les limites et directions de recherche prometteuses. Enfin, la quatrième contribution est une méthode efficace en données pour la description de vidéo qui exploite des jeux de données texte et vidéo non supervisés. / In recent years, the field of deep learning has seen tremendous progress for applications ranging from image generation, object detection, language modeling, to visual question answering. Classic approaches such as supervised learning require large amounts of task-specific and labeled data, which may be too expensive, time-consuming, or impractical to collect. Data-efficient methods, such as few-shot and self-supervised learning, attempt to deal with the limited availability of task-specific data by leveraging large amounts of general data. Progress in deep learning, and in particular, few-shot learning, is largely driven by the relevant benchmarks, evaluation metrics, and datasets. They are used to test and compare different methods on a given task, and determine the state-of-the-art. However, due to being idealized versions of the task to solve, benchmarks are rarely equivalent to the original task, and can have several limitations which hinder their role of identifying the most promising research directions. Moreover, defining meaningful evaluation metrics can be challenging, especially in the case of high-dimensional and structured outputs, such as images, audio, speech, or text. This thesis discusses the limitations and perspectives of existing benchmarks, training losses, and evaluation metrics, with a focus on generative modeling—Generative Adversarial Networks (GANs) in particular—and data-efficient modeling, which includes few-shot and self-supervised learning. The first contribution is a discussion of the generative modeling task, followed by an exploration of theoretical and empirical properties of the GAN loss. The second contribution is a discussion of a limitation of few-shot classification benchmarks, which is that they may not require class semantic generalization to be solved, and the proposal of a baseline method for solving them without test-time labels. The third contribution is a survey of few-shot and self-supervised object detection, which points out the limitations and promising future research for the field. Finally, the fourth contribution is a data-efficient method for video captioning, which leverages unsupervised text and video datasets, and explores several multimodal pretraining strategies.

Page generated in 0.1253 seconds