• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 4
  • 3
  • 1
  • Tagged with
  • 8
  • 8
  • 5
  • 5
  • 3
  • 3
  • 3
  • 3
  • 3
  • 3
  • 3
  • 3
  • 3
  • 2
  • 2
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
1

Bremsstrahlung thermique comme sonde de la multifragmentation nucléaire dans les collisions noyau-noyau aux énergies de Fermi

D'Enterria, David 05 May 2000 (has links) (PDF)
Cette thèse aborde l'étude des propriétés thermodynamiques de la matière nucléaire portée à températures et densités où l'on s'attend à observer la transition de phase liquide-gaz nucléaire. Les photons durs (E_gamma > 30 MeV) émis dans des collisions noyau-noyau sont utilisés comme sonde expérimentale. La production des photons et particules chargées dans quatre réactions d'ions lourds différentes (36Ar+197Au, 107Ag, 58Ni, 12C à 60 A MeV) a été mesurée de façon exclusive et inclusive en couplant le spectromètre de photons TAPS avec deux autres détecteurs de particules légères et de fragments de masse intermédiaire couvrant quasiment la totalité de l'angle solide.<br /><br />Nos résultats confirment l'origine dominante des photons durs comme étant due au rayonnement de freinage émis dans les collisions proton-neutron (pn gamma) de première chance (hors équilibre). Nous établissons aussi de façon définitive l'existence d'une composante de radiation thermique dans le spectre photon mesuré dans les sytèmes lourds, et attribuons son origine au rayonnement de freinage émis dans les collisions p-n de deuxième-chance. <br /><br />Nous exploitons cette observation pour i) démontrer que la matière nucléaire atteint un équilibre thermique lors de la réaction, ii) valider un nouveau thermomètre basé sur les photons du rayonnement de freinage, iii) déduire les propriétés thermodynamiques de la matière nucléaire chaude (en particulier, pour établir la "courbe calorique") et iv) évaluer les échelles de temps du processus de fragmentation nucléaire.
2

Incidence de la torsion sur la résistance sismique de bâtiments courants avec diaphragmes horizontaux rigides. Application aux structures en bois

Vu, Thanh Kien 08 December 2011 (has links) (PDF)
Les secousses sismiques sont des catastrophes naturelles, affectant la croûte terrestre, qui peuvent avoir des effets destructeurs majeurs dans les zones urbanisées. Même si des méthodes précises de calcul d'ouvrages en situation sismique existent, il est nécessaire de disposer de méthodes adaptées aux ingénieries mises en oeuvre. L'évolution de la réglementation parasismique (Eurocode 8 et annexes nationales) et du zonage sismique en France fait évoluer de manière significative la nécessité de prise en compte de l'action sismique dans la conception des bâtiments. Dans un calcul sismique, il est indispensable de prendre en compte des effets de la torsion qui peuvent conduire à des conséquences graves, en termes de dommages affectant les ouvrages de génie civil. Le présent travail expose une démarche incluant différents niveaux d'approches pour prendre en compte ce phénomène. Les structures particulièrement visées par ce travail sont les ossatures dites souples et plus spécifiquement les constructions en bois. Une étude paramétrique est menée avec une méthode de combinaison multidimensionnelle pour analyser l'influence de différentes configurations de contreventement sur la sensibilité de l'ouvrage aux phénomènes de torsion. Cette étape est basée sur l'adaptation pour des structures en bois, dans le contexte des Eurocodes (torsion structurale et torsion accidentelle), d'une méthode néozélandaise développée par Priestley et Paulay initialement proposée pour des bâtiments en béton armé. L'étude du comportement des bâtiments en bois en situation sismique s'inscrit dans une approche utilisant la méthode de linéarisation équivalente par coefficient de comportement. L'action sismique peut ainsi être modélisée par des forces statiques équivalentes qui sont ensuite transmises aux éléments structuraux verticaux par des diaphragmes horizontaux. Ce travail permet de définir des distributions d'efforts sismiques sur chaque contreventement avec la prise en compte de la torsion à partir d'une cartographie d'implantation des contreventements et des masses. Cette méthode originale de prise en compte de la torsion est mise en application et l'ensemble des résultats obtenus conduit à la réalisation d'une base de données conséquente sur les effets de la torsion, pour une situation sismique, dans le cas d'un dimensionnement en capacité, avec contreventements ductiles à comportement linéarisé par coefficient de comportement et diaphragmes horizontaux rigides. Après mise en application de cette méthode, une approche numérique du comportement de structures génériques est conduite afin d'illustrer les effets de différents niveaux de simplification inhérents à la méthode originale mise en place. Dans cette étape, les calculs utilisent la méthode des éléments finis en s'appuyant sur le logiciel Cast3m. Les calculs dynamiques sont réalisés sur la base de comportements linéaires ou linéarisés afin d'analyser les effets de différentes méthodes de calcul proposées par l'Eurocode 8, partie 1. Les calculs menés dans cette phase permettent notamment de valider des conditions d'application de méthodes simplifiées pour des structures en bois, et d'approcher les effets de la torsion sur ces structures avec différents degrés de précision.
3

La voie ferrée et sa fondation - Modélisation mathématique

Profillidis, Vassilios 28 October 1983 (has links) (PDF)
La présente thèse a pour but principal d'approfondir, à l'aide d'une modélisation mathématique, les divers aspects du comportement mécanique du système complet " voie ferrée-fondation ". La thèse comporte quatre chapitres, dans lesquels sont traités les thèmes suivants. Dans le premier chapitre on établit une modélisation en élasto-plasticité du système " rail-traverses-couches d'assise-plate-forme ", en utilisant la méthode des éléments finis. Dans le deuxième chapitre, on détermine les épaisseurs rationnelles des couches d'assise, après avoir étudié successivement, à l'aide de cette modélisation, l'influence sur le comportement mécanique de la voie ferrée des paramètres suivants : - type et longueur de la traverse, - qualité du sol de la plate-forme, - surcharges dynamiques dues aux défauts géométriques de la voie, - tonnage supporté, - niveau des opérations d'entretien de la voie. Dans le troisième chapitre, on étudie le comportement à la fatigue des matériaux constitutifs des couches d'assise et de la plate-forme. Dans le quatrième chapitre, on analyse le problème de la propagation des vibrations ferroviaires dans les sols environnants et on étudie notamment la dissipation de l'énergie vibratoire dans la couche de ballast.
4

Incidence de la torsion sur la résistance sismique de bâtiments courants avec diaphragmes horizontaux rigides. Application aux structures en bois / Impact of torsion on the seismic resistance of common buildings with rigid horizontal diaphragms. Application to wooden structures

Vu, Thanh Kien 08 December 2011 (has links)
Les secousses sismiques sont des catastrophes naturelles, affectant la croûte terrestre, qui peuvent avoir des effets destructeurs majeurs dans les zones urbanisées. Même si des méthodes précises de calcul d’ouvrages en situation sismique existent, il est nécessaire de disposer de méthodes adaptées aux ingénieries mises en oeuvre. L’évolution de la réglementation parasismique (Eurocode 8 et annexes nationales) et du zonage sismique en France fait évoluer de manière significative la nécessité de prise en compte de l’action sismique dans la conception des bâtiments. Dans un calcul sismique, il est indispensable de prendre en compte des effets de la torsion qui peuvent conduire à des conséquences graves, en termes de dommages affectant les ouvrages de génie civil. Le présent travail expose une démarche incluant différents niveaux d'approches pour prendre en compte ce phénomène. Les structures particulièrement visées par ce travail sont les ossatures dites souples et plus spécifiquement les constructions en bois. Une étude paramétrique est menée avec une méthode de combinaison multidimensionnelle pour analyser l'influence de différentes configurations de contreventement sur la sensibilité de l'ouvrage aux phénomènes de torsion. Cette étape est basée sur l’adaptation pour des structures en bois, dans le contexte des Eurocodes (torsion structurale et torsion accidentelle), d’une méthode néozélandaise développée par Priestley et Paulay initialement proposée pour des bâtiments en béton armé. L’étude du comportement des bâtiments en bois en situation sismique s’inscrit dans une approche utilisant la méthode de linéarisation équivalente par coefficient de comportement. L’action sismique peut ainsi être modélisée par des forces statiques équivalentes qui sont ensuite transmises aux éléments structuraux verticaux par des diaphragmes horizontaux. Ce travail permet de définir des distributions d’efforts sismiques sur chaque contreventement avec la prise en compte de la torsion à partir d’une cartographie d’implantation des contreventements et des masses. Cette méthode originale de prise en compte de la torsion est mise en application et l’ensemble des résultats obtenus conduit à la réalisation d’une base de données conséquente sur les effets de la torsion, pour une situation sismique, dans le cas d’un dimensionnement en capacité, avec contreventements ductiles à comportement linéarisé par coefficient de comportement et diaphragmes horizontaux rigides. Après mise en application de cette méthode, une approche numérique du comportement de structures génériques est conduite afin d’illustrer les effets de différents niveaux de simplification inhérents à la méthode originale mise en place. Dans cette étape, les calculs utilisent la méthode des éléments finis en s’appuyant sur le logiciel Cast3m. Les calculs dynamiques sont réalisés sur la base de comportements linéaires ou linéarisés afin d’analyser les effets de différentes méthodes de calcul proposées par l’Eurocode 8, partie 1. Les calculs menés dans cette phase permettent notamment de valider des conditions d’application de méthodes simplifiées pour des structures en bois, et d’approcher les effets de la torsion sur ces structures avec différents degrés de précision. / The earthquakes are natural disasters affecting the earth's crust, which can have major destructive effects in urban areas. We have a set of scientific, technical and conception knowledge which allow to « build earthquake-resistant », but these methods must be adapted to simple buildings. The development of earthquake-resistant regulations (Eurocode 8 and national annexes) and seismic zoning of France evolve significantly to the need for taking into account the seismic action in the building design. In seismic design, it is essential to take into account the torsion effects that can lead to serious consequences in terms of damage to civil engineering structures. This research work presents a process including different levels of approach to take into account the effect of the torsion. The structures particularly targeted by this work are the so-called soft frames and more specifically the timber buildings. After a course of bibliographic elements related to the timber structures and the structures of current buildings subjected to seismic situations, a parametric study is taken with a method for multi-dimensional combination in order to analyze the influence of different bracing configurations on the sensitivity of the structure to the torsion phenomena. This first stage is based on the adaptation for timber structures, in the context of Eurocodes (structural torsion and accidental torsion), of a New Zealand method developed by Paulay and Priestley originally proposed for reinforced concrete buildings. The study of the behavior of timber buildings in seismic situation is part of an approach using the equivalent linearization method by a behavior coefficient. So the seismic action can be modeled by equivalent static forces which are then transmitted to the vertical structural elements by horizontal diaphragms. The objective of this work is to define the distribution of seismic forces on each brace with the inclusion of torsion from cartography of bracing and masses implantation. This original method, taking into account the torsion effect, is implemented and all the results lead to the creation of a rich database, for a seismic situation, in the case of design capacity, with ductile bracing and linearized behavior through the behavior factors and rigid horizontal diaphragms. This database can be used to simplify the approach of the torsional effects of the current timber buildings. It can also be used as a reference for the analysis of the influence of the semi rigid diaphragms or the actual non-linearity of bracing. After implementation of this method, a numerical approach considering the behavior of generic structures is conducted to illustrate the effects of different levels of simplification inherent to the implemented original method. In this step, the calculations use the finite element method (software Cast3M). The dynamic analysis is made on the basis of linear or linearized behavior to evaluate the effects of different calculation methods proposed by Eurocode 8, Part 1. The calculations done in this phase allow mainly to validate the applicability of simplified methods for timber structures, and to predict the torsional effects on these structures with different degrees of precision.
5

La géométrie du sens : la polysémie verbale en question / The geometry of meaning : verbal polysemy in question

Sendi, Monia 18 December 2015 (has links)
Notre étude porte sur la notion de géométrie de sens. Ainsi, l’étude de la notion de verbe occupe l’axe principal de notre thèse. Cette notion est connue par sa complexité. Cela s’explique par la forte polysémie des verbes français. Nous avons focalisé notre étude sur l’analyse syntactico-sémantique des verbes « monter» et « passer ». La notion de polysémie, malgré sa grande importance, reste toujours très difficile à formaliser. Nous avons tenté, dans cette étude, d’utiliser trois dictionnaires électroniques pour désambiguïser les verbes « monter » et « passer ». Ce travail permet de rendre compte de l’influence de la syntaxe et du lexique sur les sens de ces deux verbes. Dans notre démarche, nous avons utilisé la méthode de désambiguïsation automatique de B. Victorri qui a pour spécificité l’analyse des unités lexicales polysémiques. Ce modèle se base sur des théories linguistiques et il exploite les mathématiques et l’informatique dans l’objectif de bien décrire et de résoudre le problème de la polysémie verbale. Donc, notre travail est pluridisciplinaire. C’est là où l’informatique et les mathématiques sont au service de l’analyse des langues naturelles. / Our study focuses on the concept of geometry of sense. the study of the concept of verb occupies the main axis of our thesis. This concept is known for its complexity. This is explained by the polysemy of French verbs. We focused our study on the syntactic-semantic analysis of the two verbs "to climb " and "to pass". Indeed, the multiplicity of use involves the notion of verbal polysemy. This notion despite its importance is still very difficult to formulate. We have tried in this study using three electronic dictionaries to disambiguate the verbs "to climb " and "to pass". This work allows us to account for the influence of the syntax and vocabulary of the senses of these two verbs. We explained the opportunity to disambiguate a polysemous verb not by recourse to a list of synonyms but by a set of meanings in specific syntactic constructions. In our approach, we used an automatic method of disambiguation B Victorri that has specificity for the analysis of polysemous lexical units. We found that there is reconciliation between the theoretical analysis and the analysis given by this method. This model is based on linguistic theories and operates mathematics and computer with the aim to clearly describe and solve the problem of verbal polysemy. So our work is multidisciplinary. This is where computer science and mathematics is at the service of the analysis of natural languages.
6

Deep neural networks for natural language processing and its acceleration

Lin, Zhouhan 08 1900 (has links)
Cette thèse par article comprend quatre articles qui contribuent au domaine de l'apprentissage profond, en particulier à l'accélération de l’apprentissage par le biais de réseaux à faible précision et à l'application de réseaux de neurones profonds au traitement du langage naturel. Dans le premier article, nous étudions un schéma d’entraînement de réseau de neurones qui élimine la plupart des multiplications en virgule flottante. Cette approche consiste à binariser ou à ternariser les poids dans la propagation en avant et à quantifier les états cachés dans la propagation arrière, ce qui convertit les multiplications en changements de signe et en décalages binaires. Les résultats expérimentaux sur des jeux de données de petite à moyenne taille montrent que cette approche produit des performances encore meilleures que l’approche standard de descente de gradient stochastique, ouvrant la voie à un entraînement des réseaux de neurones rapide et efficace au niveau du matériel. Dans le deuxième article, nous avons proposé un mécanisme structuré d’auto-attention d’enchâssement de phrases qui extrait des représentations interprétables de phrases sous forme matricielle. Nous démontrons des améliorations dans 3 tâches différentes: le profilage de l'auteur, la classification des sentiments et l'implication textuelle. Les résultats expérimentaux montrent que notre modèle génère un gain en performance significatif par rapport aux autres méthodes d’enchâssement de phrases dans les 3 tâches. Dans le troisième article, nous proposons un modèle hiérarchique avec graphe de calcul dynamique, pour les données séquentielles, qui apprend à construire un arbre lors de la lecture de la séquence. Le modèle apprend à créer des connexions de saut adaptatives, ce qui facilitent l'apprentissage des dépendances à long terme en construisant des cellules récurrentes de manière récursive. L’entraînement du réseau peut être fait soit par entraînement supervisée en donnant des structures d’arbres dorés, soit par apprentissage par renforcement. Nous proposons des expériences préliminaires dans 3 tâches différentes: une nouvelle tâche d'évaluation de l'expression mathématique (MEE), une tâche bien connue de la logique propositionnelle et des tâches de modélisation du langage. Les résultats expérimentaux montrent le potentiel de l'approche proposée. Dans le quatrième article, nous proposons une nouvelle méthode d’analyse par circonscription utilisant les réseaux de neurones. Le modèle prédit la structure de l'arbre d'analyse en prédisant un scalaire à valeur réelle, soit la distance syntaxique, pour chaque position de division dans la phrase d'entrée. L'ordre des valeurs relatives de ces distances syntaxiques détermine ensuite la structure de l'arbre d'analyse en spécifiant l'ordre dans lequel les points de division seront sélectionnés, en partitionnant l'entrée de manière récursive et descendante. L’approche proposée obtient une performance compétitive sur le jeu de données Penn Treebank et réalise l’état de l’art sur le jeu de données Chinese Treebank. / This thesis by article consists of four articles which contribute to the field of deep learning, specifically in the acceleration of training through low-precision networks, and the application of deep neural networks on natural language processing. In the first article, we investigate a neural network training scheme that eliminates most of the floating-point multiplications. This approach consists of binarizing or ternarizing the weights in the forward propagation and quantizing the hidden states in the backward propagation, which converts multiplications to sign changes and binary shifts. Experimental results on datasets from small to medium size show that this approach result in even better performance than standard stochastic gradient descent training, paving the way to fast, hardware-friendly training of neural networks. In the second article, we proposed a structured self-attentive sentence embedding that extracts interpretable sentence representations in matrix form. We demonstrate improvements on 3 different tasks: author profiling, sentiment classification and textual entailment. Experimental results show that our model yields a significant performance gain compared to other sentence embedding methods in all of the 3 tasks. In the third article, we propose a hierarchical model with dynamical computation graph for sequential data that learns to construct a tree while reading the sequence. The model learns to create adaptive skip-connections that ease the learning of long-term dependencies through constructing recurrent cells in a recursive manner. The training of the network can either be supervised training by giving golden tree structures, or through reinforcement learning. We provide preliminary experiments in 3 different tasks: a novel Math Expression Evaluation (MEE) task, a well-known propositional logic task, and language modelling tasks. Experimental results show the potential of the proposed approach. In the fourth article, we propose a novel constituency parsing method with neural networks. The model predicts the parse tree structure by predicting a real valued scalar, named syntactic distance, for each split position in the input sentence. The order of the relative values of these syntactic distances then determine the parse tree structure by specifying the order in which the split points will be selected, recursively partitioning the input, in a top-down fashion. Our proposed approach was demonstrated with competitive performance on Penn Treebank dataset, and the state-of-the-art performance on Chinese Treebank dataset.
7

Towards computationally efficient neural networks with adaptive and dynamic computations

Kim, Taesup 08 1900 (has links)
Ces dernières années, l'intelligence artificielle a été considérablement avancée et l'apprentissage en profondeur, où des réseaux de neurones profonds sont utilisés pour tenter d'imiter vaguement le cerveau humain, y a contribué de manière significative. Les réseaux de neurones profonds sont désormais capables d'obtenir un grand succès sur la base d'une grande quantité de données et de ressources de calcul suffisantes. Malgré leur succès, leur capacité à s'adapter rapidement à de nouveaux concepts, tâches et environnements est assez limitée voire inexistante. Dans cette thèse, nous nous intéressons à la façon dont les réseaux de neurones profonds peuvent s'adapter à des circonstances en constante évolution ou totalement nouvelles, de la même manière que l'intelligence humaine, et introduisons en outre des modules architecturaux adaptatifs et dynamiques ou des cadres de méta-apprentissage pour que cela se produise de manière efficace sur le plan informatique. Cette thèse consiste en une série d'études proposant des méthodes pour utiliser des calculs adaptatifs et dynamiques pour aborder les problèmes d'adaptation qui sont étudiés sous différentes perspectives telles que les adaptations au niveau de la tâche, au niveau temporel et au niveau du contexte. Dans le premier article, nous nous concentrons sur l'adaptation rapide des tâches basée sur un cadre de méta-apprentissage. Plus précisément, nous étudions l'incertitude du modèle induite par l'adaptation rapide à une nouvelle tâche avec quelques exemples. Ce problème est atténué en combinant un méta-apprentissage efficace basé sur des gradients avec une inférence variationnelle non paramétrique dans un cadre probabiliste fondé sur des principes. C'est une étape importante vers un méta-apprentissage robuste que nous développons une méthode d'apprentissage bayésienne à quelques exemples pour éviter le surapprentissage au niveau des tâches. Dans le deuxième article, nous essayons d'améliorer les performances de la prédiction de la séquence (c'est-à-dire du futur) en introduisant une prédiction du futur sauteur basée sur la taille du pas adaptatif. C'est une capacité critique pour un agent intelligent d'explorer un environnement qui permet un apprentissage efficace avec une imagination sauteur futur. Nous rendons cela possible en introduisant le modèle hiérarchique d'espace d'état récurrent (HRSSM) qui peut découvrir la structure temporelle latente (par exemple, les sous-séquences) tout en modélisant ses transitions d'état stochastiques de manière hiérarchique. Enfin, dans le dernier article, nous étudions un cadre qui peut capturer le contexte global dans les données d'image de manière adaptative et traiter davantage les données en fonction de ces informations. Nous implémentons ce cadre en extrayant des concepts visuels de haut niveau à travers des modules d'attention et en utilisant un raisonnement basé sur des graphes pour en saisir le contexte global. De plus, des transformations au niveau des caractéristiques sont utilisées pour propager le contexte global à tous les descripteurs locaux de manière adaptative. / Over the past few years, artificial intelligence has been greatly advanced, and deep learning, where deep neural networks are used to attempt to loosely emulate the human brain, has significantly contributed to it. Deep neural networks are now able to achieve great success based on a large amount of data and sufficient computational resources. Despite their success, their ability to quickly adapt to new concepts, tasks, and environments is quite limited or even non-existent. In this thesis, we are interested in how deep neural networks can become adaptive to continually changing or totally new circumstances, similarly to human intelligence, and further introduce adaptive and dynamic architectural modules or meta-learning frameworks to make it happen in computationally efficient ways. This thesis consists of a series of studies proposing methods to utilize adaptive and dynamic computations to tackle adaptation problems that are investigated from different perspectives such as task-level, temporal-level, and context-level adaptations. In the first article, we focus on task-level fast adaptation based on a meta-learning framework. More specifically, we investigate the inherent model uncertainty that is induced from quickly adapting to a new task with a few examples. This problem is alleviated by combining the efficient gradient-based meta-learning with nonparametric variational inference in a principled probabilistic framework. It is an important step towards robust meta-learning that we develop a Bayesian few-shot learning method to prevent task-level overfitting. In the second article, we attempt to improve the performance of sequence (i.e. future) prediction by introducing a jumpy future prediction that is based on the adaptive step size. It is a critical ability for an intelligent agent to explore an environment that enables efficient option-learning and jumpy future imagination. We make this possible by introducing the Hierarchical Recurrent State Space Model (HRSSM) that can discover the latent temporal structure (e.g. subsequences) while also modeling its stochastic state transitions hierarchically. Finally, in the last article, we investigate a framework that can capture the global context in image data in an adaptive way and further process the data based on that information. We implement this framework by extracting high-level visual concepts through attention modules and using graph-based reasoning to capture the global context from them. In addition, feature-wise transformations are used to propagate the global context to all local descriptors in an adaptive way.
8

Neural approaches to dialog modeling

Sankar, Chinnadhurai 08 1900 (has links)
Cette thèse par article se compose de quatre articles qui contribuent au domaine de l’apprentissage profond, en particulier dans la compréhension et l’apprentissage des ap- proches neuronales des systèmes de dialogue. Le premier article fait un pas vers la compréhension si les architectures de dialogue neuronal couramment utilisées capturent efficacement les informations présentes dans l’historique des conversations. Grâce à une série d’expériences de perturbation sur des ensembles de données de dialogue populaires, nous constatons que les architectures de dialogue neuronal couramment utilisées comme les modèles seq2seq récurrents et basés sur des transformateurs sont rarement sensibles à la plupart des perturbations du contexte d’entrée telles que les énoncés manquants ou réorganisés, les mots mélangés, etc. Le deuxième article propose d’améliorer la qualité de génération de réponse dans les systèmes de dialogue de domaine ouvert en modélisant conjointement les énoncés avec les attributs de dialogue de chaque énoncé. Les attributs de dialogue d’un énoncé se réfèrent à des caractéristiques ou des aspects discrets associés à un énoncé comme les actes de dialogue, le sentiment, l’émotion, l’identité du locuteur, la personnalité du locuteur, etc. Le troisième article présente un moyen simple et économique de collecter des ensembles de données à grande échelle pour modéliser des systèmes de dialogue orientés tâche. Cette approche évite l’exigence d’un schéma d’annotation d’arguments complexes. La version initiale de l’ensemble de données comprend 13 215 dialogues basés sur des tâches comprenant six domaines et environ 8 000 entités nommées uniques, presque 8 fois plus que l’ensemble de données MultiWOZ populaire. / This thesis by article consists of four articles which contribute to the field of deep learning, specifically in understanding and learning neural approaches to dialog systems. The first article takes a step towards understanding if commonly used neural dialog architectures effectively capture the information present in the conversation history. Through a series of perturbation experiments on popular dialog datasets, wefindthatcommonly used neural dialog architectures like recurrent and transformer-based seq2seq models are rarely sensitive to most input context perturbations such as missing or reordering utterances, shuffling words, etc. The second article introduces a simple and cost-effective way to collect large scale datasets for modeling task-oriented dialog systems. This approach avoids the requirement of a com-plex argument annotation schema. The initial release of the dataset includes 13,215 task-based dialogs comprising six domains and around 8k unique named entities, almost 8 times more than the popular MultiWOZ dataset. The third article proposes to improve response generation quality in open domain dialog systems by jointly modeling the utterances with the dialog attributes of each utterance. Dialog attributes of an utterance refer to discrete features or aspects associated with an utterance like dialog-acts, sentiment, emotion, speaker identity, speaker personality, etc. The final article introduces an embedding-free method to compute word representations on-the-fly. This approach significantly reduces the memory footprint which facilitates de-ployment in on-device (memory constraints) devices. Apart from being independent of the vocabulary size, we find this approach to be inherently resilient to common misspellings.

Page generated in 0.4588 seconds