Spelling suggestions: "subject:"réseau dde neurones"" "subject:"réseau dee neurones""
121 |
Continuous space models with neural networks in natural language processing / Modèles neuronaux pour la modélisation statistique de la langueLe, Hai Son 20 December 2012 (has links)
Les modèles de langage ont pour but de caractériser et d'évaluer la qualité des énoncés en langue naturelle. Leur rôle est fondamentale dans de nombreux cadres d'application comme la reconnaissance automatique de la parole, la traduction automatique, l'extraction et la recherche d'information. La modélisation actuellement état de l'art est la modélisation "historique" dite n-gramme associée à des techniques de lissage. Ce type de modèle prédit un mot uniquement en fonction des n-1 mots précédents. Pourtant, cette approche est loin d'être satisfaisante puisque chaque mot est traité comme un symbole discret qui n'a pas de relation avec les autres. Ainsi les spécificités du langage ne sont pas prises en compte explicitement et les propriétés morphologiques, sémantiques et syntaxiques des mots sont ignorées. De plus, à cause du caractère éparse des langues naturelles, l'ordre est limité à n=4 ou 5. Sa construction repose sur le dénombrement de successions de mots, effectué sur des données d'entrainement. Ce sont donc uniquement les textes d'apprentissage qui conditionnent la pertinence de la modélisation n-gramme, par leur quantité (plusieurs milliards de mots sont utilisés) et leur représentativité du contenu en terme de thématique, époque ou de genre. L'usage des modèles neuronaux ont récemment ouvert de nombreuses perspectives. Le principe de projection des mots dans un espace de représentation continu permet d'exploiter la notion de similarité entre les mots: les mots du contexte sont projetés dans un espace continu et l'estimation de la probabilité du mot suivant exploite alors la similarité entre ces vecteurs. Cette représentation continue confère aux modèles neuronaux une meilleure capacité de généralisation et leur utilisation a donné lieu à des améliorations significative en reconnaissance automatique de la parole et en traduction automatique. Pourtant, l'apprentissage et l'inférence des modèles de langue neuronaux à grand vocabulaire restent très couteux. Ainsi par le passé, les modèles neuronaux ont été utilisés soit pour des tâches avec peu de données d'apprentissage, soit avec un vocabulaire de mots à prédire limités en taille. La première contribution de cette thèse est donc de proposer une solution qui s’appuie sur la structuration de la couche de sortie sous forme d’un arbre de classification pour résoudre ce problème de complexité. Le modèle se nomme Structure OUtput Layer (SOUL) et allie une architecture neuronale avec les modèles de classes. Dans le cadre de la reconnaissance automatique de la parole et de la traduction automatique, ce nouveau type de modèle a permis d'obtenir des améliorations significatives des performances pour des systèmes à grande échelle et à état l'art. La deuxième contribution de cette thèse est d'analyser les représentations continues induites et de comparer ces modèles avec d'autres architectures comme les modèles récurrents. Enfin, la troisième contribution est d'explorer la capacité de la structure SOUL à modéliser le processus de traduction. Les résultats obtenus montrent que les modèles continus comme SOUL ouvrent des perspectives importantes de recherche en traduction automatique. / The purpose of language models is in general to capture and to model regularities of language, thereby capturing morphological, syntactical and distributional properties of word sequences in a given language. They play an important role in many successful applications of Natural Language Processing, such as Automatic Speech Recognition, Machine Translation and Information Extraction. The most successful approaches to date are based on n-gram assumption and the adjustment of statistics from the training data by applying smoothing and back-off techniques, notably Kneser-Ney technique, introduced twenty years ago. In this way, language models predict a word based on its n-1 previous words. In spite of their prevalence, conventional n-gram based language models still suffer from several limitations that could be intuitively overcome by consulting human expert knowledge. One critical limitation is that, ignoring all linguistic properties, they treat each word as one discrete symbol with no relation with the others. Another point is that, even with a huge amount of data, the data sparsity issue always has an important impact, so the optimal value of n in the n-gram assumption is often 4 or 5 which is insufficient in practice. This kind of model is constructed based on the count of n-grams in training data. Therefore, the pertinence of these models is conditioned only on the characteristics of the training text (its quantity, its representation of the content in terms of theme, date). Recently, one of the most successful attempts that tries to directly learn word similarities is to use distributed word representations in language modeling, where distributionally words, which have semantic and syntactic similarities, are expected to be represented as neighbors in a continuous space. These representations and the associated objective function (the likelihood of the training data) are jointly learned using a multi-layer neural network architecture. In this way, word similarities are learned automatically. This approach has shown significant and consistent improvements when applied to automatic speech recognition and statistical machine translation tasks. A major difficulty with the continuous space neural network based approach remains the computational burden, which does not scale well to the massive corpora that are nowadays available. For this reason, the first contribution of this dissertation is the definition of a neural architecture based on a tree representation of the output vocabulary, namely Structured OUtput Layer (SOUL), which makes them well suited for large scale frameworks. The SOUL model combines the neural network approach with the class-based approach. It achieves significant improvements on both state-of-the-art large scale automatic speech recognition and statistical machine translations tasks. The second contribution is to provide several insightful analyses on their performances, their pros and cons, their induced word space representation. Finally, the third contribution is the successful adoption of the continuous space neural network into a machine translation framework. New translation models are proposed and reported to achieve significant improvements over state-of-the-art baseline systems.
|
122 |
Pilotage des cycles limites dans les systèmes dynamiques hybrides : application aux alimentations électriques statiques / Limit cycle control in hybrid systems. Application in static power suppliesPatino, Diego 06 February 2009 (has links)
Cette thèse s'intéresse au pilotage des cycles limites pour une classe particulière de systèmes hybrides (SDH): les systèmes commutés cycliques. La thématique des SDH est née du constat d'insuffisance des modèles dynamiques classiques pour décrire les comportements lorsque des aspects évènementiels interviennent. Une classe particulièrement importante de SDH est formée par celle qui présente un régime permanent cyclique. Ces systèmes ont des points de fonctionnement non auto-maintenables: il n'existe pas de commande qui maintienne le système sur ce point. Le maintien n'est assuré qu'en valeur moyenne, en effectuant un cycle dans un voisinage du point par commutation des sous systèmes. L'établissement d'une loi de commutation pour cette classe de systèmes doit répondre aux objectifs de stabilité et de performance dynamique, mais doit également garantir la satisfaction de critères liés à la forme d'onde. A l'heure actuelle, peu de méthodes de commande prennent en compte le caractère cyclique du système. Les travaux de cette thèse ont pour objectif de développer des méthodes génériques et robustes pour piloter cette classe de systèmes. Les algorithmes proposés doivent également pouvoir être implémenté en temps réels. On modélise le système comme un système non - linéaire affine en la commande dont la loi de commande apparait dans le modèle. Ce type de modélisation permet d'envisager deux types de synthèse: l'une à base de commande prédictive et l'autre à base de commande optimale. Ce travail est validé par une partie applicative sur des manipulations dans le CRAN et dans des laboratoires du réseau d'excellence européenne HYCON dans le cadre duquel s'est déroulé cette étude / This work deals with limit cycle control for one particular class of hybrid dynamical systems (HDS): The cyclic switched systems. The HDS were born because the traditional dynamical models were not able to describe complex behaviors and most of all, behaviors with discontinuities. From an application point of view, one important class of HDS depicts a cyclic behavior in steady state. The main characteristic of these systems is that the operation point cannot be maintained: It does not exist a control that maintains the system on a desired operation point. However, this point can be obtained in average by turning into its neighborhood. Thus, a cycle is produced by switching among the system modes. A switched control law must satisfy stability and dynamic performance. Moreover, criteria related to the waveform must be verified. Nowadays, few methods take into account the cyclic behavior of the system. In this research, some generic methods are studied. They show good performance for controlling the cyclic switched systems. The proposed algorithms can be implemented in real-time. The approaches are based on an affine non-linear model of the system whose control explicitly appears. Two control methods are considered: i) A predictive control, ii) An optimal control. Since the predictive control is a good choice for tracking, it will be able to maintain the system in a cycle. The optimal control yields solutions that can be applied to the transients. Some experiments with both control methods applied to the power converters are shown. These tests were carried out not only in our laboratory (CRAN), but also in other laboratories as part of the HYCON excellence network
|
123 |
Apprentissage Intelligent des Robots Mobiles dans la Navigation Autonome / Intelligent Mobile Robot Learning in Autonomous NavigationXia, Chen 24 November 2015 (has links)
Les robots modernes sont appelés à effectuer des opérations ou tâches complexes et la capacité de navigation autonome dans un environnement dynamique est un besoin essentiel pour les robots mobiles. Dans l’objectif de soulager de la fastidieuse tâche de préprogrammer un robot manuellement, cette thèse contribue à la conception de commande intelligente afin de réaliser l’apprentissage des robots mobiles durant la navigation autonome. D’abord, nous considérons l’apprentissage des robots via des démonstrations d’experts. Nous proposons d’utiliser un réseau de neurones pour apprendre hors-ligne une politique de commande à partir de données utiles extraites d’expertises. Ensuite, nous nous intéressons à l’apprentissage sans démonstrations d’experts. Nous utilisons l’apprentissage par renforcement afin que le robot puisse optimiser une stratégie de commande pendant le processus d’interaction avec l’environnement inconnu. Un réseau de neurones est également incorporé et une généralisation rapide permet à l’apprentissage de converger en un certain nombre d’épisodes inférieur à la littérature. Enfin, nous étudions l’apprentissage par fonction de récompenses potentielles compte rendu des démonstrations d’experts optimaux ou non-optimaux. Nous proposons un algorithme basé sur l’apprentissage inverse par renforcement. Une représentation non-linéaire de la politique est désignée et la méthode du max-margin est appliquée permettant d’affiner les récompenses et de générer la politique de commande. Les trois méthodes proposées sont évaluées sur des robots mobiles afin de leurs permettre d’acquérir les compétences de navigation autonome dans des environnements dynamiques et inconnus / Modern robots are designed for assisting or replacing human beings to perform complicated planning and control operations, and the capability of autonomous navigation in a dynamic environment is an essential requirement for mobile robots. In order to alleviate the tedious task of manually programming a robot, this dissertation contributes to the design of intelligent robot control to endow mobile robots with a learning ability in autonomous navigation tasks. First, we consider the robot learning from expert demonstrations. A neural network framework is proposed as the inference mechanism to learn a policy offline from the dataset extracted from experts. Then we are interested in the robot self-learning ability without expert demonstrations. We apply reinforcement learning techniques to acquire and optimize a control strategy during the interaction process between the learning robot and the unknown environment. A neural network is also incorporated to allow a fast generalization, and it helps the learning to converge in a number of episodes that is greatly smaller than the traditional methods. Finally, we study the robot learning of the potential rewards underneath the states from optimal or suboptimal expert demonstrations. We propose an algorithm based on inverse reinforcement learning. A nonlinear policy representation is designed and the max-margin method is applied to refine the rewards and generate an optimal control policy. The three proposed methods have been successfully implemented on the autonomous navigation tasks for mobile robots in unknown and dynamic environments.
|
124 |
Analysis and diagnosis of faults in the PMSM drivetrains for series hybrid electrical vehicles (SHEVs) / Analyse et diagnostic des défauts dans les chaînes de traction à MSAP pour les véhicules hybrides sérieMoosavi Anchehpoli, Seyed Saeid 11 December 2013 (has links)
L'intérêt pour les véhicules électriques ne cesse de croitre au sein de la société contemporaine compte tenu de ses nombreuses interrogations sur l’environnement et la dépendance énergétique. Dans ce travail de thèse, nous essayons d’améliorer l’acceptabtabilité sociétale du véhicule électrique en essayant de faire avancer la recherche sur le diagnostique des défauts d’une chaine de traction électrique. Les résultats escomptés devraient permettre à terme d’améliorer la fiabilité et la durabilité de ces systèmes.Nous commençons par une revue des problèmes des défauts déjà apparus dans les véhicules hybrides séries qui disposent de l’architecture la plus proche du véhicule électrique. Une étude approfondie sur le diagnostic des défauts d’un convertisseur de puissance statique (AC-DC) ainsi que celle du moteur synchrone à aimants permanents est menée. Quatre types de défauts majeurs ont été répertoriés concernant le moteur (court-circuit au stator, démagnétisation, excentricité du rotor et défaut des roulements). Au niveau du convertisseur, nous avons considéré le défaut d’ouverture des interrupteurs. Afin d’être dans les mêmes conditions d’utilisation réelle, nous avons effectué des tests expérimentaux à vitesse et charge variables. Ce travail est basé aussi bien sur l’expérimentation que sur la modélisation. Comme par exemple, la méthode des éléments finis pour l’étude de la démagnétisation de la machine. De même, l’essai en court-circuit du stator du moteur en présence d’un contrôle vectoriel.Afin de réaliser un diagnostic en ligne des défauts, nous avons développé un modèle basé sur les réseaux de neurones. L’apprentissage de ce réseau de neurone a été effectué sur la base des résultats expérimentaux et de simulations, que nous avons réalisées. Le réseau de neurones est capable d'assimiler beaucoup de données. Ceci nous permet de classifier les défauts en termes de sévérité et de les localiser. Il permet ainsi d'évaluer le degré de performance de la chaine de traction électrique en ligne en présence des défauts et nous renseigner ainsi sur l'état de santé du système. Ces résultats devraient aboutir à l’élaboration d’une stratégie de contrôle tolérant aux défauts auto-reconfigurable pour prendre en compte les modes dégradés permettant une continuité de service du véhicule ce qui améliorera sa disponibilité. / The interest in the electric vehicles rose recently due both to environmental questions and to energetic dependence of the contemporary society. Accordingly, it is necessary to study and implement in these vehicle fault diagnosis systems which enable them to be more reliable and safe enhancing its sustainability. In this work after a review on problem of faults in the drivetrain of series hybrid electric vehicles (SHEV), a deep investigation on fault diagnosis of AC-DC power converter and permanent magnet synchronous motor (PMSM) have been done as two important parts of traction chains in SHEVs. In other major part of this work, four types of faults (stator winding inter turn short circuit, demagnetization, eccentricity ant bearing faults) of a PMSM have been studied. Inter turn short circuit of stator winding of PMSM in different speeds and loads has been considered to identify fault feature in all operation aspects, as it is expected by electric vehicle application. Experimental results aiming short circuits, bearing and eccentricity fault detection has been presented. Analytical and finite element method (FEM) aiming demagnetization fault investigation has been developed. The AC-DC converter switches are generally exposed to the possibility of outbreak open phase faults because of troubles of the switching devices. This work proposes a robust and efficient identification method for data acquisition selection aiming fault analysis and detection. Two new patterns under AC-DC converter failure are identified and presented. To achieve this goal, four different level of switches fault are considered on the basis of both simulation and experimental results. For accuracy needs of the identified pattern for SHEV application, several parameters have been considered namely: capacitor size changes, load and speed variations. On the basis of the developed fault sensitive models above, an ANN based fault detection, diagnosis strategy and the related algorithm have been developed to show the way of using the identified patterns in the supervision and the diagnosis of the PMSM drivetrain of SHEVs. ANN method have been used to develop three diagnosis based models for : the vector controlled PMSM under inter turn short circuit, the AC/DC power converter under an open phase fault and also the PMSM under unbalanced voltage caused by open phase DC/AC inverter. These models allow supervising the main components of the PMSM drivetrains used to propel the SHEV. The ANN advantages of ability to include a lot of data mad possible to classify the faults in terms of their type and severity. This allows estimating the performance degree of that drivetrains during faulty conditions through the parameter state of health (SOH). The latter can be used in a global control strategy of PMSM control in degraded mode in which the control is auto-adjusted when a defect occurs on the system. The goal is to ensure a continuity of service of the SHEV in faulty conditions to improve its reliability.
|
125 |
Etude de la synergie des observations satellites pour la caractérisation du manteau neigeuxCordisco, Emmanuel 04 November 2005 (has links) (PDF)
La neige étant une composante importante du climat terrestre, il convient de l'étudier à l'échelle du globe pour en comprendre son rôle.<br /><br />Ces travaux visent ainsi à étudier le contenu en information sur le manteau neigeux à l'échelle globale des observations satellites réalisées à partir de différents instruments couvrant différents domaines du spectre électromagnétique (visible, infrarouge et micro-ondes). Des paramètres autres que la neige interférant dans la problématique, il est nécessaire de les déterminer afin d'encadrer leurs influences. Ensuite, on cherchera comment limiter la pollution qu'engendre ces paramètres sur l'information accessible du manteau neigeux, on aura alors recours à ce que l'on appelera des statistiques locales.<br />Hélas ces statistiques locales ne sont pas disponibles sur l'ensemble du globe. Il est donc inévitable d'utiliser la modélisation pour permettre l'interpolation. Toutefois, une méthode originale d'ajustement de modèle par analyse en composantes principales sera présentée. Au final, la synergie entre les observations satellites, la modélisation et les mesures in situ devra être utilisée pour extraire de façon optimale l'information contenu dans les données et permettre l'inversion de l'épaisseur de neige à grande échelle.<br />D'autre part, il sera intéressant de caractériser les différents types de neiges existants selon une classification non-supervisée des observations satellites afin d'extraire les similitudes et les spécificités de chacun de ces types.
|
126 |
Etude psychophysique et modélisation des traitements de bas niveau sous-tendant la vision des contours des objetsTzvetanov, Tzvetomir 26 November 2003 (has links) (PDF)
Les mécanismes de formation des contours sont connus pour avoir des propriétés fonctionnelles différentes. Une étude de l'intégration de l'information spatiale entre éléments de lignes coaxiaux a été effectuée. Deux régimes sont présents, différenciés à partir d'une séparation spatiale d'environ un quart de degré d'angle visuel : les régimes courte et longue distance. Le premier a été intensivement étudié, contrairement au deuxième. En utilisant une approche expérimentale et par modélisation, les caractéristiques fonctionnelles du régime longue distance ont été mesurées et attribuées en partie à l'aire visuelle primaire de l'Homme. Les expériences ont permis d'obtenir les différentes caractéristiques psychophysiques. Avec des stimuli de polarités positives, le régime courte distance a pour limites spatiales 0 et un tiers de degré, et est sensible à l'intensité de l'inducteur (Expérience 1). Le régime longue distance a pour limites spatiales un tiers de degré et 2,5 degrés, et n'est pas sensible à l'intensité de l'inducteur (Expérience 1). Le régime longue distance semble être de manière générale facilitateur pour la détection de la cible (Expérience 2 et 5), quelles que soient la polarité et l'intensité de l'inducteur. Par contre, des différences entre polarités opposées et identiques des stimuli sont présentes pour ce régime. Les interactions OFF-vers-ON sont de manière générale beaucoup moins facilitatrices que les autres interactions dans le régime longue distance (Expérience 2 et 5). La luminance du fond sur lequel sont présentés les stimuli semblait intervenir dans les interactions (Expérience 2), mais l'étude contrôle sur des sujets naïfs n'a pas montré d'effet du fond (Expérience 5). En fonction de la séparation spatiale entre les deux stimuli, il est possible d'obtenir une interaction entre les deux régimes si le stimulus inducteur est placé de manière à ce que les deux régimes soient en compétition pour la détection de la cible (Expérience 3). Pour des polarités positives des stimuli, le régime longue distance s'est avéré posséder une plasticité visuelle spécifique à la direction d'alignement des stimuli (Expérience 4) : la direction verticale a montré une augmentation des seuils de détection des sujets au début des expériences, et la direction horizontale une diminution des seuils de détection des sujets au début des expériences. Par la suite, nous avons tenté de modéliser ces résultats expérimentaux au moyen du modèle LAMINART. Ce modèle simule certaines propriétés fonctionnelles des neurones du cortex visuel primaire (V1). Celui-ci permet de reproduire de manière globale les effets dus aux polarités, mais ne semble pas être sensible au facteur "séparation spatiale". Les résultats de cette thèse soutiennent l'idée que les deux régimes d'intégration de l'information spatiale d'iso-orientation sont principalement présents dans le cortex visuel primaire de l'Homme.
|
127 |
Mesure de la fonction de structure polarisée g1n du neutron par l'expérience E154 au SLACIncerti, Sébastien 21 January 1998 (has links) (PDF)
Cette thèse décrit la mesure précise de la fonction de structure polarisée g1n du neutron menée par la collaboration E154 à l'automne 1995 auprès de l'accélérateur linéaire de Stanford aux Etats-Unis, par diffusion profondément inélastique inclusive d'un faisceau d'électrons polarisé de 48.3 GeV sur une cible d'Hélium 3 polarisée. Les électrons diffusés ont été détectés par deux spectromètres permettant de couvrir le domaine cinématique en x Bjorken : 0.014 < x < 0.7 et en quadritransfert carré : 1 GeV2 < Q2 < 17 GeV2 à une valeur moyenne Q2 = 5 GeV2. Deux calorimètres électromagnétiques pris en charge par le LPC de Clermont-Ferrand et le SphN du CEA-Saclay ont été utilisés pour déterminer l'énergie des électrons diffusés et pour rejeter le bruit de fond hadronique. Pour cela, nous avons développé un automate cellulaire et un réseau de neurones, largement décrits dans ce manuscrit. L'analyse de la mesure de la fonction de structure g1n menée à Clermont-Fd et exposée dans ce manuscrit nous a conduit à l'intégrale sur la région mesurée : intégrale (g1n(x)dx, xmin=0.0135, xmax=0.7) = -0.03 +- 0.003 STAT +- 0.004 SYST +- 0.001 EVOL à Q2 = 5 GeV2 où nous avons fait évoluer nos mesures vers Q2 = 5 GeV2 à l'aide des équations d'évolution DGLAP à l'ordre sous-dominant en utilisant une paramétrisation mondiale des distributions de partons polarisées. La règle de somme d'Ellis et Jaffe sur le neutron est clairement violée par nos mesures. Pour les différents extrapolations envisagées à bas x, notre intégrale est compatible avec la règle de somme de Bjorken. Nous avons estimé la contribution du spin des quarks au spin du nucléon à DelatSigma = 29 ± 6 % dans le schéma MS barre et à DeltaSigma = 37 ± 7 % dans le schéma AB, à Q2 = 5 GeV2. La contribution du spin des gluons au spin du nucléon semble positive et comprise entre 0 et 2 à cette échelle.
|
128 |
Reconstitution de la parole par imagerie ultrasonore et vidéo de l'appareil vocal : vers une communication parlée silencieuseHueber, Thomas 09 December 2009 (has links) (PDF)
L'objectif poursuivi dans ce travail de thèse est la réalisation d'un dispositif capable d'interpréter une parole normalement articulée mais non vocalisée, permettant ainsi la " communication parlée silencieuse ". Destiné, à terme, à être léger et portatif, ce dispositif pourrait être utilisé d'une part, par une personne ayant subi une laryngectomie (ablation du larynx suite à un cancer), et d'autre part, pour toute communication, soit dans un milieu où le silence est requis (transport en commun, opération militaire, etc.), soit dans un environnement extrêmement bruité. Le dispositif proposé combine deux systèmes d'imagerie pour capturer l'activité de l'appareil vocal pendant " l'articulation silencieuse " : l'imagerie ultrasonore, qui donne accès aux articulateurs internes de la cavité buccale (comme la langue), et la vidéo, utilisée pour capturer le mouvement des lèvres. Le problème traité dans cette étude est celui de la synthèse d'un signal de parole " acoustique ", uniquement à partir d'un flux de données " visuelles " (images ultrasonores et vidéo). Cette conversion qualifiée ici de " visuo-acoustique ", s'effectue par apprentissage artificiel et fait intervenir quatre étapes principales : l'acquisition des données audiovisuelles, leur caractérisation, l'inférence d'une cible acoustique à partir de l'observation du geste articulatoire et la synthèse du signal. Dans le cadre de la réalisation du dispositif expérimental d'acquisition des données, un système de positionnement de la sonde ultrasonore par rapport à la tête du locuteur, basé sur l'utilisation combinée de deux capteurs inertiaux a tout d'abord été conçu. Un système permettant l'enregistrement simultané des flux visuels et du flux acoustique, basé sur la synchronisation des capteurs ultrasonore, vidéo et audio par voie logicielle, a ensuite été développé. Deux bases de données associant observations articulatoires et réalisations acoustiques, contenant chacune environ une heure de parole (continue), en langue anglaise, ont été construites. Pour la caractérisation des images ultrasonores et vidéo, deux approches ont été mises en œuvre. La première est basée sur l'utilisation de la transformée en cosinus discrète, la seconde, sur l'analyse en composantes principales (approche EigenTongues/EigenLips). La première approche proposée pour l'inférence des paramètres acoustiques, qualifiée de " directe ", est basée sur la construction d'une " fonction de conversion " à l'aide d'un réseau de neurones et d'un modèle par mélange de gaussiennes. Dans une seconde approche, qualifiée cette fois " d'indirecte ", une étape de décodage des flux visuels au niveau phonétique est introduite en amont du processus de synthèse. Cette étape intermédiaire permet notamment l'introduction de connaissances linguistiques a priori sur la séquence observée. Elle s'appuie sur la modélisation des gestes articulatoires par des modèles de Markov cachés (MMC). Deux méthodes sont enfin proposées pour la synthèse du signal à partir de la suite phonétique décodée. La première est basée sur une approche par concaténation d'unités ; la seconde utilise la technique dite de " synthèse par MMC ". Pour permettre notamment la réalisation d'adaptations prosodiques, ces deux méthodes de synthèse s'appuient sur une description paramétrique du signal de parole du type "Harmonique plus Bruit" (HNM).
|
129 |
Observation des photons directs dans les premières données et préparation à la recherche du boson de Higgs dans l'expérience CMS au LHC (CERN)Chanon, Nicolas 06 October 2010 (has links) (PDF)
Le LHC (Large Hadron Collider) fournit aux expériences du CERN (Laboratoire Européen pour la Physique des Particules) des collisions proton-proton avec une énergie de 7 TeV dans le centre de masse depuis fin Mars 2010. Le LHC a en particulier été conçu pour permettre la recherche du boson de Higgs, particule prédite par le modèle standard encore jamais observée à ce jour, dans toute la gamme de masse où il est attendu. Ce travail de thèse est une contribution à la recherche du boson de Higgs dans CMS (Compact Muon Solenoid), l'un des quatre grands détecteurs placés auprès du LHC, et développe plusieurs outils qui permettent la mesure des bruits de fonds et l'amélioration du potentiel de découverte. Un nouvel outil de récupération des photons émis par les leptons dans l'état final de la désintégration H --> ZZ(*) ->4$\ll (\ll= e\ mu)$ a été développé dans cette thèse. Cette méthode permet la récupération d'un nombre variable de photons par événements, donne une meilleure performance que la méthode précédemment utilisée dans CMS et permet l'amélioration de la résolution sur la masse des bosons Z0 et du boson de Higgs, ainsi qu'un gain de 5% sur la significance d'une observation du boson de Higgs dans ce canal. La deuxième partie de cette thèse traite de l'étude des bruits de fond et de la recherche d'un boson de Higgs léger (110 < mH < 140 GeV) dans le canal H --> $\gamma\gamma$. Un nouvel outil de discrimination $\gamma/\pi^i0$ à l'aide d'un réseau de neurone a été mis au point pour le rejet des photons provenant de la désintégration des $\pi^0$ produits copieusement dans les jets de QCD. Les performances du réseau de neurone sont examinées dans le détail. Le réseau de neurone est alors utilisé comme variable "template" permettant la mesure du processus $\gamma$+X à partir des données avec 10 nb−1 de luminosité intégrée dans CMS. La mesure du processus $\gamma\gamma+X$ est aussi préparée à partir de la simulation dans l'hypothèse d'une luminosité intégrée de 10 pb−1. La prise en compte des effets cinématiques aux ordres supérieurs, nécessaire pour la prédiction la plus précise possible du signal H -> $\gamma\gamma$ et du bruit de fond, est effectuée dans cette thèse par la méthode de repondération, pour le gg -> H $\gamma\gamma$ processus au NNLO et pour la première fois pour le processus $\gamma\gamma$ +X au NLO, dans les deux cas à l'aide de distributions doublement différentielles. Les outils de repondération et de discrimination $\gamma/\pi^0$ sont ensuite intégrés dans l'analyse pour améliorer la sensibilité de CMS à la recherche du boson de Higgs dans le canal H->$\gamma\gamma$ dans le modèle standard et au-delà, grâce à une paramétrisation effective développée par des phénoménologues avec lesquels nous avons travaillé.
|
130 |
Modélisation de l'interprétation des pianistes & applications d'auto-encodeurs sur des modèles temporelsLauly, Stanislas 04 1900 (has links)
Ce mémoire traite d'abord du problème de la modélisation de l'interprétation des pianistes à l'aide de l'apprentissage machine. Il s'occupe ensuite de présenter de nouveaux modèles temporels qui utilisent des auto-encodeurs pour améliorer l'apprentissage de séquences.
Dans un premier temps, nous présentons le travail préalablement fait dans le domaine de la modélisation de l'expressivité musicale, notamment les modèles statistiques du professeur Widmer. Nous parlons ensuite de notre ensemble de données, unique au monde, qu'il a été nécessaire de créer pour accomplir notre tâche. Cet ensemble est composé de 13 pianistes différents enregistrés sur le fameux piano Bösendorfer 290SE. Enfin, nous expliquons en détail les résultats de l'apprentissage de réseaux de neurones et de réseaux de neurones récurrents. Ceux-ci sont appliqués sur les données mentionnées pour apprendre les variations expressives propres à un style de musique.
Dans un deuxième temps, ce mémoire aborde la découverte de modèles statistiques expérimentaux qui impliquent l'utilisation d'auto-encodeurs sur des réseaux de neurones récurrents. Pour pouvoir tester la limite de leur capacité d'apprentissage, nous utilisons deux ensembles de données artificielles développées à l'Université de Toronto. / This thesis addresses the problem of modeling pianists' interpretations using machine learning, and presents new models that use temporal auto-encoders to improve their learning for sequences.
We present previous work in the field of modeling musical expression, including Professor Widmer's statistical models. We then discuss our unique dataset created specifically for our task. This dataset is composed of 13 different pianists recorded on the famous Bösendorfer 290SE piano. Finally, we present the learning results of neural networks and recurrent neural networks in detail. These algorithms are applied to the dataset to learn expressive variations specific to a style of music.
We also present novel statistical models involving the use of auto-encoders in recurrent neural networks. To test the limits of these algorithms' ability to learn, we use two artificial datasets developed at the University of Toronto.
|
Page generated in 0.0741 seconds