Global ETD Search

201	Classification de vocalises de mammifères marins en environnement sismique / Recognition of marine mammal vocalizations in seismic environment Guilment, Thomas 21 June 2018 (has links) En partenariat avec l’entreprise Sercel, la thèse concerne la mise en œuvre d’algorithmes de reconnaissance des sons émis par les mysticètes (baleines à fanons). Cessons peuvent être étudiés grâce aux systèmes de surveillance par acoustique passive. L’entreprise Sercel, par ses activités sismiques liées à la prospection pétrolière, a son propre logiciel pour détecter et localiser les sources d’énergie sonores sous-marines. Le travail de la thèse consiste dès lors à ajouter un module de reconnaissance pour identifier si l'énergie détectée et localisée correspond bien à un éventuel mysticète. Les campagnes de tirs sismiques étant onéreuses, la méthode utilisée doit pouvoir réduire la probabilité de fausse alarme, la reconnaissance pouvant infirmer la détection. La méthode proposée est basée sur l’apprentissage de dictionnaire. Elle est dynamique, modulaire, ne dépend que de peu de paramètres et est robuste aux fausses alarmes. Une expérimentation sur cinq types de vocalises est présentée. Nous obtenons un rappel moyen de 92.1 % tout en rejetant 97.3 % des bruits (persistants et transitoires). De plus, un coefficient de confiance est associé à chaque reconnaissance et permet de réaliser de l’apprentissage incrémental semi-supervisé. Enfin, nous proposons une méthode capable de gérer la détection et la reconnaissance conjointement. Ce « détecteur multiclasses » respecte au mieux les contraintes de gestion des fausses alarmes et permet d’identifier plusieurs types de vocalises au même instant. Cette méthode est bien adaptée au contexte industriel pour lequel elle est dédiée. Elle ouvre également des perspectives très prometteuses dans le contexte bioacoustique. / In partnership with Sercel, the thesis concerns the implementation of algorithms for recognizing the sounds emitted by mysticetes (baleen whales). These sounds can be studiedusing passive acoustic monitoring systems. Sercel, through its seismic activities related to oïl exploration, has its own software to detect and locate underwater sound energy sources. The thesis work therefore consists in adding a recognition module to identify if the detected andlocalized energy corresponds to a possible mysticete. Since seismic shooting campaigns areexpensive, the method used must be able to reduce the probability of false alarms, as recognitioncan invalidate detection. The proposed method is based on dictionary learning. It is dynamic, modular, depends on few parameters and is robust to false alarms. An experiment on five types of vocalizations is presented. We obtain an average recall of 92.1% while rejecting 97.3% of the noises (persistent and transient). In addition, a confidence coefficient is associated with each recognition and allows semi-supervised incremental learning to be achieved. Finally, we propose a method capable of managing detection and recognition together. This "multiclassdetector" best respects the constraints of false alarm management and allows several types of vocalizations to be identified at the same time. This method is well adapted to the industrial context for which it is dedicated. It also opens up very promising prospects in the bioacoustic context. Reconnaissance Mammifères marins Sismique Représentations parcimonieuses Apprentissage automatique Classification Marine mammal Seismic environment Sparse representation Machine learning 004
202	Diffusion élastique optique pour l'identification de pathogènes / Elastic light scattering for fast identification of pathogens Genuer, Valentin 20 October 2017 (has links) Dans un contexte mondial de prolifération de pathogènes résistants aux antibiotiques, il y a un réel besoin de nouvelles techniques de diagnostic microbiologique rapides et fiables. Ce travail de thèse vise à apporter une meilleure compréhension de la technique d’identification microbienne par diffusion élastique (ELS pour Elastic Light Scattering). Cette méthode phénotypique utilise la diffraction d’un faisceau de lumière cohérente sur une colonie microbienne directement sur son milieu de culture. L’image de diffraction alors obtenue est considérée comme la signature phénotypique du microorganisme étudié. Cette image est ensuite transformée au moyen de descripteurs mathématiques afin de la comparer à une base de données pré-calculée au moyen d’algorithmes d’apprentissage automatiques. Dans un premier temps, l’architecture optique de l’instrument a été modifiée afin de le rendre compatible avec les milieux de culture opaque très répandus en diagnostic clinique. Deux approches ont ensuite été proposées afin de modéliser l’interaction lumière/colonie microbienne. Une première approche d’optique géométrique par lancer de rayons nous a permis d’apprécier les besoins en termes d’ouverture numérique pour l’acquisition des images de diffraction selon le profil morphologique des colonies. La seconde approche basée sur la théorie scalaire de la diffraction a permis de mettre en évidence l’importance de la répartition de la biomasse à l’intérieur de colonies. En effet, les macrostructures résultantes de l’empilement des cellules microbiennes jouent un rôle majeur dans la formation des images de diffraction. Dans un second temps, une procédure systématique d’amélioration des performances de classification a été proposée. Elle combine une description plus fidèle des images de diffraction via la projection sur une base de Fourier-Bessel, une optimisation par recherche de grille sur les paramètres de l’algorithme d’apprentissage automatique supervisé et enfin l’application d’une méthode de réduction de dimensionnalité. Grâce à cela nous pouvons par exemple proposer un test Gram+/Gram-/Levures avec un taux de discrimination de plus de 98% sur une base de 15 espèces. Enfin, l’utilisation de l’illumination cohérente a également été étendue à la lecture d’antibiogrammes par analyse dynamique de speckle. / The current health situation across the world is of great concern. There is an urgent need for novel and innovative diagnostic methods that would speed up accurate treatments decisions and be of significant utility for public health in the fight against antibiotic resistance.This Ph. D. work aims to better understand the Elastic Light Scattering (ELS) method for microbial identification. This phenotypic technique is based on the elastic scattering of a coherent light beam by a microorganism colony growing on its culture plate. The resulting scattering pattern can be considered as the phenotypic signature of the microorganism. Then this image is translated using mathematical descriptors so that it can be compared to a database previously obtained using learning algorithms.Part of this work was dedicated to the improvement of the optical design so that the instrument can handle opaque culture media widely used in clinical diagnosis. Then two approaches were proposed to model the interaction between light and bacterial colonies. A first geometrical approach could help us, using ray tracing algorithms, to estimate the numerical aperture needed for the acquisition depending on the colonies morphologies. The second approach, based on scalar diffraction theory, highlighted the importance of the biomass distribution inside the colonies. Macro-structures resulting from cells arrangement play a great role in the scattering patterns formation indeed. In addition, the features extraction step from images using a Bessel-Fourier basis significantly improved the description accuracy. A systematic approach comprising the optimization of the learning algorithm and a dimensionality reduction technique was proposed. Great improvements of classification rates were achieved. Among them: a Gram+/Gram-/Yeasts discrimination at 98.1% was obtained over 15 species. Finally the use of coherent lighting for the reading of antibiotics susceptibility test by means of dynamic speckle analysis was introduced and showed promising results. Elastic light scattering Identification Diagnostic clinique Bactéries Apprentissage automatique Elastic light scattering Identification Clinical diagnosis Bacteria Machine learning 620
203	Theory and algorithms for learning metrics with controlled behaviour / Théorie et algorithmes pour l'apprentissage de métriques à comportement contrôlé Perrot, Michaël 13 December 2016 (has links) De nombreux algorithmes en Apprentissage Automatique utilisent une notion de distance ou de similarité entre les exemples pour résoudre divers problèmes tels que la classification, le partitionnement ou l'adaptation de domaine. En fonction des tâches considérées ces métriques devraient avoir des propriétés différentes mais les choisir manuellement peut-être fastidieux et difficile. Une solution naturelle est alors d'adapter automatiquement ces métriques à la tâche considérée. Il s'agit alors d'un problème connu sous le nom d'Apprentissage de Métriques et où le but est principalement de trouver les meilleurs paramètres d'une métrique respectant des contraintes spécifiques. Les approches classiques dans ce domaine se focalisent habituellement sur l'apprentissage de distances de Mahalanobis ou de similarités bilinéaires et l'une des principales limitations est le fait que le contrôle du comportement de ces métriques est souvent limité. De plus, si des travaux théoriques existent pour justifier de la capacité de généralisation des modèles appris, la plupart des approches ne présentent pas de telles garanties. Dans cette thèse nous proposons de nouveaux algorithmes pour apprendre des métriques à comportement contrôlé et nous mettons l'accent sur les propriétés théoriques de ceux-ci. Nous proposons quatre contributions distinctes qui peuvent être séparées en deux parties: (i) contrôler la métrique apprise en utilisant une métrique de référence et (ii) contrôler la transformation induite par la métrique apprise. Notre première contribution est une approche locale d'apprentissage de métriques où le but est de régresser une distance proportionnelle à la perception humaine des couleurs. Notre approche est justifiée théoriquement par des garanties en généralisation sur les métriques apprises. Dans notre deuxième contribution nous nous sommes intéressés à l'analyse théorique de l'intérêt d'utiliser une métrique de référence dans un terme de régularisation biaisé pour aider lors du processus d'apprentissage. Nous proposons d'utiliser trois cadres théoriques différents qui nous permettent de dériver trois mesures différentes de l'apport de la métrique de référence. Ces mesures nous donnent un aperçu de l'impact de la métrique de référence sur celle apprise. Dans notre troisième contribution nous proposons un algorithme d'apprentissage de métriques où la transformation induite est contrôlée. L'idée est que, plutôt que d'utiliser des contraintes de similarité et de dissimilarité, chaque exemple est associé à un point virtuel qui appartient déjà à l'espace induit par la métrique apprise. D'un point de vue théorique nous montrons que les métriques apprises de cette façon généralisent bien mais aussi que notre approche est liée à une méthode plus classique d'apprentissage de métriques basée sur des contraintes de paires. Dans notre quatrième contribution nous essayons aussi de contrôler la transformation induite par une métrique apprise. Cependant, plutôt que considérer un contrôle individuel pour chaque exemple, nous proposons une approche plus globale en forçant la transformation à suivre une transformation géométrique associée à un problème de transport optimal. D'un point de vue théorique nous proposons une discussion sur le lien entre la transformation associée à la métrique apprise et la transformation associée au problème de transport optimal. D'un point de vue plus pratique nous montrons l'intérêt de notre approche pour l'adaptation de domaine mais aussi pour l'édition d'images / Many Machine Learning algorithms make use of a notion of distance or similarity between examples to solve various problems such as classification, clustering or domain adaptation. Depending on the tasks considered these metrics should have different properties but manually choosing an adapted comparison function can be tedious and difficult. A natural trend is then to automatically tailor such metrics to the task at hand. This is known as Metric Learning and the goal is mainly to find the best parameters of a metric under some specific constraints. Standard approaches in this field usually focus on learning Mahalanobis distances or Bilinear similarities and one of the main limitations is that the control over the behaviour of the learned metrics is often limited. Furthermore if some theoretical works exist to justify the generalization ability of the learned models, most of the approaches do not come with such guarantees. In this thesis we propose new algorithms to learn metrics with a controlled behaviour and we put a particular emphasis on the theoretical properties of these algorithms. We propose four distinct contributions which can be separated in two parts, namely (i) controlling the metric with respect to a reference metric and (ii) controlling the underlying transformation corresponding to the learned metric. Our first contribution is a local metric learning method where the goal is to regress a distance proportional to the human perception of colors. Our approach is backed up by theoretical guarantees on the generalization ability of the learned metrics. In our second contribution we are interested in theoretically studying the interest of using a reference metric in a biased regularization term to help during the learning process. We propose to use three different theoretical frameworks allowing us to derive three different measures of goodness for the reference metric. These measures give us some insights on the impact of the reference metric on the learned one. In our third contribution we propose a metric learning algorithm where the underlying transformation is controlled. The idea is that instead of using similarity and dissimilarity constraints we associate each learning example to a so-called virtual point belonging to the output space associated with the learned metric. We theoretically show that metrics learned in this way generalize well but also that our approach is linked to a classic metric learning method based on pairs constraints. In our fourth contribution we also try to control the underlying transformation of a learned metric. However instead of considering a point-wise control we consider a global one by forcing the transformation to follow the geometrical transformation associated to an optimal transport problem. From a theoretical standpoint we propose a discussion on the link between the transformation associated with the learned metric and the transformation associated with the optimal transport problem. On a more practical side we show the interest of our approach for domain adaptation but also for a task of seamless copy in images Intelligence artificielle Apprentissage automatique Apprentissage statistique Apprentissage des métriques Théorie de l'apprentissage Artificial intelligence Machine learning Statistical learning Metric learning Learning theory
204	Systèmes de recommandation pour la publicité en ligne / Recommendation systems for online advertising Sidana, Sumit 08 November 2018 (has links) Cette thèse est consacrée à l’étude des systèmes de recommandation basés sur des réseaux de neurones artificiels appris pour faire de l'ordonnancement de produits avec des retours implicites (sous forme de clics). Dans ce sens, nous proposons un nouveau modèle neuronal qui apprend conjointement la représentation des utilisateurs et des produits dans un espace latent, ainsi que la relation de préférence des utilisateurs sur les produits. Nous montrons que le modèle proposé est apprenable au sens du principe de la minimisation du risque empirique et performant par rapport aux autres modèles de l'état de l'art sur plusieurs collections. En outre, nous contribuons à la création de deux nouvelles collections, produites grâce aux enregistrements des comportements de clients de Kelkoo (https://www.kelkoo.com/); le leader européen de la publicité programmatique et de Purch (http://www.purch.com/). Les deux jeux de données recueillent des retours implicites des utilisateurs sur des produits, ainsi qu’un grand nombre d'informations contextuelles concernant à la fois les clients et les produits. La collections de données de Purch contient en plus une information sur la popularité des produits ainsi que des commentaires textuelles associés. Nous proposons, une stratégie simple et efficace sur la manière de prendre en compte le biais de la popularité ainsi qu'un modèle probabiliste latent temporel pour extraire automatiquement les thèmes des textes des commentaires.Mots clés. Systèmes de recommandation, apprentissage d'ordonnancement, réseaux de neurones, recommandations avec des retours implicites, Modèles probabilistes latents temporels / This thesis is dedicated to the study of Recommendation Systems for implicit feedback (clicks) mostly using Learning-to-rank and neural network based approaches. In this line, we derive a novel Neural-Network model that jointly learns a new representation of users and items in an embedded space as well as the preference relation of users over the pairs of items and give theoretical analysis. In addition we contribute to the creation of two novel, publicly available, collections for recommendations that record the behavior of customers of European Leaders in eCommerce advertising, Kelkoofootnote{url{https://www.kelkoo.com/}} and Purchfootnote{label{purch}url{http://www.purch.com/}}. Both datasets gather implicit feedback, in form of clicks, of users, along with a rich set of contextual features regarding both customers and offers. Purch's dataset, is affected by popularity bias. Therefore, we propose a simple yet effective strategy on how to overcome the popularity bias introduced while designing an efficient and scalable recommendation algorithm by introducing diversity based on an appropriate representation of items. Further, this collection contains contextual information about offers in form of text. We make use of this textual information in novel time-aware topic models and show the use of topics as contextual information in Factorization Machines that improves performance. In this vein and in conjunction with a detailed description of the datasets, we show the performance of six state-of-the-art recommender models.Keywords. Recommendation Systems, Data Sets, Learning-to-Rank, Neural Network, Popularity Bias, Diverse Recommendations, Contextual information, Topic Model. Publicité programmatique Apprentissage multi-Cibles Apprentissage automatique Systèmes de recommendation Online advertising Multi-Target learning Machine learning Recommender Systems 004
205	Représentations parcimonieuses et apprentissage de dictionnaires pour la classification et le clustering de séries temporelles / Time warp invariant sparse coding and dictionary learning for time series classification and clustering Varasteh Yazdi, Saeed 15 November 2018 (has links) L'apprentissage de dictionnaires à partir de données temporelles est un problème fondamental pour l’extraction de caractéristiques temporelles latentes, la révélation de primitives saillantes et la représentation de données temporelles complexes. Cette thèse porte sur l’apprentissage de dictionnaires pour la représentation parcimonieuse de séries temporelles. On s’intéresse à l’apprentissage de représentations pour la reconstruction, la classification et le clustering de séries temporelles sous des transformations de distortions temporelles. Nous proposons de nouveaux modèles invariants aux distortions temporelles.La première partie du travail porte sur l’apprentissage de dictionnaire pour des tâches de reconstruction et de classification de séries temporelles. Nous avons proposé un modèle TWI-OMP (Time-Warp Invariant Orthogonal Matching Pursuit) invariant aux distorsions temporelles, basé sur un opérateur de maximisation du cosinus entre des séries temporelles. Nous avons ensuite introduit le concept d’atomes jumelés (sibling atomes) et avons proposé une approche d’apprentissage de dictionnaires TWI-kSVD étendant la méthode kSVD à des séries temporelles.Dans la seconde partie du travail, nous nous sommes intéressés à l’apprentissage de dictionnaires pour le clustering de séries temporelles. Nous avons proposé une formalisation du problème et une solution TWI-DLCLUST par descente de gradient.Les modèles proposés sont évalués au travers plusieurs jeux de données publiques et réelles puis comparés aux approches majeures de l’état de l’art. Les expériences conduites et les résultats obtenus montrent l’intérêt des modèles d’apprentissage de représentations proposés pour la classification et le clustering de séries temporelles. / Learning dictionary for sparse representing time series is an important issue to extract latent temporal features, reveal salient primitives and sparsely represent complex temporal data. This thesis addresses the sparse coding and dictionary learning problem for time series classification and clustering under time warp. For that, we propose a time warp invariant sparse coding and dictionary learning framework where both input samples and atoms define time series of different lengths that involve varying delays.In the first part, we formalize an L0 sparse coding problem and propose a time warp invariant orthogonal matching pursuit based on a new cosine maximization time warp operator. For the dictionary learning stage, a non linear time warp invariant kSVD (TWI-kSVD) is proposed. Thanks to a rotation transformation between each atom and its sibling atoms, a singular value decomposition is used to jointly approximate the coefficients and update the dictionary, similar to the standard kSVD. In the second part, a time warp invariant dictionary learning for time series clustering is formalized and a gradient descent solution is proposed.The proposed methods are confronted to major shift invariant, convolved and kernel dictionary learning methods on several public and real temporal data. The conducted experiments show the potential of the proposed frameworks to efficiently sparse represent, classify and cluster time series under time warp. Apprentissage automatique Représentation parcimonieuse Séries temporelles Apprentissage de dictionnaire Machine learning Sparse coding Temporal data Dictionary learning 510
206	Enrichissement des Modèles de Classification de Textes Représentés par des Concepts / Improving text-classification models using the bag-of-concept paradigm Risch, Jean-Charles 27 June 2017 (has links) La majorité des méthodes de classification de textes utilisent le paradigme du sac de mots pour représenter les textes. Pourtant cette technique pose différents problèmes sémantiques : certains mots sont polysémiques, d'autres peuvent être des synonymes et être malgré tout différenciés, d'autres encore sont liés sémantiquement sans que cela soit pris en compte et enfin, certains mots perdent leur sens s'ils sont extraits de leur groupe nominal. Pour pallier ces problèmes, certaines méthodes ne représentent plus les textes par des mots mais par des concepts extraits d'une ontologie de domaine, intégrant ainsi la notion de sens au modèle. Les modèles intégrant la représentation des textes par des concepts restent peu utilisés à cause des résultats peu satisfaisants. Afin d'améliorer les performances de ces modèles, plusieurs méthodes ont été proposées pour enrichir les caractéristiques des textes à l'aide de nouveaux concepts extraits de bases de connaissances. Mes travaux donnent suite à ces approches en proposant une étape d'enrichissement des modèles à l'aide d'une ontologie de domaine associée. J'ai proposé deux mesures permettant d'estimer l'appartenance aux catégories de ces nouveaux concepts. A l'aide de l'algorithme du classifieur naïf Bayésien, j'ai testé et comparé mes contributions sur le corpus de textes labéllisés Ohsumed et l'ontologie de domaine Disease Ontology. Les résultats satisfaisants m'ont amené à analyser plus précisément le rôle des relations sémantiques dans l'enrichissement des modèles. Ces nouveaux travaux ont été le sujet d'une seconde expérience où il est question d'évaluer les apports des relations hiérarchiques d'hyperonymie et d'hyponymie. / Most of text-classification methods use the ``bag of words” paradigm to represent texts. However Bloahdom and Hortho have identified four limits to this representation: (1) some words are polysemics, (2) others can be synonyms and yet differentiated in the analysis, (3) some words are strongly semantically linked without being taken into account in the representation as such and (4) certain words lose their meaning if they are extracted from their nominal group. To overcome these problems, some methods no longer represent texts with words but with concepts extracted from a domain ontology (Bag of Concept), integrating the notion of meaning into the model. Models integrating the bag of concepts remain less used because of the unsatisfactory results, thus several methods have been proposed to enrich text features using new concepts extracted from knowledge bases. My work follows these approaches by proposing a model-enrichment step using a domain ontology, I proposed two measures to estimate to belong to the categories of these new concepts. Using the naive Bayes classifier algorithm, I tested and compared my contributions on the Ohsumed corpus using the domain ontology ``Disease Ontology”. The satisfactory results led me to analyse more precisely the role of semantic relations in the enrichment step. These new works have been the subject of a second experiment in which we evaluate the contributions of the hierarchical relations of hypernymy and hyponymy. Classification de Textes Intelligence Artificielle Mégadonnées Apprentissage Automatique Visualisation de Données Text Classification Artificial Intelligence Big Data Machine Learning Data Visualization
207	Solid oxide fuel cell modeling and lifetime prediction for real-time simulations / Modélisation de pile à combustible à oxyde solide et prédiction de durée de vie pour des simulations en temps réel Ma, Rui 20 September 2018 (has links) Cette thèse présente d'abord une modélisation multi-physique d'une cellule de pile à combustible à oxydes solides de géométrie tubulaire réversible 2D. Le modèle développé peut représenter à la fois une cellule d'électrolyse à oxydes solides (SOEC) et une cellule de pile à combustible à oxydes solides (SOFC). En tenant compte des phénomènes physiques, électrochimiques, fluidiques et thermiques, le modèle présenté peut décrire avec précision les effets multi-physiques à l'intérieur d'une cellule pour le fonctionnement en mode électrolyseur ou en mode pile sur toute la plage de fonctionnement en courant et en température. En outre, un solveur itératif a été mis en place afin de résoudre la distribution 2D des quantités physiques le long de la cellule tubulaire. Le modèle de cellule réversible est ensuite validé expérimentalement dans les deux configurations sous différentes conditions. Par ailleurs, un modèle de pile à combustible alimentée par du syngas a été développé. Ce dernier est orienté contrôle et prend en compte à la fois des phénomènes de co-oxydation de l'hydrogène et du monoxyde de carbone. Le modèle de gaz de synthèse développé est validé expérimentalement dans différentes conditions de fonctionnement. Le modèle développé peut être utilisé dans des applications embarquées comme la simulation en temps réel, ce qui peut aider à concevoir et tester la stratégie de contrôle et de diagnostic en ligne pour le système de génération d'énergie des piles à combustible dans les applications industrielles.La simulation en temps réel est importante pour le diagnostic en ligne des piles à combustible et les tests HIL (hardware-in-the-loop) avant les applications industrielles. Cependant, il est difficile de mettre en œuvre des modèles de piles à combustible multi-dimensionnels et multi-physiques en temps réel en raison des problèmes de rigidité numérique du modèle. Ainsi, la rigidité numérique du modèle en temps réel de la pile de type SOFC est d'abord analysée. Certains des solveurs d'équations différentielles ordinaires (ODE) couramment utilisés sont ensuite testés par la mise en place d’une simulation en temps réel comme objectif principal. Enfin, un nouveau solveur ODE rigide est employé pour améliorer la stabilité et réduire le temps d'exécution du modèle de pile à combustible en temps réel multidimensionnel. Pour vérifier le modèle proposé et le solveur ODE, des expériences de simulation en temps réel sont réalisées au sein d’une plate-forme temps réel embarquée commune. Les résultats expérimentaux montrent que la vitesse d'exécution satisfait à l'exigence de la simulation en temps réel. La stabilité du solveur sous forte rigidité et la grande précision du modèle sont également validées.Les piles à combustible sont vulnérables aux impuretés de l'hydrogène et aux conditions de fonctionnement qui entraînent une dégradation des performances de la pile au cours du temps. Ainsi, au cours de ces dernières années, la prédiction de la dégradation des performances attire l'attention qui conduit à des remarques critiques sur la fiabilité du système. Ainsi, une méthode innovante de prédiction de dégradation PEMFC utilisant un réseau neutre récurrent (RNN) à longue distance (G-LSTM) est étudiée. Le système LSTM peut efficacement éviter les problèmes d'explosion et de disparition de gradient en comparaison avec l'architecture RNN conventionnelle, ce qui le rend pertinent pour le problème de prédiction pour une longue période. En mettant en parallèle et en combinant les cellules LSTM, l'architecture G-LSTM peut optimiser de façon avantageuse la précision de prédiction de la dégradation des performances de PEMFC. Le modèle de prédiction proposé est validé expérimentalement par trois types différents de PEMFC. Les résultats indiquent que le réseau G-LSTM utilisé peut prédire la dégradation de la pile à combustible d'une manière précise. / This thesis first presents a multi-physical modeling of a 2D reversible tubular solid oxide cell. The developed model can represent both a solid oxide electrolysis cell (SOEC) and solid oxide fuel cell (SOFC) operations. By taking into account of the electrochemical, fluidic and thermal physical phenomena, the presented model can accurately describe the multi-physical effects inside a cell for both fuel cell and electrolysis cell operation under entire working range of cell current and temperature. In addition, an iterative solver is proposed which is used to solve the 2D distribution of physical quantities along the tubular cell. The reversible solid oxide cell model is then validated experimentally in both SOEC and SOFC configurations under different species partial pressures, operating temperatures and current densities conditions. Meanwhile, a control-oriented syngas fuel cell model includes both hydrogen and carbon monoxide co-oxidation phenomena are also proposed. The developed syngas model is validated experimentally under different operating conditions regarding different reaction temperatures, species partial pressures and entire working range of current densities. The developed model can be used in embedded applications like real-time simulation, which can help to design and test the control and online diagnostic strategy for fuel cell power generation system in the industrial applications.Real-time simulation is important for the fuel cell online diagnostics and hardware-in-the-loop (HIL) tests before industrial applications. However, it is hard to implement real-time multi-dimensional, multi-physical fuel cell models due to the model numerical stiffness issues. Thus, the numerical stiffness of the tubular solid oxide fuel cell (SOFC) real-time model is analyzed to identify the perturbation ranges related to the fuel cell electrochemical, fluidic and thermal domains. Some of the commonly used ordinary differential equation (ODE) solvers are then tested for the real-time simulation purpose. At last, the novel stiff ODE solver is proposed to improve the stability and reduce the multi-dimensional real-time fuel cell model execution time. To verify the proposed model and the ODE solver, real-time simulation experiments are carried out in a common embedded real-time platform. The experimental results show that the execution speed satisfies the requirement of real-time simulation. The solver stability under strong stiffness and the high model accuracy are also validated.Fuel cell are vulnerable to the impurities of hydrogen and operating conditions, which could cause the degradation of output performance over time during operation. Thus, the prediction of the performance degradation draws attention lately and is critical for the reliability of the fuel cell system. Thus, an innovative degradation prediction method using Grid Long Short-Term Memory (G-LSTM) recurrent neutral network (RNN) is proposed. LSTM can effectively avoid the gradient exploding and vanishing problem compared with conventional RNN architecture, which makes it suitable for the prediction of long time period. By paralleling and combining the LSTM cells, G-LSTM architecture can further optimize the prediction accuracy of the PEMFC performance degradation. The proposed prediction model is experimentally validated by three different types of PEMFC: 1.2 kW NEXA Ballard fuel cells, 1 kW Proton Motor PM200 fuel cells and 25 kW Proton Motor PM200 fuel cells. The results indicate that the proposed G-LSTM network can predict the fuel cell degradation in a precise way. The proposed G-LSTM deep learning approach can be efficiently applied to predict and optimize the lifetime of fuel cell in transportation applications. Piles à combustible Modélisation Dégradation Apprentissage automatique Multi-Physique Fuel cells Modeling Degradation Machine learning Multi-Physical 621.312
208	Approches évolutionnaires pour la reconstruction de réseaux de régulation génétique par apprentissage de réseaux bayésiens. Auliac, Cédric 24 September 2008 (has links) (PDF) De nombreuses fonctions cellulaires sont réalisées grâce à l'interaction coordonnée de plusieurs gènes. Identifier le graphe de ces interactions, appelé réseau de régulation génétique, à partir de données d'expression de gènes est l'un des objectifs majeurs de la biologie des systèmes. Dans cette thèse, nous abordons ce problème en choisissant de modéliser les relations entre gènes par un réseau bayésien. Se pose alors la question de l'apprentissage de la structure de ce type de modèle à partir de données qui sont en général peu nombreuses. Pour résoudre ce problème, nous recherchons parmi tous les modèles possibles le modèle le plus simple, expliquant le mieux les données. Pour cela, nous introduisons et étudions différents types d'algorithmes génétiques permettant d'explorer l'espace des modèles. Nous nous intéressons plus particulièrement aux méthodes de spéciation. ces dernières, en favorisant la diversité des solutions candidates considérées, empêchent l'algorithme de converger trop rapidement vers des optima locaux. Ces algorithmes génétiques sont comparés avec différentes méthodes d'apprentissage de structure de réseaux bayésiens, classiquement utilisées dans la littérature. Nous mettons ainsi en avant la pertinence des approches evolutionnaires pour l'apprentissage de ces graphes d'interactions. Enfin, nous les comparons à une classe alternative d'algorithmes évolutionnaires qui s'avère particulièrement prometteuse : les algorithmes à estimation de distribution. Tous ces algorithmes sont testés et comparés sur un modèle du réseau de régulation de l'insuline de 35 noeuds dont nous tirons des jeux de données synthétiques de taille modeste. [SDV] Life Sciences réseaux de régulation génétique apprentissage automatique réseaux bayésiens algorithmes génétiques
209	Du textuel au numérique : analyse et classification automatiques Torres Moreno, Juan-Manuel 12 December 2007 (has links) (PDF) Dans ce document, je présente les travaux de recherche que j'ai menés après ma thèse, d'abord comme chercheur au LANIA, Mexique, puis pendant mon post-doctorat au Canada au LANCI-UQAM et comme chercheur au ERMETIS, ensuite à l'École Polytechnique de Montréal et finalement au LIA où je suis actuellement responsable de la thématique TALNE.<br /> Un goût personnel pour les méthodes d'apprentissage automatique m'a orienté vers leur utilisation dans le Traitement Automatique de la Langue Naturelle. Je laisserai de côte des aspects psycholinguistiques de la compréhension d'une langue humaine et je vais m'intéresser uniquement à la modélisation de son traitement comme un système à entrée-sortie. L'approche linguistique possède des limitations pour décider de cette appartenance, et en général pour faire face à trois caractéristiques des langages humaines : Ambiguïté. <br /> Je pense que l'approche linguistique n'est pas tout à fait appropriée pour traiter des problèmes qui sont liés à un phénomène sous-jacent des langues humaines : l'incertitude. L'incertitude affecte aussi les réalisations technologiques dérivées du TAL : un système de reconnaissance vocale par exemple, doit faire face à de multiples choix générés par une entrée. Les phrases étranges, mal écrites ou avec une syntaxe pauvre ne posent pas un problème insurmontable à un humain, car les personnes sont capables de choisir l'interprétation des phrases en fonction de leur utilisation courante. L'approche probabiliste fait face à l'incertitude en posant un modèle de langage comme une distribution de probabilité. Il permet de diviser un modèle de langage en plusieurs couches : morphologie, syntaxe, sémantique et ainsi de suite. Tout au long de cette dissertation, j'ai essayé de montrer que les méthodes numériques sont performantes en utilisant une approche pragmatique : les campagnes d'évaluation nationales et internationales. Et au moins, dans les campagnes à portée de ma connaissance, les performances des méthodes numériques surpassent celles des méthodes linguistiques. Au moment de traiter de grandes masses de documents, l'analyse linguistique fine est vite dépassée par la quantité de textes à traiter. On voit des articles et des études portant sur Jean aime Marie et autant sur Marie aime Jean ou encore Marie est aimée par Jean. J'ai découvert tout au long de mes travaux, en particulier ceux consacrés au résumé automatique et au raffinement de requêtes, qu'un système hybride combinant des approches numériques à la base et une analyse linguistique au sommet, donne de meilleures performances que les systèmes pris de façon isolée. <br />Dans l'introduction je me posais la question de savoir si la linguistique pouvait encore jouer un rôle dans le traitement de la langue naturelle. Enfin, le modèle de sac de mots est une simplification exagérée qui néglige la structure de la phrase, ce qui implique une perte importante d'information. Je reformule alors les deux questions précédentes comme ceci : Les approches linguistiques et les méthodes numériques peuvent-elles jouer un partenariat dans les tâches du TAL? Cela ouvre une voie intéressante aux recherches que je compte entreprendre la conception de systèmes TAL hybrides, notamment pour la génération automatique de texte et pour la compression de phrases.<br /> On peut difficilement envisager de dépasser le plafond auquel les méthodes numériques se heurtent sans faire appel à la finesse des approches linguistiques, mais sans négliger pour autant de les valider et de les tester sur des corpora. [INFO:INFO_OH] Computer Science/Other Apprentissage automatique Généralisation Classification
210	Nouvelles contributions du boosting en apprentissage automatique Suchier, Henri-Maxime 21 June 2006 (has links) (PDF) L'apprentissage automatique vise la production d'une hypothèse modélisant un concept à partir d'exemples, dans le but notamment de prédire si de nouvelles observations relèvent ou non de ce concept. Parmi les algorithmes d'apprentissage, les méthodes ensemblistes combinent des hypothèses de base (dites ``faibles'') en une hypothèse globale plus performante.<br /><br />Le boosting, et son algorithme AdaBoost, est une méthode ensembliste très étudiée depuis plusieurs années : ses performances expérimentales remarquables reposent sur des fondements théoriques rigoureux. Il construit de manière adaptative et itérative des hypothèses de base en focalisant l'apprentissage, à chaque nouvelle itération, sur les exemples qui ont été difficiles à apprendre lors des itérations précédentes. Cependant, AdaBoost est relativement inadapté aux données du monde réel. Dans cette thèse, nous nous concentrons en particulier sur les données bruitées, et sur les données hétérogènes.<br /><br />Dans le cas des données bruitées, non seulement la méthode peut devenir très lente, mais surtout, AdaBoost apprend par coeur les données, et le pouvoir prédictif des hypothèses globales générées, s'en trouve extrêmement dégradé. Nous nous sommes donc intéressés à une adaptation du boosting pour traiter les données bruitées. Notre solution exploite l'information provenant d'un oracle de confiance permettant d'annihiler les effets dramatiques du bruit. Nous montrons que notre nouvel algorithme conserve les propriétés théoriques du boosting standard. Nous mettons en pratique cette nouvelle méthode, d'une part sur des données numériques, et d'autre part, de manière plus originale, sur des données textuelles.<br /><br />Dans le cas des données hétérogènes, aucune adaptation du boosting n'a été proposée jusqu'à présent. Pourtant, ces données, caractérisées par des attributs multiples mais de natures différentes (comme des images, du son, du texte, etc), sont extrêmement fréquentes sur le web, par exemple. Nous avons donc développé un nouvel algorithme de boosting permettant de les utiliser. Plutôt que de combiner des hypothèses boostées indépendamment, nous construisons un nouveau schéma de boosting permettant de faire collaborer durant l'apprentissage des algorithmes spécialisés sur chaque type d'attribut. Nous prouvons que les décroissances exponentielles des erreurs sont toujours assurées par ce nouveau modèle, aussi bien d'un point de vue théorique qu'expérimental. [INFO] Computer Science Apprentissage automatique méthodes ensemblistes boosting données bruitées données hétérogènes

Search results