Global ETD Search

41	Extraire et valider les relations complexes en sciences humaines : statistiques, motifs et règles d'association Cadot, Martine 12 December 2006 (has links) (PDF) Cette thèse concerne la fouille de données en sciences humaines. Cette branche récente de l'intelligence artificielle consiste en un ensemble de méthodes visant à extraire de la connaissance à partir de données stockées sur des supports informatiques. Parmi celles-ci, l'extraction de motifs et de règles d'association est une méthode de traitement des données qui permet de représenter de façon symbolique la structure des données, comme le font les méthodes statistiques classiques, mais qui, contrairement à celles-ci, reste opérationnelle en cas de données complexes, volumineuses. Toutefois ce modèle informatique des données, construit à partir de comptages de cooccurrences, n'est pas directement utilisable par les chercheurs en sciences humaines : il est essentiellement dédié aux données dichotomiques (vrai/faux), ses résultats directs, très morcelés, sont difficiles à interpréter, et sa validité peut paraître douteuse aux chercheurs habitués à la démarche statistique. Nous proposons des techniques que nous avons construites puis expérimentées sur des données réelles dans le but de réduire les difficultés d'utilisation que nous venons de décrire : 1) un test de randomisation à base d'échanges en cascade dans la matrice sujets x propriétés permet d'obtenir les liaisons statistiquement significatives entre deux propriétés, 2) une extension floue de la méthode d'extraction classique des motifs, qui produit des règles d'association floues généralisant les règles binaires et proches des règles floues définies par les chercheurs poursuivant les travaux de Zadeh, 3) MIDOVA, un algorithme extrayant les interactions n-aires entre variables - problème peu connu, peu abordé en informatique, et abordé avec de fortes limitations en statistiques - et 4) des méta-règles pour nettoyer le jeu de règles d'association de ses principales contradictions et redondances. fouille de données fouille de textes extraction de connaissances apprentissage artificiel motifs règles d'association motifs flous règles floues interaction statistique significativité statistique test de randomisation nettoyage et prétraitement des données codage et recodage des données
42	Traitement automatique des langues pour l'indexation d'images Tirilly, Pierre 07 July 2010 (has links) (PDF) Bien que s'inscrivant dans un cadre global de recherche d'information (RI) classique, l'indexation d'image ne tire que peu parti des nombreux travaux existants en RI textuelle et en traitement automatique des langues (TAL). Nous identifions deux niveaux auxquels de tels travaux peuvent s'intégrer aux systèmes d'indexation d'images. Le premier niveau est celui de la description du contenu visuel des images. Pour y intégrer des techniques de TAL, nous adoptons la description des images par mots visuels proposée par Sivic et Zisserman. Cette représentation soulève deux problématiques similaires aux problématiques classiques de la RI textuelle~: le choix des termes d'indexation les plus pertinents pour décrire les documents et la prise en compte des relations entre ces termes. Pour répondre à la première de ces problématiques nous proposons une étude des stop-lists et des pondérations dans le cadre de l'indexation d'images. Cette étude montre que, contrairement au cas des textes, il n'existe pas de pondération optimale pour tous types de requêtes, et que la pondération doit être choisie en fonction de la requête. Pour la seconde, nous utilisons des modèles de langues, outil classique du TAL que nous adaptons au cas des images, pour dépasser l'hypothèse d'indépendance des termes dans un cadre de classification d'images. Nos expérimentations montrent que prendre en compte des relations géométriques entre mots visuels permet d'améliorer les performances des systèmes. Le second niveau étudié est l'indexation sémantique des images : il est possible d'utiliser des méthodes de TAL sur des textes accompagnant les images pour obtenir des descriptions textuelles de celles-ci. Dans un premier temps, nous montrons que les descripteurs classiques d'images ne permettent pas d'obtenir des systèmes d'annotation d'images efficaces. Puis nous proposons une méthode d'annotation qui contourne cet écueil en se basant sur des descripteurs textuels et visuels de haut-niveau~: nous extrayons des textes des entités nommées, que nous mettons en relation avec des concepts visuels détectés dans les images afin d'annoter celles-ci. Nous validons notre approche sur un corpus réel et de grande taille composé d'articles de presse. Recherche d'information recherche d'images par le contenu annotation d'images traitement automatique des langues apprentissage artificiel modèles de langues entités nommées mots visuels pondérations détection de logos
43	Apprentissage incrémental pour la construction de bases lexicales évolutives : application en désambiguïsation d'entités nommées Girault, Thomas 18 June 2010 (has links) (PDF) Certaines applications du traitement automatique des langues sont amenées à traiter des flux de données textuelles caractérisés par l'emploi d'un vocabulaire en perpétuelle évolution, que ce soit au niveau de la création des mots que des sens de ceux existant déjà. En partant de ce constat, nous avons mis au point un algorithme incrémental pour construire automatiquement et faire évoluer une base lexicale qui répertorie des unités lexicales non étiquetées sémantiquement observées dans des flux. Cette base lexicale est représentée par un treillis de Galois qui organise des concepts formels (assimilés à des unités de sens) sur des niveaux de granularité allant du très spécifique au très général. Cette représentation est complétée par une modélisation vectorielle visualisable qui tient compte des aspects continus du sens et de la proximité sémantique entre concepts. Ce modèle est alors exploité pour propager l'étiquetage manuel d'un petit nombre d'entités nommées (EN : unités lexicales qui se référent habituellement à des personnes, des lieux, des organisations...) à d'autres EN non étiquetées observées dans un flux pendant la construction incrémentale du treillis. Les concepts de ce treillis sont enrichis avec les étiquettes d'EN observées dans un corpus d'apprentissage. Ces concepts et leurs étiquettes attachées sont respectivement employés pour l'annotation non supervisée et la classification supervisée des EN d'un corpus de test. apprentissage artificiel incrémental flux de données textuelles bases lexicales évolutives treillis de Galois désambiguïsation d'entités nommées
44	Réseaux de neurones, SVM et approches locales pour la prévision de séries temporelles / No available Cherif, Aymen 16 July 2013 (has links) La prévision des séries temporelles est un problème qui est traité depuis de nombreuses années. On y trouve des applications dans différents domaines tels que : la finance, la médecine, le transport, etc. Dans cette thèse, on s’est intéressé aux méthodes issues de l’apprentissage artificiel : les réseaux de neurones et les SVM. On s’est également intéressé à l’intérêt des méta-méthodes pour améliorer les performances des prédicteurs, notamment l’approche locale. Dans une optique de diviser pour régner, les approches locales effectuent le clustering des données avant d’affecter les prédicteurs aux sous ensembles obtenus. Nous présentons une modification dans l’algorithme d’apprentissage des réseaux de neurones récurrents afin de les adapter à cette approche. Nous proposons également deux nouvelles techniques de clustering, la première basée sur les cartes de Kohonen et la seconde sur les arbres binaires. / Time series forecasting is a widely discussed issue for many years. Researchers from various disciplines have addressed it in several application areas : finance, medical, transportation, etc. In this thesis, we focused on machine learning methods : neural networks and SVM. We have also been interested in the meta-methods to push up the predictor performances, and more specifically the local models. In a divide and conquer strategy, the local models perform a clustering over the data sets before different predictors are affected into each obtained subset. We present in this thesis a new algorithm for recurrent neural networks to use them as local predictors. We also propose two novel clustering techniques suitable for local models. The first is based on Kohonen maps, and the second is based on binary trees. Perceptron multi-couche Neural networks Multi layer perceptron Recurrent neural networks SVM (Support Vector Machines) Time series forecasting Regression Machine learning Supervised learning Unsupervised learning
45	Traitement de maquettes numériques pour la préparation de modèles de simulation en conception de produits à l'aide de techniques d'intelligence artificielle / A priori evaluation of simulation models preparation processes using artificial intelligence techniques Danglade, Florence 07 December 2015 (has links) Maitriser le triptyque coût-qualité-délai lors des différentes phases du Processus de Développement d’un Produit (PDP) dans un environnement de plus en plus concurrentiel est un enjeu majeur pour l’industrie. Le développement de nouvelles méthodes et de nouveaux outils pour adapter une représentation du produit à une activité du PDP est l’une des nombreuses pistes d’amélioration du processus et certainement l’une des plus prometteuses. Cela est particulièrement vrai dans le domaine du transfert de modèles de Conception Assistée par Ordinateur (CAO) vers des activités de simulations numériques. Actuellement, les méthodes et outils de préparation d’un modèle CAO original vers un modèle dédié à une activité existent. Cependant, ces processus de préparation sont des tâches complexes qui reposent souvent sur les connaissances des experts et sont peu formalisés, en particulier lorsque l’on considère des maquettes numériques riches comprenant plusieurs centaines de milliers de pièces. Pouvoir estimer a priori l’impact de la préparation de la maquette numérique sur le résultat de la simulation permettrait d’identifier dès le début le meilleur processus et assurerait une meilleure maitrise des processus et des coûts de préparation. Cette thèse a pour objectif de relever ce défi en utilisant des techniques d’intelligence artificielles capables d'imiter et de prévoir un comportement à partir d'exemples judicieusement choisis. L’idée principale est d’utiliser des exemples de préparation de maquettes numériques comme entrées d’algorithmes d’apprentissage pour configurer des estimateurs de la performance d’un processus. Lorsqu’un nouveau cas se présente, ces estimateurs pourront alors prédire a priori l’impact de la préparation sur le résultat de l’analyse sans avoir à la réaliser. Afin d'atteindre cet objectif, une méthode a été développée pour construire une base d’exemples représentatifs, identifier les variables d’entrée et de sortie déterminantes et configurer des modèles d’apprentissage. La performance d’un processus de préparation sera évaluée à l’aide de critères tels que des coûts de préparation, des coûts de simulation et des erreurs sur le résultat de l’analyse dues à la simplification des modèles CAO. Ces critères seront les données de sortie des algorithmes d’apprentissage. Le premier challenge de l’approche proposée est d’extraire les données des modèles 3D complétées par des données relatives au cas de simulation qui caractérisent au mieux un processus de préparation , puis d’identifier les variables explicatives les plus déterminantes. Un autre challenge est de configurer des modèles d’apprentissage capables d’évaluer avec une bonne précision la qualité d’un processus malgré un nombre limité d’exemples de processus de préparation et de données disponibles (seules les données relatives aux modèles CAO originaux, aux cas de simulation sont connues pour un nouveau cas). Au final, l’estimateur de la performance d’un processus aidera les analystes dans le choix d'opérations de préparation de modèles CAO. Cela ne les dispensera pas de la simulation mais permettra d'obtenir plus rapidement un modèle préparé de meilleure qualité. Les techniques d’intelligence artificielles utilisées seront des classifieurs de type réseaux de neurones ou arbres de décision. L’approche proposée sera appliquée à la préparation de modèles CAO riches pour l’analyse CFD. / Controlling the well-known triptych costs, quality and time during the different phases of the Product Development Process (PDP) is an everlasting challenge for the industry. Among the numerous issues that are to be addressed, the development of new methods and tools to adapt to the various needs the models used all along the PDP is certainly one of the most challenging and promising improvement area. This is particularly true for the adaptation of CAD (Computer-Aided Design) models to CAE (Computer-Aided Engineering) applications. Today, even if methods and tools exist, such a preparation phase still requires a deep knowledge and a huge amount of time when considering Digital Mock-Up (DMU) composed of several hundreds of thousands of parts. Thus, being able to estimate a priori the impact of DMU preparation process on the simulation results would help identifying the best process right from the beginning, and this will ensure a better control of processes and preparation costs. This thesis addresses such a difficult problem and uses Artificial Intelligence (AI) techniques to learn and accurately predict behaviors from carefully selected examples. The main idea is to identify rules from these examples used as inputs of learning algorithms. Once those rules obtained, they can be used as estimators to be applied a priori on new cases for which the impact of a preparation process can be estimated without having to perform it. To reach this objective, a method to build a representative database of examples has been developed, the right input and output variables have been identified, then the learning model and its associated control parameters have been tuned. The performance of a preparation process is assessed by criteria like preparation costs, analysis costs and the errors induced by the simplifications on the analysis results. The first challenge of the proposed approach is to extract and select most relevant input variables from the original and 3D prepared models, which are completed with data characterizing the preparation processes. Another challenge is to configure learning models able to assess with good accuracy the quality of a process, despite a limited number of examples of preparation processes and data available (the only data known to a new case are the data that characterize the original CAD models and simulation case). In the end, the estimator of the process’ performance will help analysts in the selection of CAD model preparation operations. This does not exempt the analysts to make the numerical simulation. However, this will get faster a simplified model of best quality. The rules linking the output variables to the input ones are obtained using AI techniques such as well-known neural networks and decision trees. The proposed approach is illustrated and validated on industrial examples in the context of CFD simulations. Evaluation a priori de processus Simplification de modèles CAO complexes Transfert CAD-CAE Apprentissage artificiel Formalisation des connaissances A priori process evaluation Large CAD models simplification Link CAD-CAE Artificial intelligence techniques Knowledge formalization
46	Les systèmes cognitifs dans les réseaux autonomes : une méthode d'apprentissage distribué et collaboratif situé dans le plan de connaissance pour l'auto-adaptation / Cognitive systems in automatic networks : a distributed and collaborative learning method in knoledge plane for self-adapting function Mbaye, Maïssa 17 December 2009 (has links) L'un des défis majeurs pour les décennies à venir, dans le domaine des technologies de l'information et de la communication, est la réalisation du concept des réseaux autonomes. Ce paradigme a pour objectif de rendre les équipements réseaux capables de s'autogérer, c'est-à-dire qu'ils pourront s'auto-configurer, s'auto-optimiser, s'auto-protéger et s'auto-restaurer en respectant les objectifs de haut niveau de leurs concepteurs. Les architectures majeures de réseaux autonomes se basent principalement sur la notion de boucle de contrôle fermée permettant l'auto-adaptation (auto-configuration et auto-optimisation) de l'équipement réseau en fonction des événements qui surviennent sur leur environnement. Le plan de connaissance est une des approches, très mise en avant ces dernières années par le monde de la recherche, qui suggère l'utilisation des systèmes cognitifs (l'apprentissage et le raisonnement) pour fermer la boucle de contrôle. Cependant, bien que les architectures majeures de gestion autonomes intègrent des modules d'apprentissage sous forme de boite noire, peu de recherches s'intéressent véritablement au contenu de ces boites. C'est dans ce cadre que nous avons fait une étude sur l'apport potentiel de l'apprentissage et proposé une méthode d'apprentissage distribué et collaboratif. Nous proposons une formalisation du problème d'auto-adaptation sous forme d'un problème d'apprentissage d'état-actions. Cette formalisation nous permet de définir un apprentissage de stratégies d'auto-adaptation qui se base sur l'utilisation de l'historique des transitions et utilise la programmation logique inductive pour découvrir de nouvelles stratégies à partir de celles déjà découvertes. Nous définissons, aussi un algorithme de partage de la connaissance qui permet d'accélérer le processus d'apprentissage. Enfin, nous avons testé l'approche proposé dans le cadre d'un réseau DiffServ et montré sa transposition sur le contexte du transport de flux multimédia dans les réseaux sans-fil 802.11. / One of the major challenges for decades to come, in the field of information technologies and the communication, is realization of autonomic paradigm. It aims to enable network equipments to self-manage, enable them to self-configure, self-optimize, self-protect and self-heal according to high-level objectives of their designers. Major architectures of autonomic networking are based on closed control loop allowing self-adapting (self-configuring and self-optimizing) of the network equipment according to the events which arise on their environment. Knowledge plane is one approach, very emphasis these last years by researchers, which suggests the use of the cognitive systems (machine learning and the reasoning) to realize closed control loop. However, although the major autonomic architectures integrate machine learning modules as functional block, few researches are really interested in the contents of these blocks. It is in this context that we made a study on the potential contribution machine learning and proposed a method of distributed and collaborative machine learning. We propose a formalization self-adapting problem in term of learning configuration strategies (state-actions) problem. This formalization allows us to define a strategies machine learning method for self-adapting which is based on the history observed transitions and uses inductive logic programming to discover new strategies from those already discovered. We defined, also a knowledge sharing algorithm which makes network components collaborate to improve learning process. Finally, we tested our approach in DiffServ context and showed its transposition on multimedia streaming in 802.11 wireless networks. Réseaux autonomes Auto-adaptation Plan de connaissance Systèmes cognitifs Apprentissage artificiel Apprentissage distribué Apprentissage collaboratif Programmation logique inductive Distibuted machine learning Autonomic networking Self-adaptating Knowledge plane Cognitive systems Machine learning Collaborative machine learning Inductive logic programming
47	Optimization and uncertainty handling in air traffic management / Optimisation et gestion de l'incertitude du trafic aérien Marceau Caron, Gaetan 22 September 2014 (has links) Cette thèse traite de la gestion du trafic aérien et plus précisément, de l’optimisation globale des plans de vol déposés par les compagnies aériennes sous contrainte du respect de la capacité de l’espace aérien. Une composante importante de ce travail concerne la gestion de l’incertitude entourant les trajectoires des aéronefs. Dans la première partie du travail, nous identifions les principales causes d’incertitude au niveau de la prédiction de trajectoires. Celle-ci est la composante essentielle à l’automatisation des systèmes de gestion du trafic aérien. Nous étudions donc le problème du réglage automatique et en-ligne des paramètres de la prédiction de trajectoires au cours de la phase de montée avec l’algorithme d’optimisation CMA-ES. La principale conclusion, corroborée par d’autres travaux de la littérature, implique que la prédiction de trajectoires des centres de contrôle n’est pas suffisamment précise aujourd’hui pour supporter l’automatisation complète des tâches critiques. Ainsi, un système d’optimisation centralisé de la gestion du traficaérien doit prendre en compte le facteur humain et l’incertitude de façon générale.Par conséquent, la seconde partie traite du développement des modèles et des algorithmes dans une perspective globale. De plus, nous décrivons un modèle stochastique qui capture les incertitudes sur les temps de passage sur des balises de survol pour chaque trajectoire. Ceci nous permet d’inférer l’incertitude engendrée sur l’occupation des secteurs de contrôle par les aéronefs à tout moment.Dans la troisième partie, nous formulons une variante du problème classique du Air Traffic Flow and Capacity Management au cours de la phase tactique. L’intérêt est de renforcer les échanges d’information entre le gestionnaire du réseau et les contrôleurs aériens. Nous définissons donc un problème d’optimisation dont l’objectif est de minimiser conjointement les coûts de retard et de congestion tout en respectant les contraintes de séquencement au cours des phases de décollage et d’attérissage. Pour combattre le nombre de dimensions élevé de ce problème, nous choisissons un algorithme évolutionnaire multiobjectif avec une représentation indirecte du problème en se basant sur des ordonnanceurs gloutons. Enfin, nous étudions les performances et la robustesse de cette approche en utilisant le modèle stochastique défini précédemment. Ce travail est validé à l’aide de problèmes réels obtenus du Central Flow Management Unit en Europe, que l’on a aussi densifiés artificiellement. / In this thesis, we investigate the issue of optimizing the aircraft operators' demand with the airspace capacity by taking into account uncertainty in air traffic management. In the first part of the work, we identify the main causes of uncertainty of the trajectory prediction (TP), the core component underlying automation in ATM systems. We study the problem of online parameter-tuning of the TP during the climbing phase with the optimization algorithm CMA-ES. The main conclusion, corroborated by other works in the literature, is that ground TP is not sufficiently accurate nowadays to support fully automated safety-critical applications. Hence, with the current data sharing limitations, any centralized optimization system in Air Traffic Control should consider the human-in-the-loop factor, as well as other uncertainties. Consequently, in the second part of the thesis, we develop models and algorithms from a network global perspective and we describe a generic uncertainty model that captures flight trajectories uncertainties and infer their impact on the occupancy count of the Air Traffic Control sectors. This usual indicator quantifies coarsely the complexity managed by air traffic controllers in terms of number of flights. In the third part of the thesis, we formulate a variant of the Air Traffic Flow and Capacity Management problem in the tactical phase for bridging the gap between the network manager and air traffic controllers. The optimization problem consists in minimizing jointly the cost of delays and the cost of congestion while meeting sequencing constraints. In order to cope with the high dimensionality of the problem, evolutionary multi-objective optimization algorithms are used with an indirect representation and some greedy schedulers to optimize flight plans. An additional uncertainty model is added on top of the network model, allowing us to study the performances and the robustness of the proposed optimization algorithm when facing noisy context. We validate our approach on real-world and artificially densified instances obtained from the Central Flow Management Unit in Europe. Gestion du traffic aérien Prédiction de trajectoire Apprentissage artificiel Modélisation de l'espace aérien Ordonnanacement du trafic aérien Modèle probabiliste Simulation stochastique Gestion de l'incertitude Air traffic management Trajectory prediction Machine learning Airspace modeling Air traffic scheduling Evolutionary multi-ojective optimization Probabilistic model Stochastic simulation Uncertainty handling

Page generated in 0.1019 seconds