Global ETD Search

1	Arbre de décision temporel multi-opérateur / Multi-operator Temporal Decision Trees Shalaeva, Vera 30 November 2018 (has links) Aujourd'hui, du fait de la multiplication du nombre des capteurs et, plus généralement, de celle des données issues de dispositifs connectés, de nombreux domaines d'activité sont intéressés par la classification automatique des séries temporelles.Au-delà de la recherche théorique de nouveaux algorithmes d'apprentissage automatique capables de traiter ces données complexes, il est important de fournir aux utilisateurs des méthodes capables de construire efficacement des modèles prédictifs, mais aussi de se focaliser sur l'explicabilité des modèles générés et la transparence des processus mis en oeuvre.Ainsi, les utilisateurs qui n'ont pas forcément des connaissances en théorie d'apprentissage peuvent prendre en main plus rapidement ces méthodes et surtout valider la qualité des connaissances apprises vis à vis de leur domaine d'expertise.Dans ce travail de doctorat, nous nous sommes intéressée à la génération d'arbres de décision sur des données temporelles qui est une approche susceptible de construire des modèles assez faciles à interpréter pour un utilisateur "non-expert". Nous avons cherché à améliorer les différentes méthodes présentes dans la littérature en nous focalisant sur trois aspects liés à la construction des noeuds de l'arbre. Premièrement, nous avons introduit la notion d'arbre de décision temporel multi-opérateur (MTDT) qui consiste à utiliser, en concurrence, plusieurs méthodes pour construire chaque noeud. D'une part cela permet d'améliorer les capacités prédictives des arbres en capturant les meilleures structures géométriques discriminantes pour chaque classe et pour chaque niveau de l'arbre. D'autre part, grâce à cette approche on améliore la lisibilité des modèles en réduisant significativement la taille des arbres qui sont produits. Deuxièmement, nous avons cherché à réduire la complexité des algorithmes en utilisant une recherche locale pour explorer les opérateurs de contruction des noeuds. Cette recherche s'appuie sur la définition de bornes dans les métriques utilisées. Enfin, nous avons développé et comparé différentes méthodes automatiques de pondération des sous-séquences des séries temporelles de manière à maximiser la précision des arbres de décision produits. / Rising interest in mining and analyzing time series data in many domains motivates designing machine learning (ML) algorithms that are capable of tackling such complex data. Except of the need in modification, improvement, and creation of novel ML algorithms that initially works with static data, criteria of its interpretability, accuracy and computational efficiency have to be fulfilled. For a domain expert, it becomes crucial to extract knowledge from data and appealing when a yielded model is transparent and interpretable. So that, no preliminary knowledge of ML is required to read and understand results. Indeed, an emphasized by many recent works, it is more and more needed for domain experts to get a transparent and interpretable model from the learning tool, thus allowing them to use it, even if they have few knowledge about ML's theories. Decision Tree is an algorithm that focuses on providing interpretable and quite accurate classification model.More precisely, in this research we address the problem of interpretable time series classification by Decision Tree (DT) method. Firstly, we present Temporal Decision Tree, which is the modification of classical DT algorithm. The gist of this change is the definition of a node's split. Secondly, we propose an extension, called Multi-operator Temporal Decision Tree (MTDT), of the modified algorithm for temporal data that is able to capture different geometrical classes structures. The resulting algorithm improves model readability while preserving the classification accuracy.Furthermore, we explore two complementary issues: computational efficiency of extended algorithm and its classification accuracy. We suggest that decreasing of the former is reachable using a Local Search approach to built nodes. And preserving of the latter can be handled by discovering and weighting discriminative time stamps of time series. Arbre de Décision Series temporelles Classification Decision Trees Time series Classification 004
2	Etude statistique de la stabilité des stations de géodésie spatiale. Application à DORIS Le Bail, Karine 10 December 2004 (has links) (PDF) DORIS (Détermination d'Orbite et Radio positionnement Intégré sur Satellite) est un des systèmes permanents d'observation de la Terre avec le Global Positioning System (GPS) et la télémétrie laser sur satellite (SLR). La richesse des mesures collectées par ces systèmes permet de représenter le déplacement des stations au sol sous forme de séries temporelles de coordonnées. Au delà de la modélisation déterministe habituelle des phénomènes géophysiques, un nouveau domaine de recherche en géodésie s'est ouvert il y a quelques années, visant à la validation et à l'interprétation de ces séries temporelles.Dans la première partie du mémoire on décrit l'intégration de la fonction de mesure DORIS dans le logiciel de traitement GPS de l'Université de Berne.La partie principale des recherches effectuées concerne l'étude et la mise en oeuvre d'une méthode d'analyse de séries géodésiques 3D allant au delà des approches classiques que sont la répétitivité ou la recherche de périodicités et de ruptures. La méthode fait appel à des outils empruntés à d'autres disciplines : l'Analyse en Composantes Principales aux statistiques des sondages, et la variance d'Allan à la métrologie du temps et des fréquences. Elle est testée sur un certain nombre de jeux de séries temporelles de coordonnées de stations DORIS et GPS. On obtient une batterie de diagnostics qualifiant le spectre des mouvements de station et celui des erreurs de mesure. Ces diagnostics permettent la description déterministe et statistique du mouvement des stations obtenu par les analyses de géodésie spatiale. Ils conduisent aussi à une différenciation des systèmes de positionnement DORIS et GPS par leur signature spectrale. SERIES TEMPORELLES DORIS "BERNESE SOFTWARE" VARIANCE D'ALLAN ANALYSE EN COMPOSANTES PRINCIPALES
3	Encodage visuel composite pour les séries temporelles / Composite visual mapping for time series visualization Jabbari, Ali 04 July 2018 (has links) Les séries temporelles sont l'un des types de données les plus courants dans divers domaines scientifiques, industriels et financiers. Selon le contexte, l'analyse des séries temporelles est effectuée à diverses fins: prévision, estimation, classification et détection des tendances et des événements. Grâce aux capacités exceptionnelles de la perception visuelle humaine, la visualisation reste l'un des outils les plus puissants pour l'analyse de données, en particulier pour les données temporelles. Avec la croissance de volume et de la complexité des jeux de données, de nouvelles techniques de visualisation sont clairement nécessaires pour améliorer l'analyse des données. Elles visent à faciliter l'analyse visuelle dans le cas où des situations ou des tâches sont bien spécifiées, ou à favoriser l'analyse exploratoire non guidée.La visualisation est basée sur le "mapping visuel", un processus qui consiste à associer les valeurs de données aux canaux visuels comme la position, la taille et la couleur des éléments graphiques. A cet égard, la forme la plus connue de visualisation des séries temporelles, c'est-à-dire les graphiques linéaires ("line charts" en anglais), consiste en une mise en correspondance des valeurs de données avec la position verticale de la ligne. Cependant, un seul mapping visuel ne convient pas à toutes les situations et objectifs analytiques.Notre but est d'introduire des alternatives au mapping visuel conventionnel et de trouver des situations dans lesquelles, la nouvelle approche compense la simplicité et la familiarité des techniques existantes. Nous présentons une revue de l'état de l'art sur la visualisation des séries chronologiques, puis nous nous concentrons sur les approches existantes du mapping visuel.Ensuite, nous présentons nos contributions. Notre première contribution est une étude systématique d'un «mapping visuelle composite» qui consiste à utiliser des combinaisons de canaux visuels pour communiquer différentes facettes d'une série temporelle. Au moyen de plusieurs expériences avec des utilisateurs, nous comparons les nouveaux mappings visuels à une technique de référence existante et nous mesurons la vitesse et la précision des utilisateurs dans différentes tâches analytiques. Nos résultats montrent que les nouvelles conceptions visuelles conduisent à des performances analytiques proches de celles des techniques existantes sans être inutilement complexes ou nécessiter un entraînement. De plus, certains mappings proposés surpassent les techniques existantes dans les situations de contraintes spatiales. L'efficacité spatiale est d'une grande importance pour la visualisation simultanée de grands volumes de données ou de visualisation sur de petits écrans. Les deux scénarios font partie des défis actuels de la visualisation de l'information. / Time series are one of the most common types of recorded data in various scientific, industrial, and financial domains. Depending on the context, time series analysis are used for a variety of purposes: forecasting, estimation, classification, and trend and event detection. Thanks to the outstanding capabilities of human visual perception, visualization remains one of the most powerful tools for data analysis, particularly for time series. With the increase in data sets' volume and complexity, new visualization techniques are clearly needed to improve data analysis. They aim to facilitate visual analysis in specified situations, tasks, or for unguided exploratory analysis.Visualization is based upon visual mapping, which consists in association of data values to visual channels, e.g. position, size, and color of the graphical elements. In this regard, the most familiar form of time series visualization, i.e. line charts, consists in a mapping of data values to the vertical position of the line. However, a single visual mapping is not suitable for all situations and analytical objectives.Our goal is to introduce alternatives to the conventional visual mapping and find situations in which, the new approach compensate for the simplicity and familiarity of the existing techniques. We present a review of the existing literature on time series visualization and then, we focus on the existing approaches to visual mapping.Next, we present our contributions. Our first contribution is a systematic study of a "composite" visual mapping which consists in using combinations of visual channels to communicate different facets of a time series. By means of several user studies, we compare our new visual mappings with an existing reference technique and we measure users' speed and accuracy in different analytical tasks. Our results show that the new visual designs lead to analytical performances close to those of the existing techniques without being unnecessarily complex or requiring training. Also, some of the proposed mappings outperform the existing techniques in space constraint situations. Space efficiency is of great importance to simultaneous visualization of large volumes of data or visualization on small screens. Both scenarios are among the current challenges in information visualization. Visualisation d'information Series temporelles Encodage visuel Interaction Information visualization Time series Visual mapping Interaction 004

1

Page generated in 0.0155 seconds