491 |
Réseaux de neurones récurrents pour le traitement automatique de la parole / Speech processing using recurrent neural networksGelly, Grégory 22 September 2017 (has links)
Le domaine du traitement automatique de la parole regroupe un très grand nombre de tâches parmi lesquelles on trouve la reconnaissance de la parole, l'identification de la langue ou l'identification du locuteur. Ce domaine de recherche fait l'objet d'études depuis le milieu du vingtième siècle mais la dernière rupture technologique marquante est relativement récente et date du début des années 2010. C'est en effet à ce moment qu'apparaissent des systèmes hybrides utilisant des réseaux de neurones profonds (DNN) qui améliorent très notablement l'état de l'art. Inspirés par le gain de performance apporté par les DNN et par les travaux d'Alex Graves sur les réseaux de neurones récurrents (RNN), nous souhaitions explorer les capacités de ces derniers. En effet, les RNN nous semblaient plus adaptés que les DNN pour traiter au mieux les séquences temporelles du signal de parole. Dans cette thèse, nous nous intéressons tout particulièrement aux RNN à mémoire court-terme persistante (Long Short Term Memory (LSTM) qui permettent de s'affranchir d'un certain nombre de difficultés rencontrées avec des RNN standards. Nous augmentons ce modèle et nous proposons des processus d'optimisation permettant d'améliorer les performances obtenues en segmentation parole/non-parole et en identification de la langue. En particulier, nous introduisons des fonctions de coût dédiées à chacune des deux tâches: un simili-WER pour la segmentation parole/non-parole dans le but de diminuer le taux d'erreur d'un système de reconnaissance de la parole et une fonction de coût dite de proximité angulaire pour les problèmes de classification multi-classes tels que l'identification de la langue parlée. / Automatic speech processing is an active field of research since the 1950s. Within this field the main area of research is automatic speech recognition but simpler tasks such as speech activity detection, language identification or speaker identification are also of great interest to the community. The most recent breakthrough in speech processing appeared around 2010 when speech recognition systems using deep neural networks drastically improved the state-of-the-art. Inspired by this gains and the work of Alex Graves on recurrent neural networks (RNN), we decided to explore the possibilities brought by these models on realistic data for two different tasks: speech activity detection and spoken language identification. In this work, we closely look at a specific model for the RNNs: the Long Short Term Memory (LSTM) which mitigates a lot of the difficulties that can arise when training an RNN. We augment this model and introduce optimization methods that lead to significant performance gains for speech activity detection and language identification. More specifically, we introduce a WER-like loss function to train a speech activity detection system so as to minimize the word error rate of a downstream speech recognition system. We also introduce two different methods to successfully train a multiclass classifier based on neural networks for tasks such as LID. The first one is based on a divide-and-conquer approach and the second one is based on an angular proximity loss function. Both yield performance gains but also speed up the training process.
|
492 |
Contribution à l'évaluation opérationnelle des systèmes biométriques multimodaux / Contribution to the operational evaluation of multimodal biometric systemsCabana, Antoine 28 November 2018 (has links)
Le développement et la multiplication de dispositifs connectés, en particulier avec les \textit{smartphones}, nécessitent la mise en place de moyens d'authentification. Dans un soucis d'ergonomie, les industriels intègrent massivement des systèmes biométrique afin de garantir l'identité du porteur, et ce afin d'autoriser l'accès à certaines applications et fonctionnalités sensibles (paiements, e-banking, accès à des données personnelles : correspondance électronique..). Dans un soucis de garantir, une adéquation entre ces systèmes d'authentification et leur usages, la mise en œuvre d'un processus d'évaluation est nécessaire.L'amélioration des performances biométriques est un enjeux important afin de permettre l'intégration de telles solutions d'authentification dans certains environnement ayant d'importantes exigences sur les performances, particulièrement sécuritaires. Afin d'améliorer les performances et la fiabilité des authentifications, différentes sources biométriques sont susceptibles d'être utilisées dans un processus de fusion. La biométrie multimodale réalise, en particulier, la fusion des informations extraites de différentes modalités biométriques. / Development and spread of connected devices, in particular smartphones, requires the implementation of authentication methods. In an ergonomic concern, manufacturers integrates biometric systems in order to deal with logical control access issues. These biometric systems grant access to critical data and application (payment, e-banking, privcy concerns : emails...). Thus, evaluation processes allows to estimate the systems' suitabilty with these uses. In order to improve recognition performances, manufacturer are susceptible to perform multimodal fusion.In this thesis, the evaluation of operationnal biometric systems has been studied, and an implementation is presented. A second contribution studies the quality estimation of speech samples, in order to predict recognition performances.
|
493 |
Perception et apprentissage prérinatal chez la seiche : approche comparative et effet du stress / Perception abilities and perinatal learning in cuttlefish : comparative approach and effect of stressMezrai, Nawel 01 March 2019 (has links)
Ette thèse est centrée sur les capacités sensorielles, cognitives et sur les effets du stress chez deux espèces de seiche : Sepia officinalis et Sepia pharaonis. Nous avons d’abord démontré que les embryons répondent à différents stimuli environnementaux (lumière, proies, prédateurs, encre de seiche) mettant en évidence que l'information sensorielle passe à travers la capsule de l'œuf, ce qui permet une continuité sensorielle transnatale. De telles réponses sont possibles puisque leur système chimiosensoriel et visuel sont fonctionnels avant l'éclosion. Nous avons également montré que les embryons des deux espèces sont capables d'apprentissage simple (empreinte alimentaire) et associatif (conditionnement classique) et que ces capacités précoces pourraient augmenter leurs chances de survie avant et après l'éclosion en permettant la reconnaissance des proies et des prédateurs. Enfin, nous avons montré que le stress embryonnaire naturel (odeur de prédateur) et artificiel (lumière) ont des effets modérés voire nuls sur les capacités d’apprentissage périnatal. Ces résultats comportementaux ont été observés sans grande différence entre les deux espèces qui vivent pourtant dans des environnements très éloignés. Pris ensemble, ces résultats démontrent que les embryons de seiche ne sont pas isolés de leur environnement mais détectent et traitent les informations environnementales qui modulent leur comportement après l’éclosion. / The focus of this thesis centres on the sensory, cognitive abilities and stress effect of two cuttlefish species: Sepia officinalis and Sepia pharaonis. First, we demonstrated that embryos respond to different environmental stimuli (i.e. light, prey, predators, ink) showing that sensory information passes through the egg capsule which allows a sensory transnatal continuity. Such responses to external stimuli are likely facilitated through their visual and chemosensory systems that are functional prior to hatching. We also demonstrated that the embryos of these two species are capable of simple learning (food imprinting) and associative learning (classical conditioning). These early abilities might increase their survival chance before and after hatching because they allow prey and predator recognition event before hatching. Finally, we showed that both natural embryonic stress (predatory odour) and artificial stress (light) have moderate or no effects on perinatal learning abilities. The same behavior was observed on the two species whereas they live in different continent. Taken together, these results demonstrate that cuttlefish embryos are not isolated from their environment, but rather detect and process external information which shapes their behaviors after hatching.
|
494 |
Reconnaissance d’actions humaines dans des vidéos utilisant une représentation locale / Human action recognition in videos with local representationKoperski, Michal 09 November 2017 (has links)
Cette thèse étudie le problème de la reconnaissance d’actions humaines dans des vidéos. La reconnaissance d’action peut être définie comme étant la capacité à décider si une action est présente due une vidéo. Ce problème est difficile en raison de la complexité des actions humaines, dans la grande variété de leur apparence et de leur mouvement. Les avancées récentes dans les méthodes manuelles ou par apprentissage profond ont considérablement amélioré la précision de la reconnaissance d’action. Mais de nombreuses questions restent ouvertes, ce qui rend le problème de la reconnaissance d’actions loin d’être résolu. Les méthodes actuelles basées sur les caractéristiques locales, donnent des résultats satisfaisants. Mais les actions humaines sont complexes, ce qui nous conduit à la question suivante : comment modéliser les relations entre les caractéristiques locales dans leur contexte spatiotemporel ? Dans cette thèse nous proposons 2 méthodes pour y répondre. La première modélise les relations spatio-temporelles entre les caractéristiques images utilisant la Covariance Brownienne, et la seconde modélise la disposition spatiale des caractéristiques locales à l’intérieur de la boite englobante de chaque personne. Les méthodes que nous proposons sont générales et peuvent améliorer aussi bien les méthodes manuelles que celles avec apprentissage. Une autre question ouverte est : l’information 3D peut-elle améliorer la reconnaissance d’actions ? Plusieurs méthodes utilisent les informations 3D pour détecter les articulations du corps. Nous proposons de les améliorer avec un nouveau descripteur, utilisant la trajectoire 3D calculée à partir des informations RGB-D. Finalement, nous affirmons que la capacité de traiter une vidéo en temps-réel sera un facteur clé pour les futures applications de reconnaissance d’actions. Toutes les méthodes proposées dans cette thèse sont prêtes à fonctionner en temps-réel. Nous avons prouvé notre affirmation empiriquement en créant un système temps-réel de détection d’actions. Ce système a été adapté avec succès par la compagnie Toyota pour leurs systèmes robotiques. Pour l’évaluation, nous nous concentrons sur les actions quotidiennes à la maison telles que : manger, boire ou cuisiner. La reconnaissance de telles actions est importante pour le suivi des patients à l’hôpital et pour les systèmes d’aide robotisée à domicile. Dans ce but, nous avons créé une grande base de données, qui contient 160 heures d’enregistrement de 20 personnes âgées. Les vidéos ont été enregistrées dans 3 chambres avec7 capteurs RGB-D. Nous avons annoté ces vidéos avec 28 classes d’actions. Les actions dans la base de données sont effectuées d’une manière naturelle et non supervisée, ce qui introduit des défis manquants dans les bases de données publiques. Nous évaluons aussi nos méthodes en utilisant les bases de données publiques : CAD60, CAD120 et MSRDailyActivity3D. Les expérimentations montrent que nos méthodes améliorent les résultats de l’état de l’art. / This thesis targets recognition of human actions in videos. This problem can be defined as the ability to name the action that occurs in the video. Due to the complexity of human actions such as appearance and motion pattern variations, many open questions keep action recognition far from being solved. Current state-of-the-art methods achieved satisfactory results based only on local features. To handle complexity of actions we propose 2 methods which model spatio-temporal relationship between features: (1) model a pairwise relationship between features with Brownian Covariance, (2) model spatial-layout of features w.r.t. person bounding box. Our methods are generic and can improve both hand-crafted and deep-learning based methods. Another question is whether 3D information can improve action recognition. Many methods use 3D information only to obtain body joints. We show that 3D information can be used not only for joints detection. We propose a novel descriptor which introduces 3D trajectories computed on RGB-D information. In the evaluation, we focus on daily living actions -- performed by people in daily self-care routine. Recognition of such actions is important for patient monitoring and assistive robots systems. To evaluate our methods we created a large-scale dataset, which consists of 160~hours of video footage of 20~seniors. We have annotated 35 action classes. The actions are performed in un-acted way, thus we introduce real-world challenges, absent in many public datasets. We also evaluated our methods on public datasets: CAD60, CAD120, MSRDailyActivity3D. THe experiments show that our methods improve state-of-the-art results.
|
495 |
Se mobiliser contre la violence et le VIH : dynamiques subjectives de l'engagement associatif des femmes à la Guadeloupe et à Saint-Martin / Mobilizing against violence and HIV : the subjective dynamics of women’s associative involvement in Guadeloupe and Saint-Martin.Thiandoum, Barbara 06 November 2017 (has links)
La fréquentation d’une association de lutte contre le VIH/SIDA et/ou contre les violences (et lesdiscriminations) n’est pas seulement une pratique, elle est aussi un rapport social, c’est-à-direqu’elle se déploie dans un espace caractérisé par des rapports de pouvoir et de domination. EnGuadeloupe, une étude exploratoire sur les processus de structuration du milieu associatif de luttecontre le VIH/SIDA a fait émerger une organisation autour de trois positions associatives defemmes – celles d’ « usagère », de « petite main » et d’ « entrepreneuse ». Au-delà de cettedifférence de position, les récits autobiographiques des femmes concernées sont largementstructurés autour de l’expérience de situations de violence (ou de discrimination). Nous faisonsl’hypothèse que ces positions associatives s’étayent, entre autres, sur les spécificités des rapports àl’expérience de la violence et des discriminations des femmes concernées. Aussi, la thèse proposéecherche à mettre en relation la position occupée par ces femmes dans des associations de luttecontre le VIH/SIDA et/ou les violences et les modes de subjectivation adoptés par celles-ci dans uncontexte postcolonial marqué par la problématique socio-raciale. Ce qui est à l’étude, c’est doncfinalement la manière dont ces femmes s’expriment et ra-content des situations vécues de violence(ou de discrimination) selon leur position associative et les ressources et modèles interprétatifs,discursifs et affectifs dont elles disposent. Le problème est résolument posé dans le cadre destravaux sur les rapports de domination se fondant sur une approche intersectionnelle. Sacompréhension s’appuie, dans le prolongement d’un terrain ethnographique, d’une part sur desdonnées recueillies lors d’entretiens individuels de type récit de vie et de pratique (n=15) et d’autrepart sur dix-sept focus-groups qui ont mobilisé trente femmes fréquentant des associations de luttecontre le VIH/SIDA et/ou les violences à la Guadeloupe et à Saint-Martin. Il apparaît que lespositions associatives observées sont déterminées par une combinaison spécifique de ressources etde dispositions à l’engagement de soi, et correspondent à des modes de subjectivation spécifiquesdans cet espace. / Being involved in an associative movement against HIV/AIDS and/or violence (and discrimination)is not only a practice, it is a social relationship, because it takes place in a context which ischaracterized by power and domination relationships. In Guadeloupe, an exploratory study on thestructuring processes of associations against HIV/AIDS led to the discovery of an organizationbased on three associative positions of women – the « consumer », the « worker » and the« entrepreneur ». Beyond their different positions, the autobiographical narratives of these womenare mainly structured around experienced violence (or discrimination). Our hypothesis is that theseassociative positions are based, among other things, on the specificities of these women’sexperience of violence and discrimination. Thus, the proposed thesis seeks to relate the positionoccupied by these women in associations fighting HIV/AIDS and/or the violence to the modes ofsubjectification they have adopted in a postcolonial context marked by socioracial issues. The studyfocuses on how these women express themselves and narrate their experiences of violence (ordiscrimination) according to their associative position and the interpretative, discursive andemotional resources and models that were available to them. The issues are raised in the context of research on dominance based on an intersectional approach. Their resolution is set in theethnographic field, based on data collected during personal interviews such as life and practice (n =15) narratives and on seventeen Focus groups of thirty women involved in associative movementsagainst HIV/AIDS and/or violence in Guadeloupe and Saint Martin. It seems that the observedassociative positions are determined by a specific combination of resources and a tendency to getinvolved, which correspond to specific modes of subjectification in this spatial context.
|
496 |
A Machine Learning Approach for Reconnaissance Detection to Enhance Network SecurityBakaletz, Rachel 01 May 2022 (has links)
Before cyber-crime can happen, attackers must research the targeted organization to collect vital information about the target and pave the way for the subsequent attack phases. This cyber-attack phase is called reconnaissance or enumeration. This malicious phase allows attackers to discover information about a target to be leveraged and used in an exploit. Information such as the version of the operating system and installed applications, open ports can be detected using various tools during the reconnaissance phase. By knowing such information cyber attackers can exploit vulnerabilities that are often unique to a specific version.
In this work, we develop an end-to-end system that uses machine learning techniques to detect reconnaissance attacks on cyber networks. Successful detection of such attacks provides the target the time to devise plans on how to evade or mitigate the cyber-attack phases that supervene the reconnaissance phase.
|
497 |
Influence du mapping sur la reconnaissance d'un système de communication / Influence of the constellation labeling on the recognition of a communication systemBellard, Marion 30 January 2014 (has links)
Le contexte de cette thèse est la reconnaissance de systèmes de communication dans un contexte non coopératif. Nous nous intéressons au problème de la reconstruction de codes convolutifs et à la reconstruction du mapping (la bijection utilisée pour associer une séquence binaire à un signal modulé). Nous avons élaboré une nouvelle méthode statistique qui à partir d'une séquence binaire bruitée observée permet de détecter si une séquence binaire est codée par un codeur convolutif. Cette méthode consiste à former des blocs de séquence suffisamment grands pour contenir le support d'une équation de parité et à compter le nombre de blocs identiques. Elle a l'avantage de fournir la longueur du code utilisé lorsque le mapping est inconnu. Cette méthode peut également être utilisée pour reconstruire le dual d'un code convolutif lorsque le mapping est connu. Nous proposons par ailleurs un algorithme de reconnaissance de mapping basé sur le parcours de classes d'équivalences. Deux types de classes sont définies. Nous disposons d'un signal bruité partiellement démodulé (démodulé avec un mapping par défaut) et supposons que les données sont codées par un codeur convolutif. Nous utilisons la reconnaissance d'un tel code comme testeur et parcourons enfin les classes d'équivalences faisant apparaître une structure de codes convolutifs. Cette classification améliore la complexité de la recherche pour les petites constellations (4 et 8-PSK). Dans le cas des constellations 16 à 256-QAM l'algorithme est appliqué aux mappings Gray ou quasi-Gray. L'algorithme ne fournit pas un résultat unique mais il permet de trouver un ensemble de mappings possibles à partir de données bruitées. / The context of this thesis is the recognition of communication systems in a non-cooperative context. We are interested in the convolutional code reconstruction problem and in the constellation labeling reconstruction (the mapping used to associate a binary sequence to a modulated signal). We have defined a new statistical method for detecting if a given binary sequence is a noisy convolutional code-word obtained from an unknown convolutional code. It consists in forming blocks of sequence which are big enough to contain the support of a parity check equation and counting the number of blocks which are equal. It gives the length of the convolutional code without knowledge of the constellation labeling. This method can also be used to reconstruct the dual of a convolutional code when the constellation labeling is known. Moreover we propose a constellation labeling recognition algorithm using some equivalence classes. Two types of classes are defined: linear and affine. We observe a noisy signal which is partially demodulated (with a default labeling) and assume that the data are coded by a convolutional encoder. Thus we use the reconstruction of a code as a test and run through the classes which reveal a code structure. This classification improves the complexity of the search for small constellations (4-PSK and 8-PSK). In case of 16-QAM to 256-QAM constellations we apply the algorithm to Gray or quasi-Gray labelings. The algorithm does not give a unique result but it allows to find a small set of possible constellation labelings from noisy data.
|
498 |
Distance metric learning for image and webpage comparison / Apprentissage de distance pour la comparaison d'images et de pages WebLaw, Marc Teva 20 January 2015 (has links)
Cette thèse se focalise sur l'apprentissage de distance pour la comparaison d'images ou de pages Web. Les distances (ou métriques) sont exploitées dans divers contextes de l'apprentissage automatique et de la vision artificielle tels que la recherche des k plus proches voisins, le partitionnement, les machines à vecteurs de support, la recherche d'information/images, la visualisation etc. Nous nous intéressons dans cette thèse à l'apprentissage de fonction de distance paramétrée par une matrice symétrique semi-définie positive. Ce modèle, appelé (par abus) apprentissage de distance de Mahalanobis, consiste à apprendre une transformation linéaire des données telle que la distance euclidienne dans l'espace projeté appris satisfasse les contraintes d'apprentissage.Premièrement, nous proposons une méthode basée sur la comparaison de distances relatives qui prend en compte des relations riches entre les données, et exploite des similarités entre quadruplets d'exemples. Nous appliquons cette méthode aux attributs relatifs et à la classification hiérarchique d'images.Deuxièmement, nous proposons une nouvelle méthode de régularisation qui permet de contrôler le rang de la matrice apprise, limitant ainsi le nombre de paramètres indépendants appris et le sur-apprentissage. Nous montrons l'intérêt de notre méthode sur des bases synthétiques et réelles d'identification de visage.Enfin, nous proposons une nouvelle méthode de détection automatique de changement dans les pages Web, dans un contexte d'archivage. Pour cela, nous utilisons les relations de distance temporelle entre différentes versions d'une même page Web. La métrique apprise de façon entièrement non supervisée détecte les régions d'intérêt de la page et ignore le contenu non informatif tel que les menus et publicités. Nous montrons l'intérêt de la méthode sur différents sites Web. / This thesis focuses on distance metric learning for image and webpage comparison. Distance metrics are used in many machine learning and computer vision contexts such as k-nearest neighbors classification, clustering, support vector machine, information/image retrieval, visualization etc. In this thesis, we focus on Mahalanobis-like distance metric learning where the learned model is parametered by a symmetric positive semidefinite matrix. It learns a linear tranformation such that the Euclidean distance in the induced projected space satisfies learning constraints.First, we propose a method based on comparison between relative distances that takes rich relations between data into account, and exploits similarities between quadruplets of examples. We apply this method on relative attributes and hierarchical image classification. Second, we propose a new regularization method that controls the rank of the learned matrix, limiting the number of independent parameters and overfitting. We show the interest of our method on synthetic and real-world recognition datasets. Eventually, we propose a novel Webpage change detection framework in a context of archiving. For this purpose, we use temporal distance relations between different versions of a same Webpage. The metric learned in a totally unsupervised way detects important regions and ignores unimportant content such as menus and advertisements. We show the interest of our method on different Websites.
|
499 |
Non-rigid correspondences between surfaces embedded in 3D / Correspondances non-rigides entre surfaces plongées en 3DNogneng, Dorian 21 December 2018 (has links)
La manipulation et le traitement d'énormes quantités de données en 3D est devenu un défi ayant d'innombrables applications, telles que la conception assistée par ordinateur, le calcul biomédical, les jeux interactifs, la perception des machines, la robotique, etc. Le traitement géométrique est un sujet de recherche à l'interface entre l'algorithmique, les mathématiques appliquées et l'informatique en lien avec les applications sus-mentionnées, qui existe depuis une cinquantaine d'années. C'est un domaine de recherche vaste qui inclut des sous-domaines. Le problème de correspondances de forme consiste à, étant donnée une paire de formes, trouver une "bonne" correspondance entre elles. Par exemple on peut vouloir que la correspondance préserve les distances géodésiques, ou des caractéristiques locales.Ce problème a attiré un intérêt croissant, en partie dû à ses nombreuses applications, par exemple en animation, interpolation de formes ou modélisation statistique de formes.Le cadre des correspondances fonctionnelles est un outil récent qui a dévoilé de nombreuses propriété utiles pour les correspondances de formes. Cette approche donne une représentation régulière et compacte du problème de correspondances entre formes, et la plupart des contraintes sur les correspondances fonctionnelles peuvent s'exprimer sous forme de contraintes linéaires ce qui permet une formulation du problème par moindres carrés. Dans cette thèse on se concentre sur le problème de correspondance de forme, spécifiquement en utilisant des correspondances fonctionnelles. Au Chapitre 1 on introduit les notions et notations de base qui seront utilisées le long de la thèse, liées aux surfaces continues ou discrètes, l'opérateur de Laplace-Beltrami, le problème de correspondance de forme non rigide, et le processus standard du calcul d'une correspondance fonctionnelle.Au Chapitre 2 on remarque que les correspondances fonctionnelles induites par des correspondances point à point doivent satisfaire des contraintes de préservation de produits point par point. On applique cette observation à des descripteurs de formes pour améliorer la formulation classique des contraintes sur les correspondances fonctionnelles. Cela mène à une approche qui permet d'extraire plus d'information des contraintes existantes et donne de meilleures correspondances, surtout lorsqu'il y a peu de descripteurs indépendants.Au Chapitre 3 on s'appuie sur la remarque précédente, mais cette fois dans le cas où on a déjà obtenu une correspondance fonctionnelle par une méthode existante. On remarque que la préservation du produit point par point peut aussi être utilisé pour étendre le domaine sur lequel la correspondance fonctionnelle peut transférer des fonctions. On montre que cela permet d'améliorer la précision du transfert de fonction.Au Chapitre 4 on étend l'approche proposée au Chapitre 3 en remarquant qu'au lieu d'utiliser le produit point par point de fonctions, la composition par n'importe quel opérateur fixé doit aussi être préservée. On utilise un réseau de neurones pour optimiser l'approximation d'une fonction donnée qu'on veut transférer, comme fonction point par point de fonctions d'une base précalculée, qu'on sait déjà transférer à l'aide de la correspondance fonctionnelle. Puis on décrit comment évaluer ce réseau de neurones entrainé sur l'image des fonctions de la base afin de construire l'image de la fonction que l'on souhaite transférer. On montre des résultats préliminaires qui suggèrent que cette méthode peut apporter des améliorations significatives au transfert de fonctions.Finalement, au Chapitre 5 on aborde les autres sujets étudiés lors de la thèse, qui n'ont aucun lien avec les correspondances non rigides. / Handling and processing the massive amount of 3D data has become a challenge with countless applications, such as computer-aided design, biomedical computing, interactive games, machine perception, robotics, etc. Geometry Processing is an area of research at the interface between algorithmics, applied mathematics and computer science related to the above applications, that exists since approximately 50 years. It is a large topic of research that includes sub-areas. The problem of shape correspondence (also known as "shape matching") consists in, given a pair of shapes, finding a "good" correspondence between them. For example we may want the correspondence to preserve geodesic distances, or local geometric features.This problem has received a growing interest, in part due to its wide applicability, for example in animation, shape morphing or statistical shape modeling.The functional map framework is a recent tool that has shown many useful properties for shape matching. This approach provides a smooth compact representation of correspondences between shapes, and most constraints over functional maps can be expressed as linear constraints, which allows a least squares formulation of the problem.In this thesis we focus on the problem of shape correspondence, specifically using functional maps. In Chapter 1 we introduce basic notions and notations that will be used throughout the thesis, related to continuous and discrete surfaces, the Laplace-Beltrami operator, the problem of non-rigid shape matching, and the standard functional map computation pipeline.In Chapter 2 we notice that functional maps that are induced by point-to-point maps should satisfy point-wise product preservation constraints. We apply this observation to shape descriptors in order to improve the previous classical constraints on functional maps. This leads to an approach that allows to extract more information from existing constraints and results in better correspondences, particularly when the number of independent descriptors is small.In Chapter 3 we build on the previous remark, but this time in the situation where we already have a functional map that was computed by an existing method. We notice that the point-wise product preservation can also be used to extend the domain over which the given functional map can transfer functions. We show that this allows to improve the accuracy of function transfer.In Chapter 4 we extend the approach proposed in Chapter 3 by noticing that instead of using point-wise function products, the point-wise composition by any fixed operator should also be preserved. We use a neural network that optimizes the approximation of a given function that we want to transfer, as a point-wise function of some basis functions that we already know how to transfer using a given functional map. We then describe how to apply this trained network to the image of the basis functions to construct the image of the function that we want to transfer. We show preliminary results that suggest that this method can lead to significant improvement for function transfer.Finally, in Chapter 5 we mention other topics studied during the thesis, that are unrelated to non-rigid shape matching.
|
500 |
Modelling and Recognition of Human Activities of Daily Living in a Smart Home / Modélisation et reconnaissance des habitudes de vie d’un habitant dans un habitat intelligent / Modellizzazione e riconoscimento delle abitudini di un abitante in una casa intelligenteViard, Kévin 13 July 2018 (has links)
La plupart des travaux réalisés dans le domaine de l'assistance à l'autonomie à domicile (AAL) reposent sur l'utilisation de capteurs visuels et audio tels que des caméras. Or, ces capteurs sont souvent rejetés par le patient à cause de leur caractère invasif. Des approches alternatives requièrent l'utilisation de capteurs embarqués sur la personne (GPS, bracelets électroniques ou puces RFID dans les vêtements...), et leur pertinence est donc ramenée à l'hypothèse que les personnes les portent effectivement, sans jamais les rejeter ni les oublier. Pour ces raisons, dans cette thèse, nous trouvons plus pertinentes les approches uniquement basées sur l'utilisation de capteurs binaires intégrés dans l'habitat, tels que les détecteurs de mouvements, les tapis sensitifs ou les barrières optiques. Dans un tel contexte technologique, il devient intéressant d'utiliser les paradigmes, les modèles et les outils des systèmes à événement Discrets (SED), initialement plutôt développés pour la modélisation, l'analyse et la commande des systèmes industriels complexes. Dans ces travaux de thèse, l'objectif est de construire une approche pour la modélisation et le suivi des habitudes de vie, basée sur les modèles et les paradigmes des SED et répondant à une problématique qui s'énonce de la manière suivante : L'objectif est de développer un cadre global pour découvrir et reconnaître les activités de la vie quotidienne d'un habitant vivant seul dans une maison intelligente. Cette maison intelligente doit être équipée uniquement de capteurs binaires, l'étiquetage par des experts des activités observées ne doit pas être nécessaire et les activités peuvent être représentées par des modèles probabilistes. La première méthode présentée dans cette thèse permet, à partir d'une base de données d'apprentissage et d'une description experte des activités à modéliser listées par des médecins, de construire pour chaque activité un modèle sous la forme d'un automate à état-fini probabiliste (PFA). La seconde méthode développée lors de cette thèse permet d'estimer en temps réel, à partir des seules données observées par les capteurs ambiants, quelle activité la personne observée réalise effectivement. Les méthodes décrites dans cette thèse sont illustrées en utilisant les données générées localement via l'utilisation d'un appartement prêté par ENS Paris-Saclay équipé pour répondre aux besoins expérimentaux de cette thèse. / Most of the work done in the field of ambient assisted living (AAL) is based on the use of visual and audio sensors such as cameras. However, these sensors are often rejected by the patient because of their invasiveness. Alternative approaches require the use of sensors embedded on the person (GPS, electronic wristbands or RFID chips in clothing ...), and their relevance is therefore reduced to the assumption that people actually wear them, without rejecting nor forgetting them. For these reasons, in this thesis, we find more relevant the approaches based on the use of binary sensors integrated into the habitat only, such as motion detectors, sensory mats or optical barriers. In such a technological context, it becomes interesting to use paradigms, models and tools of Discrete Event Systems (DES), initially developed for modeling, analysis and control of complex industrial systems. In this thesis work, the goal is to build an activity of daily living modeling and monitoring approach, based on the models and the paradigm of the DES and answering a problem that is expressed as follows:The objective is to develop a global framework to discover and recognise activities of daily living of an inhabitant living alone in a smart home. This smart home have to be equipped with binary sensors only, expert labeling of activities should not be needed and activities can be represented by probabilistic models. The first method presented in this thesis allows to build a probabilistic finite-state automata (PFA) from a learning database and an expert description of the activities to be modeled given by the medical staff. The second method developed during this thesis estimates, according to the observations, the activity performed by the monitored inhabitant. The methods described in this thesis are applied on data generated using an apartment lent by ENS Paris-Saclay and equipped according the experimental needs of this thesis. / La maggior parte dei lavori nel settore dell’Ambient Assisted Living (AAL) si basasull’uso di sensori visivi e audio come le telecamere. Tuttavia, questi sensori sonospesso rifiutati dal paziente a causa della loro natura invasiva. Gli approcci alternativi richiedono l’uso di sensori integrati nella persona (GPS, bracciali elettronici o chipRFID...), e la loro rilevanza è quindi ridotta all’ipotesi che le persone li indossino effettivamente, senza mai rifiutarli o dimenticarli.Per questi motivi, in questa tesi, troviamo approcci più rilevanti basati esclusivamente sull’uso di sensori binari integrati nell’habitat, come rilevatori di movimento,tappeti sensoriali o barriere fotoelettriche.In tale contesto tecnologico, diventa interessante utilizzare i paradigmi, i modelli egli strumenti dei sistemi ad eventi discreti (SED), inizialmente sviluppati per la modellazione, l’analisi e il controllo di sistemi industriali complessi.In questo lavoro di tesi, l’obiettivo è quello di presentare un metodo per la modellazione e il monitoraggio delle abitudini di vita, basato sui modelli e paradigmi di SEDe rispondendo ad un problema che si esprime come segue : L’obiettivo è quello di sviluppare un quadro globale per rivelare e riconoscere le attività della vita quotidiana di una persona che abita da sola in una smart home chedovrebbe essere dotata solo di sensori binari. Inoltre si suppone che non sia necessarial’etichettatura delle attività osservate da parte di un esperto e tali attività sono rappresentate da modelli probabilistici.Il primo metodo presentato in questa tesi permette di costruire un modello probabilistico di automa a stati finiti (PFA) ottenuto da un database di apprendimento e unadescrizione delle attività da parte di medici. Il secondo metodo sviluppato in questa tesi stima, alla luce delle osservazioni, qualeattività svolge la persona osservata. I metodi descritti sono illustrati utilizzando dati generati localmente attraverso l’usodi un appartamento messo a disposizione da ENS Paris-Saclay e attrezzato per soddisfarele esigenze sperimentali di questa tesi.
|
Page generated in 0.0375 seconds