Global ETD Search

391	Induction de lexiques bilingues à partir de corpus comparables et parallèles Jakubina, Laurent 07 1900 (has links) No description available. corpus parallèle corpus comparable alignement embedding représentation de mots reclassement supervisé induction lexique bilingue Parallel corpus Comparable corpus Alignment Bilingual lexicons induction Word representation Supervised reclassification
392	Pratiques d'enseignement de l'orthographe lexicale : le cas des propriétés visuelles Bruneau, Marie-Josée 08 1900 (has links) No description available. Orthographe lexicale Approches éducatives Dispositifs d'enseignement Spelling Pedagological approaches Teaching devices
393	Immobilisation de courte durée d'un membre et Imagerie motrice / Short-term limb Immobilization and Motor imagery Meugnot, Aurore 25 June 2014 (has links) Ce travail de thèse visait à étudier les effets de l'immobilisation de courte durée d'un membre sur les processus cognitifs impliqués dans la planification et le contrôle des mouvements. Précisément, nous avons examiné l'impact d'une immobilisation de courte durée du membre supérieur (main droite ou gauche) sur la représentation mentale des actions de ce membre. Pour cela, nous avons eu recours à une tâche d'imagerie motrice implicite (rotation mentale de stimuli corporels), en partant du principe qu'un ensemble de processus cognitifs similaires sont sollicités que l'action soit réellement ou simplement simulée. Nos résultats indiquent que l'inactivité physique modifie le fonctionnement des processus cognitifs permettant la réalisation et l'optimisation des actions. L'immobilisation de courte durée du membre supérieur altère la capacité des sujets à se représenter mentalement des actions. L'effet de ces perturbations (changement de stratégie d'imagerie, transfert inter-membre…) peut varier d'un individu à l'autre, ainsi qu'en fonction des contraintes de la tâche d'imagerie implicite et de la durée de l'immobilisation. Un second objectif visait à examiner le potentiel de l'imagerie motrice explicite pour réactiver le système sensorimoteur suite à la période d'immobilisation de la main. Nous montrons qu'une pratique mentale en imagerie motrice kinesthésique pendant la période d'immobilisation permet de contrecarrer les perturbations fonctionnelles induite par la restriction d'exercice. / The present thesis focused on the effects of short-term limb immobilization on the cognitive level of action control. Especially, we examined the influence of short-term upper-limb immobilization (right or left-hand) on the mental representation of action. To this aim, an implicit motor imagery task (mental rotation of body-stimuli) was used, assuming similar processes between motor simulation and motor execution. Results showed that physical inactivity affects the cognitive processing of action. Short-term upper-limb immobilization impaired the ability to mentally represent action. The immobilization-induced effects (switch from a motor to a visual imagery strategy, inte-limb transfer…) may vary from one individual to another, and may depend on the constraints of the implicit imagery task or with the period of immobilization (24h vs. 48h). A second aim of this thesis was to examine the potential of explicit motor imagery to reactivate the sensorimotor system after the period of sensorimotor restriction. We showed that kinesthetic imagery practice during the period of immobilization can counteract the functional impairment induced by sensorimotor restriction. Imagerie motrice Représentations sensorimotrices Processus cognitivo-Moteurs Pratique mentale en imagerie motrice Short-Term limb immobillization Motor imagery Sensorimotor representations Cognitivo-Motor processes Motor imagery practice 796 610 150
394	Recherche multi-descripteurs dans les fonds photographiques numérisés / Multi-descriptor retrieval in digitalized photographs collections Bhowmik, Neelanjan 07 November 2017 (has links) La recherche d’images par contenu (CBIR) est une discipline de l’informatique qui vise à structurer automatiquement les collections d’images selon des critères visuels. Les fonctionnalités proposées couvrent notamment l’accès efficace aux images dans une grande base de données d’images ou l’identification de leur contenu par des outils de détection et de reconnaissance d’objets. Ils ont un impact sur une large gamme de domaines qui manipulent ce genre de données, telles que le multimedia, la culture, la sécurité, la santé, la recherche scientifique, etc.Indexer une image à partir de son contenu visuel nécessite d’abord de produire un résumé visuel de ce contenu pour un usage donné, qui sera l’index de cette image dans la collection. En matière de descripteurs d’images, la littérature est désormais trés riche: plusieurs familles de descripteurs existent, et dans chaque famille de nombreuses approches cohabitent. Bon nombre de descripteurs ne décrivant pas la même information et n’ayant pas les mêmes propriétés d’invariance, il peut être pertinent de les combiner de manière à mieux décrire le contenu de l’image. Cette combinaison peut être mise en oeuvre de différentes manières, selon les descripteurs considérés et le but recherché. Dans cette thése, nous nous concentrons sur la famille des descripteurs locaux, avec pour application la recherche d’images ou d’objets par l’exemple dans une collection d’images. Leurs bonnes propriétés les rendent très populaires pour la recherche, la reconnaissance et la catégorisation d'objets et de scènes. Deux directions de recherche sont étudiées:Combinaison de caractéristiques pour la recherche d’images par l’exemple: Le coeur de la thèse repose sur la proposition d’un modèle pour combiner des descripteurs de bas niveau et génériques afin d’obtenir un descripteur plus riche et adapté à un cas d’utilisation donné tout en conservant la généricité afin d’indexer différents types de contenus visuels. L’application considérée étant la recherche par l’exemple, une autre difficulté majeure est la complexité de la proposition, qui doit correspondre à des temps de récupération réduits, même avec de grands ensembles de données. Pour atteindre ces objectifs, nous proposons une approche basée sur la fusion d'index inversés, ce qui permet de mieux représenter le contenu tout en étant associé à une méthode d’accès efficace.Complémentarité des descripteurs: Nous nous concentrons sur l’évaluation de la complémentarité des descripteurs locaux existant en proposant des critères statistiques d’analyse de leur répartition spatiale dans l'image. Ce travail permet de mettre en évidence une synergie entre certaines de ces techniques lorsqu’elles sont jugées suffisamment complémentaires. Les critères spatiaux sont exploités dans un modèle de prédiction à base de régression linéaire, qui a l'avantage de permettre la sélection de combinaisons de descripteurs optimale pour la base considérée mais surtout pour chaque image de cette base. L'approche est évaluée avec le moteur de recherche multi-index, où il montre sa pertinence et met aussi en lumière le fait que la combinaison optimale de descripteurs peut varier d'une image à l'autre.En outre, nous exploitons les deux propositions précédentes pour traiter le problème de la recherche d'images inter-domaines, correspondant notamment à des vues multi-source et multi-date. Deux applications sont explorées dans cette thèse. La recherche d’images inter-domaines est appliquée aux collections photographiques culturelles numérisées d’un musée, où elle démontre son efficacité pour l’exploration et la valorisation de ces contenus à différents niveaux, depuis leur archivage jusqu’à leur exposition ou ex situ. Ensuite, nous explorons l’application de la localisation basée image entre domaines, où la pose d’une image est estimée à partir d’images géoréférencées, en retrouvant des images géolocalisées visuellement similaires à la requête / Content-Based Image Retrieval (CBIR) is a discipline of Computer Science which aims at automatically structuring image collections according to some visual criteria. The offered functionalities include the efficient access to images in a large database of images, or the identification of their content through object detection and recognition tools. They impact a large range of fields which manipulate this kind of data, such as multimedia, culture, security, health, scientific research, etc.To index an image from its visual content first requires producing a visual summary of this content for a given use, which will be the index of this image in the database. From now on, the literature on image descriptors is very rich; several families of descriptors exist and in each family, a lot of approaches live together. Many descriptors do not describe the same information and do not have the same properties. Therefore it is relevant to combine some of them to better describe the image content. The combination can be implemented differently according to the involved descriptors and to the application. In this thesis, we focus on the family of local descriptors, with application to image and object retrieval by example in a collection of images. Their nice properties make them very popular for retrieval, recognition and categorization of objects and scenes. Two directions of research are investigated:Feature combination applied to query-by-example image retrieval: the core of the thesis rests on the proposal of a model for combining low-level and generic descriptors in order to obtain a descriptor richer and adapted to a given use case while maintaining genericity in order to be able to index different types of visual contents. The considered application being query-by-example, another major difficulty is the complexity of the proposal, which has to meet with reduced retrieval times, even with large datasets. To meet these goals, we propose an approach based on the fusion of inverted indices, which allows to represent the content better while being associated with an efficient access method.Complementarity of the descriptors: We focus on the evaluation of the complementarity of existing local descriptors by proposing statistical criteria of analysis of their spatial distribution. This work allows highlighting a synergy between some of these techniques when judged sufficiently complementary. The spatial criteria are employed within a regression-based prediction model which has the advantage of selecting the suitable feature combinations globally for a dataset but most importantly for each image. The approach is evaluated within the fusion of inverted indices search engine, where it shows its relevance and also highlights that the optimal combination of features may vary from an image to another.Additionally, we exploit the previous two proposals to address the problem of cross-domain image retrieval, where the images are matched across different domains, including multi-source and multi-date contents. Two applications of cross-domain matching are explored. First, cross-domain image retrieval is applied to the digitized cultural photographic collections of a museum, where it demonstrates its effectiveness for the exploration and promotion of these contents at different levels from their archiving up to their exhibition in or ex-situ. Second, we explore the application of cross-domain image localization, where the pose of a landmark is estimated by retrieving visually similar geo-referenced images to the query images Recherche d’image par contenu Combinaison de caractéristiques Sac de mots Index inversé Complémentarité spatiale Recherche d’images inter-Domaines Content-Based image retrieval Feature combination Bag-Of-Features Inverted index Spatial complementarity Cross-Domain image retrieval
395	Indexation de bases d'images : évaluation de l'impact émotionnel / Image databases indexing : emotional impact assessing Gbehounou, Syntyche 21 November 2014 (has links) L'objectif de ce travail est de proposer une solution de reconnaissance de l'impact émotionnel des images en se basant sur les techniques utilisées en recherche d'images par le contenu. Nous partons des résultats intéressants de cette architecture pour la tester sur une tâche plus complexe. La tâche consiste à classifier les images en fonction de leurs émotions que nous avons définies "Négative", "Neutre" et "Positive". Les émotions sont liées aussi bien au contenu des images, qu'à notre vécu. On ne pourrait donc pas proposer un système de reconnaissance des émotions performant universel. Nous ne sommes pas sensible aux mêmes choses toute notre vie : certaines différences apparaissent avec l'âge et aussi en fonction du genre. Nous essaierons de nous affranchir de ces inconstances en ayant une évaluation des bases d'images la plus hétérogène possible. Notre première contribution va dans ce sens : nous proposons une base de 350 images très largement évaluée. Durant nos travaux, nous avons étudié l'apport de la saillance visuelle aussi bien pendant les expérimentations subjectives que pendant la classification des images. Les descripteurs, que nous avons choisis, ont été évalués dans leur majorité sur une base consacrée à la recherche d'images par le contenu afin de ne sélectionner que les plus pertinents. Notre approche qui tire les avantages d'une architecture bien codifiée, conduit à des résultats très intéressants aussi bien sur la base que nous avons construite que sur la base IAPS, qui sert de référence dans l'analyse de l'impact émotionnel des images. / The goal of this work is to propose an efficient approach for emotional impact recognition based on CBIR techniques (descriptors, image representation). The main idea relies in classifying images according to their emotion which can be "Negative", "Neutral" or "Positive". Emotion is related to the image content and also to the personnal feelings. To achieve our goal we firstly need a correct assessed image database. Our first contribution is about this aspect. We proposed a set of 350 diversifed images rated by people around the world. Added to our choice to use CBIR methods, we studied the impact of visual saliency for the subjective evaluations and interest region segmentation for classification. The results are really interesting and prove that the CBIR methods are usefull for emotion recognition. The chosen desciptors are complementary and their performance are consistent on the database we have built and on IAPS, reference database for the analysis of the image emotional impact. Recherche d'images par le contenu Sac de mots visuels Impact émotionnel des images Saillance visuelle Évaluations subjectives Content based image retrieval Bag of visual words Image emotional impact Visual saliency Subjective evaluations 006.6
396	La reconnaissance visuelle des mots chez le dyslexique : implication des voies ventrale et dorsale / Visual word recognition in dyslexia : implication of ventral and dorsal pathways Mahé, Gwendoline 04 July 2013 (has links) L’objectif de ces travaux a été d’étudier, à partir des potentiels évoqués, l’implication des voies ventrale (qui sous-tend le traitement expert de l’écrit) et dorsale (qui sous-tend des processus phonologiques et attentionnels) lors de la reconnaissance visuelle des mots chez des adultes dyslexiques. Les spécificités des sujets dyslexiques ont été isolées en les comparant à deux groupes contrôles, appariés sur : l’âge (i.e., des lecteurs experts) et sur le niveau de lecture (i.e., des mauvais lecteurs). Les résultats montrent des déficits du traitement expert de l’écrit, phonologiques et de la détection du conflit spécifiques aux sujets dyslexiques. Nos données montrent aussi des déficits du traitement expert des mots familiers et d’orientation de l’attention communs aux sujets dyslexiques et mauvais lecteurs. Les résultats sont discutés dans le cadre du modèle LCD, de la théorie du mapping phonologique et d’une implication précoce de l’orientation attentionnelle dans la lecture. / The aim of this project was to examine with event related potentials ventral (involved in expertise for print) and dorsal (involved in phonological and attentional processes) pathways implication in visual word recognition in dyslexic adults. The specificity of dyslexics was determined by comparing them to age-matched controls (i.e., expert readers) and reading-level matched controls (i.e., poor readers). Results showed impaired expertise for print, decoding abilities and conflict detection which were specific to dyslexics. Our data also revealed impaired expertise for familiar words and attention orienting in both dyslexics and poor readers. Results are discussed in the context of the LCD model, the phonological mapping theory and an early involvement of attention orienting in reading. Reconnaissance visuelle des mots Dyslexie développementale Voie ventrale Voie dorsale Expertise de l’écrit Attention visuo-spatiale Décodage phonologique Potentiels évoqués Visual word recognition Developmental dyslexia Ventral stream Dorsal stream Expertise for print Visuo-spatial attention Phonological decoding Event related potentials 616.855
397	Traçage de contenu vidéo : une méthode robuste à l’enregistrement en salle de cinéma / Towards camcorder recording robust video fingerprinting Garboan, Adriana 13 December 2012 (has links) Composantes sine qua non des contenus multimédias distribués et/ou partagés via un réseau, les techniques de fingerprinting permettent d'identifier tout contenu numérique à l'aide d'une signature (empreinte) de taille réduite, calculée à partir des données d'origine. Cette signature doit être invariante aux transformations du contenu. Pour des vidéos, cela renvoie aussi bien à du filtrage, de la compression, des opérations géométriques (rotation, sélection de sous-région… ) qu'à du sous-échantillonnage spatio-temporel. Dans la pratique, c'est l'enregistrement par caméscope directement dans une salle de projection qui combine de façon non linéaire toutes les transformations pré-citées.Par rapport à l'état de l'art, sous contrainte de robustesse à l'enregistrement en salle de cinéma, trois verrous scientifiques restent à lever : (1) unicité des signatures, (2) appariement mathématique des signatures, (3) scalabilité de la recherche au regard de la dimension de la base de données.La principale contribution de cette thèse est de spécifier, concevoir, implanter et valider TrackART, une nouvelle méthode de traçage des contenus vidéo relevant ces trois défis dans un contexte de traçage de contenus cinématographiques.L'unicité de la signature est obtenue par sélection d'un sous-ensemble de coefficients d'ondelettes, selon un critère statistique de leurs propriétés. La robustesse des signatures aux distorsions lors de l'appariement est garantie par l'introduction d'un test statistique Rho de corrélation. Enfin, la méthode développée est scalable : l'algorithme de localisation met en œuvre une représentation auto-adaptative par sac de mots visuels. TrackART comporte également un mécanisme de synchronisation supplémentaire, capable de corriger automatiquement le jitter introduit par les attaques de désynchronisation variables en temps.La méthode TrackART a été validée dans le cadre d'un partenariat industriel, avec les principaux professionnels de l'industrie cinématographique et avec le concours de la Commission Technique Supérieure de l'Image et du Son. La base de données de référence est constituée de 14 heures de contenu vidéo. La base de données requête correspond à 25 heures de contenu vidéo attaqué, obtenues en appliquant neuf types de distorsion sur le tiers des vidéo de la base de référence.Les performances de la méthode TrackART ont été mesurées objectivement dans un contexte d'enregistrement en salle : la probabilité de fausse alarme est inférieure à 16*10^-6, la probabilité de perte inférieure à 0,041, la précision et le rappel sont égal à 93%. Ces valeurs représentent une avancée par rapport à l'état de l'art qui n'exhibe aucune méthode de traçage robuste à l'enregistrement en salle et valident une première preuve de concept de la méthodologie statistique développée. / Sine qua non component of multimedia content distribution on the Internet, video fingerprinting techniques allow the identification of content based on digital signatures(fingerprints) computed from the content itself. The signatures have to be invariant to content transformations like filtering, compression, geometric modifications, and spatial-temporal sub-sampling/cropping. In practice, all these transformations are non-linearly combined by the live camcorder recording use case.The state-of-the-art limitations for video fingerprinting can be identified at three levels: (1) the uniqueness of the fingerprint is solely dealt with by heuristic procedures; (2) the fingerprinting matching is not constructed on a mathematical ground, thus resulting in lack of robustness to live camcorder recording distortions; (3) very few, if any, full scalable mono-modal methods exist.The main contribution of the present thesis is to specify, design, implement and validate a new video fingerprinting method, TrackART, able to overcome these limitations. In order to ensure a unique and mathematical representation of the video content, the fingerprint is represented by a set of wavelet coefficients. In order to grant the fingerprints robustness to the mundane or malicious distortions which appear practical use-cases, the fingerprint matching is based on a repeated Rho test on correlation. In order to make the method efficient in the case of large scale databases, a localization algorithm based on a bag of visual words representation (Sivic and Zisserman, 2003) is employed. An additional synchronization mechanism able to address the time-variants distortions induced by live camcorder recording was also designed.The TrackART method was validated in industrial partnership with professional players in cinematography special effects (Mikros Image) and with the French Cinematography Authority (CST - Commision Supérieure Technique de l'Image et du Son). The reference video database consists of 14 hours of video content. The query dataset consists in 25 hours of replica content obtained by applying nine types of distortions on a third of the reference video content. The performances of the TrackART method have been objectively assessed in the context of live camcorder recording: the probability of false alarm lower than 16 10-6, the probability of missed detection lower than 0.041, precision and recall equal to 0.93. These results represent an advancement compared to the state of the art which does not exhibit any video fingerprinting method robust to live camcorder recording and validate a first proof of concept for the developed statistical methodology. Signature numérique Coefficients des ondelettes Test statistique Rho sur la correlation Sac de mots visuels Validation industrielle Digital fingerprint Wavelet coefficients Statistical Rho test on correlation Bag of visual words Live camcorder recording in cinema Industrial validation
398	ÉVALUATION ET AMÉLIORATION DES CAPACITÉS MOTRICES D'ENFANTS INFIRMES MOTEURS CÉRÉBRAUX CONGOLAIS ÂGES DE 6 Â 15 ANS M'Lembakani T'Hengua, Félicien 24 January 2018 (has links) Evaluation et amélioration des capacités motrices d’enfants infirmes moteurs cérébraux congolais âgés de 6 à 15 ansTHESE de Félicien M’LEMBAKANI T’HENGUA (Lic. Agr. Ed. Phys.)Laboratoire de Neurophysiologie et de Biomécanique du Mouvement. Faculté des Sciences de la MotricitéUNIVERSITE LIBRE DE BRUXELLES (U. L. B.)RESUMEAu cours de ce travail nous avons mesuré les capacités psychomotrices potentielles chez des enfants IMC congolais à Kinshasa dans deux Centre de Rééducation (CRHP et CREBD) et dans le Complexe Scolaire du Mont Amba (UNIKIN) en vue de proposer des programmes adaptés de prise en charge pour améliorer leurs capacités et aptitudes motrices et comportementales. Ceci dans le but aussi d’améliorer leur intégration scolaire et ainsi parvenir à une meilleure immersion familiale et sociétale. Proposer des solutions en ces matières permettrait de faire face à la situation actuelle et ensuite de proposer des solutions relatives aux deux problèmes majeurs des enfants IMC en RDC :- (1) les déficiences motrices dues à des lésions cérébrales irréversibles, - (2) les mépris, totales exclusions, rejet et abandons dont ces enfants sont continuellement victimes de la part des familles et de la société congolaise. Pour parvenir à ces objectifs, nous avons d’abord testés à l’aide de l’échelle de développement psychomoteur de Lincoln-Oseretsky (LOMDS) 160 garçons et filles choisis de façon aléatoire parmi une population de 640 enfants dont 80 IMCs et 80 contrôles. Pour la suite de l’étude et afin d’évaluer les effets d’un entraînement de 9 mois aux activités physiques adaptées (APA), ces deux groupes ont été scindés chacun en deux sous-groupes de 40 sujets, un groupe participant à l’entraînement APA et l’autre servant de contrôle. Avant l’expérimentation APA, un important déficit moteur et psychologique a été mis en évidence chez les 80 enfants IMC par rapport aux 80 enfants contrôles du même âge. Nous n’avons pas observé de différence significative entre les genres. Nos résultats par rapport à la pratique régulière des APA sont importants :les enfants IMC et ainsi que les contrôles qui ont suivi les APA ont nettement amélioré leurs performances finales. Ceci signifie clairement que les aptitudes physiques, et cognitives de ces enfants ont été nettement améliorées. De plus, nous avons démontré, avant les APA, l’absence de relation entre l’âge des enfants IMC et le score au test LOMDS, alors que cette relation existe bien chez les enfants contrôles. De façon inattendue, après les 9 mois d’entraînement cette relation entre l’âge des enfants IMC et le score a pu être démontrée. A l’opposé de ces résultats positifs les scores au sein des groupes n’ayant pas participé aux APA n’ont pas évolués durant cette période de 9 mois. En conclusion, cette thèse démontre qu’un entraînement par les APA des enfants IMC conduit à une amélioration significative de leur aptitude motrice et cognitive. Ces résultats balaient toutes les opinions mystico-religieuses en cours en RDC selon lesquelles les enfants IMC congolais seraient inaptes à tout effort mental, à l’apprentissage et donc à une insertion familiale et sociale / Doctorat en Sciences de la motricité / info:eu-repo/semantics/nonPublished Kinésithérapie réadaptation Education physique Ergothérapie Neurologie du développement Neuropathologie Pathologies particulières Physiothérapie Mots-clés Amélioration Activités physiques adaptées (APA) Ataxie Athétose Capacités motrices Évaluation Handicap Infirmité motrice cérébrale (IMC) Paralysie cérébrale Paralysie spastique « Konzo » Spasticité
399	On the use of a discriminant approach for handwritten word recognition based on bi-character models / Vers une approche discriminante pour la reconnaissance de mots manuscrits en-ligne utilisant des modèles de bi-caractères Prum, Sophea 08 November 2013 (has links) Avec l’avènement des dispositifs nomades tels que les smartphones et les tablettes, la reconnaissance automatique de l’écriture manuscrite cursive à partir d’un signal en ligne est devenue durant les dernières décennies un besoin réel de la vie quotidienne à l’ère numérique. Dans le cadre de cette thèse, nous proposons de nouvelles stratégies pour un système de reconnaissance de mots manuscrits en-ligne. Ce système se base sur une méthode collaborative segmentation/reconnaissance et en utilisant des analyses à deux niveaux : caractère et bi-caractères. Plus précisément, notre système repose sur une segmentation de mots manuscrits en graphèmes afin de créer un treillis à L niveaux. Chaque noeud de ce treillis est considéré comme un caractère potentiel envoyé à un moteur de Reconnaissance de Caractères Isolés (RCI) basé sur un SVM. Pour chaque noeud, ce dernier renvoie une liste de caractères associés à une liste d’estimations de probabilités de reconnaissance. Du fait de la grande diversité des informations résultant de la segmentation en graphèmes, en particulier à cause de la présence de morceaux de caractères et de ligatures, l’injection de chacun des noeuds du treillis dans le RCI engendre de potentielles ambiguïtés au niveau du caractère. Nous proposons de lever ces ambiguïtés en utilisant des modèles de bi-caractères, basés sur une régression logistique dont l’objectif est de vérifier la cohérence des informations à un niveau de reconnaissance plus élevé. Finalement, les résultats renvoyés par le RCI et l’analyse des modèles de bi-caractères sont utilisés dans la phase de décodage pour parcourir le treillis dans le but de trouver le chemin optimal associé à chaque mot dans le lexique. Deux méthodes de décodage sont proposées (recherche heuristique et programmation dynamique), la plus efficace étant basée sur de la programmation dynamique. / With the advent of mobile devices such as tablets and smartphones over the last decades, on-line handwriting recognition has become a very highly demanded service for daily life activities and professional applications. This thesis presents a new approach for on-line handwriting recognition. This approach is based on explicit segmentation/recognition integrated in a two level analysis system: character and bi-character. More specifically, our system segments a handwritten word in a sequence of graphemes to be then used to create a L-levels lattice of graphemes. Each node of the lattice is considered as a character to be submitted to a SVM based Isolated Character Recognizer (ICR). The ICR returns a list of potential character candidates, each of which is associated with an estimated recognition probability. However, each node of the lattice is a combination of various segmented graphemes. As a consequence, a node may contain some ambiguous information that cannot be handled by the ICR at character level analysis. We propose to solve this problem using "bi-character" models based on Logistic Regression, in order to verify the consistency of the information at a higher level of analysis. Finally, the recognition results provided by the ICR and the bi-character models are used in the word decoding stage, whose role is to find the optimal path in the lattice associated to each word in the lexicon. Two methods are presented for word decoding (heuristic search and dynamic programming), and dynamic programming is found to be the most effective. Modèle de bi-caractères Programmation dynamique Séparateurs à vaste marge On-line handwriting recognition Bi-character models Dynamic programming Support vector machine Combining on-line and Off-line Features
400	Vers un système omni-langage de recherche de mots dans des bases de documents écrits homogènes / Towards an omni-language word retrieval system applied in homogeneous document collections Bui, Quang Anh 28 September 2015 (has links) Notre thèse a pour objectif la construction d’un système omni-langage de recherche de mots dans les documents numérisés. Nous nous plaçons dans le contexte où le contenu du document est homogène (ce qui est le cas pour les documents anciens où l’écriture est souvent bien soignée et mono-scripteur) et la connaissance préalable du document (le langage, le scripteur, le type d’écriture, le tampon, etc.) n’est pas connue. Grâce à ce système, l'utilisateur peut composer librement et intuitivement sa requête et il peut rechercher des mots dans des documents homogènes de n’importe quel langage, sans détecter préalablement une occurrence du mot à rechercher. Le point clé du système que nous proposons est les invariants, qui sont les formes les plus fréquentes dans la collection de documents. Pour le requêtage, l’utilisateur pourra créer le mot à rechercher en utilisant les invariants (la composition des requêtes), grâce à une interface visuelle. Pour la recherche des mots, les invariants peuvent servir à construire des signatures structurelles pour représenter les images de mots. Nous présentons dans cette thèse la méthode pour extraire automatiquement les invariants à partir de la collection de documents, la méthode pour évaluer la qualité des invariants ainsi que les applications des invariants à la recherche de mots et à la composition des requêtes. / The objective of our thesis is to build an omni-language word retrieval system for scanned documents. We place ourselves in the context where the content of documents is homogenous and the prior knowledge about the document (the language, the writer, the writing style, etc.) is not known. Due to this system, user can freely and intuitively compose his/her query. With the query created by the user, he/she can retrieve words in homogenous documents of any language, without finding an occurrence of the word to search. The key of our proposed system is the invariants, which are writing pieces that frequently appeared in the collection of documents. The invariants can be used in query making process in which the user selects and composes appropriate invariants to make the query. They can be also used as structural descriptor to characterize word images in the retrieval process. We introduce in this thesis our method for automatically extracting invariants from document collection, our evaluation method for evaluating the quality of invariants and invariant’s applications in the query making process as well as in the retrieval process. Système de recherche de mots Composition des requêtes Extraction de strokes Invariants Représentation basée sur graphe Distance d’édition de graphes Word retrieval system Request composition Stroke extraction Invariants Graph-based representation Graph edit distance

Search results