Global ETD Search

321	Modélisation non-supervisée de signaux sociaux / Unsupervised modelisation of social signals Michelet, Stéphane 10 March 2016 (has links) Le but de cette thèse est de proposer des méthodes d'étude et des modèles pour l'analyse des signaux sociaux dans un contexte d'interaction en exploitant à la fois des techniques issues du traitement du signal et de la reconnaissance des formes.Tout d'abord, une méthode non supervisée permettant de mesurer l'imitation entre deux partenaires en termes de délai et de degré est proposée en étudiant uniquement des données gestuelles. Dans un premier temps, des points d'intérêts spatio-temporels sont détectés afin de sélectionner les régions les plus importantes des vidéos. Ils sont ensuite décrits à l'aide d'histogrammes pour permettre la construction de modèles sac-de-mots dans lesquels l'information spatiale est réintroduite. Le degré d'imitation et le délai entre les partenaires sont alors estimés de manière continue grâce à une corrélation-croisée entre les deux modèles sac-de-mots.La deuxième partie de cette thèse porte sur l'extraction automatique d'indices permettant de caractériser des interactions de groupe. Après avoir regroupé tous les indices couramment employés dans la littérature, nous avons proposé l'utilisation d'une factorisation en matrice non négative. En plus d'extraire les indices les plus pertinents, celle-ci a permis de regrouper automatiquement et de manière non supervisée des meetings en 3 classes correspondant aux trois types de leadership tels que définis par les psychologues.Enfin, la dernière partie se focalise sur l'extraction non supervisée d'indices permettant de caractériser des groupes. La pertinence de ces indices, par rapport à des indices ad-hoc provenant de l'état de l'art, est ensuite validée dans une tâche de reconnaissance des rôles. / In a social interaction, we adapt our behavior to our interlocutors. Studying and understanding the underlying mecanisms of this adaptation is the center of Social Signal Processing. The goal of this thesis is to propose methods of study and models for the analysis of social signals in the context of interaction, by exploiting both social processing and pattern recognition techniques. First, an unsupervised method allowing the measurement of imitation between two partners in terms of delay and degree is proposed, only using gestual data. Spatio-temporal interest point are first detected in order to select the most important regions of videos. Then they are described by histograms in order to construct bag-of-words models in which spatial information is reintroduced. Imitation degree and delay between partners are estimated in a continuous way thanks to cross-correlation between the two bag-of-words models. The second part of this thesis focus on the automatic extraction of features permitting to characterizing group interactions. After regrouping all features commonly used in literature, we proposed the utilization of non-negative factorization. More than only extracting the most pertinent features, it also allowed to automatically regroup, and in an unsupervised manner, meetings in three classes corresponding to three types of leadership defined by psychologists. Finally, the last part focus on unsupervised extraction of features permitting to characterize groups. The relevance of these features, compared to ad-hoc features from state of the art, is then validated in a role recognition task. Apprentissage non supervisé Interaction Traitement du signal social Imitation Reconnaissance de rôles Extraction d'indices Sac-De-Mots Factorisation en matrices non-négatives Unsupervised learning Social signal processing Extraction of features 004
322	Représentations phonologiques dans la prononciation et l'identification des mots écrits alphabétiquement Peereman, Ronald January 1989 (has links) Doctorat en sciences psychologiques / info:eu-repo/semantics/nonPublished Psychologie Word recognition -- Experiments Mots, Reconnaissance des -- Expériences
323	Evaluation cognitive de la lecture chez le collégien : Elaboration d'un outil diagnostique / Cognitive assessment of reading in middle school students : Development of a diagnostic tool Pourcin, Laure 11 December 2014 (has links) Cette thèse est centrée sur l'évaluation des capacités de lecture et reliées à la lecture des collégiens normo-lecteurs français. Le premier objectif est d'identifier les capacités engagées dans la compréhension écrite. Dans les premiers grades (6 et 7), les capacités de compréhension écrite sont surtout expliquées par celles de compréhension orale, de conscience morphologique et de lecture de mots irréguliers, mais pas par la lecture de pseudomots, quelle que soit la mesure (précision ou temps). Ce dernier résultat se retrouve dans les grades supérieurs (8 et 9) dans lesquels la lecture de mots irréguliers n'a plus d'incidence sur la compréhension écrite. Le second objectif est d'élaborer un outil diagnostique des capacités de lecture, et des capacités reliées, chez les collégiens (6 à 9). L'examen des capacités d'identifications des mots écrits montre que les effets de régularité et de lexicalité sont significatifs, quelle que soit la mesure, et le niveau scolaire. Les effets de longueur varient selon la lexicalité: quel que soit le niveau scolaire, les pseudomots longs sont lus moins précisément et moins rapidement que les courts alors que les mots irréguliers longs ne sont jamais pénalisés. Le niveau de lecture (mesuré à l'aide d'un test Français de référence) est déterminé surtout par les capacités de lecture de pseudomots, et également par celles de conscience phonémique mais uniquement lorsque les temps sont pris en compte. La construction cohérente de l'outil est vérifiée à l'aide d'une classification hiérarchique de variables. L'ensemble des résultats souligne l'importance de considérer pour toutes évaluations les temps de traitement en plus de la précision. / The aim of this thesis was to evaluate the reading and reading-related skills of French middle school students (Grades 6 to 9). The first objective was to identify the capacity involved in reading comprehension at the middle school level. In the first grades (Grades 6 and 7), the results show that reading comprehension skills are largely predicted by listening comprehension, morphological awareness, and irregular word reading, but not pseudoword reading skills, whatever the measure (accuracy or time). This latter result is found in the higher grades (Grades 8 and 9) in which irregular word reading has no impact on reading comprehension, again regardless of the measure. The second objective was to develop a diagnostic evaluation tool for word-level reading and reading-related skills in middle school students. The examination of word-level reading skills at middle school showed significant effects of both regularity and lexicality, whatever the measure and independently of grade. The effect of length depends on lexicality: long pseudowords are read less accurately and more slowly than short ones, whereas long irregular words are read as well as short ones. Reading level (assessed by a French "gold standard" test) is mainly predicted by pseudoword reading skills, and also by phonemic awareness, for response times. The consistent structure (validity) of the tool is verified using a new statistical method: hierarchical classification of variables. The overall results underline the importance of considering response times in addition to accuracy in all assessments. Compréhension écrite Compréhension orale Identification de mots écrits Capacités reliées à la lecture Outil d'évaluation de la lecture Reading comprehension Listening comprehension Word-Level reading Reading-Related skills Reading evaluation tool
324	Study on preparation, structures and non linear optical properties of novel chalcogenide glasses and fibers Zheng, Xiaolin 08 July 2011 (has links) Pas de résumé en français / Being compared with oxide glasses, chalcogenide glasses have fine infrared transmissivity and higher optical nonlinearity, and also could be drawn into optical fibers. So chalcogenide glasses and fibers have potential wide applications in the fields of all-optical information processing, infrared lasers, nonlinear optical devices, and so on, the studies of their optical nonlinearity are one of the attractive subjects in the area of optoelectronics at present. The main purpose of this paper is to improve the stability and enhance the intensity of nonlinearity in chalcogenide glasses and fibers by means of exploring new glass compositions, optimizing the external field poling method, designing and fabricating fibers with special structures, all of these will promote their real applications. The main results are concluded as follows . The glass-forming region of GeS2-GA2S3-AgX (X=Cl, Br, I) and GeS2-Ga (In)2S3-CuI systems were determined , the maximal content of the additive halides are 70% and 12% respectively. In both two systems glasses, with the increasing addition of halides, the thermal stability reduce, density and linear refractive index increase, the ultraviolet cut-off edges shift to longer wavelength, while the infrared cut-off edges keep almost the same. 30GeS2 35Ga2S3 35AgCl and 47.5GeS2 17.5Ga2S3 35AgCl surface- and bulk-crystallized glasses that contain AgGaGeS4 nonlinear optical crystallites were prepared. Obvious second harmonic generation (SHG) could be observed in these crystallized glasses, and their intensity relate to the distribution and size of the precipitated AgGaGeS4 crystals, the maximal second-order nonlinearity coefficients is as high as 12.4pm/V. These crystallized glasses have good chemical and SHG stability. For GeS2-Ga (In)2S3-CuI systems glasses, due to their small glass-forming region, they are not suit for the preparation of crystallized glasses that contain CuGaS2 or CuInS2 nonlinear optical crystals. According to the structural studies of two system glasses, the main structural units of theses glasses are [YS4-xXx] (Y=Ge, Ga, In. X=Cl, Br, I) mixed anion tetrahedrons, they form a three-dimensional glassy network through bridging sulphur bonds. When the contents of halides MX(M=Ag, Cu. X=Cl, Br, I) are low, some [XxS3-xGe(Ga)S3-xXx] (X=Cl, Br, I) mixed ethane-like structural units exist in the glass network, and they will gradually transform to [YS4-xXx] (Y=Ge, Ga, In. X=Cl, Br, I) mixed anion tetrahedrons with the increasing content of halides, till totally disappear. Both two system glasses have ultrafast (~150fs) third-order optical nonlinearity and reverse saturation absorption, they belong to self-focusing medium. The third-order optical nonlinearity mainly originate from the distortion of electron cloud of Y-X (Y=Ge, Ga, In, X=Cl, Br, I, S) bonds in the structural units. For GeS2-GA2S3-AgX (X=Cl, Br, I) system glasses, the largest nonlinear susceptibility n2 is 10.50x10-18 m/W, the smallest figure of merit (FOM) is 0.606. In addition, the relation of n2 with n0 do not obey Miller’s rule, but in accordance with the structural variation. Among the glass compositions with different additive halogens, Br-containing glasses have relatively best third-order nonlinearities. For GeS2-Ga (In)2S3-CuI system glasses, the largest nonlinear susceptibility n2 is 9.37x10-18 m/W, the smallest figure of merit (FOM) is 2.237. High purity AS2S3 glass performs and low loss single index fibers with diameter of 100~400µm that drawn form these performs were prepared, the transmission losses between 2~6 µm is only 0.5dB/m. AS2S3 tapered fibers have a uniform diameter of taper wasit, fine surface smoothness, and sharp taper transition part. Pas de mots-clés en français Chalcogenide glasses Crystallized glasses Heat-treatment Second harmonic generation Third-order optical nonlinearity Tapered fibers 535 547 621.36
325	Theory and molecular dynamics simulations of the local dynamics and free energy profiles of proteins : application to the interpretation of protein NMR data / Théorie et simulations de dynamique moléculaire de la dynamique locale et des profils d'énergie libre des protéines : application à l'interprétation des données RMN Cote, Yoann 07 December 2012 (has links) Comprendre la dynamique locale des protéines dans leur état natif (structure repliée etfonctionnelle) est essentiel pour comprendre leur dynamique globale et leur fonction biologique. Aucours de cette thèse, nous avons étudié la dynamique locale de plusieurs petites protéines enmesurant les fluctuations de sondes locales le long de la séquence d’acide aminé de ces protéines.Nous avons essayé de comprendre la dynamique de ces sondes locales, comment celles-ci serelaxaient entre leurs différentes conformations, comment leurs fluctuations étaient corrélées lesunes aux autres et comment peuvent-elles être reliées à la fonction biologique des protéines.Dans les trois premiers chapitres, nous introduisons les concepts du mouvement Browniende rotation libre, de la spectroscopie par Résonance Magnétique Nucléaire (RMN) et de ladynamique moléculaire (DM). Dans les chapitres 4 et 5, nous avons étudié la dynamique desliaisons amides de la chaine principale (backbone) des protéines sur leurs paysages d’énergie libre.Dans le chapitre 4, nous avons démontré que les fluctuations des liaisons amide dubackbone de la protéine VA3 sont décrites par une diffusion rotationnelle anormale plutôt que parune diffusion rotationnelle libre généralement utilisée pour interpréter les données RMN enrelaxation de spins et en couplage résiduel dipolaire. [...] Dans le chapitre 5, nous avons démontré la diffusion rotationnelle anormale de ces liaisons jusqu’à une échelle de temps de 100 ns en utilisant dix simulations de DM de 1 μs de la protéineUbiquitine. Nous avons aussi étudié la convergence des paramètres RMN extraits des trajectoiresde DM en fonction de leur durée. [...] Dans le chapitre 6, nous avons réalisé une l’étude de la corrélation entre les mouvements du backbone et des chaines latérales des protéines. [...] Dans la première partie du dernier chapitre de cette thèse, nous avons étudié l’évolution de la corrélation dynamique entre les chaines latérales et la chaine principale d’une protéine durant des évènements de dépliement/repliement. Pour cette étude préliminaire, nous avons utilisé unesimulation de DM d’un « ultra-fast folder » nommé Trp-cage réalisée à 380K. Nous avons confirméles résultats précédemment trouvés pour les protéines dans leur état natif. Nous avons observél’augmentation de la corrélation entre les séries temporelles yn(t) and δn(t) pendant un évènementde dépliement caractérisé par la sortie du tryptophane de sa cage. Un paramètre stérique s aégalement été défini afin de quantifier les intéractions des chaines latérales avec leurenvironnement. Dans une seconde partie de ce dernier chapitre, nous présentons une étudepréliminaire du dépliement d’un « downhill folder » nommé gpW sous contrainte d’une force. Pourcaractériser le dépliement de la protéine gpW, nous avons calculé les chemical shifts des atomes Cª et Hⁿ du backbone le long de sa séquence en fonction d’une coordonnée réactionnelle choisie comme étant la distance entre les Cª de résidus C- et N- terminaux. Nous avons démontré qu’il était difficile de discerner un comportement particulier à partir des tous les chemical shifts en fonction de la distance. Cependant, en moyennant la valeur des chemical shifts en sur tous lesrésidus de la protéine nous trouvons que l’évolution de cette valeur moyenne en fonction de ladistance permettait de décrire les évènements du dépliement de la protéine en fonction de lacoordonnée de réaction durant la simulation de DM / Understand the local dynamics of proteins in their native state, i.e. in their folded functionalstructure, is a prerequisite to understand their global dynamics and their biological function. In thepresent thesis, we investigated the local dynamics of several small proteins by recording thefluctuations of local probes along the amino-acid sequence of those proteins. We tried tounderstand the dynamics of the local probe, i.e. how they relax between their differentconformations, how their fluctuations are correlated to each other, how their fluctuations arerelated to the function of the proteins. In the first three chapters, we introduced the concepts of the free rotational Brownian motion, of the Nuclear Magnetic Resonance spectroscopy and of the Molecular Dynamics (MD)simulations. In chapters 4 and 5, we studied the dynamics of the backbone amide bonds of theproteins on their free-energy landscape. In chapter 4, we demonstrated that the fluctuations of the backbone amide bonds of the protein VA3 are described by a rotational anomalous diffusion rather than by a free rotationaldiffusion, as often assumed in the interpretation of the raw NMR-measured data (Spin relaxation(SR) data and Residual Dipolar Coupling (RDC) data. [...] In chapter 5, we demonstrated the anomalous diffusion of backbone amide bonds up to 100 ns by using ten MD trajectories of 1 μs of duration for the protein ubiquitin. We also studied the convergence of the NMR-derived parameters extracted from the MD trajectories in function of their duration. [...] In chapter 6, we addressed the question of the correlation between the motions of the side chains and main chain of a protein. [...] In the first part of the final chapter of the present thesis, we investigated the evolution of the correlation between the side-chain and the main-chain motions of a protein during unfolding/folding events. In this preliminary work, we used a single MD simulation of the ultrafast folder Trp-cage performed at 380 K. We confirmed the results found for proteins in theirnative state. We observed an increase of the correlation between the two time series yn(t) and δn(t) during an unfolding event characterized, here, by the exit of the TRP residue of its “cage”.A steric parameter s was also defined in order to quantify interactions of the amino-acid side chainwith its environment. In a second part of the last chapter, we present a preliminary study of theunfolding of the downhill folder gpW under a mechanical force. To characterized the unfolding ofgpW, we computed the chemical shift of the Cª and of the Hⁿ atoms along the amino-acidsequence of the protein in function of a reaction coordinate: the distance, rCªCª , between the Cª atoms of the N and C terminal residues. We demonstrated that it is hard to distinguish a typical behavior of all the chemical shift of all the residues along the amino-acid sequence in function of the distance rCªCª . However, by averaging the chemical shift over all the residues of the protein we found that the evolution of the average value of the chemical shift described the unfolding eventsof the protein during the MD simulations Pas de mots clés Molecular Dynamics simulations Proteins Local dynamics Free-energy landscape Anomalous diffusion NMR Amide bonds Dihedral angles Backbone Side chains 531 543
326	L'enfant naturel en Grèce : une proposition méthodologique de la recherche psycho-sociale : le modèle d'identité Ego-Ecologique en psychologie sociale-clinique / The illegitimate child in Greece : a methodological proposition of a psychosocial investigation : the application of ego-ecology identity model in social-clinical psychology Rigas-Panagiotacopoulos, Anastasia-Valentine 02 April 2010 (has links) Cette étude est un essai de développer la méthode ego-écologique, dans le champs de la psychologie sociale-clinique. Nous-nous référons à une analyse de contenu qualitative. Notre approche s’ancre au point de rencontre des approches postpositivistes et socio-cognitives avec les théories des Symboles de Jung et des images de Desoille. Il n’est point de lieu plus propice que pour cette rencontre que le champ de la biographie du sujet, parce que le matériaux biographique jette un point entre l’imagination et l’intellect, l’individuel et le social le discours et l’action, à travers d’une part les symboles des mots-images et d’autre part l’interaction symbolique entre chercheur et sujet de la recherche, dont elle est le produit. Notre objectif est de montrer pourquoi et comment cette partialité des techniques analytiques peut être surmontée en replaçant la fonction symboliste dans la méthode ego-écologique à travers le protocole de recherche d’une adolescente née hors mariage. Ce travail se structure en quatre parties et en plus les annexes. La première partie est consacrée des trois directions théoriques : l’ego-écologie, les théories des symboles/images et l’approche biographique. En deuxième partie nous étudions trois groupes par l’ego-écologie et la méthode biographique : la mère célibataire, la famille d’accueil et les enfants naturels. La troisième partie est consacrée aux conclusions générales et la quatrième partie présente la bibliographie. La méthode d’analyse de contenu du matériaux biographique fonctionnait chez les sujets, comme une catharsis émotionnelle, en créant des conditions plus favorables leur permettant de faire face à leurs problèmes psychosociaux. / This study its an essay to develop the ego-ecology identity method, an content analysis on the field of Social-Clinical Psychology. Our investigation treats the issues of post-positivist and socio-cognitive approaches under a point of view of the theories of Ego-ecology. Jung symbols and Desoille’s images. The field of biography approach is a convenient moment to joint with, because the biographical material bridges over imagination and intelligence, individual and social, discourse and action, though on the one hand of the symbolism between words/images and on the other hand of the symbolic interaction between investigator/individual, that is the product. Our objective will be why and how this partial analytical techniques could be surmount replaced the symbolic function of the ego-ecology method, through the protocol of an illegitimate adolescent.. The structure of this work has been divided into four parts and the annexes. On the first part is consecrated to the three central theoretical directions: the ego-ecology, the theories of symbols/images and the biographical one. On the second part we search three social groups adopted on three conditions through the methods of ego-ecology and biography: the unmarried mother, the foster family and the illegitimate children living in an institution. On the third part we present the general conclusions and on the fourth part are presented the references. The proposed content analysis technique through the critical view of the subjects themselves, provides the respondents through their biography life course in a therapeutic way towards self-observation and self-analysis. Ego-écologie Images Biographie Mots-identitaires Analyse de contenu Enfant naturel Symboles Mère célibataire Ego-ecology Biography Content analysis Symbols Images Identity words Illegitimate child Unwed mother
327	Le web social et le web sémantique pour la recommandation de ressources pédagogiques / Social Web and semantic Web for recommendation in e-learning Ghenname, Mérième 02 December 2015 (has links) Ce travail de recherche est conjointement effectué dans le cadre d’une cotutelle entre deux universités : en France l’Université Jean Monnet de Saint-Etienne, laboratoire Hubert Curien sous la supervision de Mme Frédérique Laforest, M. Christophe Gravier et M. Julien Subercaze, et au Maroc l’Université Mohamed V de Rabat, équipe LeRMA sous la supervision de Mme Rachida Ajhoun et Mme Mounia Abik. Les connaissances et les apprentissages sont des préoccupations majeures dans la société d’aujourd’hui. Les technologies de l’apprentissage humain visent à promouvoir, stimuler, soutenir et valider le processus d’apprentissage. Notre approche explore les opportunités soulevées en faisant coopérer le Web Social et le Web sémantique pour le e-learning. Plus précisément, nous travaillons sur l’enrichissement des profils des apprenants en fonction de leurs activités sur le Web Social. Le Web social peut être une source d’information très importante à explorer, car il implique les utilisateurs dans le monde de l’information et leur donne la possibilité de participer à la construction et à la diffusion de connaissances. Nous nous focalisons sur le suivi des différents types de contributions, dans les activités de collaboration spontanée des apprenants sur les réseaux sociaux. Le profil de l’apprenant est non seulement basé sur la connaissance extraite de ses activités sur le système de e-learning, mais aussi de ses nombreuses activités sur les réseaux sociaux. En particulier, nous proposons une méthodologie pour exploiter les hashtags contenus dans les écrits des utilisateurs pour la génération automatique des intérêts des apprenants dans le but d’enrichir leurs profils. Cependant les hashtags nécessitent un certain traitement avant d’être source de connaissances sur les intérêts des utilisateurs. Nous avons défini une méthode pour identifier la sémantique de hashtags et les relations sémantiques entre les significations des différents hashtags. Par ailleurs, nous avons défini le concept de Folksionary, comme un dictionnaire de hashtags qui pour chaque hashtag regroupe ses définitions en unités de sens. Les hashtags enrichis en sémantique sont donc utilisés pour nourrir le profil de l’apprenant de manière à personnaliser les recommandations sur le matériel d’apprentissage. L’objectif est de construire une représentation sémantique des activités et des intérêts des apprenants sur les réseaux sociaux afin d’enrichir leurs profils. Nous présentons également notre approche générale de recommandation multidimensionnelle dans un environnement d’e-learning. Nous avons conçu une approche fondée sur trois types de filtrage : le filtrage personnalisé à base du profil de l’apprenant, le filtrage social à partir des activités de l’apprenant sur les réseaux sociaux, et le filtrage local à partir des statistiques d’interaction de l’apprenant avec le système. Notre implémentation s’est focalisée sur la recommandation personnalisée / This work has been jointly supervised by U. Jean Monnet Saint Etienne, in the Hubert Curien Lab (Frederique Laforest, Christophe Gravier, Julien Subercaze) and U. Mohamed V Rabat, LeRMA ENSIAS (Rachida Ahjoun, Mounia Abik). Knowledge, education and learning are major concerns in today’s society. The technologies for human learning aim to promote, stimulate, support and validate the learning process. Our approach explores the opportunities raised by mixing the Social Web and the Semantic Web technologies for e-learning. More precisely, we work on discovering learners profiles from their activities on the social web. The Social Web can be a source of information, as it involves users in the information world and gives them the ability to participate in the construction and dissemination of knowledge. We focused our attention on tracking the different types of contributions, activities and conversations in learners spontaneous collaborative activities on social networks. The learner profile is not only based on the knowledge extracted from his/her activities on the e-learning system, but also from his/her many activities on social networks. We propose a methodology for exploiting hashtags contained in users’ writings for the automatic generation of learner’s semantic profiles. Hashtags require some processing before being source of knowledge on the user interests. We have defined a method to identify semantics of hashtags and semantic relationships between the meanings of different hashtags. By the way, we have defined the concept of Folksionary, as a hashtags dictionary that for each hashtag clusters its definitions into meanings. Semantized hashtags are thus used to feed the learner’s profile so as to personalize recommendations on learning material. The goal is to build a semantic representation of the activities and interests of learners on social networks in order to enrich their profiles. We also discuss our recommendation approach based on three types of filtering (personalized, social, and statistical interactions with the system). We focus on personalized recommendation of pedagogical resources to the learner according to his/her expectations and profile Mots dièse Réseau social Traitement du langage naturel Regroupement Web sémantique Environnements d'apprentissage en ligne Recommandation Hashtags Social network Natural language processing Clustering Semantic Web E-learning environments Recommendation
328	Typologie des constructions verbales à prédicat complexe : composition verbale en japonais et préverbation en polonais / Typology of complex predicate verbal constructions : verbal compounding in Japanese and verbal prefixation in Polish Matsumoto, Asuka 26 February 2016 (has links) Cette thèse vise à traiter les verbes composés en japonais et les verbes préverbés en polonais comme faisant partie des constructions verbales à prédicat complexe. D’abord, la notion de la formation des mots et, par conséquent, la notion de « mot », sont examinées par les analyses entre les mots (ortho)graphiques et prosodiques ; le problème d’espace entre les mots et différents systèmes d’accentuation sont pris en compte. D’une part, l’analyse des verbes composés japonais remonte jusqu’aux deux premières grammaires au XVIIe siècle, celle de Rodriguez et de Collado, dont la première propose la dichotomie entre les verbes composés à « mode de l’action » et à « particule ». Ensuite suivent les analyses des verbes composés contemporains, avec un accent particulier sur un certain nombre de couples de verbes transitifs et intransitifs en second élément du composé. D’autre part, la typologie des constructions préverbales de la langue polonaise est examinée. Enfin, à travers la comparaison multilingue du Petit prince de Saint-Exupéry entre l’original et deux traductions japonaises et deux polonaises, une typologie des constructions verbales à prédicat complexe est proposée, ce qui fait écho au choix de notre langue de rédaction, le français servant de pivot afin d’examiner diverses constructions verbales de nos langues de comparaison, le japonais et le polonais : composition verbale et construction converbale pour le premier et préverbation et construction infinitivale à semi-auxiliaire pour le second. / This thesis seeks to analyse Japanese compound verbs and Polish prefixed verbs as a part of complex predicate verbal constructions. First, the notion of word-formation and consequently that of word are examined by analyses between (ortho)graphic and prosodical words, which include problems of word space and several accentual systems. Next, this analysis of compound verbs goes back to 17th century with the first two Japanese grammars by Rodriguez and Collado, respectively, where the former proposes a dichotomy between manner of action and particle verbal compounds. Then follows an analysis of contemporary Japanese compound verbs, with particular emphasis on some pairs of transitive and intransitive verbs in the second element of compound. Contrastingly, a typology of verbal prefix constructions in Polish is considered and reviewed. Finally, through a multilingual comparison of The Little Prince, by Saint-Exupéry, using two translations in each of Japanese and Polish, a typology of complex predicate verbal constructions is put forward which corresponds with the language, French, in which this thesis is written and which serves as a pivot for the examination of various verbal constructions of the languages for comparison, Japanese and Polish: verbal compounding and converbal construction for the former, verbal prefixation and infinitival auxiliary construction for the latter. Formation des mots Composition verbale Prédicat complexe Préverbation Converbe Préverbe Mot João Rodriguez Word formation Verbal composition Complex predicate Verbal prefixation Converb Preverb Word João Rodriguez
329	Modèles de langage ad hoc pour la reconnaissance automatique de la parole / Ad-hoc language models for automatic speech recognition Oger, Stanislas 30 November 2011 (has links) Les trois piliers d’un système de reconnaissance automatique de la parole sont le lexique,le modèle de langage et le modèle acoustique. Le lexique fournit l’ensemble des mots qu’il est possible de transcrire, associés à leur prononciation. Le modèle acoustique donne une indication sur la manière dont sont réalisés les unités acoustiques et le modèle de langage apporte la connaissance de la manière dont les mots s’enchaînent.Dans les systèmes de reconnaissance automatique de la parole markoviens, les modèles acoustiques et linguistiques sont de nature statistique. Leur estimation nécessite de gros volumes de données sélectionnées, normalisées et annotées.A l’heure actuelle, les données disponibles sur le Web constituent de loin le plus gros corpus textuel disponible pour les langues française et anglaise. Ces données peuvent potentiellement servir à la construction du lexique et à l’estimation et l’adaptation du modèle de langage. Le travail présenté ici consiste à proposer de nouvelles approches permettant de tirer parti de cette ressource.Ce document est organisé en deux parties. La première traite de l’utilisation des données présentes sur le Web pour mettre à jour dynamiquement le lexique du moteur de reconnaissance automatique de la parole. L’approche proposée consiste à augmenter dynamiquement et localement le lexique du moteur de reconnaissance automatique de la parole lorsque des mots inconnus apparaissent dans le flux de parole. Les nouveaux mots sont extraits du Web grâce à la formulation automatique de requêtes soumises à un moteur de recherche. La phonétisation de ces mots est obtenue grâce à un phonétiseur automatique.La seconde partie présente une nouvelle manière de considérer l’information que représente le Web et des éléments de la théorie des possibilités sont utilisés pour la modéliser. Un modèle de langage possibiliste est alors proposé. Il fournit une estimation de la possibilité d’une séquence de mots à partir de connaissances relatives à ’existence de séquences de mots sur le Web. Un modèle probabiliste Web reposant sur le compte de documents fourni par un moteur de recherche Web est également présenté. Plusieurs approches permettant de combiner ces modèles avec des modèles probabilistes classiques estimés sur corpus sont proposées. Les résultats montrent que combiner les modèles probabilistes et possibilistes donne de meilleurs résultats que es modèles probabilistes classiques. De plus, les modèles estimés à partir des données Web donnent de meilleurs résultats que ceux estimés sur corpus. / The three pillars of an automatic speech recognition system are the lexicon, the languagemodel and the acoustic model. The lexicon provides all the words that can betranscribed, associated with their pronunciation. The acoustic model provides an indicationof how the phone units are pronounced, and the language model brings theknowledge of how words are linked. In modern automatic speech recognition systems,the acoustic and language models are statistical. Their estimation requires large volumesof data selected, standardized and annotated.At present, the Web is by far the largest textual corpus available for English andFrench languages. The data it holds can potentially be used to build the vocabularyand the estimation and adaptation of language model. The work presented here is topropose new approaches to take advantage of this resource in the context of languagemodeling.The document is organized into two parts. The first deals with the use of the Webdata to dynamically update the lexicon of the automatic speech recognition system.The proposed approach consists on increasing dynamically and locally the lexicon onlywhen unknown words appear in the speech. New words are extracted from the Webthrough the formulation of queries submitted toWeb search engines. The phonetizationof the words is obtained by an automatic grapheme-to-phoneme transcriber.The second part of the document presents a new way of handling the informationcontained on the Web by relying on possibility theory concepts. A Web-based possibilisticlanguage model is proposed. It provides an estition of the possibility of a wordsequence from knowledge of the existence of its sub-sequences on the Web. A probabilisticWeb-based language model is also proposed. It relies on Web document countsto estimate n-gram probabilities. Several approaches for combining these models withclassical models are proposed. The results show that combining probabilistic and possibilisticmodels gives better results than classical probabilistic models alone. In addition,the models estimated from Web data perform better than those estimated on corpus. Reconnaissance Automatique de la Parole Modélisation du Langage Théorie des Possibilités Modèle de Langage Web Mots Hors-Vocabulaires Automatic Speech Recognition, Language Modeling Theory of Possibilities Web Language Model Out-Of-Vocabulary Words 006.454
330	Répétitions dans les mots et seuils d'évitabilité Vaslet, Elise 23 June 2011 (has links) Nous étudions dans cette thèse différents problèmes d'évitabilité des répétitions dans les mots infinis. Soulevée par Thue et motivée par ses travaux sur les mots sans carrés, la problématique s'est développée au cours du XXe siècle, et est aujourd'hui devenue un des grands domaines de recherche en combinatoire des mots. En 1972, Dejean proposa une importante conjecture, dont la validation étape par étape s'est terminée récemment (2009). La conjecture concerne le seuil des répétitions d'un alphabet, i.e., la borne inférieure des exposants évitables sur cet alphabet. La notion de seuil, comme frontière entre évitabilité et non-évitabilité d'un ensemble donné de mots, est le fil directeur de nos travaux. Nous nous intéressons d'abord à une généralisation du seuil des répétitions (nous donnons des encadrements de sa valeur). Cette notion permet d'ajouter, pour décrire l'ensemble des répétitions à éviter, au paramètre de l'exposant, celui de la longueur des répétitions. Puis, nous étudions des problèmes d'existence de mots dans lesquels, simultanément, certaines répétitions sont interdites et d'autres sont forcées. Nous répondons, pour l'alphabet ternaire, à la question : quels réels sont l'exposant critique d'un mot infini sur un alphabet fixé? Nous introduisons ensuite une notion de haute répétitivité, et établissons une description partielle des couples d'exposants paramètrant une double contrainte de haute répétitivité et d'évitabilité. Pour finir, nous utilisons des résultats et techniques issus de ces problématiques pour résoudre une question de coloration de graphes : nous introduisons un seuil des répétitions, calqué sur celui connu pour les mots, et donnons sa valeur pour deux classes de graphes, les arbres et les graphes de subdivisions. / In this thesis we study various problems on repetition avoidance in infinite words. Raised by Thue and motivated by his work on squarefree words, the topic developed during the 20th century, and has nowadays become a principal area of research in combinatorics on words. In 1972, Dejean proposed an important conjecture whose verification in steps was completed recently (2009). The conjecture concerns the repetition threshold for an alphabet, i.e., the infimum of the avoidable exponents for that alphabet. The notion of threshold as a borderline between avoidability and unavoidability for a given set of words is the guiding line of our work. First, we focus on a generalization of the repetition threshold. This concept allows us to include, in addition to the exponent, the length of the repetitions as a parameter in the description of the set of repetitions to avoid. We obtain various bounds in that respect. We then study existence problems for words in which simultaneously some repetitions are forbidden, and others are forced. For the ternary alphabet, we answer the question: what real numbers are the critical exponent of some infinite word over a given alphabet? Also, we introduce a notion of highly repetitive words and give a partial description of the pairs of exponents which parameterize the existence of words both highly repetitive and repetition-free. Finally, we use results and techniques stemming from those problems to solve a question on graph colouring: we introduce a repetition threshold adapted from the thresholds we know for words, and give its value for two classes of graphs, namely, trees and subdivision graphs. Combinatoire des mots Évitabilité Répétitions Exposants critiques Conjecture de Dejean Seuil des répétitions Coloration de graphes Combinatorics on words Avoidability Repetitions Critical exponents Dejean's conjecture Repetition threshold Graphs coloring

Search results