Global ETD Search

31	Exploiting Semantic for the Automatic Reverse Engineering of Communication Protocols. / Exploitation de la sémantique pour la rétro-conception automatisée de protocoles de communication. Bossert, Georges 17 December 2014 (has links) Cette thèse propose une approche pratique pour la rétro-conception automatisée de protocoles de communication non-documentés. Les travaux existants dans ce domaine ne permettent qu'un apprentissage incomplet des spécifications ou exigent trop de stimulation de l'implémentation du protocol cible avec le risque d'être vaincu par des techniques de contre-inférence. Cette thèse adresse ces problématiques en s'appuyant sur la sémantique du protocole cible pour améliorer la qualité, la rapidité et la furtivité du processus d'inférence. Nous appliquons cette approche à la rétro-conception des deux principaux aspects de la définition d'un protocole à savoir l'inférence de sa syntaxe et de sa grammaire. Nous proposons un outil open-source, appelé Netzob, qui implémente nos contributions pour aider les experts en sécurité dans leur lutte contre les dernières menaces informatiques. Selons nos recherches, Netzob apparait comme l'outil publié le plus avancé pour la rétro-conception et la simulation de protocoles de communications non-documentés. / This thesis exposes a practical approach for the automatic reverse engineering of undocumented communication protocols. Current work in the field of automated protocol reverse engineering either infer incomplete protocol specifications or require too many stimulation of the targeted implementation with the risk of being defeated by counter-inference techniques. We propose to tackle these issues by leveraging the semantic of the protocol to improve the quality, the speed and the stealthiness of the inference process. This work covers the two main aspects of the protocol reverse engineering, the inference of its syntactical definition and of its grammatical definition. We propose an open-source tool, called Netzob, that implements our work to help security experts in their work against latest cyber-threats. We claim Netzob is the most advanced published tool that tackles issues related to the reverse engineering and the simulation of undocumented protocols. Rétro-conception Protocoles de communication Sécurité Inférence grammaticale Apprentissage automatisé Reverse Engineering Communication Protocols Security Grammatical Inference Machine learning 378.242
32	L'atténuation statistique des surdétections d'un correcteur grammatical symbolique Gotti, Fabrizio 02 1900 (has links) Les logiciels de correction grammaticale commettent parfois des détections illégitimes (fausses alertes), que nous appelons ici surdétections. La présente étude décrit les expériences de mise au point d’un système créé pour identifier et mettre en sourdine les surdétections produites par le correcteur du français conçu par la société Druide informatique. Plusieurs classificateurs ont été entraînés de manière supervisée sur 14 types de détections faites par le correcteur, en employant des traits couvrant di-verses informations linguistiques (dépendances et catégories syntaxiques, exploration du contexte des mots, etc.) extraites de phrases avec et sans surdétections. Huit des 14 classificateurs développés sont maintenant intégrés à la nouvelle version d’un correcteur commercial très populaire. Nos expériences ont aussi montré que les modèles de langue probabilistes, les SVM et la désambiguïsation sémantique améliorent la qualité de ces classificateurs. Ce travail est un exemple réussi de déploiement d’une approche d’apprentissage machine au service d’une application langagière grand public robuste. / Grammar checking software sometimes erroneously flags a correct word sequence as an error, a problem we call overdetection in the present study. We describe the devel-opment of a system for identifying and filtering out the overdetections produced by the French grammar checker designed by the firm Druide Informatique. Various fami-lies of classifiers have been trained in a supervised way for 14 types of detections flagged by the grammar checker, using features that capture diverse linguistic phe-nomena (syntactic dependency links, POS tags, word context exploration, etc.), extracted from sentences with and without overdetections. Eight of the 14 classifiers we trained are now part of the latest version of a very popular commercial grammar checker. Moreover, our experiments have shown that statistical language models, SVMs and word sense disambiguation can all contribute to the improvement of these classifiers. This project is a striking illustration of a machine learning component suc-cessfully integrated within a robust, commercial natural language processing application. Correction grammaticale Apprentissage machine supervisé Modèles de langue probabilistes Grammar checking Supervised machine learning Statistical language models
33	Contributions de l'inférence grammaticale à la fouille de données séquentielles Jacquemont, Stéphanie 04 December 2008 (has links) (PDF) Dans le cadre de cette thèse, nous avons établi des liens entre les modèles obtenus par des algorithmes d'inférence grammaticale et la connaissance induite par des techniques de fouille de données séquentielles. Partant du constat que le point commun entre ces deux contextes différents de travail est la manipulation de données structurées sous forme de séquences de symboles, nous avons tenté d'exploiter les propriétés des automates probabilistes inférés à partir de ces séquences au profit d'une fouille de données séquentielles plus efficace. <br />Dans ce contexte, nous avons montré que l'exploitation brute, non seulement des séquences d'origine mais aussi des automates probabilistes inférés à partir de celles-ci, ne garantit pas forcément une extraction de connaissance pertinente. Nous avons apporté dans cette thèse plusieurs contributions, sous la forme de bornes minimales et de contraintes statistiques, permettant ainsi d'assurer une exploitation fructueuse des séquences et des automates probabilistes. De plus, grâce à notre modèle nous apportons une solution efficace à certaines applications mettant en jeux des problèmes de préservation de vie privée des individus. Inférence grammaticale fouille de données séquentielles fouille de données probabiliste fouille de données sous contraintes préservation de la vie privée
34	Apprentissage d'automates modélisant des familles de séquences protéiques Kerbellec, Goulven 19 June 2008 (has links) (PDF) Cette thèse propose une nouvelle approche de découverte de signatures de familles de protéines. Etant donné un échantillon (non-aligné) de séquences appartenant à une famille structurelle ou fonctionnelle de protéines, cette approche infère des automates fini s non déterministes (NFA) caractérisant la famille.<br>Un nouveau type d'alignement multiple nommé PLMA est introduit afin de mettre en valeur les similarités partielles et locales significativement similaires. A partir de ces informations, les modèles de type NFA sont produits par un procédé relevant du domaine de l'inférence grammaticale. Les modèles NFA, présentés ici sous le nom de Protomates, sont des modèles graphiques discrets de forte expressivité, ce qui les distingue des modèles statistiques de type profils HMM ou des motifs de type Prosite.<br>Les expériences menées sur différentes familles biologiques dont les MIP et les TNF, montrent un succès sur des données réelles. Bioinformatique inférence grammaticale famille de protéines automate alignement multiple
35	Acquisition et représentation de connaissances en musique Bel, Bernard 30 November 1990 (has links) (PDF) Cette étude traite de la représentation informatique de connaissances en musique, abordée à partir de deux expériences en grandeur réelle. La première est une méthode d'acquisition de connaissances en ethnographie mettant en interaction un expert (le musicien), un analyste (le musicologue) et une machine dans une situation d'apprentissage. Les schémas d'improvisation des musiciens sont identifiés et exprimés à l'aide de règles de production dans un formalisme dérivé des grammaires génératives et des langages de formes. Un algorithme déterministe de test d'appartenance de chaînes arbitraires au langage défini par une grammaire (sensible au contexte) est présenté, ainsi qu'une technique d'inférence inductive de langages réguliers permettant l'acquisition automatique de connaissances lexicales et syntaxiques. La seconde expérience s'insère dans l'élaboration d'un environnement de composition musicale assistée par ordinateur. Le problème est ici la représentation du temps dans une structure discrète d'“objets temporels”, et plus généralement la synchronisation de processus parallèles. Une méthode est proposée pour la détermination d'une structure à partir de données incomplètes sur la synchronisation des objets. La notion d'“objet sonore” est ensuite explicitée formellement. Un algorithme efficace permet l'instanciation des objets sonores affectés à une structure en tenant compte des contraintes liées à leurs propriétés métriques et topologiques. Langages formels test d'appartenance inférence grammaticale synchronisation représentation du temps
36	Inférence grammaticale sur des alphabets ordonnés : application à la découverte de motifs dans des familles de protéines Leroux, Aurélien 24 June 2005 (has links) (PDF) Durant cette thèse, nous avons travaillé sur l'adaptation des algorithmes d'inférence grammaticale pour la recherche des propriétés communes à un ensemble de protéines. L'inférence grammaticale positive cherche à générer, à partir d'un ensemble de mots appartenant à un langage cible particulier inconnu, une représentation grammaticale qui est "optimale" par rapport à ce langage, c'est-à-dire qui rassemble et organise les particularités des mots du langage. Nous avons utilisé le diagramme de Taylor, qui classe les acides aminés suivant leurs propriétés physico-chimiques, pour construire, sous forme de treillis, un ordre sur les groupes d'acides aminés. Nous avons aussi développé une méthode d'inférence (SDTM) qui calcule les meilleurs alignements locaux entre les paires de protéines suivant un score fondé à la fois sur cet ordre et sur les propriétés statistiques de l'ensemble de protéines donné. Le résultat est une machine séquentielle proche de celle de Mealy avec des sorties réduites à "accepte" et "rejette". L'algorithme commence par construire le plus grand automate reconnaissant exactement les mots du langage et le généralise par fusions successives des paires de transitions correspondant aux acides aminés appariés dans les alignements sélectionnés. Les expérimentations ont montré l'intérêt de cette combinaison de méthodes importées de la découverte de motifs et de l'inférence grammaticale. [INFO:INFO_OH] Computer Science/Other Bioinformatique théorie des langages automates apprentissage automatique inférence grammaticale programmation logique protéines motifs
37	Découverte de motifs relationnels en bioinformatique: application à la prédiction de ponts disulfures Jacquemin, Ingrid 07 December 2005 (has links) (PDF) Déterminer la structure 3D des protéines expérimentalement est une tâche très lourde et coûteuse, qui peut s'avérer parfois impossible à réaliser. L'arrivée massive de données provenant des programmes de séquençage à grande échelle impose de passer d'une approche biochimique à une approche bioinformatique, et nécessite en particulier de développer des méthodes de prédiction sur des séquences.<br />Cette thèse propose l'exploration de deux nouvelles pistes pour progresser dans la résolution de prédiction de ponts disulfures dans les protéines. Cette liaison covalente stabilise et contraint fortement la conformation spatiale de la protéine et la connaissance des positions où elle intervient peut réduire considérablement la complexité du problème de la prédiction de la structure 3D. Pour cela, nous utilisons dans un premier temps, l'inférence grammaticale et plus particulièrement les langages de contrôle introduit par Y. Takada, puis dans un deuxième temps, la programmation logique inductive.<br />Diverses expériences visent à confronter un cadre théorique d'apprentissage et des algorithmes généraux d'inférence grammaticale régulière à une application pratique de prédiction d'appariements spécifiques au sein d'une séquence protéique. D'autres expérimentations montrent que la programmation logique inductive donne de bons résultats sur la prédiction de l'état oxydé des cystéines en inférant des règles interprétables par les biologistes. Nous proposons un algorithme d'induction heuristique dont l'idée est d'effectuer plusieurs phases d'apprentissage en tenant compte des résultats obtenus aux phases précédentes permettant ainsi de diminuer considérablement la combinatoire dans les espaces d'hypothèses logiques en construisant des règles de plus en plus discriminantes. [INFO:INFO_OH] Computer Science/Other Bioinformatique Apprentissage automatique Théorie des langages Automates Programmation Logique Inductive Protéines Ponts disulfures Inférence Grammaticale Langage de contrôle Prédiction
38	Interactions didactiques en classe de français : enseignement/apprentissage de l’accord du verbe en première secondaire Gauvin, Isabelle 05 1900 (has links) Notre recherche vise à décrire les connaissances grammaticales élaborées par des élèves de première secondaire au cours de l’enseignement/apprentissage de l’accord du verbe. Cette description se fonde sur l’observation des interactions didactiques entre les élèves, et leur enseignant autour de l’objet de savoir « accord du verbe » : elle concerne plus particulièrement l’interaction entre les pôles « élève » et « savoir ». Notre recherche s’inscrit dans le courant de la grammaire pédagogique moderne. La théorie de la transposition didactique de Chevallard (1985/1991) constitue également la pierre angulaire de nos travaux : les concepts de transposition didactique externe (le passage du savoir savant au savoir à enseigner) et interne (le passage du savoir à enseigner au savoir effectivement enseigné) agissent à titre d’analyseurs des interactions didactiques. L’observation, la description et la théorisation des interactions didactiques imposent une démarche écologique pour la collecte des données. Pour notre recherche, les données ont été recueillies grâce à la captation vidéo de séquences didactiques portant sur l’accord du verbe : elles consistent en des interactions verbales entre élèves ou entre les élèves et leur enseignant. L’analyse des données s’est effectuée selon une perspective macro et micro : (1) L’analyse macro indique que les connaissances antérieures des élèves résistent à l’institutionnalisation des savoirs puisque le savoir enseigné n’est pas celui qui est exclusivement mobilisé. Les élèves recourent à un vaste éventail de connaissances de types procédural et déclaratif pour l’identification du verbe et du sujet, dont la réussite n’est par ailleurs pas assurée. De plus, les connaissances qu’ils ont élaborées autour de la règle d’accord et du transfert des traits morphologiques sont également nombreuses et variées et ne les conduisent pas à accorder le verbe avec constance. (2) L’analyse micro suggère que l’élaboration des connaissances relatives à l’accord du verbe dépend de la manière dont les outils de la grammaire (manipulations syntaxiques et phrase de base) sont utilisés par les élèves. Plus précisément, le savoir piétine ou recule lorsque les manipulations syntaxiques ne sont pas appliquées dans la phrase ou qu’elles ne sont pas adaptées dans certains contextes syntaxiques; le savoir fait des bonds en avant dans les classes où les élèves sont en mesure de recourir à la phrase de base pour soutenir leur analyse grammaticale. Les descriptions proposées dans le cadre de notre thèse conduisent à discuter de leurs implications pour la transposition didactique externe et, plus généralement, pour la didactique du français et de la grammaire. / The purpose of our work is to describe the grammatical knowledge formulated by first- year high school students during the teaching/learning of verb agreement. This description is based on the observation of didactic interactions between students, their teacher and the knowledge element, “verb agreement”: it’s main focus is on the interaction between students and knowledge. Our research lies within the mainstream of modern pedagogical grammar. The didactic transposition theory put forward by Chevallard (1985/1991) also serves as a foundation: didactic transposition concepts, both external (from scholarly knowledge to knowledge to be taught) and internal (from knowledge to be taught to knowledge actually taught) act as didactic interaction analyzers. The observation, description and theorization of didactic interactions require an ecological approach to data collection, which was done by capturing video clips of didactic sequences on verb agreement. These consisted of verbal interactions between students or between students and their teacher. The analysis of this data was performed from both a macro and micro perspective: (1) The macro analysis denotes that the students' previous knowledge is resistant to the institutionalization of learning, since taught knowledge is not being called upon. In their identification of verbs and subjects, students employ a wide range of declarative and procedural knowledge types, even without some form of success being ensured. Moreover, while the knowledge they formulate relative to the agreement rule and the transfer of morphological characteristics is both substantial and varied, it does not consistently lead them to verb agreement. (2) The micro analysis suggests that knowledge formulated relative to verb agreement depends on how the students make use of grammar tools (syntax and basic sentence manipulation). More specifically, knowledge can get underfoot or even take a step ! "#! backward when syntactic manipulations are not applied in the sentence or cannot be adapted to certain syntaxic contexts, and can leap forward in classes where students are able to support their grammatical analysis through resorting to basic sentences. The descriptions put forward within the context of our thesis lead to a discussion of their implications for external didactic transposition and more generally, to the teaching of French and of grammar. apprentissage grammaire interactions didactiques transposition didactique accord du verbe orthographe grammaticale learning grammar didactic interactions didactic transposition verb agreement grammar spelling
39	Le pronom on entre hypothèse psychomécanique et point de vue contrastif (français-arabe) / The pronoun on between psychomechanical hypothesis and contrastive point of view (French-Arabic) El Kak, Manar 23 November 2018 (has links) Cette thèse étudie la polysémie du pronom on dans une perspective contrastive français-arabe. L’objectif de cette étude consiste à résoudre le problème de l’irrégularité dans la traduction arabe de on. Ce problème provient d’une variété d’emplois contradictoires de on en français, d’où sa polysémie. La polysémie de on a été examinée d’après le modèle interprétatif de la psychomécanique du langage de Gustave Guillaume complété par une approche énonciative. Ce cadre théorique a révélé comment, par une remontée vers l’ontogénèse de on, ce dernier est devenu un pronom intra-verbal malgré son origine substantivale. Par ailleurs, il est fait usage du Tenseur Binaire Radical (TBR) qui représente le signifié de puissance de on en langue. Ce signifié de puissance est illustré par un double mouvement qui va d’une pluralité indéfinie à une pluralité indéterminée, le point de transition étant moi-locuteur. Ainsi, le signifié de puissance de on a permis d’identifier et d’ordonner 13 signifiés d’effet, en tenant compte de la catégorie du nombre et de la notion de personne. Ces critères permettent de distinguer entre les valeurs de la 3e personne, celles de la personne 4 et les valeurs discursives d’un côté, et les effets de sens de l’autre. Mais pour traduire on, l’analyse contrastive du corpus bilingue a révélé que les traducteurs privilégient plutôt les effets de sens véhiculés par ce pronom. L’étude se termine donc par une proposition d’un ensemble de correspondants arabes pour chacun des 13 signifiés d’effet de on. Enfin, pour que la traduction de ce pronom soit adéquate, il faut que le groupe on + verbe soit considéré comme une unité de traduction. / This dissertation examines the polysemy of the pronoun on from a contrastive, French-Arabic perspective. The objective of the study is to resolve a problem of irregularity in most Arabic translations of on. This problem seems to be rooted in the variety of contradictory usage of on in French which reflects its polysemy. The polysemy of on was examined through Gustave Guillaume’s interpretative model of psychomechanics of language. Then, an enunciative approach was employed to complement the theoretical framework. As a result, the ontogenesis of on revealed how the pronoun became intra-verbal, despite its substantive etymology. Moreover, the study employed the Radical Binary Tensor that represents the potential meaning of on in tongue. This potential meaning is illustrated by a double movement: from an indefinite plurality to an indeterminate plurality, where the point of transition is moi-locuteur. Further, the obtained potential meaning facilitated the identification, and ordination, of 13 effective meanings for on by taking into consideration the notion of person and the category of number. Those criteria distinguish between the values of the 3rd person, person 4, and the discursive values on one hand, and the expressive effects on the other. The contrastive analysis of a bilingual corpus revealed a preference on the part of translators to deal with on based on its expressive effects. Finally, the study proposed a set of Arabic correspondents to each of on’s 13 effective meanings. Ultimately, the research concluded that an accurate translation of on can only be possible by considering the group on + verb as a unit of translation. Polysémie On Linguistique contrastive Sémantique grammaticale Psychomécanique du langage Enonciation Pronom intra-Verbal Traduction arabe Polysemy On Contrastive linguistics Grammatical semantics Psychomechanics of language Enunciation Intra-Verbal pronoun Arabic translation
40	Utilisation de méthodes linguistiques pour la détection et la correction automatisées d'erreurs produites par des francophones écrivant en anglais / Using linguistic methods for the automatic detection and correction of errors produced by French speakers writing in English Garnier, Marie 19 September 2014 (has links) Le point de départ de cette recherche est le constat des difficultés persistantes rencontrées par les francophones de niveau intermédiaire à avancé lors de la production de textes en anglais, dans des contextes personnels ou professionnels. Les premiers outils utilisés pour remédier à ces erreurs, les correcteurs grammaticaux automatiques, ne prennent pas en compte de nombreuses erreurs produites par les francophones utilisant l'anglais, notamment car ces correcteurs sont rarement adaptés à un public ayant l'anglais comme L2. Nous proposons d'identifier précisément les difficultés rencontrées par ce public cible à partir du relevé des erreurs dans un corpus adapté, et d'élaborer une modélisation linguistique des erreurs et des corrections à apporter. Cette modélisation est fondée sur une analyse linguistique approfondie des phénomènes concernés, à partir d'indications grammaticales, d'études de corpus, et de l'analyse des segments erronés. La validité de l'utilisation de méthodes linguistiques est établie par l'implémentation informatique des règles de détection et de correction, suivie de l'évaluation des résultats de l'application de ces règles sur des corpus d'anglais L1 et L2. / The starting point of this research is the observation that French speakers writing in English in personal or professional contexts still encounter grammatical difficulties, even at intermediate to advanced levels. The first tools they can reach for to correct those errors, automatic grammar checkers, do not offer corrections for a large number of the errors produced by French-speaking users of English, especially because those tools are rarely designed for L2 users. We propose to identify the difficulties encountered by these speakers through the detection of errors in a representative corpus, and to create a linguistic model of errors and corrections. The model is the result of the thorough linguistic analysis of the phenomena at stake, based on grammatical information available in reference grammars, corpus studies, and the analysis of erroneous segments. The validity of the use of linguistic methods is established through the implementation of detection and correction rules in a functional platform, followed by the evaluation of the results of the application of those rules on L1 and L2 English corpora. Linguistique de l'anglais Correction grammaticale automatisée Adverbes anglais Structures N+N Acquisition des langues secondes English linguistics Automatic grammar checking English adverbs N+N structures Second language acquisition

Search results