Global ETD Search

81	Modéliser l'acquisition de la syntaxe du langage naturel via l'hypothèse de la primauté du sens Tellier, Isabelle 08 December 2005 (has links) (PDF) L'objet de ce travail est la modélisation informatique de la capacité d'apprentissage de la syntaxe de leur langue naturelle par les enfants. Une synthèse des connaissances psycho-linguistiques sur la question est donc tout d'abord proposée. Le point de vue adopté pour la modélisation accorde une place privilégiée à la sémantique, qui est supposée acquise avant la syntaxe. Le Principe de compositionnalité, éventuellement adapté, est mis à contribution pour formaliser les liens entre syntaxe et sémantique, et le modèle d'apprentissage ''à la limite'' par exemples positifs de Gold est choisi pour régir les conditions de l'apprentissage. Nous présentons dans ce contexte divers résultats d'apprenabilité de classes de grammaires catégorielles à partir de divers types de données qui véhiculent des informations sémantiques. Nous montrons que, dans tous les cas, la sémantique contribue à spécifier les structures sous-jacentes aux énoncés, et à réduire ainsi l'espace de recherche des algorithmes d'apprentissage. [INFO:INFO_OH] Computer Science/Other grammaires catégorielles interface syntaxe-sémantique Principe de compositionnalité inférence grammaticale modèle de Gold
82	Extensions syntaxiques dans un contexte LL(1) Vidart, Jorge 28 September 1974 (has links) (PDF) . syntaxe programmation compilation ALGOL ALGOL68 compilateur
83	Syntaxe abstraite typée Zsido, Julianna 21 June 2010 (has links) (PDF) Afin de spécifier le comportement des langages de programmation, de préciser leurs propriétés et de certifier leurs implémentations, on étudie des modèles formels des langages de programmation. L'étude se divise en l'étude de la syntaxe et en celle de la sémantique. La deuxième est basée sur des modèles formels de la syntaxe. Cette thèse de doctorat se situe dans l'étude de la syntaxe et est consacrée principalement à deux approches à la syntaxe abstraite typée avec liaison de variables. Ces deux approches utilisent le langage de la théorie des catégories. La premièere approche est dans l'esprit de l'approche catégorique aux théories alébriques. La deuxième est basée sur la notion de monade et introduit la notion d'un module sur une monade qui remplacent les foncteurs et leurs algèbres. En outre la deuxième approche est adaptée pour une classe plus large de syntaxes typées où les types dépendent des termes. [MATH] Mathematics syntaxe abstraite Lambda-Calcul liaison de variables théorie des catégories théorie des types
84	Ponctuation et syntaxe dans la langue française médiévale. Étude d'un corpus de chartes originales écrites à Liège entre 1236 et 1291 Mazziotta, Nicolas 21 December 2007 (has links) %%%Un résumé mis en forme disponible dans les fichiers joints%%% Nous avons commencé par faire le pari que la syntaxe pouvait expliquer la majorité des signes de ponctuation. Cette optique nous a guidé durant toute notre étude, dont le but était de répondre à la question: «Comment, d'après ce qu'on peut observer dans les chartes écrites en français à Liège avant 1292, la ponctuation originale interagit-elle avec la syntaxe dans la langue française médiévale?» Nous avons d'emblée positionné notre étude par rapport à la réflexion sur la ponctuation médiévale, osant le pari que la syntaxe peut servir de point de référence pour expliquer la plus grande partie de la ponctuation des chartes. Nous avons ensuite décrit la constitution du corpus. Face à une pareille question, il n'était pas envisageable de commencer immédiatement à dépouiller les documents: il nous fallait définir avec exactitude les différents concepts dont nous allions avoir besoin. * Première partie: modélisation * La première partie du travail a ainsi été consacrée à la définition, sur des bases empiriques, des concepts mobilisés. Partant du sens commun et des principes fondamentaux de l'analyse linguistique classique (tenant du structuralisme et du fonctionnalisme), nous avons exploité les matériaux à notre disposition pour en dégager des notions, dans une approche inductive par son rapport aux faits, mais déductive par sa progression. Ainsi, au chapitre 2, l'observation du tracé des unités graphiques sur le parchemin nous a amené à abstraire les catégories nécessaires à une modélisation de l'ensemble des unités de la langue écrite, pour lesquelles nous proposons une terminologie neuve reflétant notre analyse. Nous avons progressivement défini _langue écrite_, puis _scriptèmes_, _grammèmes_, etc., progressant des unités les plus générales aux unités les plus particulières. Ce n'est qu'à ce prix que nous avons pu enfin délimiter exactement, le moins intuitivement possible, notre propre acception du mot _ponctuation_: «ensemble des ponctogrammes d'une langue écrite spécifique}. Dans cette définition, le terme _ponctogramme_ désigne une unité minimale de la langue écrite (_scriptème_) n'organisant pas l'espace (_grammème_), exprimant un contenu (_plérégramme_), ne dépendant pas matériellement d'une autre unité (_autogramme_), construit à l'aide de traits qui ne se combinent pas obligatoirement sur un même axe (_nébulogramme_) et non paraphrasable par d'autres unités significatives... Employer ce terme ne pouvait se faire qu'à la fin d'un exposé détaillé, passant en revue tous les hyperonymes impliqués. De manière moins audacieuse du point de vue de la terminologie employée, nous avons également tenté d'exposer notre conception de la syntaxe (chapitre 3). À nouveau, c'est le corpus qui nous a servi de guide: une fois les phrases délimitées de manière empirique, toutes les structures syntaxiques ont été passées en revue, nommées et intégrées dans un système théorique fondé sur la notion, héritée d'Alain Lemaréchal, de _relation minimale_. Nous sommes parti de l'existence d'un lien sémantique entre les unités en présence et nous avons caractérisé la manière dont ce lien était _spécifié_. Nous croyons, au delà de l'intérêt pratique de cette première partie, que les concepts dégagés peuvent être jugés suffisamment généraux sinon pour servir à la comparaison d'autres systèmes graphiques ou syntaxiques, du moins afin de constituer une base à leur description. * Deuxième partie: analyse des données* Une fois les concepts définis et l'ensemble du corpus annoté, il a été envisageable de répondre à la question posée. Néanmoins, l'ensemble des données disponibles, de par sa nature et son abondance, rendait l'approche traditionnelle -- ou plutôt _manuelle_ -- difficilement applicable. C'est pourquoi nous avons ouvert la seconde partie du travail en annonçant le recours à des méthodes plus outillées: les statistiques (introduites au chapitre 4). Ces méthodes présentées, nous avons sélectionné six caractéristiques morphosyntaxiques et positionnelles que nous avons jugées fondamentales pour décrire tous les constituants. Ces variables répondaient à six questions: 1/ du point de vue de l'ordre linéaire des mots, le constituant est-il le premier de la structure qu'il sert à construire? 2/ le constituant est-il le dernier de la structure qu'il sert à construire? 3/ quelle est la nature et le niveau d'intégration syntaxique de la structure qui le contient? 4/ quelle est la fonction du constituant? 5/ est-il de nature propositionnelle (mode personnel ou non)? 6/ est-il relaté? Nous avons ensuite pu mettre en relation les réponses à ces questions et la simple présence de ponctuation de part et d'autre des constituants, sans tenir compte, dans un premier temps, de la forme des ponctogrammes. Pour ce faire, nous avons essentiellement employé les techniques statistiques les plus classiques en sciences humaines: l'analyse des tableaux de contingence à l'aide du test du chi². Après avoir évalué la relation entre chacune des six variables et la ponctuation, nous avons constaté l'inefficacité de la méthode, ce qui nous a conduit à en rechercher une autre, permettant d'envisager simultanément toutes les variables morphosyntaxiques et positionnelles, en particulier. Ces nouveaux dépouillements nous ont permis de repérer, au milieu de la masse de constituants inégalement marqués par la présence d'un ponctogramme, ceux dont le marquage ou le rejet du marquage avait la plus faible probabilité d'être dû au hasard. Ce qui est ressorti de cette première étape, où les données étaient réduites à une représentation très abstraite, c'est une liste de points forts concernant: - la différence de fréquence entre le marquage de la phrase et celui des autres propositions; - la spécificité du marquage d'un certain nombre de types d'arguments; - le rejet manifeste du marquage du prédicat; - la faible fréquence de marquage à la suite des relateurs; - la forte présence de marquage devant les coordonnants. Nous avons ainsi pu observer que la ponctuation n'était pas obligatoire, mais que sa présence était certainement liée à un contexte syntaxique spécifique. Ensuite, ces grandes lignes ont pu être inspectées de manière plus concrète: pour chaque tendance qui le justifiait, nous avons évalué la probabilité que l'attraction ou la répulsion observée soit généralisée. Nous avons adopté la position pragmatique selon laquelle toute tendance suffisamment fréquente pouvait être considérée comme générale si le fait de retirer les chartes qui la manifestaient de manière significative de l'échantillon ne changeait pas significativement la probabilité d'attraction. Il en est ressorti que la plupart des tendances observées étaient générales ou trop faiblement illustrées pour être évaluées de ce point de vue. Par ailleurs, nous avons essayé de mettre en relation la ponctuation avec le contexte immédiat, ce qui nous a laissé observer que beaucoup de constituants étaient davantage, voire exclusivement marqués au contact d'autres constituants attirant également le marquage ou dans un contexte de coordination. Cet examen détaillé des tendances mises en évidence au chapitre 5 permet en fin de compte de faire le tri parmi les tendances et de repérer celles qui sont manifestement dues à l'entourage du constituant ou au document dans lequel il est attesté. En observant plus intuitivement les attestations, nous avons également pu repérer, comme nous nous y attendions, un certain nombre de tendances liées à des facteurs étrangers à la morphosyntaxe: la ponctuation de formules spécifiques au type discursif, celle des chiffres ou encore la présence d'un ponctogramme devant les noms de personnes. En outre, l'examen du détail des attestations nous a amené à proposer des révisions concernant le modèle d'analyse morphosyntaxique présenté au chapitre 3: 1/ il conviendrait que soient pris en compte les lexèmes employés; 2/ la notion de la coordination pourrait être étendue à des groupements de constituants que nous n'avons pas considérés comme coordonnés; 3/ il serait peut-être profitable de considérer les coordonnants de la même manière que les autres relateurs. D'autre part, nous avons insisté sur le fait que l'analyse des structures en syntaxe immédiate gagnerait à être moins abstraite. De cette étude de la fréquence du marquage est ressorti un ensemble d'environnements propices à la présence de ponctuation. À ce moment, il nous a été possible de réintroduire les considérations portant sur la _forme_ des ponctogrammes et d'employer l'_Analyse Factorielle des Correspondances_ (AFC) pour décrire les données. Nous avons effectué un tri croisé pour mesurer les associations entre la forme des ponctogrammes et la tendance au marquage spécifique à la position où se trouvait ce ponctogramme (ce qui incluait l'absence d'environnement attirant le marquage). Après une analyse exploratoire, nous avons complété notre étude par une série de tests évaluant la probabilité que les regroupements entre la forme des ponctogrammes et l'environnement dans lequel on les rencontre soit due au hasard. Dans la majorité des cas observés, les contrastes mis en évidence par l'AFC correspondaient à des oppositions significatives. L'étude détaillée de la forme a mené à la conclusion suivante: les ponctogrammes autres que <·> sont plus rares, et leur emploi paraît plus spécifique à un environnement donné. En d'autres termes: non seulement les scribes ne ponctuaient pas n'importe où, mais, en plus, ils n'employaient pas indifféremment les signes. Les méthodes ne permettant pas de traiter de manière efficace les ponctogrammes peu attestés, nous les avons simplement commentés, laissant de côté les statistiques pour une étude plus philologique. Ces observations ont mené, d'une part, à la critique de la validité de la transcription: 1/ certaines distinctions entre les formes sont peut-être superflues; 2/ certaines unités peuvent être confondues avec d'autres. D'autre part, la forme des ponctogrammes pose la question de la relation entre les ponctogrammes et le reste du système graphique. Old French/ancien francais Syntax/syntaxe Linguistics/linguistique Charters/chartes Punctuation/ponctuation
85	Contextes de liaison et FLE : productivité des positions /ʔ/, /t/, /n/ et /z/ Fernandez, Maria 30 May 2013 (has links) (PDF) 1) Utilisation des corpus oraux en FLE. On postule une unité minimale d'information syntaxique qui opère dans les situations d'interaction communicative. Au niveau macro-syntaxique, cette unité informe la syllabe proéminente. Des positions linéarisées sont décrites pour comparer les syllabations concurrentes. Sur cette base, le gabarit syllabique opératif dans l'interlangue de l'apprenant peut être modifié par la présentation d'un modèle alternatif. Les productions déviantes constatées dans les corpus (intra-langue) justifient l'intervention d'un didacticien-tuteur et la formulation de règles établissant des rapports phonologiques entre la syllabation erratique et une syllabation modèle. 2) Les ressources. Les enregistrements de corpus oraux suivant le protocole PFC (Durand, Laks & Lyche, 2002/2009), permettent de répertorier les contextes de liaison de 14 informateurs de niveau B1/B2 apprenants de FLE à Madrid. En lecture les liaisons sont classées selon les analyses disponibles du texte PFC conçu pour étudier la variation chez des francophones. Les transcriptions orthographiques des conversations ont été réalisées par un transcripteur du sous projet IPFC (Detey, et al. 2010) qui vise l'alignement et le traitement de corpus oraux de locuteurs non francophones. 3) Traitement de données et perspectives. Trois notations (lecture, conversation, prosodie) marquent les productions pour analyse. Leur élaboration s'inspire de la méthodologie appliquée en acquisition du français L1 (Chevrot, Dugua & Fayol, 2008) et repèrent les consonnes parasites, omissions et erreurs à distance. Des critères prosodiques sont proposés pour reconstruire la syntaxe par l'élaboration d'exercices correctifs. corpus oraux interlangue macro-syntaxe phonologie syllabe proéminente
86	Étude en temps réel de l'influence des écrans sur les processus d'accord sujet-verbe Fryer, Maude 11 1900 (has links) (PDF) Ce mémoire de maîtrise a pour but d'observer, en temps réel, l'influence de facteurs syntaxiques et sémantiques sur l'accord sujet-verbe. Afin d'avoir un regard sur les processus d'accord, nous avons examiné les temps d'écriture du verbe, et les pauses avant le verbe, avant la flexion verbale et après le verbe. Une analyse des erreurs produites a aussi été effectuée. Trente-deux participants ont écrit à l'ordinateur des phrases dictées. L'écran était soit un syntagme prépositionnel, soit une subordonnée relative. La force sémantique entre l'écran et le verbe variait également selon les phrases. Les résultats des analyses statistiques multiniveaux montrent une influence de la configuration syntaxique de l'écran sur les processus d'accord sujet-verbe. Lorsque l'écran est un syntagme prépositionnel, les pauses avant la flexion verbale, après le verbe et les temps d'écriture du verbe sont plus longs que lorsque l'écran est une subordonnée relative. Par contre, aucun effet sémantique n'a été observé dans l'analyse des temps et des pauses. Les résultats sur les erreurs non corrigées indiquent un effet de la force sémantique entre l'écran et le verbe. Les résultats de l'analyse chronométrique, qui appuient les résultats sur les erreurs d'attraction observés dans la très grande majorité des études, permettent de mettre en relief l'influence respective des aspects syntaxiques et sémantiques sur les processus d'accord sujet-verbe. Par ailleurs, ce travail légitime l'observation des pauses et des temps d'écriture comme une méthode complémentaire pertinente à l'étude de l'accord verbal. ______________________________________________________________________________ MOTS-CLÉS DE L’AUTEUR : accord sujet-verbe, écriture en temps réel, syntaxe, sémantique, processus cognitifs. Accord (Grammaire) Sujet (Grammaire) Verbe Sémantique Syntaxe Processus cognitif Communication écrite Traitement en temps réel
87	L'infinitif complément d'un verbe, d'un adjectif, d'un nom. Ecriture d'un fragment de grammaire Lablanche, Anne 17 December 2007 (has links) (PDF) Le but de cette thèse est de construire un fragment de grammaire du français rendant compte de la syntaxe de l'infinitif dans le cadre des grammaires d'arbres polychromes (GAP).<br />La thèse se compose de deux parties. La première concerne l'étude des problèmes que pose l'infinitif. L'infinitif, comme un verbe, a des compléments et le constituant qu'il forme avec ses compléments peut être lui aussi un complément d'un verbe, d'un nom, d'un adjectif. Ce que les grammaires traditionnelles traduisent en parlant d'une double nature : il possède à la fois des propriétés nominales et verbales. D'où une difficulté spécifique pour faire entrer la syntaxe de l'infinitif dans un modèle formel qui puisse se prêter au traitement automatique. Nous appelons constituant infinitif l'unité composée d'un verbe infinitif et de ses compléments. Il est expliqué pourquoi ce terme est préféré à celui de « proposition subordonnée infinitive ».<br />La seconde partie aborde l'analyse syntaxique des constituants infinitifs en GAP et s'organise autour des contextes dans lesquels apparaît l'infinitif (un verbe, un nom, un adjectif). Le choix d'une représentation en GAP permet de mettre à l'épreuve ce formalisme et de montrer l'intérêt qu'il y a de séparer les fonctions syntaxiques des catégories. Ainsi peut-on rendre compte des cas où un constituant d'une catégorie non nominale occupe une position en général occupée par un nom.<br />Ce travail aura permis, en s'intéressant à la question de la syntaxe de l'infinitif, en partant d'une réinterrogation de certaines études en provenance des grammaires traditionnelles, de parvenir à l'enrichissement d'un formalisme élaboré dans la perspective du TAL. Syntaxe Grammaire Infinitif Formalismes syntaxiques TAL
88	L'acquisition des modifieurs nominaux : le cas de l'adjectif du français Fox, Gwendoline 04 December 2012 (has links) (PDF) Acquérir l'adjectif épithète pose deux problèmes majeurs en français. D'abord, l'adjectif dénote une propriété à propos d'un nom, les enfants doivent donc pouvoir concevoir un objet comme un tout et comme un ensemble de propriétés pour manier un SN avec épithète. Ensuite, l'alternance est un trait définitoire de l'adjectif du français, mais son placement n'est pas aléatoire et les contraintes en jeu sont multiples et d'ordre tendanciel. De plus, bien que les locuteurs connaissent cette possibilité, ils optent plutôt pour un placement fixe en usage. Ces faits nous ont amenée à nous demander si l'input permet à l'enfant de se construire la notion d'adjectif épithète sans avoir recours à des connaissances langagières innées. Pour y répondre, nous proposons une étude comparant les usages de trois enfants à ceux de leur famille à deux temps de leur acquisition (T1 : 3 ;8, T2 : 4 ;6). Nous étudions quatre aspects de l'usage de l'épithète (lexique, placement, combinaison avec d'autres modifieurs ou un dépendant adjectival) et nous confrontons l'adjectif aux autres modifieurs nominaux. Ces phénomènes montrent tous la même évolution. À T1, les enfants emploient la construction la plus fréquente des adultes, avec un fort degré de spécificité lexicale. À T2, d'autres constructions émergent selon leur ordre de fréquence chez les adultes. Le lexique de la construction de T1 s'est en outre élargi dans le champ de la classe sémantique des usages de T1. Les enfants montrent ainsi une sensibilité aux informations quantitatives et une abstraction graduelle des structures par analogie sémantique, qui plaident pour une construction progressive de la notion d'adjectif épithète à partir de l'input. Acquisition du Langage Syntaxe Adjectif Input Constructions Fréquence
89	Extraction et regroupement de descripteurs morpho-syntaxiques pour des processus de Fouille de Textes Béchet, Nicolas 08 December 2009 (has links) (PDF) Les mots constituent l'un des fondements des langues naturelles de type indo-européenne. Des corpus rédigés avec ces langues sont alors naturellement décrits avec des mots. Cependant, l'information qu'ils véhiculent seuls est assez réduite d'un point de vue sémantique. Il est en effet primordial de prendre en compte la complexité de ces langues comme par exemple leurs propriétés syntaxiques, lexicales et sémantiques. Nous proposons dans cette thèse de prendre en considération ces propriétés en décrivant un corpus par le biais d'informations syntaxiques permettant de découvrir des connaissances sémantiques. Nous présentons dans un premier temps un modèle de sélection de descripteurs SelDe. Ce dernier se fonde sur les objets issus des relations syntaxiques d'un corpus. Le modèle SelDe a été évalué pour des tâches de classification de données textuelles. Pour cela, nous présentons une approche d'expansion de corpus, nommée ExpLSA, dont l'objectif est de combiner les informations syntaxiques fournies par SelDe et la méthode numérique LSA. Le modèle SelDe, bien que fournissant des descripteurs de bonne qualité, ne peut être appliqué avec tous types de données textuelles. Ainsi, nous décrivons dans cette thèse un ensemble d'approches adaptées aux données textuelles dites complexes. Nous étudions la qualité de ces méthodes avec des données syntaxiquement mal formulées et orthographiées, des données bruitées ou incomplètes et finalement des données dépourvues de syntaxe. Finalement un autre modèle de sélection de descripteurs, nommé SelDeF, est proposé. Ce dernier permet de valider de manière automatique des relations syntaxiques dites “induites”. Notre approche consiste à combiner deux méthodes. Une première approche fondée sur des vecteurs sémantiques utilise les ressources d'un thésaurus. Une seconde s'appuie sur les connaissances du Web et des mesures statistiques afin de valider les relations syntaxiques. Nous avons expérimenté SelDeF pour une tâche de construction et d'enrichissement de classes conceptuelles. Les résultats expérimentaux montrent la qualité des approches de validation et reflètent ainsi la qualité des classes conceptuelles construites. [INFO:INFO_OH] Computer Science/Other [INFO:INFO_OH] Informatique/Autre TAL fouille de textes descripteur syntaxe classification
90	Les segments averbaux, unités syntaxiques de l'oral Tanguy, Noalig 07 December 2009 (has links) (PDF) Différentes études sur de larges corpus oraux ont permis ces dernières années de mettre en lumière des structures bien particulières tout en élaborant différents modèles articulés autour de nouvelles unités opératoires censées remplacer avec efficacité la notion de phrase. Nous pensons à l'inverse que la notion de phrase comme prédication assortie d'une modalité énonciative peut aisément être conservée pour traiter du français parlé, à condition cependant d'être perçue en temps réel. La phrase, désormais analysée en " noyau + affixes ", est en effet avant tout une unité de traitement et de production n'ayant qu'une existence temporaire dans le flux de l'activité productive et interprétative. Ce postulat nous permettra d'expliquer certains phénomènes averbaux typiques de l'oral comme les réalisations de compléments différés, les répétitions, les reformulations, les recatégorisations de prédicats en affixes. Nous nous sommes donc intéressée plus particulièrement aux différents fonctionnements des segments sans verbe dans un corpus oral. Un premier ensemble rassemble les segments sans verbe fonctionnant en tant que phrases selon des degrés de prédicativité plus au moins élevés : prédications averbales, prédications interjectives et réalisations averbales d'une prédication verbale implicite. Cependant, pour de nombreux segments sans verbe, l'interprétation est moins sûre et ces segments dits " flottants ", en marge des emplois canoniques, nous renvoient à la problématique de la phrase. C'est par exemple le cas de compléments différés, constituants averbaux oscillant entre trois pôles : éléments intégrés, éléments détachés et éléments autonomes. Syntaxe Phrase Oral Prédicat Averbal

Search results