• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 23
  • 4
  • 2
  • 1
  • Tagged with
  • 32
  • 15
  • 9
  • 7
  • 7
  • 7
  • 6
  • 6
  • 6
  • 6
  • 6
  • 5
  • 5
  • 5
  • 5
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
31

Annotation syntaxico-sémantique des actants en corpus spécialisé

Hadouche, Fadila 12 1900 (has links)
L’annotation en rôles sémantiques est une tâche qui permet d’attribuer des étiquettes de rôles telles que Agent, Patient, Instrument, Lieu, Destination etc. aux différents participants actants ou circonstants (arguments ou adjoints) d’une lexie prédicative. Cette tâche nécessite des ressources lexicales riches ou des corpus importants contenant des phrases annotées manuellement par des linguistes sur lesquels peuvent s’appuyer certaines approches d’automatisation (statistiques ou apprentissage machine). Les travaux antérieurs dans ce domaine ont porté essentiellement sur la langue anglaise qui dispose de ressources riches, telles que PropBank, VerbNet et FrameNet, qui ont servi à alimenter les systèmes d’annotation automatisés. L’annotation dans d’autres langues, pour lesquelles on ne dispose pas d’un corpus annoté manuellement, repose souvent sur le FrameNet anglais. Une ressource telle que FrameNet de l’anglais est plus que nécessaire pour les systèmes d’annotation automatisé et l’annotation manuelle de milliers de phrases par des linguistes est une tâche fastidieuse et exigeante en temps. Nous avons proposé dans cette thèse un système automatique pour aider les linguistes dans cette tâche qui pourraient alors se limiter à la validation des annotations proposées par le système. Dans notre travail, nous ne considérons que les verbes qui sont plus susceptibles que les noms d’être accompagnés par des actants réalisés dans les phrases. Ces verbes concernent les termes de spécialité d’informatique et d’Internet (ex. accéder, configurer, naviguer, télécharger) dont la structure actancielle est enrichie manuellement par des rôles sémantiques. La structure actancielle des lexies verbales est décrite selon les principes de la Lexicologie Explicative et Combinatoire, LEC de Mel’čuk et fait appel partiellement (en ce qui concerne les rôles sémantiques) à la notion de Frame Element tel que décrit dans la théorie Frame Semantics (FS) de Fillmore. Ces deux théories ont ceci de commun qu’elles mènent toutes les deux à la construction de dictionnaires différents de ceux issus des approches traditionnelles. Les lexies verbales d’informatique et d’Internet qui ont été annotées manuellement dans plusieurs contextes constituent notre corpus spécialisé. Notre système qui attribue automatiquement des rôles sémantiques aux actants est basé sur des règles ou classificateurs entraînés sur plus de 2300 contextes. Nous sommes limités à une liste de rôles restreinte car certains rôles dans notre corpus n’ont pas assez d’exemples annotés manuellement. Dans notre système, nous n’avons traité que les rôles Patient, Agent et Destination dont le nombre d’exemple est supérieur à 300. Nous avons crée une classe que nous avons nommé Autre où nous avons rassemblé les autres rôles dont le nombre d’exemples annotés est inférieur à 100. Nous avons subdivisé la tâche d’annotation en sous-tâches : identifier les participants actants et circonstants et attribuer des rôles sémantiques uniquement aux actants qui contribuent au sens de la lexie verbale. Nous avons soumis les phrases de notre corpus à l’analyseur syntaxique Syntex afin d’extraire les informations syntaxiques qui décrivent les différents participants d’une lexie verbale dans une phrase. Ces informations ont servi de traits (features) dans notre modèle d’apprentissage. Nous avons proposé deux techniques pour l’identification des participants : une technique à base de règles où nous avons extrait une trentaine de règles et une autre technique basée sur l’apprentissage machine. Ces mêmes techniques ont été utilisées pour la tâche de distinguer les actants des circonstants. Nous avons proposé pour la tâche d’attribuer des rôles sémantiques aux actants, une méthode de partitionnement (clustering) semi supervisé des instances que nous avons comparée à la méthode de classification de rôles sémantiques. Nous avons utilisé CHAMÉLÉON, un algorithme hiérarchique ascendant. / Semantic role annotation is a process that aims to assign labels such as Agent, Patient, Instrument, Location, etc. to actants or circumstants (also called arguments or adjuncts) of predicative lexical units. This process often requires the use of rich lexical resources or corpora in which sentences are annotated manually by linguists. The automatic approaches (statistical or machine learning) are based on corpora. Previous work was performed for the most part in English which has rich resources, such as PropBank, VerbNet and FrameNet. These resources were used to serve the automated annotation systems. This type of annotation in other languages for which no corpora of annotated sentences are available often use FrameNet by projection. Although a resource such as FrameNet is necessary for the automated annotation systems and the manual annotation by linguists of a large number of sentences is a tedious and time consuming work. We have proposed an automated system to help linguists in this task so that they have only to validate annotations proposed. Our work focuses on verbs that are more likely than other predicative units (adjectives and nouns) to be accompanied by actants realized in sentences. These verbs are specialized terms of the computer science and Internet domains (ie. access, configure, browse, download) whose actantial structures have been annotated manually with semantic roles. The actantial structure is based on principles of Explanatory and Combinatory Lexicology, LEC of Mel’čuk and appeal in part (with regard to semantic roles) to the notion of Frame Element as described in the theory of frame semantics (FS) of Fillmore. What these two theories have in common is that they lead to the construction of dictionaries different from those resulting from the traditional theories. These manually annotated verbal units in several contexts constitute the specialized corpus that our work will use. Our system designed to assign automatically semantic roles to actants is based on rules and classifiers trained on more than 2300 contexts. We are limited to a restricted list of roles for certain roles in our corpus have not enough examples manually annotated. In our system, we addressed the roles Patient, Agent and destination that the number of examples is greater than 300. We have created a class that we called Autre which we bring to gether the other roles that the number of annotated examples is less than 100. We subdivided the annotation task in the identification of participant actants and circumstants and the assignment of semantic roles to actants that contribute to the sense of the verbal lexical unit. We parsed, with Syntex, the sentences of the corpus to extract syntactic informations that describe the participants of the verbal lexical unit in the sentence. These informations are used as features in our learning model. We have proposed two techniques for the task of participant detection: the technique based in rules and machine learning. These same techniques are used for the task of classification of these participants into actants and circumstants. We proposed to the task of assigning semantic roles to the actants, a partitioning method (clustering) semi supervised of instances that we have compared to the method of semantic role classification. We used CHAMELEON, an ascending hierarchical algorithm.
32

Sobre las semejanzas sintácticas entre el español y el francés y su aprovechamiento en el aula

García Álvarez, Yansulier 08 1900 (has links)
Ce travail se concentre sur la description de certaines des similitudes syntaxiques —similarités dans la structure grammaticale ou l’ordre des mots au sein des syntagmes et des phrases— entre l’espagnol et le français actuels. Partant du constat que les similitudes syntaxiques ont été peu reflétées dans des études antérieures, il s’agit de compiler et de présenter les informations fournies par les grammaires récentes des deux langues. L’analyse des structures est complétée par des exemples provenant du Corpus del Español del Siglo XXI (CORPES) et de textes en ligne, afin d’offrir une vision aussi précise, claire et synchronique que possible des coïncidences syntaxiques entre ces langues. Le mémoire comprend cinq chapitres. Dans l’introduction, on présente l’approche générale du travail, un bref état de la question, les objectifs et les questions de recherche. Ensuite, on développe le cadre théorique et méthodologique, où sont définis le champ d’étude et les unités d’observation et d’analyse (classes de mots, groupes de mots, phrases et fonctions syntaxiques), on passe en revue les études précédentes sur les similitudes entre l’espagnol et le français, et on aborde la didactique des langues étrangères et les matériels didactiques, en mettant en évidence le rôle de la grammaire et l’importance du transfert positif dans l’apprentissage des langues. Le troisième chapitre est exclusivement consacré aux similitudes syntaxiques, en détaillant chaque groupe de mots (nominal, adjectival, verbal, adverbial, prépositionnel, conjonctif et interjectif) et les types et formes de phrases (prototypique, transformée, déclarative, interrogative, exclamative, impérative, négative, passive, emphatique, impersonnelle, simple et composée). Enfin, pour relier théorie et pratique, trois propositions didactiques sont présentées pour différents niveaux de compétence (A2, B2 et C2), dans le but de favoriser les transferts syntaxiques positifs dans l’enseignement de l’espagnol comme langue étrangère (ELE) et du français comme langue étrangère (FLE). Ces séquences d’activités visent non seulement à faciliter l’apprentissage de la grammaire, en le liant au développement de la compétence communicative, mais aussi à motiver les apprenants grâce à une approche pratique et appliquée. Le mémoire se termine par une synthèse générale, les contributions du travail au domaine de la connaissance et quelques considérations finales. / This work focuses on the description of some of the syntactic similarities— similarities in grammatical structure or word order within groups of words and sentences— between contemporary Spanish and French. Based on the observation that syntactic similarities have been scarcely reflected in previous studies, this work aims to compile and present the information provided by recent grammars of both languages. The analysis of the structures is complemented by examples from the Corpus del Español del Siglo XXI (CORPES) and online texts, to offer as precise, clear, and synchronic a view as possible of the syntactic similarities between these languages. The paper consists of five chapters. The introduction presents the general approach of the work, a brief state of the art, the objectives, and the research questions. Next, the theoretical-methodological framework is developed, where the field of study and the units of observation and analysis (word classes, word groups, sentences, and syntactic functions) are defined, previous studies on similarities between Spanish and French are reviewed, and the didactics of foreign languages and teaching materials are addressed, highlighting the role of grammar and the importance of positive transfer in language learning. The third chapter is exclusively dedicated to syntactic similarities, breaking down each word group (nominal, adjectival, verbal, adverbial, prepositional, conjunctive, and interjective) and the types and forms of sentences (prototypical, transformed, declarative, interrogative, exclamative, imperative, negative, passive, emphatic, impersonal, simple, and compound). Finally, to link theory and practice, three didactic proposals aimed at different levels of proficiency (A2, B2, and C2) are presented, with the objective of promoting positive syntactic transfers in the teaching of Spanish as a Foreign Language (ELE) and French as a Foreign Language (FLE). These activity sequences not only aim to facilitate the learning of grammar by linking it to the development of communicative competence but also seek to motivate learners through a practical and applied approach. The paper concludes with a general synthesis, the contributions of the work to the field of knowledge, and some final considerations. / Este trabajo se centra en la descripción de algunas de las semejanzas sintácticas —semejanzas en la estructura gramatical o el orden de las palabras en el seno de los sintagmas y oraciones— entre el español y el francés actuales. A partir de la constatación de que las semejanzas sintácticas han sido escasamente reflejadas en estudios anteriores, se procede a recopilar y presentar la información que suministran las gramáticas recientes de ambas lenguas. El análisis de las estructuras se complementa con ejemplos procedentes del Corpus del Español del Siglo XXI (CORPES) y de textos en línea, para ofrecer así una visión lo más precisa, clara y sincrónica posible de las coincidencias sintácticas entre estos idiomas. La memoria consta de cinco capítulos. En la introducción se presenta el planteamiento general del trabajo, un breve estado de la cuestión, los objetivos y las preguntas de investigación. A continuación, se desarrolla el marco teórico-metodológico, donde se definen el campo de estudio y las unidades de observación y análisis (clases de palabras, grupos de palabras, oraciones y funciones sintácticas), se revisan los estudios previos sobre las semejanzas entre el español y el francés, y se aborda la didáctica de lenguas extranjeras y los materiales didácticos, destacando el rol de la gramática y la importancia de la transferencia positiva en el aprendizaje de lenguas. El tercer capítulo se dedica exclusivamente a las semejanzas sintácticas, desglosando cada grupo de palabras (nominal, adjetival, verbal, adverbial, preposicional, conjuntivo e interjectivo) y los tipos y formas de las oraciones (prototípica, transformada, declarativa, interrogativa, exclamativa, imperativa, negativa, pasiva, enfática, impersonal, simple y compuesta). Finalmente, para vincular teoría y práctica, se presentan tres propuestas didácticas dirigidas a distintos niveles de competencia (A2, B2 y C2), con el objetivo de propiciar las transferencias sintácticas positivas en la enseñanza del español como lengua extranjera (ELE) y del francés como lengua extranjera (FLE). Estas secuencias de actividades no solo buscan facilitar el aprendizaje de la gramática, vinculándolo al desarrollo de la competencia comunicativa, sino que también pretenden motivar a los aprendientes mediante un enfoque práctico y aplicado. La memoria concluye con una síntesis general, los aportes del trabajo al área de conocimiento y unas consideraciones finales.

Page generated in 0.0643 seconds