• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 3
  • 2
  • 2
  • 1
  • Tagged with
  • 8
  • 8
  • 5
  • 4
  • 3
  • 3
  • 3
  • 3
  • 3
  • 3
  • 3
  • 2
  • 2
  • 2
  • 2
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
1

Kasta bort bollen och äta bort sin huvudvärk : En studie av argumentstrukturen i kausativa bort-konstruktioner / The Argument Structure of Swedish Causative bort-Constructions

Sjögreen, Christian January 2015 (has links)
This thesis investigates the argument structure of transitive particle constructions with the adverb bort, meaning ‘away’, ‘off’. On the basis of approximately 2000 authentic instances of the partially schematic structure [subject verb bort object], I have identified a number of constructions at different levels of abstraction. The overall aim of the thesis is to account for the argument structure of the bort-constructions and to provide an overview of the relation between verb meaning and constructional meaning. Based on the empirical investigation, the argument structure of these constructions seems most adequately accounted for by combining lexical and constructional factors. The investigation shows that the argument structure forms a lexical-constructional continuum: some constructions clearly have verb-specific meaning, whereas others have meaning more or less independently of the verb. In between we find constructions exhibiting various degrees of influence over the lexical properties of the verb. Verb meaning is analyzed within a causative semantic framework, and I assume an association between causation and argument structure. The bort-constructions form a causative continuum ranging from direct, physical to indirect, abstract causation. By analyzing the verbs’ semantics in relation to these different causative structures (semantic frames), I demonstrate that the causative continuum and the argument structure continuum are aligned: the more indirect the causation, the more constructionally dependent (less verb-specific) the argument structure.
2

Meat me in the green : En litteraturstudie om sensoriska egenskaper för veganska och vegetariska livsmedelsprodukter

Gillow Thorsén, Clara January 2023 (has links)
Förståelse och intresset för mat och måltid ökar explosionsartat vilket medför större krav pålivsmedelsprodukter och upplevelser av en måltid där en produkt står i centrum.Produktutvecklare och gastronomer arbetar ständigt för att producera smakfulla livsmedelsom både är klimatsmarta och uppfyller konsumenternas krav på smak. Inomlivsmedelsindustrin görs det kontinuerligt sensoriska bedömningar för att diskuterasensoriska egenskaper i livsmedelsprodukter. Men hur kommunicerar vi vår sensoriskaupplevelse av livsmedelsprodukter så precist som möjligt? Ett verktyg för att kommunicerasin upplevelse kan vara standardiserade sensoriska bedömning, vilket innebär att man skapartydliga riktlinjer för ett specifikt produktområde, vilket således kan användas för attidentifiera sensoriska egenskaper i en livsmedelsprodukt. Magisteruppsatsen syftar till en litteraturstudie som bygger på en kvalitativ innehållsanalysbaserad på 14 artiklar. Målet med innehållsanalysen var att komma fram till relevantasensoriska egenskapsord inom ramen för veganska och vegetariska livsmedelsprodukter. Ienlighet med de framtagna egenskapsorden kunde ett sensoriskt ramverk upprättas vilketsåledes också resulterar i tydliga smakprofiler och egenskaper för produktområdet. Avsiktenmed att ta fram ett semantiskt ramverk av denna sort var att förenkla smakprovningar inomOrkla Foods Sverige och på så vis utveckla ett enhetligt språk för produktområdet. Avslutningsvis går det att argumentera för att ett semantiskt ramverk med tydligaegenskapsord kan komma att underlätta processen inom produktutveckling, jämförelser avprodukter och dylikt. Trots att det inte går att utesluta människans subjektiva åsikt ochfysiska obalanser sinsemellan, är ett semantiskt ramverk ett relevant verktyg i avseende attförenkla kommunikationen och beskrivningen av veganska eller vegetariskalivsmedelsprodukt.
3

Princípios metodológicos para a construção de uma ontologia baseada na semântica de frames

Müller, Carolina 26 August 2015 (has links)
Submitted by Silvana Teresinha Dornelles Studzinski (sstudzinski) on 2015-10-28T12:55:53Z No. of bitstreams: 1 Carolina Müller_.pdf: 7010149 bytes, checksum: dea9fca340fddaec536a1d6bc89582d7 (MD5) / Made available in DSpace on 2015-10-28T12:55:53Z (GMT). No. of bitstreams: 1 Carolina Müller_.pdf: 7010149 bytes, checksum: dea9fca340fddaec536a1d6bc89582d7 (MD5) Previous issue date: 2015-08-26 / CAPES - Coordenação de Aperfeiçoamento de Pessoal de Nível Superior / CNJ/CAPES - Conselho Nacional de Justiça / Esta tese apresenta uma metodologia fundamentada na teoria da Semântica de Frames (FILLMORE, 1982) para a construção de ontologias de domínio. A metodologia proposta segue passos reinterpretados a partir de metodologias vigentes, porém embasados no conceito de frames semânticos (cenas com seus participantes e diferentes papéis) para a descrição dos significados. O principal objetivo desta pesquisa reside em refletir sobre as convergências entre ontologias (GRUBER, 1996; GUARINO, 1998) e frames, de modo a acreditar-se que a combinação destas duas formas de organizar o conhecimento garantem a representação mais precisa de conceitos do domínio jurídico. A proposta assume que a inserção da informação dos frames, especialmente a relacionada aos diferentes papéis que os participantes podem exercer, é capaz de prover uma descrição detalhada dos conceitos do domínio e, assim, prover mais significado à ontologia. A metodologia prevê cinco etapas que correspondem ao ciclo de vida da ontologia, porém têm como foco o estágio de conceitualização, no qual são descritos os conceitos do domínio através do uso dos frames. Realizou-se a construção de uma ontologia piloto tomando como base os Juizados Especiais Criminais, cujos processos tramitam em primeira instância e correspondem a crimes de menor potencial ofensivo. O estudo resultou em uma metodologia linguística para o desenvolvimento de ontologias de domínio capaz de ampliar a descrição dos conceitos, provendo detalhamentos sobre os eventos, seus participantes e os diferentes papéis por eles exercidos, de modo a prover mais significado à estrutura ontológica, contribuindo com a recuperação da informação. A etapa de avaliação da ontologia foi realizada com base no cálculo da abrangência, obtendo um resultado de 84,4% de informações representáveis na estrutura ontológica, demonstrando a proficuidade da metodologia proposta no que se refere à identificação de informações relevantes advindas dos documentos jurídicos. / This thesis presents a methodology for the construction of domain ontologies based on the theory of Semantic Frames (FILLMORE, 1982). The proposed methodology reinterprets existents methodologies, but grounded in the concept of semantic frames (scenes of its participants and different roles) for the description of meanings. The main objective of this research lies in reflecting on the similarities between ontologies (GRUBER, 1996; GUARINO, 1998) and frames in order to believe that the combination of these two ways of organizing knowledge ensures the most accurate representation of legal domain concepts. The proposal assumes the inclusion of information of frames, especially those related to the different roles that scene participants may assume, is capable of providing a detailed description of domain concepts and thus provide more meaning to the ontology. The methodology provides five steps that correspond to the ontology life cycle, but are focused on the conceptualization stage, in which describes the domain concepts through the use of frames. A pilot ontology was built based on the Special Criminal Courts context, whose cases proceed through at first instance and account for crimes of lesser offensive potential. The study resulted in a linguistic methodology to develop domain ontologies able to expand the description of the concepts, providing detailing of events, its participants and the different roles they assume in order to provide more meaning to the ontological structure, aiming at contributing specially in information retrieval of documents. The evaluation stage of ontology was based on calculation of coverage (recall), getting a score of 84.4% of representable information on the ontological structure, demonstrating the usefulness of the proposed methodology with regard to the identification of relevant information from legal documents
4

Stratégie domaine par domaine pour la création d'un FrameNet du français : annotations en corpus de cadres et rôles sémantiques / Domain by domain strategy for creating a French FrameNet : corpus annotationsof semantics frames and roles

Djemaa, Marianne 14 June 2017 (has links)
Dans cette thèse, nous décrivons la création du French FrameNet (FFN), une ressource de type FrameNet pour le français créée à partir du FrameNet de l’anglais (Baker et al., 1998) et de deux corpus arborés : le French Treebank (Abeillé et al., 2003) et le Sequoia Treebank (Candito et Seddah, 2012). La ressource séminale, le FrameNet de l’anglais, constitue un modèle d’annotation sémantique de situations prototypiques et de leurs participants. Elle propose à la fois :a) un ensemble structuré de situations prototypiques, appelées cadres, associées à des caractérisations sémantiques des participants impliqués (les rôles);b) un lexique de déclencheurs, les lexèmes évoquant ces cadres;c) un ensemble d’annotations en cadres pour l’anglais. Pour créer le FFN, nous avons suivi une approche «par domaine notionnel» : nous avons défini quatre «domaines» centrés chacun autour d’une notion (cause, communication langagière, position cognitive ou transaction commerciale), que nous avons travaillé à couvrir exhaustivement à la fois pour la définition des cadres sémantiques, la définition du lexique, et l’annotation en corpus. Cette stratégie permet de garantir une plus grande cohérence dans la structuration en cadres sémantiques, tout en abordant la polysémie au sein d’un domaine et entre les domaines. De plus, nous avons annoté les cadres de nos domaines sur du texte continu, sans sélection d’occurrences : nous préservons ainsi la distribution des caractéristiques lexicales et syntaxiques de l’évocation des cadres dans notre corpus. à l’heure actuelle, le FFN comporte 105 cadres et 873 déclencheurs distincts, qui donnent lieu à 1109 paires déclencheur-cadre distinctes, c’est-à-dire 1109 sens. Le corpus annoté compte au total 16167 annotations de cadres de nos domaines et de leurs rôles. La thèse commence par resituer le modèle FrameNet dans un contexte théorique plus large. Nous justifions ensuite le choix de nous appuyer sur cette ressource et motivons notre méthodologie en domaines notionnels. Nous explicitons pour le FFN certaines notions définies pour le FrameNet de l’anglais que nous avons jugées trop floues pour être appliquées de manière cohérente. Nous introduisons en particulier des critères plus directement syntaxiques pour la définition du périmètre lexical d’un cadre, ainsi que pour la distinction entre rôles noyaux et non-noyaux.Nous décrivons ensuite la création du FFN : d’abord, la délimitation de la structure de cadres utilisée pour le FFN, et la création de leur lexique. Nous présentons alors de manière approfondie le domaine notionnel des positions cognitives, qui englobe les cadres portant sur le degré de certitude d’un être doué de conscience sur une proposition. Puis, nous présentons notre méthodologie d’annotation du corpus en cadres et en rôles. à cette occasion, nous passons en revue certains phénomènes linguistiques qu’il nous a fallu traiter pour obtenir une annotation cohérente ; c’est par exemple le cas des constructions à attribut de l’objet.Enfin, nous présentons des données quantitatives sur le FFN tel qu’il est à ce jour et sur son évaluation. Nous terminons sur des perspectives de travaux d’amélioration et d’exploitation de la ressource créée. / This thesis describes the creation of the French FrameNet (FFN), a French language FrameNet type resource made using both the Berkeley FrameNet (Baker et al., 1998) and two morphosyntactic treebanks: the French Treebank (Abeillé et al., 2003) and the Sequoia Treebank (Candito et Seddah, 2012). The Berkeley FrameNet allows for semantic annotation of prototypical situations and their participants. It consists of:a) a structured set of prototypical situations, called frames. These frames incorporate semantic characterizations of the situations’ participants (Frame Elements, or FEs);b) a lexicon of lexical units (LUs) which can evoke those frames;c) a set of English language frame annotations. In order to create the FFN, we designed a “domain by domain” methodology: we defined four “domains”, each centered on a specific notion (cause, verbal communication, cognitive stance, or commercial transaction). We then sought to obtain full frame and lexical coverage for these domains, and annotated the first 100 corpus occurrences of each LU in our domains. This strategy guarantees a greater consistency in terms of frame structuring than other approaches and is conducive to work on both intra-domain and inter-domains frame polysemy. Our annotating frames on continuous text without selecting particular LU occurrences preserves the natural distribution of lexical and syntactic characteristics of frame-evoking elements in our corpus. At the present time, the FFNincludes 105 distinct frames and 873 distinct LUs, which combine into 1,109 LU-frame pairs (i.e. 1,109 senses). 16,167 frame occurrences, as well as their FEs, have been annotated in our corpus. In this thesis, I first situate the FrameNet model in a larger theoretical background. I then justify our using the Berkeley FrameNet as our resource base and explain why we used a domain-by- domain methodology. I next try to clarify some specific BFN notions that we found too vague to be coherently used to make the FFN. Specifically, I introduce more directly syntactic criteria both for defining a frame’s lexical perimeter and for differentiating core FEs from non-core ones.Then, I describe the FFN creation itself first by delimitating a structure of frames that will be used in the resource and by creating a lexicon for these frames. I then introduce in detail the Cognitive Stances notional domain, which includes frames having to do with a cognizer’s degree of certainty about some particular content. Next, I describe our methodology for annotating a corpus with frames and FEs, and analyze our treatment of several specific linguistic phenomena that required additional consideration (such as object complement constructions).Finally, I give quantified information about the current status of the FFN and its evaluation. I conclude with some perspectives on improving and exploiting the FFN.
5

A semântica dos compostos nominais – um estudo de corpus paralelo inglês/português

Teixeira, Lílian Figueiró 10 March 2009 (has links)
Made available in DSpace on 2015-03-05T18:11:58Z (GMT). No. of bitstreams: 0 Previous issue date: 10 / Nenhuma / Os compostos nominais são construções produtivas em diversos idiomas, ou seja, novas combinações são facilmente criadas em contextos de uso da língua. No entanto, esse fenômeno linguístico é idiossincrático, fato que torna o seu estudo um desafio para a linguística e para as investigações que se ocupam do Processamento da Linguagem Natural. Neste trabalho, é feita uma investigação sobre a forma como os elementos constituintes dos compostos nominais em inglês formados por dois substantivos (compostos NN) se relacionam semanticamente e quais as características dos seus correspondentes de tradução em língua portuguesa encontrados em dez edições da revista National Geographic. O objetivo desta investigação é identificar as relações mais frequentes no corpus a fim de que se possa propor uma tipologia que expresse a composicionalidade semântica dessas construções. Para alcançar esse fim, o trabalho está dividido em três etapas. A primeira etapa consiste em apresentar os pressupostos teóricos adotados no trabalho. P / Noun compounds are productive constructions in many languages. However, they are idiosyncratic, fact that makes the study of this linguistic phenomenon a challenge for the linguistics and for the Natural Language researches. The purpose of this paper is to study the semantics of the noun compounds formed by two nouns (NN compounds). It is also intended to identify the translation equivalents in Portuguese found in ten editions of the National Geographic Magazine. The final product is a proposal of typology which expresses the compositionality of the NN compounds according to the data found in the corpus. This paper has three distinctive parts, where the following subjects are introduced: the theoretical bases for this paper; the methodological resources from Corpus Linguistics that were adopted; the analysis and discussion about the data. Concepts about the semantics of nominal compounds as productivity, semantic transparency, headness, lexicalization and nominalization are commented. Two theories were used f
6

Semântica de frames e recursos lexicais jurídicos: um estudo contrastivo

Bertoldi, Anderson 05 January 2011 (has links)
Submitted by Nara Lays Domingues Viana Oliveira (naradv) on 2015-08-13T14:24:45Z No. of bitstreams: 1 AndersonBertoldiLinguistica.pdf: 1093382 bytes, checksum: 67276822830f904d7688524dbfd24b12 (MD5) / Made available in DSpace on 2015-08-13T14:24:45Z (GMT). No. of bitstreams: 1 AndersonBertoldiLinguistica.pdf: 1093382 bytes, checksum: 67276822830f904d7688524dbfd24b12 (MD5) Previous issue date: 2011-01-05 / CAPES - Coordenação de Aperfeiçoamento de Pessoal de Nível Superior / A presente tese teve como objetivo avaliar os desafios a serem enfrentados no desenvolvimento de recursos lexicais multilíngües segundo o paradigma FrameNet. Abordouse aqui a Semântica de Frames com uma teoria da lingüística cognitiva e a forma como a FrameNet trata o conceito de frame semântico em sua base de dados. Para tratar dos desafios no uso de frames semânticos para a descrição de informação jurídica em diferentes línguas, optou-se por investigar o frame Criminal_process. Em um primeiro momento, identificaram-se, com o auxílio de um dicionário jurídico bilíngüe, os equivalentes em português das unidades lexicais do inglês relacionadas ao processo penal. Em um segundo momento, essas unidades lexicais foram contrastadas para verificar se o conhecimento jurídico evocado pela unidade lexical em inglês era o mesmo conhecimento jurídico evocado pelo seu equivalente em português. A abordagem contrastiva permitiu a criação de frames jurídicos descrevendo o processo penal brasileiro. Constatou-se que os frames semânticos apresentam diferentes níveis de equivalência. Este trabalho procurou explicar as divergências de frames semânticos por meio da diferenciação entre frames inatos e frames aprendidos. Uma vez que constatada a falta de equivalência perfeita de frames entre as línguas, é necessário se repensar o uso dos frames semânticos como interlíngua em recursos lexicais multilíngües, especialmente se esses recursos representarem conhecimento jurídico. Este trabalho apontou como uma possível solução para a falta de equivalência entre frames o uso de um recurso ainda pouco abordado pela FrameNet: os tipos semânticos. Os tipos semânticos poderiam ser utilizados em uma base de dados jurídica multilíngüe para marcar o papel social exercido por cada participante dos eventos jurídicos. / This Ph.D. dissertation discusses the challenges to be faced in developing multilingual lexical resources according to the FrameNet paradigm. This work was based on Frame Semantics. The starting point was the Criminal_process frame. First, the equivalents in Portuguese for the lexical units were identified using a bilingual legal dictionary. Second, the lexical units were contrasted in order to verify the legal knowledge evoked by lexical units in English was the same legal knowledge evoked by their equivalents in Portuguese. Based on the contrastive study, legal frames representing the Brazilian legal system were created. This work could verify that semantic frames present different levels of equivalence. The differences in frame equivalence were analyzed according to the difference between innate and learned frames. Considering that the semantic frames do not present a perfect equivalence among languages, it is necessary to rethink the use of semantic frames as interlingual index to connect multilingual resources, especially legal lexical resources. This dissertation considers the possibility of using semantic types as a possible solution in a future.
7

Du terme prédicatif au cadre sémantique : méthodologie de compilation d'une ressource terminologique pour les termes arabes de l'informatique

Ghazzawi, Nizar 08 1900 (has links)
La description des termes dans les ressources terminologiques traditionnelles se limite à certaines informations, comme le terme (principalement nominal), sa définition et son équivalent dans une langue étrangère. Cette description donne rarement d’autres informations qui peuvent être très utiles pour l’utilisateur, surtout s’il consulte les ressources dans le but d’approfondir ses connaissances dans un domaine de spécialité, maitriser la rédaction professionnelle ou trouver des contextes où le terme recherché est réalisé. Les informations pouvant être utiles dans ce sens comprennent la description de la structure actancielle des termes, des contextes provenant de sources authentiques et l’inclusion d’autres parties du discours comme les verbes. Les verbes et les noms déverbaux, ou les unités terminologiques prédicatives (UTP), souvent ignorés par la terminologie classique, revêtent une grande importance lorsqu’il s’agit d’exprimer une action, un processus ou un évènement. Or, la description de ces unités nécessite un modèle de description terminologique qui rend compte de leurs particularités. Un certain nombre de terminologues (Condamines 1993, Mathieu-Colas 2002, Gross et Mathieu-Colas 2001 et L’Homme 2012, 2015) ont d’ailleurs proposé des modèles de description basés sur différents cadres théoriques. Notre recherche consiste à proposer une méthodologie de description terminologique des UTP de la langue arabe, notamment l’arabe standard moderne (ASM), selon la théorie de la Sémantique des cadres (Frame Semantics) de Fillmore (1976, 1977, 1982, 1985) et son application, le projet FrameNet (Ruppenhofer et al. 2010). Le domaine de spécialité qui nous intéresse est l’informatique. Dans notre recherche, nous nous appuyons sur un corpus recueilli du web et nous nous inspirons d’une ressource terminologique existante, le DiCoInfo (L’Homme 2008), pour compiler notre propre ressource. Nos objectifs se résument comme suit. Premièrement, nous souhaitons jeter les premières bases d’une version en ASM de cette ressource. Cette version a ses propres particularités : 1) nous visons des unités bien spécifiques, à savoir les UTP verbales et déverbales; 2) la méthodologie développée pour la compilation du DiCoInfo original devra être adaptée pour prendre en compte une langue sémitique. Par la suite, nous souhaitons créer une version en cadres de cette ressource, où nous regroupons les UTP dans des cadres sémantiques, en nous inspirant du modèle de FrameNet. À cette ressource, nous ajoutons les UTP anglaises et françaises, puisque cette partie du travail a une portée multilingue. La méthodologie consiste à extraire automatiquement les unités terminologiques verbales et nominales (UTV et UTN), comme Ham~ala (حمل) (télécharger) et taHmiyl (تحميل) (téléchargement). Pour ce faire, nous avons adapté un extracteur automatique existant, TermoStat (Drouin 2004). Ensuite, à l’aide des critères de validation terminologique (L’Homme 2004), nous validons le statut terminologique d’une partie des candidats. Après la validation, nous procédons à la création de fiches terminologiques, à l’aide d’un éditeur XML, pour chaque UTV et UTN retenue. Ces fiches comprennent certains éléments comme la structure actancielle des UTP et jusqu’à vingt contextes annotés. La dernière étape consiste à créer des cadres sémantiques à partir des UTP de l’ASM. Nous associons également des UTP anglaises et françaises en fonction des cadres créés. Cette association a mené à la création d’une ressource terminologique appelée « DiCoInfo : A Framed Version ». Dans cette ressource, les UTP qui partagent les mêmes propriétés sémantiques et structures actancielles sont regroupées dans des cadres sémantiques. Par exemple, le cadre sémantique Product_development regroupe des UTP comme Taw~ara (طور) (développer), to develop et développer. À la suite de ces étapes, nous avons obtenu un total de 106 UTP ASM compilées dans la version en ASM du DiCoInfo et 57 cadres sémantiques associés à ces unités dans la version en cadres du DiCoInfo. Notre recherche montre que l’ASM peut être décrite avec la méthodologie que nous avons mise au point. / The description of terms in traditional terminological resources is limited to certain details, such as the term (which is usually a noun), its definition, and its equivalent. This description seldom takes into account other details, which can be of high importance for the users, especially if they consult resources to enhance their knowledge of the domain, to improve professional writing, or to find contexts where the term is realized. The information that might be useful includes the description of the actantial structure of the terms, contexts from authentic resources and the inclusion of other parts of speech such as verbs. Verbs and deverbal nouns, or predicative terminological units (PTUs), which are often ignored by traditional terminology, are of great importance especially for expressing actions, processes or events. But the description of these units requires a model of terminological description that takes into account their special features. Some terminologists (Condamines 1993, Mathieu-Colas 2002, Gross et Mathieu-Colas 2001 et L’Homme 2012, 2015) proposed description models based on different theoretical frameworks. Our research consists of proposing a methodology of terminological description of PTUs of the Arabic language, in particular Modern Standard Arabic (MSA), according to the theory of Frame Semantics of Fillmore (1976, 1977, 1982, 1985) and its application, the FrameNet project (Ruppenhofer et al. 2010). The specialized domain in which we are interested is computing. In our research, we compiled a corpus that we collected from online material and we based our method on an existing online terminological resource called the DiCoInfo (L’Homme 2008) in our pursuit to compile our own. Our objectives are the following. First, we will lay the foundations of an MSA version of the aforementioned resource. This version has its own features: 1) we target specific units, namely verbal and deverbal PTUs; 2) the developed methodology for the compilation of the original DiCoInfo should be adapted to take into account a Semitic language. Afterwards, we will create a framed version of this resource. In this version, we organize the PTUs in semantic frames according to the model of FrameNet. Since this frame version has a multilingual dimension, we add English and French PTUs to the resource. Our methodology consists of automatically extracting the verbal and nominal terminological units (VTUs and NTUs) such as Ham~ala (حمل) (download). To do this, we integrated the MSA to an existing automatic extractor, TermoStat (Drouin 2004). Then, with the help of terminological validation criteria, we validate the terminological status of the candidates. After the validation, we create terminological files with an XML editor for each VTU and NTU. These files contain elements, such as the actantial structure of the PTUs and up to 20 annotated contexts. The last step consists of creating semantic frames from the MSA PTUs. We also associate English and French PTUs to the created frames. This association resulted in the creation of a second terminological resource called “DiCoInfo: A Framed Version”. In this resource, the PTUs that share the same semantic features and actantial structures are organized in semantic frames. For example, the semantic frame Product_development groups PTUs such as Taw~ara (طور) (develop), to develop and développer. As a result of our methodology, we obtained a total of 106 PTUs in MSA compiled in the MSA version of DiCoInfo and 57 semantic frames associated to these units in the framed version. Our research shows that the MSA can be described using the methodology that we set up.
8

Frame semantics for the field of climate change : d iscovering frames based on chinese and english terms

Zheng, Ying 12 1900 (has links)
La plupart des dictionnaires spécialisés de termes environnementaux en mandarin sont des dictionnaires papier, compilés et révisés il y a plus de dix ans, et contiennent principalement des termes nominaux. Les informations terminologiques se limitent aux connaissances véhiculées par le terme et son ou ses équivalents anglais. Pour les lecteurs qui souhaitent connaître les propriétés sémantiques ou syntaxiques des termes et pour les lecteurs qui veulent voir l’usage des termes dans des contextes réels de textes spécialisés, les informations fournies par les dictionnaires existants sont insuffisantes. Dans cette recherche, nous avons compilé une ressource terminologique en ligne du mandarin, décrivant les termes verbaux chinois dans le domaine du changement climatique. Cette ressource comble certaines des lacunes des dictionnaires environnementaux mandarin existants, en révélant le(s) sens du terme à travers la(les) structure(s) actantielle(s) et en montrant, à travers des contextes annotés, les propriétés sémantiques et syntaxiques du terme ainsi que ses usages pratiques dans des textes spécialisés. Cette ressource répondra mieux aux besoins du public. La base théorique qui sous-tend cette recherche est la Sémantique des cadres (Fillmore, 1976, 1977, 1982, 1985; Fillmore & Atkins, 1992), et le FrameNet construit à partir de celle-ci. L’objectif principal de cette recherche est de découvrir et de définir des cadres sémantiques chinois dans le domaine du changement climatique, et d’établir des relations entre les cadres chinois définis. Les cadres sémantiques chinois sont découverts à l’aide de la méthodologie du dictionnaire environnemental multilingue DiCoEnviro (et de sa ressource d’accompagnement Framed DiCoEnviro) (L’Homme, 2018; L’Homme et al., 2020). Afin de rendre cette méthodologie applicable à une langue sino-tibétaine, le chinois, nous avons modifié et adapté cette méthodologie pour qu’elle convienne à la description des termes chinois et à la définition des cadres sémantiques chinois. Certaines de ces modifications et adaptations sont basées sur le Chinese FrameNet (CFN) (Liu & You, 2015). Afin de découvrir les cadres sémantiques chinois, un corpus monolingue en chinois mandarin sur le changement climatique (MCCC) a d’abord été compilé. Ce corpus contient 224 textes iv authentiques chinois spécialisés dans le domaine du changement climatique, qui totalisent 1,228,333 caractères chinois, soit 547,592 mots chinois. Puis, les termes candidats ont été automatiquement extraits du MCCC à l’aide du logiciel de gestion et d’analyse de corpus – Sketch Engine. Après une analyse et une validation manuelle, nous avons déterminé quels termes candidats sont des termes réels. Par la suite, la structure actancielle de chaque terme a été écrite en analysant les contextes où le terme apparaît. Ensuite, chaque sens d’un terme polysémique a été placé dans une entrée séparée et 16-20 contextes ont été sélectionnés pour chaque entrée. Puis, chaque contexte a été annoté en fonction de trois couches – structure sémantique, fonction syntaxique et groupe syntaxique. Ensuite, les termes ont été classés en fonction des scénarios qu’ils évoquent. Les termes qui dépeignent la même scène ou situation dans le domaine du changement climatique, qui ont une structure actantielle similaire et qui partagent la majorité des circonstants sont classés dans un seul cadre sémantique (critères basés sur le projet DiCoEnviro (L’Homme, 2018; L’Homme et al., 2020)). Après avoir identifié les cadres sémantiques chinois, chaque cadre a été défini. Enfin, les cadres chinois découverts ont été reliés selon les huit types de relations entre cadres proposés par Ruppenhofer et al. (2016). Pour être affichés en ligne, les entrées de termes et les cadres sémantiques ont été encodés dans des fichiers XML. Guidés par cette méthodologie de recherche, nous avons finalement relevé 23 cadres sémantiques chinois et nous les avons définis. Le résultat final de cette recherche est une ressource terminologique en chinois mandarin basée sur des cadres et spécialisée dans le domaine du changement climatique. Cette ressource terminologique se compose de deux parties. La première partie est la description d’un total de 39 termes verbaux chinois. Chaque sens d’un terme verbal polysémique étant placé dans une entrée séparée, il y a au total 59 entrées (chaque entrée contient la structure actantielle et les contextes annotés). Au total, 1,027 contextes ont été annotés. La deuxième partie de cette ressource présente les 23 cadres sémantiques chinois identifiés ainsi que les relations entre les cadres. / Most of the existing Mandarin Chinese specialised dictionaries of environmental terms are paper dictionaries, compiled and revised more than ten years ago, and contain mainly noun terms. Terminological information is restricted to knowledge conveyed by the term and its English equivalent(s). For readers who want to learn about semantic or syntactic properties of terms and for readers who want to see usage of terms in real contexts of specialised texts, information provided in existing dictionaries is insufficient. In this research, we compiled an online Mandarin Chinese terminological resource, describing Chinese verb terms in the field of climate change. This resource makes up for some of the deficiencies of existing Chinese environmental dictionaries, revealing meaning(s) of the term through actantial structure(s) and showing, through annotated contexts, semantic and syntactic properties of the term as well as its practical usages in specialised texts. This resource better meets the needs of the audience. The theoretical basis underpinning this research is Frame Semantics (Fillmore, 1976, 1977, 1982, 1985; Fillmore & Atkins, 1992), and the FrameNet built from it. The main objective of this research is to discover and define Chinese semantic frames in the field of climate change, and to establish relations between the Chinese frames defined. The Chinese semantic frames are discovered with the help of the methodology of the multilingual environmental dictionary DiCoEnviro (and its accompanying resource Framed DiCoEnviro) (L’Homme, 2018; L’Homme et al., 2020). In order to make this methodology applicable to a Sino-Tibetan language, Chinese, we modified and adapted this methodology to suit the description of Chinese terms and definition of Chinese semantic frames. Some of the changes and adaptations are based on the Chinese FrameNet (CFN) (Liu & You, 2015). In order to discover Chinese semantic frames, a monolingual Mandarin (Chinese) Climate Change Corpus (MCCC) was first compiled. This corpus contains 224 authentic Chinese specialised texts in the field of climate change, totaling 1,228,333 Chinese characters, which is 547,592 Chinese words. Following this, candidate terms were automatically extracted from MCCC using the corpus ii management and analysing software – Sketch Engine. After manual analysis and validation, which of the candidate terms are true terms was clarified. Subsequently, the actantial structure of each term was written by analysing the contexts where the term occurs. Next, each sense of a polysemous term was placed in a separate entry and 16-20 contexts were selected for each entry. Then, each context was annotated in terms of three layers – semantic structure, syntactic function and syntactic group. After this, the terms were classified according to the scenarios they evoke. Terms that depict the same scene or situation in the field of climate change, have similar actantial structure, and share the majority of circumstants are categorised into one semantic frame (criteria based on the project DiCoEnviro (L’Homme, 2018; L’Homme et al., 2020)). After Chinese semantic frames were identified, each frame was defined. Finally, the discovered Chinese frames were linked according to the eight types of frame relations proposed by Ruppenhofer et al. (2016). To be displayed online, term entries and semantic frames were encoded in XML files. Guided by this research methodology, we eventually discovered and defined 23 Chinese semantic frames. The end result of this research is a frame-based Mandarin Chinese terminological resource specialised in the field of climate change. This terminological resource consists of two parts. The first part is the description of a total of 39 Chinese verb terms. With each meaning of a polysemous verb term placed in a separate entry, there are a total of 59 entries (each entry contains the actantial structure and annotated contexts). A total of 1,027 contexts were annotated. The second part of this resource presents the 23 Chinese semantic frames identified as well as the relations between frames.

Page generated in 0.081 seconds