• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 1
  • 1
  • Tagged with
  • 2
  • 2
  • 2
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
1

Kun on tunteet:suomen kielen tunnesanojen semantiikkaa

Tuovila, S. (Seija) 29 August 2005 (has links)
Abstract The present study focuses on the semantics of Finnish emotion words (e.g. joy, anger). My aim has been to investigate and describe what kinds of linguistic-semantic interpretations arise from an emotions vocabulary compiled using a questionnaire as a research instrument. Moreover, I was interested in finding out what kinds of emotions the Finns identify. The data used for the study consisted of the written responses of a hundred Finns of various ages to a questionnaire item, which asked them to name various emotions. Besides the two objectives above, male and female conceptual frameworks for emotions were compared in the study, as well as those of different age groups. Both a qualitative and a quantitative analysis of the data, which consists of 2020 responses, were carried out. The view of language adopted for this study draws from the basic notions of cognitive linguistics. I applied Anna Wierzbicka's ideas to the semantic grouping of emotion words. Moreover, the explanations given for the 51 most commonly used emotion words were based on Wierzbicka's idea of a natural semantic meta-language. I also used for the word descriptions the information provided by the Kielipankki newspaper corpus on the use of emotion words. The semantic contents of emotion words were explained as prototypical scenarios using the following semantic primitives: I, PERSON/SOMEONE, SOMETHING, THIS, OTHER, GOOD, BAD, THINK, KNOW, WANT, FEEL, CAN, DO, HAPPEN, THERE IS, WHEN, NOW, BEFORE, AFTER, A LONG TIME, A SHORT TIME, FOR SOME TIME, SOMETIMES, MIND, BODY, NEAR, INSIDE, NOT, TRUE, MAYBE, CAN, WOULD 'cond.', BECAUSE, IF, VERY, LIKE, MORE, SOME. The following semantic main categories were defined for emotion words: "Something good happened or will happen", "Something bad happened or will happen", "I want", "I don't want", "I think something about myself", "I think something about others", "I know / don't know". I investigated the status and significance of emotion words for the speakers of Finnish by using a cognitive significance index. The index has been developed by Urmas Sutrop particularly for the analysis of listing tasks. The cognitively most important emotion words for Finns were found to be: viha, ilo, rakkaus, suru, pelko, onnellisuus, kateus, ahdistus, väsymys, masennus, tuska, ihastus, tyytyväisyys, inho, jännitys, pettymys, kaipaus, rauhallisuus, ikävä, and toivo. According to this study, the emotions with the highest frequency of expression in the Finnish language are hatred, joy, love and sorrow. Women were found to have more words for emotions (23.0) than men (17.6). The emotion vocabulary includes more negative words (53%) than positive ones (43%). The findings of this study suggest that the Finns think more often good of other people than bad, and more often bad of themselves than good. / Tiivistelmä Tutkimukseni aiheena on suomen kielen tunteiden (esim. ilo, viha) semantiikka. Tavoitteenani on ollut tutkia ja kuvata, millainen lingvistinen semanttinen tulkinta tutkimukseni kyselyllä koostetusta tunnesanastosta muodostuu ja millaisia tunteita suomalaiset mieltävät olevan olemassa. Tutkimukseni perusaineiston muodostivat sadan eri-ikäisen suomalaisen kirjalliset vastaukset tehtävään, jossa he saivat vapaasti luetella tunteiden nimityksiä. Lisäksi olen vertaillut miesten ja naisten sekä eri ikäryhmien tunnekäsitteistyksiä. Tutkin saamaani 2 020 vastauksesta muodostunutta aineistoa sekä laadullisesti että määrällisesti. Työni kielinäkemys pohjautuu kognitiivisen kielentutkimuksen peruskäsityksiin. Sovelsin Anna Wierzbickan näkemyksiä tunnesanojen merkityksenmukaisessa ryhmittelyssä ja ajatusta luonnollisesta semanttisesta metakielestä 51 tyypillisimmän tunnesanan selittämisessä. Hyödynsin kuvauksissani myös Kielipankin lehtikorpusten antamaan tietoa tunnesanojen käytöstä. Selitin tunnesanojen merkityssisällöt prototyyppisinä skenaariona seuraavien semanttisten primitiivien avulla: MINÄ/ITSE, IHMINEN/HÄN/JOKU, ASIA/JOKIN, TÄMÄ, MUU/TOINEN, HYVÄ, PAHA/HUONO, AJATELLA, TIETÄÄ, HALUTA, TUNTEA, VOIDA, TEHDÄ, TAPAHTUA, OLLA / OLLA OLEMASSA, KUN, NYT, ENNEN, JÄLKEEN, KAUAN AIKAA, VÄHÄN AIKAA, JONKIN AIKAA, JOSKUS, MIELI, RUUMIS, LÄHELLÄ, SISÄLLÄ, EI/KIELTO, TOTTA, EHKÄ, SAATTAA, -ISI-, KOSKA/VUOKSI, JOS, HYVIN, KALTAISUUS, ENEMMÄN/LISÄÄ, VÄHÄN. Varsinaisista tunnesanoista hahmotin seuraavat päämerkitysryhmät: "Jotakin hyvää tapahtui tai tapahtuu", "Jotakin pahaa tapahtui tai tapahtuu", "Haluan", "En halua", "Ajattelen itsestäni jotain", "Ajattelen toisista jotain", "Tiedän / en tiedä". Selvitin aineistoni tunnesanojen asemaa ja tärkeyttä kielenpuhujien mielessä kognitiivisen tärkeyden indeksin avulla. Indeksin on kehitellyt Urmas Sutrop nimenomaan luettelointitehtävien analysointia varten. Suomalaisille kognitiivisesti tärkeimmiksi tunnesanoiksi osoittautuivat viha, ilo, rakkaus, suru, pelko, onnellisuus, kateus, ahdistus, väsymys, masennus, tuska, ihastus, tyytyväisyys, inho, jännitys, pettymys, kaipaus, rauhallisuus, ikävä, toivo. Tutkimukseni mukaan suomen kielen perustunteita ovat viha, ilo, rakkaus ja suru. Naisilla on runsaammin sanoja (23,0) tunteille kuin miehillä (17,6). Tunnesanastossa on enemmän negatiivisia (53 %) kuin positiivisia (43 %) sanoja. Tutkimukseni perusteella suomalaiset muun muassa ajattelevat toisista ihmistä enemmän hyvää kuin huonoa ja itsestä enemmän huonoa kuin hyvää.
2

Perspectives on the utility of linguistic knowledge in English word prediction

Väyrynen, P. (Pertti) 11 November 2005 (has links)
Abstract The problem addressed in the present thesis is the utility of linguistic knowledge in one domain of language technology, word prediction. An important characteristic of any practical language technology application is its level of performance, and it is therefore essential to be able to measure this quantitatively. The main questions in the present thesis are the following: (1) how can a significant improvement in performance be obtained in practical language technology products, and (2) what is the cost of improved performance in terms of the sources of linguistic knowledge that should be incorporated in them? On a more general level, the major findings suggest that the practical utility of linguistic knowledge in language technology should generally be evaluated from at least three larger perspectives: (1) language, (2) technology, and (3) the user of the application. From these three perspectives, a variety of constraints can be identified which either increase or decrease the usefulness of linguistic knowledge in practical language technology applications. A statistical state-of-the-art word prediction system was developed and tested in the empirical part of this work, and testing the performance of a few prediction methods that utilise sources of linguistic knowledge showed that they can perform just as well as some existing state-of-the-art statistical prediction methods. When the syllable-initial characters of the words to be predicted were used, for example, the expected length of the search key in a running text with a prediction list of ten tokens was only 1.59 characters, while the use of information on the parts of speech of the word tokens to be predicted in a system with five lists representing five parts of speech resulted only in a three percent improvement in performance. One of the practical implications of these results for the field of language technology is that a significant improvement in the performance of a word prediction system may be achieved only incrementally. The simultaneous use of several techniques may in turn dilute the real-time operation of the prediction system, so that it is unable to suggest candidate words quickly enough for the user. It can also affect some performance aspects such as the average percentage of keystrokes/characters saved. / Abstrakti Tässä työssä tutkittiin lingvistisen tiedon hyödyllisyyttä kieliteknologian yhdellä sovellusalueella eli sanan ennakointia englannin kielessä. Sovellus pyrkii ennakoimaan sanan, jota käyttäjä kirjoittaa parhaillaan tai aikoo kirjoittaa seuraavaksi. Nämä sovellukset ovat hyödyllisiä esim. pienissä päätelaitteissa, joissa tekstin tuottaminen on hankalaa. Eräs kieliteknologiasovellusten tärkeimmistä ominaisuuksista on niiden tehokas toiminta ja suorituskyky, jonka tulisi olla kvantitatiivisesti mitattavissa. Oleellisin tutkimuskysymys on näin ollen: (1) miten käytännön kieliteknologiasovellusten suorituskykyä voidaan parantaa merkittävästi lingvistisen tiedon avulla ja (2) mitä tämä vaatii käytännössä? Yleisellä tasolla tutkimuksen tärkeimmät tulokset ovat seuraavat: lingvistisen tiedon käytännön hyödyllisyyttä pitäisi arvioida ainakin kolmesta näkökulmasta, jotka ovat: (1) kielen näkökulma, (2) teknologian näkökulma ja (3) sovelluksen käyttäjän näkökulma. Näiden kolmen näkökulman avulla voidaan määrittää joukko tekijöitä, jotka joko lisäävät tai vähentävät lingvistisen tiedon hyödyllisyyttä käytännön kieliteknologiasovelluksissa. Työn empiirisessä osassa kehitettiin tilastollinen sananennakointisovellus englannin kieleen hyödyntäen parhaiten toimivia ennakointitekniikoita yhdessä ja samassa järjestelmässä. Kehitetyssä järjestelmässä suorituskyky vastaa täysin aiempien järjestelmien suorituskykyä. Työssä testattiin myös joitakin uusia, lingvististä tietoa hyödyntäviä ennakointitekniikoita, joiden suorituskyky vastasi tiettyjen tilastollisten ennakointimenetelmien suorituskykyä. Tutkimuksen tuloksista voidaan päätellä muun muassa, että sananennakointisovellusten suorituskykyä voidaan parantaa merkittävästi lingvistisen tiedon avulla vain käyttämällä samanaikaisesti useita lingvistisen tiedon lähteitä. Tämä taas saattaa hidastaa sovelluksen reaaliaikaista toimintaa ja vaikuttaa sovelluksen suorituskykyyn silloin kun se mitataan näppäinsäästönä merkkisäästön asemesta.

Page generated in 0.0543 seconds