Spelling suggestions: "subject:"språkteknologi"" "subject:"språkteknologin""
11 |
The effect of speaking style on the performance of a forensic voice comparison systemKoschwitz, Joana January 2018 (has links)
No description available.
|
12 |
Natural language interfaces over spatial data : investigations in scalability, extensibility and reliability / Naturliga-språkgränssnitt över rumsliga data : undersökningar i skalbarhet, utbyggbarhet och tillförlitlighetMollevik, Johan January 2013 (has links)
No description available.
|
13 |
Intonation and sentence type interpretation in Greek : A production and perception approachKotsifas, Dimitrios January 2009 (has links)
This thesis examines the intonation patterns of Modern Greek with regard to different interpretations of the sentence types (declarative, interrogative, imperative). 14 utterances are produced by Greek native speakers (2 men and 2 women) so as to express various speech acts: STATEMENT, QUESTION, COMMAND and REQUEST. The acquisition of the F0 curve for each utterance by means of the Wavesurfer tool leads to an analysis of the pitch movements and their alignments. After the F0 curves are analyzed and illustrated using the Excel program we are able to compare and group them. Thus, we come up with 5 different intonation patterns. After a second-level comparison based on the fact that some of the F0 curves were similar but they differed only as far as the final pitch movement is concerned, we ended up with 3 fundamental categories of intonation patterns: Category I whose main feature is the rising pitch movement aligned to the onset of the stressed syllables. This category includes only sentences that denote Statement so we can call it the STATEMENT category. Category II’s main characteristic is a dipping pitch movement aligned to the head of the utterance that is the stress of the verb or a particle that signifies negation (/min/, /den/). Sentences meaning Command or Request belong to this category. Lastly, Category III’s intonation pattern consists of peaking pitch movements aligned to the initial and final stressed syllables. Interrogative sentences belong to this category no matter their interpretation. A secondary goal of the thesis is to examine to which extent intonation can be a safe criterion for the “correct” interpretation of a sentence. A de facto presumption that since the ratio between the number of utterances (14) and the different intonation patterns (5) is not 1:1 there can always be misunderstandings among speakers, is basically verified by the results of our perception test conducted to Greek native speakers: Greek native speakers were able to identify most of the speech acts that were expressed by the most common (default) sentence type (i.e. imperative sentence for COMMAND and interrogative for QUESTION) however there were combinations that they had difficulties to identify, such as interrogative sentences that were denoting other than QUESTION, e.g. REQUEST or STATEMENT.Ending, a perception test conducted to Flemish speakers (subjects that were native speakers of another language than Greek) showed that they were more successful in sentences that meant STATEMENT and QUESTION but they could hardly identify an interrogative sentence that meant other than QUESTION and they also confused between COMMAND and REQUEST. This implies that the intonation used to convey different interpretations is basically language-dependent. Concluding, this study offers a description of the intonation patterns (based on pitch movements) regarding the 3 sentence types with 4 different interpretations. Our findings prove that the intonation for some cases (i.e. for sentences that express COMMAND or STATEMENT) seems to be structure-independent and for others structure-dependent (cf. the interrogative sentences). Additionally, the fact that the negation can play an important role for the choice of intonation pattern (as shown for the case of COMMAND and STATEMENT) could be considered as a structure-dependent feature of intonation. This approach contrasts the approach used for many years in the traditional Grammar according to which the structure alone (sentence type) defines the meaning that is to be conveyed.
|
14 |
Digitala verktyg och läsmotivation : Hur digitala verktyg används i högstadiet för att stimulera elevernas vilja att läsaNilsson, Beatrice January 2017 (has links)
No description available.
|
15 |
Detektion av handskrivna ordobjekt i inskannade dokumentRydberg, Jonatan January 2012 (has links)
I denna rapport presenteras ett sätt att detektera handskrivna ordobjekt i inskannade dokument. Rapporten belyser också några av de problem som förekommer vid detektion av handskrivna ordobjekt. Detektionen görs med hjälp av en indelning av bilden i rektangulära regioner. Därefter används enmaskininlärningsalgoritm för att klassificera regionerna som antingen handskriven text eller övrigt. För att klassificera en region behövs mätvärden för en region, såsom area, som en algoritm kan använda. De flesta som testas och används i denna rapport har använts tidigare för att detektera handskriven text. En del är modifierade från tidigare använda mätvärden. Resultaten visar att att det går att detektera handskrivna ordobjekt med en föreslagna metoden. Resultaten är dock inte lika goda som flertalet andra inom området, några olika orsaker diskuteras. Rapporten visar även att klassificeringen av en region får ett statistiskt signifikant högre resultat om algoritmen som använts har tränats på andra regioner i samma dokument. Detta resultat är viktigt när en algoritm ska utvärderas. Att viktning av träningsdata kan användas för att manipulera precision och recall för de fyra algoritmer som används bekräftas. Detta gör det möjligt att skapa ett precision-recall-diagram för att jämföra olika maskininlärningsalgoritmer. En sådan jämförelse mellan fyra olika typer av algoritmer visar att det är liten skillnad mellan två beslutsträd och ett neuralt nätvärk. Den sista algoritmen, en stödvektormaskin, klarade uppgiften sämst.
|
16 |
Språkteknologi för myndigheters hemsidor : En studie av verktyg som kan underlätta för personer som inte har svenska som modersmål att självständigt använda e-tjänsterNilsson, Karin January 2011 (has links)
På svenska myndigheter arbetar man aktivt med att erbjuda sina kunder möjligheter att göra ärenden via Internet. Försäkringskassans egna studier tyder dock på att personer som inte har svenska som modersmål är en grupp som i stället väljer att komma in på kontoren för att utföra sina ärenden, även om ärendena är relativt enkla. Den här studien undersöker hur språkteknologiska hjälpmedel skulle kunna underlätta för den här gruppen att använda tjänster på Internet. För att ta reda på hur nysvenskar själva ser på sin kontakt med myndigheter hölls fokusgrupper där deras erfarenheter diskuterades. Fokusgrupperna resulterade i tre scenarier som illustrerar hur situationer där en person med språksvårigheter försöker göra sina ärenden på Internet skulle kunna se ut. Några olika språkteknologiska verktyg och hur de skulle kunna användas på Internet diskuteras mot bakgrund av scenarierna. För ett av verktygen, automatisk sammanfattning, utfördes en användarundersökning där sammanfattningar framställda med ett automatiskt sammanfattningsprogram jämfördes. Användning av textsammanfattning som stöd för nysvenskars användning av e-tjänster analyseras och diskuteras.
|
17 |
Estimating Post-Editing Effort with Translation Quality FeaturesSagemo, Oscar January 2016 (has links)
No description available.
|
18 |
Textuella särdrag som kvalitet : En studie om att automatiskt mäta kvalitet i teknisk dokumentationHantosi Albertsson, Sarah January 2015 (has links)
Denna uppsats har undersökt vilka textuella särdrag som upplevs som brott emot kvalitet för den tekniska dokumentationen internt på Saab och hur särdrag som valts enligt experters bedömning kan evalueras automatiskt. Uppsatsen har med hjälp av data som genererats ur en deltagande design föreslagit en ny automatisk metod för att undersöka kvalitet i teknisk dokumentation. Tekniska skribenter och redaktörer deltog för att besvara uppsatsens första fråga och resultatet ifrån detta är en samling textuella särdrag som är möjliga att kvantifiera. Ur samlingen valdes fyra textuella särdrag som sedan undersökts genom programmering med syfte att evaluera textens läsbarhet, textens unikhet och dess syntaktiska struktur genom dependensparsning och dependenslängd som ett värde för kvalitet. Kvalitetsvärdet som systemet genererar anses validerat. Uppsatsen visar därmed att det finns goda möjligheter att använda mått som en del i en kvalitetsbedömning för teknisk dokumentation.
|
19 |
Abbreviation Expansion in Swedish Clinical Text : Using Distributional Semantic Models and Levenshtein Distance NormalizationTengstrand, Lisa January 2014 (has links)
In the medical domain, especially in clinical texts, non-standard abbreviations are prevalent, which impairs readability for patients. To ease the understanding of the physicians' notes, abbreviations need to be identified and expanded into their original forms. This thesis presents a distributional semantic approach to find candidates of the original form of the abbreviation, which is combined with Levenshtein distance to choose the correct candidate among the semantically related words. The method is applied to radiology reports and medical journal texts, and a comparison is made to general Swedish. The results show that the correct expansion of the abbreviation can be found in 40% of the cases, an improvement by 24 percentage points compared to the baseline (0.16), and an increase by 22 percentage points compared to using word space models alone (0.18).
|
20 |
Identifying Base Noun Phrases by Means of Recurrent Neural Networks : Using Morphological and Dependency FeaturesWang, Tonghe January 2020 (has links)
Noun phrases convey key information in communication and are of interest in NLP tasks. A base NP is defined as the headword and left-hand side modifiers of a noun phrase. In this thesis, we identify base NPs in Universal Dependencies treebanks in English and French using an RNN architecture.The data of this thesis consist of three multi-layered treebanks in which each sentence is annotated in both constituency and dependency formalisms. To build our training data, we find base NPs in the constituency layers and project them onto the dependency layer by labeling corresponding tokens. For input features, we devised 18 configurations of features available in UD annotation. We train RNN models with LSTM and GRU cells with different numbers of epochs on these configurations of features.Tested on monolingual and bilingual test sets, our models delivered satisfactory token-based F1 scores (92.70% on English, 94.87% on French, 94.29% on bilingual test set). The most predicative configuration of features is found out to be pos_dep_parent_child_morph, which covers 1) dependency relations between the current token, its syntactic head, its leftmost and rightmost syntactic dependents; 2) PoS tags of these tokens; and 3) morphological features of the current token.
|
Page generated in 0.0434 seconds