• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 24
  • 2
  • Tagged with
  • 26
  • 9
  • 7
  • 7
  • 7
  • 6
  • 6
  • 5
  • 5
  • 5
  • 5
  • 5
  • 5
  • 4
  • 4
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
21

Elever med läs- och skrivsvårigheter och deras olika uppfattningar om användande av talsyntes / Students with reading and writing difficulties and their perceptions of the use of text-to-speech

Stengel, Marie January 2013 (has links)
Syftet med studien är att undersöka elever med läs- och skrivsvårigheters skilda sätt att uppfatta användandet av talsyntes. Kvalitativa intervjuer har genomförts med nio elever i grundskolans årskurs tre till nio. Studien har utgått från en fenomenografisk ansats. I resultatet framkommer sex skilda uppfattningar om användandet av talsyntes. De sex kategorierna är: talsyntesen i användning, viktiga andra, autonomi och självständighet, lärande, delaktighet och förändring samt engagemang och attityd. Majoriteten av eleverna upplever användandet av talsyntes positivt. Studien pekar på att talsyntesen ökar elevernas lärande, motivation och delaktighet hos de allra flesta av eleverna. Elever med läs- och skrivsvårigheter är en heterogen grupp med olika behov beroende av vad som orsakar deras svårigheter och talsyntesens betydelse och användningsområden kan därför variera.  Studien visar att det är viktigt att införandet av talsyntes sker i dialog med eleven och att hon eller han har stora möjligheter att själv bestämma över när, hur och var den ska användas. Resultatet visar också att det är viktigt att det finns en god stöttning i början av användandet. / The aim of the study is to examine students with reading and writing difficulties different ways of perceiving the use of text-to speech. Qualitative interviews were conducted with nine students in the primary grades three to nine. The study was based on a phenomenographic approach. The result shows six different views on the use of text-to-speech. The six description categories are: text-to-speech  in use, significant others, autonomy and independence,  learning, participation and change and commitment and attitude. The majority of students experience the use of text-to-speech positively. The study indicates that text-to-speech increases student learning, motivation and participation of the vast majority of students. Students with reading and writing difficulties are a heterogeneous group with different needs depending on what is causing their difficulties and the importance and use of text-to-speech may therefore vary. It is important that the introduction of text-to-speech through discussion with the student and that she or he has great opportunity to decide when, how and where to use it. The result also shows that it is important with scaffolding at the beginning of use.
22

Identification and Classification of TTS Intelligibility Errors Using ASR : A Method for Automatic Evaluation of Speech Intelligibility / Identifiering och klassifiering av fel relaterade till begriplighet inom talsyntes. : Ett förslag på en metod för automatisk utvärdering av begriplighet av tal.

Henriksson, Erik January 2023 (has links)
In recent years, applications using synthesized speech have become more numerous and publicly available. As the area grows, so does the need for delivering high-quality, intelligible speech, and subsequently the need for effective methods of assessing the intelligibility of synthesized speech. The common method of evaluating speech using human listeners has the disadvantages of being costly and time-inefficient. Because of this, alternative methods of evaluating speech automatically, using automatic speech recognition (ASR) models, have been introduced. This thesis presents an evaluation system that analyses the intelligibility of synthesized speech using automatic speech recognition, and attempts to identify and categorize the intelligibility errors present in the speech. This system is put through evaluation using two experiments. The first uses publicly available sentences and corresponding synthesized speech, and the second uses publicly available models to synthesize speech for evaluation. Additionally, a survey is conducted where human transcriptions are used instead of automatic speech recognition, and the resulting intelligibility evaluations are compared with those based on automatic speech recognition transcriptions. Results show that this system can be used to evaluate the intelligibility of a model, as well as identify and classify intelligibility errors. It is shown that a combination of automatic speech recognition models can lead to more robust and reliable evaluations, and that reference human recordings can be used to further increase confidence. The evaluation scores show a good correlation with human evaluations, while certain automatic speech recognition models are shown to have a stronger correlation with human evaluations. This research shows that automatic speech recognition can be used to produce a reliable and detailed analysis of text-to-speech intelligibility, which has the potential of making text-to-speech (TTS) improvements more efficient and allowing for the delivery of better text-to-speech models at a faster rate. / Under de senaste åren har antalet applikationer som använder syntetiskt tal ökat och blivit mer tillgängliga för allmänheten. I takt med att området växer ökar också behovet av att leverera tal av hög kvalitet och tydlighet, och därmed behovet av effektiva metoder för att bedöma förståeligheten hos syntetiskt tal. Den vanliga metoden att utvärdera tal med hjälp av mänskliga lyssnare har nackdelarna att den är kostsam och tidskrävande. Av den anledningen har alternativa metoder för att automatiskt utvärdera tal med hjälp av automatiska taligenkänningsmodeller introducerats. I denna avhandling presenteras ett utvärderingssystem som analyserar förståeligheten hos syntetiskt tal med hjälp av automatisk taligenkänning och försöker identifiera och kategorisera de fel i förståelighet som finns i talet. Detta system genomgår sedan utvärdering genom två experiment. Det första experimentet använder offentligt tillgängliga meningar och motsvarande ljudfiler med syntetiskt tal, och det andra använder offentligt tillgängliga modeller för att syntetisera tal för utvärdering. Dessutom genomförs en enkätundersökning där mänskliga transkriptioner används istället för automatisk taligenkänning. De resulterande bedömningarna av förståelighet jämförs sedan med bedömningar baserade på transkriptioner producerade med automatisk taligenkänning. Resultaten visar att utvärderingen som utförs av detta system kan användas för att bedöma förståeligheten hos en talsyntesmodell samt identifiera och kategorisera fel i förståelighet. Det visas att en kombination av automatiska taligenkänningsmodeller kan leda till mer robusta och tillförlitliga utvärderingar, och att referensinspelningar av mänskligt tal kan användas för att ytterligare öka tillförlitligheten. Utvärderingsresultaten visar en god korrelation med mänskliga utvärderingar, medan vissa automatiska taligenkänningsmodeller visar sig ha en starkare korrelation med mänskliga utvärderingar. Denna forskning visar att automatisk taligenkänning kan användas för att producera pålitlig och detaljerad analys av förståeligheten hos talsyntes, vilket har potentialen att göra förbättringar inom talsyntes mer effektiva och möjliggöra leverans av bättre talsyntes-modeller i snabbare takt.
23

Ett digitalt läromedel för barn med lässvårigheter

Eriksson, Ruth, Galaz Miranda, Luis January 2016 (has links)
Den digitala tidsåldern förändrar samhället. Ny teknik ger möjligheter att framställa och organisera kunskap på nya sätt. Tekniken som finns i skolan i dag, kan även utnyttjas till att optimera lästräningen till elever med lässvårigheter. Denna avhandling undersöker hur ett digitalt läromedel för läsinlärning för barn med lässvårigheter kan designas och implementeras, och visar att detta är möjligt att genomföra. Ett digitalt läromedel av bra kvalitet måste utgå ifrån en vetenskapligt vedertagen läsinlärningsmetod. Denna avhandling utgår ifrån Gunnel Wendicks modell, som redan används av många specialpedagoger. Modellen används dock i sin ursprungsform, med papperslistor med ord, utan datorer, surfplattor eller liknande. Vi analyserar Wendick-modellen, och tillämpar den på ett kreativt sätt för att designa en digital motsvarighet till det ursprungliga arbetssättet. Vårt mål är att skapa ett digitalt läromedel som implementerar Wendick-modellen, och på så sätt göra det möjligt att modellen används på olika smarta enheter. Med detta hoppas vi kunna underlätta arbetet både för specialpedagoger och barn med lässvårigheter, samt göra rutinerna mer tilltalande och kreativa. I vår studie undersöker vi olika tekniska möjligheter för att implementera Wendick-modellen. Vi väljer att skapa en prototyp av en webbapplikation, med passande funktionalitet för både administratörer, specialpedagoger och elever. Prototypens funktionalitet kan delas upp i två delar, den administrativa delen och övningsdelen. Den administrativa delen omfattar användargränssnitt och funktionalitet för hantering av elever och andra relevanta uppgifter. Övningsdelen omfattar övningsvyer och deras funktionalitet. Övningarnas funktionalitet är tänkt för att träna den auditiva kanalen, den fonologiska avkodningen - med målet att läsa rätt, samt den ortografiska avkodningen - med målet att eleven ska automatisera sin avkodning, d.v.s. att uppfatta orden som en bild. I utvecklandet av det digitala läromedlet används beprövade principer inom mjukvaruteknik och beprövade implementationstekniker. Man sammanställer högnivåkrav, modellerar domänen och definierar passande användningsfall. För att implementera applikationen används Java EE plattform, Web speech API, Primefaces specifikationer, och annat. Vår prototyp är en bra början som inspirerar till vidare utveckling, med förhoppning om att en fullständig webapplikation ska skapas, som ska förändra arbetssättet i våra skolor. / The digital age is changing society. New technology provides opportunities to produce and organize knowledge in new ways. The technology available in schools today can also be used to optimize literacy training for students with reading difficulties. This thesis examines how a digital teaching material for literacy training for children with reading difficulties can be designed and implemented, and shows that this is possible to achieve. A digital learning material of good quality should be based on a scientifically accepted method of literacy training. This thesis uses Gunnel Wendick’s training model which is already used by many special education teachers. The training model is used with word lists, without computers, tablets or the like. We analyze Wendick’s training model and employ it, in a creative way, to design a digital equivalent to the original model. Our goal is to create a digital learning material that implements Wendick’s training model, and thus make it possible to use in various smart devices. With this we hope to facilitate the work of both the special education teachers and children with reading difficulties and to make the procedures more appealing and creative. In our study, we examine various technical possibilities to implement Wendick’s training model. We choose to create a prototype of a web application, with suitable functionality for both administrators, special education teachers and students. The prototype’s functionality can be divided into two parts, the administrative part and the exercise part. The administrative part covers the user interface and functionality for handling students and other relevant data. The exercise part includes training views and their functionality. The functionality of the exercises is intended to train the auditory channel, the phonological awarenesswith the goal of reading accurately, and the orthographic decoding - with the goal that students should automate their decoding, that is, to perceive the words as an image. In the development of the digital teaching material, we used proven principles in software technologies and proven implementation techniques. It compiles high-level requirements, the domain model and defines the appropriate use cases. To implement the application, we used the Java EE platform, Web Speech API, Prime Faces specifications, and more. Our prototype is a good start to inspire further development, with the hope that a full web application will be created, that will transform the practices in our schools.
24

Wavebender GAN : Deep architecture for high-quality and controllable speech synthesis through interpretable features and exchangeable neural synthesizers / Wavebender GAN : Djup arkitektur för kontrollerbar talsyntes genom tolkningsbara attribut och utbytbara neurala syntessystem

Döhler Beck, Gustavo Teodoro January 2021 (has links)
Modeling humans’ speech is a challenging task that originally required a coalition between phoneticians and speech engineers. Yet, the latter, disengaged from phoneticians, have strived for evermore natural speech synthesis in the absence of an awareness of speech modelling due to data- driven and ever-growing deep learning models. By virtue of decades of detachment between phoneticians and speech engineers, this thesis presents a deep learning architecture, alleged Wavebender GAN, that predicts mel- spectrograms that are processed by a vocoder, HiFi-GAN, to synthesize speech. Wavebender GAN pushes for progress in both speech science and technology, allowing phoneticians to manipulate stimuli and test phonological models supported by high-quality synthesized speeches generated through interpretable low-level signal properties. This work sets a new step of cooperation for phoneticians and speech engineers. / Att modellera mänskligt tal är en utmanande uppgift som ursprungligen krävde en samverkan mellan fonetiker och taltekniker. De senare har dock, utan att vara kopplade till fonetikerna, strävat efter en allt mer naturlig talsyntes i avsaknad av en djup medvetenhet om talmodellering på grund av datadrivna och ständigt växande modeller fördjupinlärning. Med anledning av decennier av distansering mellan fonetiker och taltekniker presenteras i denna avhandling en arkitektur för djupinlärning, som påstås vara Wavebender GAN, som förutsäger mel-spektrogram som tas emot av en vocoder, HiFi-GAN, för att syntetisera tal. Wavebender GAN driver på för framsteg inom både tal vetenskap och teknik, vilket gör det möjligt för fonetiker att manipulera stimulus och testa fonologiska modeller som stöds av högkvalitativa syntetiserade tal som genereras genom tolkningsbara signalegenskaper på lågnivå. Detta arbete inleder en ny era av samarbete för fonetiker och taltekniker.
25

Talsyntes Påverkan på Mellanstadieelevers Textförståelse : En kvantitativ, Explorativ Studie / The Influence of Speech Synthesis on Middle School Students' Text Comprehension : A Quantitative, Explorative Study

Doweyko Nilsson, Maggie, Göransson, Ellinor January 2021 (has links)
Aim and research questions: The study examined how text comprehension of middle school students in Sweden changed depending on the modalities of reading and speech synthesis. Impact on the outcome based on factors such as decoding ability, working memory, gender and multilingualism were examined. A new text comprehension test was evaluated. Method: Questionnaires and measuring instruments including the text comprehension test were used in an in-group design. Results: In the given sample (N=94), reading generated best results on the text comprehension test in comparison to speech synthesis. The effects were strongest in the group with weaker decoding ability. No significant correlations were found when working memory or gender was taken into account. The results of the study showed that monolingual participants got better results on the text comprehension test after speech synthesis than multilingual participants. Conclusion: The study found significant differences between modalities, where reading generated better results on the text comprehension test than speech synthesis. Multilingual children scored significantly lower with speech synthesis than monolinguals. Further studies are required. / Syfte och frågeställningar: Studien undersökte hur textförståelsen hos mellanstadieelever i Sverige förändrades beroende på modaliteterna läsning respektive talsyntes. Påverkan på utfallet utifrån faktorer som avkodningsförmåga, arbetsminne, könstillhörighet och flerspråkighet undersöktes. Ett nytt textförståelsetest utvärderades. Metod: Frågeformulär och mätinstrument inklusive textförståelsetestet användes i en inomgruppsdesign. Resultat: I givet urval (N=94) gav läsning bäst resultat på textförståelsetest i jämförelse med talsyntes. Effekterna var starkast i gruppen med svag avkodningsförmåga. Inga signifikanta korrelationer hittades när hänsyn togs till arbetsminne eller könstillhörighet. Studiens resultat visade att enspråkiga deltagare fick bättre resultat på textförståelsetestet efter talsyntes än flerspråkiga deltagare. Slutsats: Studien fann signifikanta skillnader mellan modaliteterna, där läsning gav bättre resultat på textförståelsetest än talsyntes. Flerspråkiga barn fick signifikant sämre resultat med talsyntes än enspråkiga. Vidare studier krävs.
26

Komma till tals och komma till lyssnande : Lyssnande i språkutvecklande arbetssätt / Speak Up and Listen Up

Adamsson Danred, Sofie January 2023 (has links)
Ambitionen med föreliggande uppsats är att bidra till att medvetandegöra och väcka diskussion om lyssnandet som en del av elevers språkutveckling. Att skriva, läsa och tala ses ofta som självklara delar av språklig utveckling medan talandets receptionsaspekt, att lyssna, är mindre utforskat i svensk skolkontext. Förhoppningen är att genom specialpedagogers och en speciallärares erfarenheter av att arbeta med elever i språklig sårbarhet kunna ringa in vilka typer av lyssnande som framträder i språkutvecklande undervisningssammanhang. I förlängningen kan detta bidra till att öka medvetenheten om vilka lyssnandestrategier som behöver definieras och explicitgöras för att öka möjligheten att elever utvecklar god lyssnandekompetens. Lyssnande som pedagogisk praktik saknar idag en tydlig teoretisk förankring. Begreppets komplexitet medför också att olika delar av lyssnandeprocessen aktualiseras genom olika teoretiska perspektiv. Eftersom intentionen med denna uppsats är att undersöka lyssnandet didaktiska ställning riktas blicken främst mot det yttre observerbara lyssnandet. Den teoribildning som får störst utrymme är sociokulturell teori då lyssnande i skolkontext är tätt sammankopplat med dialog, samspel och sociokulturella ramar. Semistrukturerad samtalsintervju med fyra verksamma specialpedagoger och en speciallärare har valts som metod. Detta i syfte att synliggöra nuvarande didaktisk grund för lyssnande i språkutvecklande arbetssätt samt för att skapa möjlighet att finna oväntade resultat. Resultaten indikerar att lyssnande främst är implicit invävt i språkutvecklande undervisning. Däremot framför respondenterna generell kunskap och förtrogenhet om receptionsaspekter av språkutveckling. I materialet framkommer också tysta och erfarenhetsbaserade förhållningssätt till lyssnandedidaktik. Ur speciallärarens och specialpedagogernas perspektiv i undervisningen framträder det interaktiva, analytiska och relationella lyssnandet medan det distinkta, överförande, effektiva och analytiska är det mest tydliga utifrån pedagogernas utsagor om elevers lyssnandesituationer. De möjliga språkutvecklande strategier som lyfts fram syftar främst till att kompensera för nedsatta kognitiva förmågor såsom informationsbearbetning, fokus˗ och koncentrationssvårigheter, inlevelseförmåga och förmågor att tolka sociala icke-verbala koder. Även visuellt stöd, att låta elever komma till lyssnande, träna lyssningshastighet och att vara en social tolk nämns. En lyssnandekategori som inte uttryckligen motsvarar de kategorier som nämns i tidigare forskning är lyssnande av text med hjälp av talsyntes, talbok eller ljudbok. Resultatet antyder att vissa elever i språklig sårbarhet har liten behållning av lyssnande på text genom uppläsningsverktyg. Att utveckla goda lyssnandekompetenser och lyssnandestrategier är ur språkutvecklingsperspektiv grundläggande men aktualiseras särskilt i relation till elever som befinner sig i språklig sårbarhet. Förmågan att lyssna är beroende av många olika faktorer, som t.ex. fonologisk och semantisk organisation; ordförråd och ordförståelse; fokus och koncentration samt pragmatisk språkförståelse. Av stor vikt för att kunna bidra till alla delar av elevers språkutveckling är vilken kunskap speciallärare i språk˗, skriv˗ och läsutveckling har eller behöver utveckla, såväl teoretisk som praktisk.

Page generated in 0.0403 seconds