Spelling suggestions: "subject:"ljudinspelning"" "subject:"ljudinspelnings""
1 |
Flexibel ljudinspelning för talkvalitetsanalys / Flexible Sound Recording for Speech AnalysisNilsson, Daniel January 2010 (has links)
<p>This report describes how wavefiles can be recorded with programs written in the C++ language . The report also describes how the</p><p>recorded sound is handled before it can be analyzed. The report describes the different parts that make a wave file to a wave file and</p><p>how Windows handle these files. There is always some silence or noise of unknown length that passes through the system before</p><p>some interesting sound arrives. That silence or nose must not be recorded and therefore some function must be developed that can</p><p>detect interesting sound or speech. Besides of that this report handle the problem of cutting a longer wave file into smaller parts and</p><p>how to down sample recorded files and files that have been cut.</p>
|
2 |
En lärares erfarenhet av ljudinspelning i matematik-undervisningen : En fallstudie i årskurs 4-5 / A teacher’s experience of sound recording in mathematics education : A case study in grades 4-5Wallin, Emil January 2020 (has links)
Syftet med den här studien är att undersöka en lärares erfarenhet av hur ljudinspelning kan fungera för att ta reda på elevers visade kunskaper i ett muntligt moment. För att ta reda på lärarens erfarenhet har en fallstudie gjorts. Den grundar sig i två frågeställningar som kan härledas till möjligheter och hinder som användandet av ljudinspelning kan ge upphov till i samband med bedömning av elevers visade kunskaper. I studien har det framkommit att lärarens erfarenhet är att ljudinspelning kan ses som ett möjligt verktyg i matematikundervisningen, men att lärares följdfrågor under ett bedömningsmoment är fortfarande viktiga för att elever ska kunna ge mer utvecklade svar.
|
3 |
Flexibel ljudinspelning för talkvalitetsanalys / Flexible Sound Recording for Speech AnalysisNilsson, Daniel January 2010 (has links)
This report describes how wavefiles can be recorded with programs written in the C++ language . The report also describes how the recorded sound is handled before it can be analyzed. The report describes the different parts that make a wave file to a wave file and how Windows handle these files. There is always some silence or noise of unknown length that passes through the system before some interesting sound arrives. That silence or nose must not be recorded and therefore some function must be developed that can detect interesting sound or speech. Besides of that this report handle the problem of cutting a longer wave file into smaller parts and how to down sample recorded files and files that have been cut. / Denna rapport beskriver hur man kan spela in ljudfiler i realtid med hjälp av programmering i C++. Rapporten beskriver även hur programmet har tagits fram och hur ljud bearbetas innan det är klart för analys. Här beskrivs även de olika delar som är obligatoriska för en wavefil, hur wavefiler fungerar samt om hur Windows hanterar dessa ljudfiler. Innan något intressant ljud kommit in i systemet kommer det alltid vara en tystnad eller bara brus som man inte vet längden på och detta måste kunna hanteras så att denna tystnad eller bruset inte spelas in. Förutom hur tystnad och brus hanteras, beskrivs det även hur mappar och filer hanteras i realtid. Rapporten tar även upp hur ljudfiler kan klippas till mindre filer samt hur man samplar ner det ljud som spelats in eller blivit klippt.
|
4 |
Utveckling av programvara för inrapportering av vägstatus och utrustning längs med vägarBjörk, Johan January 2010 (has links)
No description available.
|
5 |
VoiceSec by Visuera Utveckling av iOS-applikation / VoiceSec by Visuera Development of an iOS Software ApplicationSvensson, Patrik January 2014 (has links)
Inom rådgivningsbranschen finns ett ökat behov av bra hjälpmedel för att underlätta rådgivarnas arbete med dokumentation och arkivering av information som uppkommer vid rådgivningssituationer. Målet med examensarbetet var att kunna presentera en färdigställd iOS applikation som erbjuder en lösning på problemet med hjälp av ljudupptagningar. Utifrån en modellerad processbild över systemet togs en kravspecifikation fram. Metoden som användes i projektet har varit en Scrum inspirerad utvecklingsprocess. Först togs en prototyp fram med hjälp av en Storyboard. Därefter fick varje vy utgöra en sprint i utvecklingsprocessen. Utvecklingen skedde med hjälp av utvecklingsmiljön Xcode. De inbyggda verktygen för enhetstestning samt automatiserade gränssnittstester har använts för att säkerställa att funktionaliteten överensstämmer med kraven. Vid utvecklingen användes även tekniker för Objektorienterad design samt användning av designmönster som t.ex. Model, View, Controller (MVC).Resultatet blev en fullt funktionell iOS applikation som kommunicerar med en bakomliggande webbtjänst för att kunna erbjuda den efterfrågade funktionaliteten. Applikationen presenteras i ett stilrent och lättnavigerat grafiskt gränssnitt som är enkelt för användaren att använda. Applikationen erbjuder funktionalitet för att rådgivare skall kunna logga in i applikationen, söka efter kunder, se rådgivningshistorik, välja olika formulär och spela in rådgivningssamtal som sker med kunden. Slutligen säkerställer applikationen rådgivningen genom att ladda upp rådgivningsfilerna till webbtjänsten som arkiverar och distribuerar ljudfilerna till berörda parter. Applikationen finns tillgänglig för både iPhone och iPad och stödjer iOS-versioner från om med iOS 5 vilket gör att applikationen kan nå ca 98,5% av marknaden för dessa enheter. / In the counseling industry, there is a greater need for good tools to facilitate advisors work with documentation and archiving of information arising from the counseling situations. The aim of this thesis was to present a finalized iOS application that offers a solution to the problem by using sound recording. Based on a modeled process image of the system, a requirement specifi-cation was developed. The methodology of the project has been a Scrum inspired line of development. First a prototype was developed by using a Storyboard. Thereafter, each was represented by a sprint in the devel-opment process. The development was done using the development environment Xcode. The built-in tools for unit testing and automated interface testing has been used to ensure that the functionality complies with the requirements. The development also used techniques for objectoriented design and the use of design patterns, such as Model, View, Controller (MVC).The result was a fully functional iOS application that communicates with an underlying web service to provide the sought-after functionality. The application is presented in a stylish and easy-to-navigate graphical user interface that is easy for the user to use. The application pro-vides functionality for advisers to log in to the application, search for customers, see consultation history, choose different forms and record a consultation that takes place with a client. Finally, the application ensures the consultation by uploading the consultation files to the web service which archives and distributes audio files to interested parties. The application is available for both iPhone and iPad and supports iOS-versions as from iOS 5 which makes the application available for ap-proximately 98.5% of the market for these devices.
|
6 |
Detecting Signal Corruptions in Voice Recordings for Speech Therapy / Igenkänning av Signalproblem i Röstinspelningar för LogopediNylén, Helmer January 2021 (has links)
When recording voice samples from a patient in speech therapy the quality of the recording may be affected by different signal corruptions, for example background noise or clipping. The equipment and expertise required to identify small disturbances are not always present at smaller clinics. Therefore, this study investigates possible machine learning algorithms to automatically detect selected corruptions in speech signals, including infrasound and random muting. Five algorithms are analyzed: kernel substitution based Support Vector Machine, Convolutional Neural Network, Long Short-term Memory (LSTM), Gaussian Mixture Model based Hidden Markov Model and Generative Model based Hidden Markov Model. A tool to generate datasets of corrupted recordings is developed to test the algorithms in both single-label and multi-label settings. Mel-frequency Cepstral Coefficients are used as the main features. For each type of corruption different ways to increase the classification accuracy are tested, for example by using a Voice Activity Detector to filter out less relevant parts of the recording, changing the feature parameters, or using an ensemble of classifiers. The experiments show that a machine learning approach is feasible for this problem as a balanced accuracy of at least 75% is reached on all tested corruptions. While the single-label study gave mixed results with no algorithm clearly outperforming the others, in the multi-label case the LSTM in general performs better than other algorithms. Notably it achieves over 95% balanced accuracy on both white noise and infrasound. As the algorithms are trained only on spoken English phrases the usability of this tool in its current state is limited, but the experiments are easily expanded upon with other types of audio recordings, corruptions, features, or classification algorithms. / När en patients röst spelas in för analys i talterapi kan inspelningskvaliteten påverkas av olika signalproblem, till exempel bakgrundsljud eller klippning. Utrustningen och expertisen som behövs för att upptäcka små störningar finns dock inte alltid tillgänglig på mindre kliniker. Därför undersöker denna studie olika maskininlärningsalgoritmer för att automatiskt kunna upptäcka utvalda problem i talinspelningar, bland andra infraljud och slumpmässig utsläckning av signalen. Fem algoritmer analyseras: stödvektormaskin, Convolutional Neural Network, Long Short-term Memory (LSTM), Gaussian mixture model-baserad dold Markovmodell och generatorbaserad dold Markovmodell. Ett verktyg för att skapa datamängder med försämrade inspelningar utvecklas för att kunna testa algoritmerna. Vi undersöker separat fallen där inspelningarna tillåts ha en eller flera problem samtidigt, och använder framförallt en slags kepstralkoefficienter, MFCC:er, som särdrag. För varje typ av problem undersöker vi också sätt att förbättra noggrannheten, till exempel genom att filtrera bort irrelevanta delar av signalen med hjälp av en röstupptäckare, ändra särdragsparametrarna, eller genom att använda en ensemble av klassificerare. Experimenten visar att maskininlärning är ett rimligt tillvägagångssätt för detta problem då den balanserade träffsäkerheten överskrider 75%för samtliga testade störningar. Den delen av studien som fokuserade på enproblemsinspelningar gav inga resultat som tydde på att en algoritm var klart bättre än de andra, men i flerproblemsfallet överträffade LSTM:en generellt övriga algoritmer. Värt att notera är att den nådde över 95 % balanserad träffsäkerhet på både vitt brus och infraljud. Eftersom algoritmerna enbart tränats på engelskspråkiga, talade meningar så har detta verktyg i nuläget begränsad praktisk användbarhet. Däremot är det lätt att utöka dessa experiment med andra typer av inspelningar, signalproblem, särdrag eller algoritmer.
|
Page generated in 0.0562 seconds