• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 14
  • 4
  • Tagged with
  • 18
  • 12
  • 11
  • 10
  • 8
  • 7
  • 7
  • 6
  • 4
  • 4
  • 4
  • 4
  • 3
  • 3
  • 3
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
1

Räcker det att lyssna? – En kvalitativ studie av användarupplevelser av podcastapplikationen Acast

Andersson, Anders January 2018 (has links)
Syftet med denna studie är att bidra med kunskap om användaruppleveser av podcasts med förstärkande material i form av bilder, länkar och videos samt att ge en ökad förståelse för relationen mellan ny teknik och användare med fokus på podcastslyssnande. Detta gjordes genom att utvärdera användarupplevelser av podcastsapplikationen Acast (vilken inkluderar förstärkande material i form av bilder, länkar och videos).Studien är genomförd genom en kvalitativ metod i form av en fallstudie. Det empiriska materialet är baserat på 11 respondenter där dessa fått besvara ett frågeformulär gällande deras tidigare erfarenheter av podcastslyssning. Respondenterna har även deltagit i fokusgrupper där de fått interagera med det förstärkande materialet. Fokusgrupperna resulterade i en mängd empirisk data vilken transkriberades och analyserades genom en kategorisering av ämnena. Det analyserade materialet sattes även i förhållande till svaren som gick att utläsa från frågeformuläret och på så sätt gick det att finna samband och motsättningar.Resultatet visar på att respondenterna upplevde brister när det kom till produktens miljö för interaktion, funktionalitet och syfte vilket stod i motsättning till respondenternas behov och förväntningar. Det visar även på att respondenter som lyssnar på podcasts dagligen hade en mer negativ bild av det förstärkande materialet än resterande respondenter. Resultatet visar även på att det krävs att podcasterna är genomarbetade, använder högupplösta bilder samt notiser för att det förstärkande materialet ska anses vara värdefullt för användaren. / The purpose of this study is to provide knowledge about user experiences of podcasts with enhancing material in the form of images, links and videos, as well as to provide a better understanding of the relationship between new technology and user with focus on podcast listening. This was made by evaluating user experiences of the podcast application Acast (which includes enhancing material in the form of images, links and videos).The study is conducted with qualitative methods through a case study. The empirical material is based on 11 respondents where they have answered a survey regarding their previous experience of podcast listening. The respondents have also participated in focus groups where they interacted with the enhancing material. The focus groups resulted in empirical data which was transcribed and analysed by a categorization. The analysed material was also set in relation to the answers from the survey, in that way relationships and contradictions where identyfied.The conclusions from the study indicate that respondents experienced shortcomings when it came to the product's environment for interaction, functionality and purpose, which was in contrast to the respondents needs and expectations. It also shows that respondents who listen to podcasts daily had a more negative view of the enhancing material than the remaining respondents. The study also shows that podcasts needs to be well made, use high resolution images and notices to ensure that the enhancing material is considered valuable to the user.
2

Lärares användning av digitala verktyg i matematikundervisningen : En kvantitativ enkätstudie

Arvidsson, Katarina, Isaksson, Sabina January 2023 (has links)
Lärares behov av att utvärdera digitala verktygs användning i undervisningen har föranlett ramverket för teknik som ersättande, förstärkande och transformerande (Ramverket EFT). Ersättande innebär att digitala verktyg erbjuder ett alternativt lärande. Förstärkande medför att digitala verktyg förstärker undervisningen. Transformerande betecknar att digitala verktyg medför ökade möjligheter för lärande av ett reformerat innehåll: undervisningen omstruktureras beroende på elevernas upptäckter. Syftet med studien var att öka medvetenheten kring hur legitimerade grundlärare i årskurs F-3 använder sig av digitala verktyg i ämnet matematik utifrån kategorierna ersättande, förstärkande och transformerande. En kvantitativ metod genomfördes i form av en webbaserad enkätundersökning och urvalet bestod av 35 respondenter. Enkätfrågorna formulerades utifrån ramverket EFT, samt utifrån dimensioner som kan användas vid analys av digitala verktygs användning i undervisningen. För att kunna analysera och utläsa kategorierna utifrån ramverket EFT, skapades en tabell utifrån dessa. Resultatet visar att de digitala verktygen används mestadels som ersättande och förstärkande, och endast till viss del som transformerande. Författarna kopplar transformerad användning av digitala verktyg till Skolverkets formulering om vikten av att elevernas kreativitet och upptäckarlust vitaliseras (Skolverket, 2022b). Författarnas slutsats är att: för att en fördjupad förståelse för matematiska begrepp ska kunna utvecklas hos eleverna, behöver digitala verktyg i matematikundervisningen användas mer transformerande.
3

Modelling the viscoplastic properties of carbon black filled rubber : A finite strain material model suitable for Finite Element Analysis

Österlöf, Rickard January 2016 (has links)
An increased environmental awareness, legal demands and the large part of total costs attributable to fuel cost are all incentives for the automotive industry to reduce fuel consumption. The optimal driveline to enable this reduction depends on the operational conditions and the available infrastructure. Moreover, special care is needed when developing the driveline isolators, since the demands on noise, vibration and harshness (NVH) are the same regardless of driveline. To this end, computer aided calculations can be used in order to evaluate a large number of configurations. However, these calculations are only, at best, as good as the material models employed. In the foreseeable future, rubber with reinforcing fillers will be used in vibration isolators in order to obtain the desired properties of these components. However, the stiffness and damping of rubber with reinforcing fillers are highly non-linear functions, and the available material models in commercial software and in the literature are often insufficient. Therefore, a finite strain viscoplastic material model is derived in the time domain and implemented as a user defined material model in Abaqus Explicit. The model captures the strain amplitude and frequency dependency of the storage and loss modulus for a carbon black filled natural rubber. The model is accurate over a wide range of shear strain amplitudes and frequencies, 0.2-50 % and 0.5-20 Hz, respectively, using only 5 material parameters. In addition, the model correctly captures the response from bimodal excitations. The implementation in Abaqus Explicit enables component characteristics to be evaluated early in the development phase, with material parameters derived from simple test specimens. The improved accuracy of simulations of these components can aid engineers develop more optimized solutions faster than with conventional methods. / En ökad miljömedvetenhet, juridiska krav och den stora delen av de totala kostnaderna som kan hänföras till bränslekostnader är alla incitament för fordonsindustrin att minska bränsleförbrukningen. Den optimala drivlinan för att möjliggöra denna minskning beror på driftförhållanden och den tillgängliga infrastrukturen. Dessutom ställs höga krav på utvecklingen av drivlineisolatorer, eftersom kraven på buller och vibrationer (NVH) är desamma oavsett drivlina. För detta ändamål kan datorstödda beräkningar användas för att utvärdera ett stort antal konfigurationer. Dessa beräkningar är, i bästa fall, endast så bra som de använda materialmodellerna. Inom en överskådlig framtid kommer gummi med förstärkande fyllmedel användas i vibrationsisolatorer för att erhålla de önskade egenskaperna hos dessa komponenter. Men styvheten och dämpningen i gummi med förstärkande fyllmedel är kraftigt icke-linjära funktioner, och de tillgängliga materialmodellerna i kommersiella programvaror och i litteraturen är ofta otillräckliga. Därför är en viskoplastisk materialmodell för finita deformationer framtagen i tidsdomänen och implementeras som ett användardefinierat material i Abaqus Explicit. Modellen fångar töjningsamplitud- och frekvensberoendet av lagrings- och förlustmodulen för ett kimröksfyllt naturgummi. Den är korrekt över ett brett intervall av skjuvtöjningsamplituder och frekvenser, 0.2-50% respektive 0.5-20 Hz, och kräver endast 5 materialparametrar. Dessutom fångar modeller responsen från bimodala excitationer. Implementeringen i Abaqus Explicit gör att komponentegenskaper kan utvärderas tidigt i utvecklingsfasen, med materialparametrar som härrör från enkla provkroppar. Den förbättrade noggrannheten i simuleringar av dessa komponenter kan hjälpa ingenjörer att utveckla mer optimerade lösningar snabbare än med konventionella metoder. / <p>QC 20160406</p>
4

Självutlämning i dagboksbloggen : På gränsen mellan privat och offentligt

Sharifpour, Sara January 2012 (has links)
Syftet med denna uppsats är att undersöka hur bloggens innehåll reflekterar bloggarens syn på vad som är privat och vad som är offentligt. Detta har skett genom att först urskilja följande ämnen i bloggarna: vänner, jobb, sömn, mat, hälsa, nöje, familj, sex och pengar, och sedan undersöka vilka av dessa ämnen som respektive bloggare använder sig av och vilka som utelämnas från bloggen. De ämnen som används av bloggarens blir då offentliga, medan de som utelämnas förblir privata. Funktionerna av självutlämning – självförtydligande, social bekräftelse, social kontroll och relationell utveckling - har analyserats och slutligen har skillnaderna mellan de manliga och kvinnliga bloggarna undersökts.   Den teoretiska ramen består av kategorierna; privat och offentligt, medierad voyeurism, empowering exhibitionism samt ett renodlat likhetsperspektiv inom genusdiskurs. Medierad voyeurism som är konsumtionen av avslöjande bilder och information om andras verkliga liv, leder ofta till empowering exhibitionism vilket sker då individen tar kontroll över framställningen av sig själv och går emot den skam som är kopplad till konceptet privat. Det empiriska materialet för undersökningen består av sju dagars utdrag av Cimon Lundberg, Isabella Löwengrip, Johanna And och Simon Leisjö’s bloggtexter från sista veckan i augusti 2012. Kvalitativa samtalsintervjuer med And och Leisjö har fungerat som ett komplement till textanalysen av bloggarna. Genom en kvalitativ metod har ett narratologiskt perspektiv tillämpats i analysen för att besvara följande frågeställningar: 1. Hur reflekterar bloggarnas innehåll gränsen mellan den privata och den offentliga sfären? Vilka ämnen tas upp och vilka utelämnas? 2. Skiljer sig förhållandet till det privata/offentliga mellan kvinnliga och manliga bloggare? 3. Vad kan de olika graderna av självutlämning säga om bloggens betydelse för individen? Vilken funktion fyller olika texttyper hos dessa bloggare? Undersökningen har visat att även om flera ämnen som tidigare var privata offentliggörs i bloggarna, så dras gränsen för det privata än idag vid ämnet; sex. Familj och vänner har flyttats till den främre regionen samtidigt som gränsdragningen för ämnena jobb och ekonomi skiftar hos de olika bloggarna. Skillnaderna mellan de kvinnliga och de manliga bloggarna har varit obefintliga eller minimala, vilket kan hänvisas till att bloggarna formas inom samma sociokulturella sammanhang. I samtliga bloggar sker självutlämning i olika grader och högre grad av självutlämning har visat sig fungera som empowering exhibitionism. Större självutlämning kan kopplas till att ämnet blir mer privat.
5

Bilder i barnlitteraturen : En studie av bildens betydelse för elevernas förståelse för textinnehållet i bilderböcker i årskurs F-3

Englund, Maja, Tasdelen, Alexandra January 2020 (has links)
Bilderna i skönlitterära barnböcker har en viktig roll för elevers läsförståelse och är inte enbart dekorativa. Forskning pekar på att bilden kan vara avgörande för förståelsen av bokens innehåll i de fall där eleven inte förstått texten fullt ut. Denna studie har utgått från att bilden har betydelse för läsförståelsen men syftet med studien är att ta reda på vilken funktion bilden kan ha utifrån att bilderböcker inte är lika utan kan delas upp i fem olika kategorier. Vi har valt att fokusera på två av dessa fem kategorier. Studien är gjord i en årskurs tre där ena halvan av klassen har haft tillgång till bilden under tiden de läst medan andra halvan inte haft tillgång till bilden under tiden de läst. Empirin består av standardiserade frågor samt semistrukturerade intervjuer. De frågeställningar vi arbetat utifrån är: Vilken funktion har bilden för elevers läsförståelse i en kompletterande bilderbok? Vilken funktion har bilden för elevers läsförståelse i en expanderande/förstärkande bilderbok? Resultatet pekar på att bilden spelar mer eller mindre roll beroende på vilken kategori bilderboken tillhör. I en kompletterande bilderbok såg vi att bilden inte var avgörande för elevernas läsförståelse då båda grupperna hade förstått bokens innehåll ungefär lika väl. Vi märkte däremot skillnad i läsförståelsen i den expanderande/förstärkande bilderboken där de elever som inte haft tillgång till bilden gått miste om delar av bokens innehåll och därmed inte förstått bokens budskap fullt ut. Det som var intresseväckande utöver att bilden var avgörande för läsförståelsen var elevernas uppfattning, i gruppen som inte haft tillgång till bilden, att det inte behövde bilden för att förstå boken. Medan gruppen som haft tillgång till bilden såg dess fördelar för läsförståelsen. En didaktisk implikation vi kommit fram till är att bilderna fyller olika syften i olika bilderböcker och förslag på vidare forskning vore att studera de tre bilderbokskategorier som denna studie inte berör.
6

Playstyle Generation with Multimodal Generative Adversarial Imitation Learning : Style-reward from Human Demonstration for Playtesting Agents / Spelstilsgenerering med Multimodal Generativ Motståndarimitationsinlärning : Spelstilsbelöning från Demonstrationer för Playtesting-Agenter

Ahlberg, William January 2023 (has links)
Playtesting plays a crucial role in video game production. The presence of gameplay issues and faulty design choices can be of great detriment to the overall player experience. Machine learning has the potential to be applied to automated playtesting solutions, removing mundane and repetitive testing, and allowing game designers and playtesters to focus their efforts on rewarding tasks. It is important in playtesting to consider the different playstyles players might use to adapt game design choices accordingly. With Reinforcement learning, it is possible to create high quality agents able to play and traverse complex game environments with fairly simple task-rewards. However, an automated playtesting solution must also be able to incorporate unique behaviour which mimic human playstyles. It can often be difficult to handcraft a quantitative style-reward to drive agent learning, especially for those with limited reinforcement learning experience, like game developers. MultiGAIL, Multimodal Generative Adversarial Imitation Learning, is a proposed learning algorithm able to generate autonomous agents imbued with human playstyles from recorded playstyle demonstrations. The proposed method requires no handcrafted style-reward, and can generate novel intermediate playstyles from demonstrated ones. MultiGAIL is evaluated in game environments resembling complex 3D games with both discrete and continuous action spaces. The playstyle the agent exhibits is easily controllable at inference with an auxiliary input parameter. Evaluation shows the agent is able to successfully replicate the underlying playstyles in human demonstrations, and that novel playstyles generate explainable action distributions indicative of the level of blending the auxiliary input declares. The results indicate that MultiGAIL could be a suitable solution to incorporate style behaviours in playtesting autonomous agents, and can be easily be used by those with limited domain knowledge of reinforcement learning. / ”Playtesting” har en viktig roll i TV-spelsutveckling. Fel i spel, såsom buggar och dålig speldesign kan drastiskt försämra spelupplevelsen. Maskininlärning kan användas för att automatisera testandet av spel och därmed ta bort behovet för människor att utföra repetitiva och tråkiga test. Spelutvecklare och speltestare kan då istället inrikta sig på mer nyttiga uppgifter. I playtesting så behöver de diverse spelstilar som spelare kan ha beaktas, så att spelutvecklare har möjligheten att anpassa spelet därefter. Förstärkande inlärning har använts för att skapa högkvalitativa agenter som kan spela och navigera komplexa spelmiljöer genom att definiera relativt simpla belöningsfunktioner. Dock är uppgiften att skapa en belöningsfunktion som formar agenten att följa specifika spelstilar en mycket svårare uppgift. Att anta att de utan förkunskaper inom maskininlärning och förstärkande inlärning, som spelutvecklare, ska kunna skapa sådana belöningsfunktioner är orealistiskt. MultiGAIL, Multimodal Generative Adversarial Imitation Learning", är en maskininlärningsalgoritm som kan generera autonoma agenter som efterföljer spelstilar med hjälp av tillgången till inspelade spelstilsdemonstrationer. Metoden kräver inga hårdkodade stilbelöningar och kan interpolera de spelstilarna funna i demonstrationerna, därav skapa nya beteenden för agenterna. MultiGAIL evalueras i spelmiljöer liknande komplexa 3D spel och kan använda både diskreta och kontinuerliga åtgärdsrum. Den spelstil agenten uppvisar kan enkelt kontrolleras vid inferens av en varierbar parameter. Vår evaluering visar att metoden kan lära agenten att korrekt imitera de spelstilar som definieras av inspelade demonstrationer. Nya spelstilar generade av MultiGAIL har förutsägbara beteenden utefter värdet på den varierande parametern. MultiGAIL kan mycket troligt användas för att skapa playtesting autonoma agenter som beter sig utefter specifika spelstilar utan att behöva definiera en belöningsfunktion.
7

Truck tyre rolling resistance : Experimental testing and constitutive modelling of tyres

Hyttinen, Jukka January 2022 (has links)
Global warming sets a high demand to reduce the CO2 emissions of vehicles. In the European Union heavy-duty road transports account for 6 % of the total greenhouse gases and one of the main factors affecting these emissions is related to the rolling resistance of tyres. The optimal usage of tyres is an important part of solving these challenges, thereby it is important to understand the parameters affecting rolling resistance and the different compromises coupled to them. These compromises could be analysed using computational and experimental methods. To set out the groundwork necessary to minimise the energy consumption of trucks and assess the different parameters affecting tyre behaviour, the following studies have been conducted during this thesis. A framework to model and parametrise truck tyre rubber has been developed for finite element simulations. The presented parallel rheological material model utilises Mooney-Rivlin hyperelasticity, Prony series viscoelasticity, and perfectly plastic networks. A method to reduce tuneable parameters of the model, which significantly simplifies possible parameter studies, is presented. The model has been parametrised using test data from dynamic mechanical analysis of samples from a long haulage heavy truck tyre, and shows a good agreement with the test data. To test the suitability of the modelling technique for tyre simulations, the constitutive model is used in various tyre simulations using the arbitrary Lagrangian-Eulerian method. The material modelling technique is shown to work for static force-deflection as well as dynamic simulations estimating longitudinal force build-up with varying slip levels. Additionally, the modelling technique captures the uneven contact pressure in steady-state rolling, which indicates that the model could also be used in rolling resistance simulations. To study the change of ambient temperature on rolling resistance using experimental methods, a climate wind tunnel is used where the rolling resistance is quantified using a measurement drum. Tests were conducted between -30 °C and +25 °C, and a considerable ambient temperature dependency on rolling resistance was found. Moreover, temperature measurement inside a tyre shoulder is a good indicator for rolling resistance in a broad range of ambient temperatures. Finally, battery-electric long haulage truck driving range calculations are also conducted with varying rolling resistance and air density at different temperatures, showing a significant decrease of driving range with decreasing ambient temperature. / Den globala uppvärmningen ställer höga krav på att minska tunga fordons CO2-utsläpp. Tunga transporter står för 6 % av de totala växthusgaserna i Europeiska unionen och att fokusera på optimal användning av däck är en viktig del för att minska förorenande växthusgaser. Därför är det viktigt att förstå parametrar som påverkar rullmotståndet och olika kompromisser kopplade till dem. Dessa kompromisser skulle kunna analyseras med hjälp av beräkningsmetoder och experimentella metoder. För att lägga grunden för att minimera energiförbrukningen för lastbilar och bedöma olika parametrar som påverkar däckens beteende, har följande studier genomförts i denna avhandling. Ett ramverk för att modellera och parametrisera lastbilsdäcksgummi utvecklades för finita elementmetod-simuleringar. Den presenterade parallella reologiska materialmodellen använder Mooney-Rivlin hyperelasticitet, Prony-series viskoelasticitet och perfekt plastiska nätverk. En metod har utvecklats för att reducera antalet justerbara materialparametrar i modellen, vilket avsevärt förenklar möjliga parameterstudier. Modellen har parametriserats med hjälp av testdata från dynamisk mekanisk analys och visar en god överensstämmelse mellan testdata och simuleringar. Provstavarna skars ut från ett lastbilsdäck för tunga fordon. För att testa modelleringsteknikens lämplighet användes den konstitutiva modellen i olika däcksimuleringar. Materialmodelleringstekniken har visat sig fungera för statisk vertikalstyvhet såväl som dynamiska simuleringar som uppskattar longitudinell kraftgenerering med varierande slipnivåer och olika friktionskoefficienter. Modelleringstekniken fångar ojämnt kontakttryck vid stationär rullning, vilket indikerar att modellen även kan användas i simuleringar av rullmotstånd. För att studera omgivningstemperaturens inverkan på rullmotståndet med experimentella metoder användes en klimatvindtunnel. Tester utfördes mellan -30 °C och +25 °C och rullmotståndet bestämdes med en mättrumma. Ett avsevärt beroende av omgivningstemperaturen på rullmotståndet påvisades. Dessutom indikerade provningen att temperaturmätning inuti däckskuldran är en bra indikator för rullmotstånd i ett brett område av omgivningstemperaturer. Räckviddsberäkningar för en elektrisk fjärrtransportlastbil utfördes med varierande rullmotstånd och luftdensitet vid olika temperaturer, vilket visade en signifikant minskning av körräckvidden med sjunkande omgivningstemperatur. / <p>QC 220525</p>
8

Development of an Artificial Intelligent Software Agent using Artificial Intelligence and Machine Learning Techniques to play Backgammon Variants

Kostias, Aristotelis, Tagkoulis, Georgios January 2018 (has links)
Artificial Intelligence has seen enormous progress in many disciplines in the recent years. Particularly, digitalized versions of board games require artificial intelligence application due to their complex decision-making environment. Game developers aim to create board game software agents which are intelligent, adaptive and responsive. However, the process of designing and developing such a software agent is far from straight forward due the nature and diversity of each game. The thesis examines and presents a detailed procedure of constructing a software agent for backgammon variants, using temporal difference, artificial neural networks and backpropagation. Different artificial intelligence and machine learning algorithms used in board games, are overviewed and presented. Finally, the thesis describes the development and implementation of a software agent for the backgammon variant called Swedish Tables and evaluates its performance. / Artificiell intelligens har sett enorma framsteg inom många discipliner de senare åren. Speciellt, digitaliserade brädspel kräver implementering av Artificiell intelligens då deras beslutfattande logik är väldigt komplex. Dataspelutvecklarnas syfte och mål är att skapa programvaror som är intelligenta, adaptiva och lyhörda. Dock konstruktionsoch utvecklingsprocess för att kunna skapa en sådan mjukvara är långtifrån att vara faställd, mest på grund av diversitet av naturen av varje spel. Denna avhandlingen forskar och föreslår en detaljerad procedur för att bygga en "Software Agent" för olika slags Backagammon, genom att använda AI neurala nätvärk och back-propagation metoder. Olika artificiell intelligensoch maskininlärningsalgoritmer som används i brädspel forskas och presenteras. Slutligen denna avhandling beskriver implementeringen och utvecklingen av ett mjukvaru agent för en backgammonvariant, närmare bestämt av "Svenska Tabeller" samt utvärderar dess prestanda.
9

A comparison of algorithms used in traffic control systems / En jämförelse av algoritmer i trafiksystem

Björck, Erik, Omstedt, Fredrik January 2018 (has links)
A challenge in today's society is to handle a large amount of vehicles traversing an intersection. Traffic lights are often used to control the traffic flow in these intersections. However, there are inefficiencies since the algorithms used to control the traffic lights do not perfectly adapt to the traffic situation. The purpose of this paper is to compare three different types of algorithms used in traffic control systems to find out how to minimize vehicle waiting times. A pretimed, a deterministic and a reinforcement learning algorithm were compared with each other. Test were conducted on a four-way intersection with various traffic demands using the program Simulation of Urban MObility (SUMO). The results showed that the deterministic algorithm performed best for all demands tested. The reinforcement learning algorithm performed better than the pretimed for low demands, but worse for varied and higher demands. The reasons behind these results are the deterministic algorithm's knowledge about vehicular movement and the negative effects the curse of dimensionality has on the training of the reinforcement learning algorithm. However, more research must be conducted to ensure that the results obtained are trustworthy in similar and different traffic situations. / En utmaning i dagens samhälle är att hantera en stor mängd fordon som kör igenom en korsning. Trafikljus används ofta för att kontrollera trafikflödena genom dessa korsningar. Det finns däremot ineffektiviteter eftersom algoritmerna som används för att kontrollera trafikljusen inte är perfekt anpassade till trafiksituationen. Syftet med denna rapport är att jämföra tre typer av algoritmer som används i trafiksystem för att undersöka hur väntetid för fordon kan minimeras. En tidsbaserad, en deterministisk och en förstärkande inlärning-algoritm jämfördes med varandra. Testerna utfördes på en fyrvägskorsning med olika trafikintensiteter med hjälp av programmet Simulation of Urban MObility (SUMO). Resultaten visade att den deterministiska algoritmen presterade bäst för alla olika trafikintensiteter. Inlärningsalgoritmen presterade bättre än den tidsbaserade på låga intensiteter, men sämre på varierande och högre intensiteter. Anledningarna bakom resultaten är att den deterministiska algoritmen har kunskap om hur fordon rör sig samt att dimensionalitetsproblem påverkar träningen av inlärningsalgoritmen negativt. Det krävs däremot mer forskning för att säkerställa att resultaten är pålitliga i liknande och annorlunda trafiksituationer.
10

Exploring the effects of state-action space complexity on training time for AlphaZero agents / Undersökning av påverkan av spelkomplexitet på träningstiden för AlphaZero-agenter

Glimmerfors, Tobias January 2022 (has links)
DeepMind’s development of AlphaGo took the world by storm in 2016 when it became the first computer program to defeat a world champion at the game of Go. Through further development, DeepMind showed that the underlying algorithm could be made more general, and applied to a large set of problems. This thesis will focus on the AlphaZero algorithm and what parameters affect the rate at which an agent is able to learn through self-play. We investigated the effect that the neural network size has on the agent’s learning as well as how the environment complexity affects the agent’s learning. We used Connect4 as the environment for our agents, and by varying the width of the board we were able to simulate environments with different complexities. For each board width, we trained an AlphaZero agent and tracked the rate at which it improved. While we were unable to find a clear correlation between the complexity of the environment and the rate at which the agent improves, we found that a larger neural network both improved the final performance of the agent as well as the rate at which it learns. Along with this, we also studied what impact the number of MonteCarlo tree search iterations have on an already trained AlphaZero agent. Unsurprisingly, we found that a higher number of iterations led to an improved performance. However, the difference between using only the priors of the neural network and a series of Monte-Carlo tree search iterations is not very large. This suggest that using solely the priors can sometimes be useful if inferences need to made quickly. / DeepMinds utveckling av AlphaGo blev ett stort framsteg året 2016 då det blev första datorprogrammet att besegra världsmästaren i Go. Med utvecklingen av AlphaZero visade DeepMind att en mer generell algoritm kunde användas för att lösa en större mängd problem. Den här rapporten kommer att fokusera på AlphaZero-algoritmen och hur olika parametrar påverkar träningen. Vi undersökte påverkan av neuronnätets storlek och spelkomplexiteten på agentens förmåga att förbättra sig. Med hjälp av 4 i rad som testningsmiljö för våra agenter, och genom att ändra på bredden på spelbrädet kunde vi simulera olika komplexa spel. För varje bredd som vi testade, tränade vi en AlphaZero-agent och mätte dens förbättring. Vi kunde inte hitta någon tydlig korrelation mellan spelets komplexitet och agentens förmåga att lära sig. Däremot visade vi att ett större neuronnät leder till att agenten förbättrar sig mer, och dessutom lär sig snabbare. Vi studerade även påverkan av att variera antalet trädsökningar för en färdigtränad agent. Våra experiment visar på att det finns en korrelation mellan agentens spelstyrka och antalet trädsökningar, där fler trädsökningar innebär en förbättrad förmåga att spela spelet. Skillnaden som antalet trädsökningar gör visade sig däremot inte vara så stor som förväntad. Detta visar på att man kan spara tid under inferensfasen genom att sänka antalet trädsökningar, med en minimal bestraffning i prestanda.

Page generated in 0.0944 seconds