• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 2
  • Tagged with
  • 2
  • 2
  • 2
  • 2
  • 2
  • 2
  • 2
  • 2
  • 2
  • 2
  • 2
  • 2
  • 2
  • 1
  • 1
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
1

LSTM-nätverk för generellt Atari 2600 spelande / LSTM networks for general Atari 2600 playing

Nilson, Erik, Renström, Arvid January 2019 (has links)
I detta arbete jämfördes ett LSTM-nätverk med ett feedforward-nätverk för generellt Atari 2600 spelande. Prestandan definierades som poängen agenten får för ett visst spel. Hypotesen var att LSTM skulle prestera minst lika bra som feedforward och förhoppningsvis mycket bättre. För att svara på frågeställningen skapades två olika agenter, en med ett LSTM-nätverk och en med ett feedforward-nätverk. Experimenten utfördes på Stella emulatorn med hjälp av ramverket the Arcade Learning Environment (ALE). Hänsyn togs till Machado råd om inställningar för användning av ALE och hur agenter borde tränas och evalueras samtidigt. Agenterna utvecklades med hjälp av en genetisk algoritm. Resultaten visade att LSTM var minst lika bra som feedforward men båda metoderna blev slagna av Machados metoder. Toppoängen i varje spel jämfördes med Granfelts arbete som har varit en utgångspunkt för detta arbete.
2

Elmannätverk för generellt Atari-spelande / Elman network for general Atari game playing

Granfelt, Elias January 2017 (has links)
Generellt spelande är ett forskningsområde fokuserat på att skapa AI som kan spela spel utan någon domänspecifik information. Detta arbete har undersökt elman-nätverks potential för generellt Atari-spelande genom att testa ett elman-nätverk och ett feedforward-nätverk via the Arcade Learning Environment. Nätverken använder en pixelrepresentation för att representera spelmiljön och baserar sina handlingar endast på den informationen. Agenterna testades på fyra spel varav två anses kräva en mer avancerad struktur än feedforward. Agenterna evalueras via deras toppoäng i spelen som testas och tränas via en genetisk algoritm. Resultaten visade att elman-strukturen inte presterar bättre än feedforward, dessutom erhölls ingen poäng i de avancerade spelen vilket tyder på att ett korttidsminne inte är tillräckligt för att spela dessa spel. Jämfört med tidigare forskning sågs en liten förbättring över liknande struktur vilket tyder på en förbättrad representation. För att förbättra resultaten i detta arbete borde ett större antal spel testas.

Page generated in 0.0855 seconds