Spelling suggestions: "subject:"belöningsbaserad inlärning"" "subject:"belöningsbaserade inlärning""
1 |
Styrsystem för fordon med hjälp av artificiella neurala nätverkEngerström, Sigurd January 2007 (has links)
<p>Denna rapport jämför två nätverksarkitekturer för artificiella neurala nätverk vars uppgift är att realisera ett styrsystem för ett fordon som det även skall lära sig att styra. Jämförelsen bygger på utförda experiment där de båda nätverken fick lära sig att styra ett fordon längs en slumpgenererad väg. Båda nätverken bygger på belöningsbaserad inlärning för att lära sig lösa uppgiften.</p><p>Resultatet av utvärderingen visar både att nätverken inte hade några problem med att lära sig att styra fordonet och att de inte krävde lång tid för att kunna lära sig hur fordonet skulle styras. Resultaten visar inte heller att någon skillnad fanns i vare sig tillförlitlighet eller generaliseringsförmåga hos de båda nätverksarkitekturerna.</p>
|
2 |
Kombination av exempelbaserad och belöningsbaserad inlärning för ANN / Combination of supervised and unsupervised learning of ANNPogemaa, Joel January 2019 (has links)
Det här experimentet gick ut på att testa tre olika inlärningsstrategier emot varandra i en spelmiljö. De tre inlärningsstrategier som testades var en exempelbaserad strategi, en belöningsbaserad strategi och en strategi som kombinerade dessa två algoritmer. Kombinationen bestod av att först träna upp ett nätverk med den exempelbaserade strategin för att sedan använda det nätverket som en utgångspunkt för den belöningsbaserade strategin. Dessa strategier testades sedan i en spelmiljö. Resultatet som de olika strategierna producerade var svårtolkade. På grund av att alla inlärningsstrategierna inte förbättrade sig märkvärdigt under deras träningstid har det gjort att resultaten från att ändra på variablerna hos de olika strategierna inte visat på några märkvärda skillnader i resultat. Skillnader i resultat vid jämförelser av de olika strategierna har observerats men det går inte att säkerställa att det är inlärningsstrategierna som är anledningen till skillnad i resultat.
|
3 |
Styrsystem för fordon med hjälp av artificiella neurala nätverkEngerström, Sigurd January 2007 (has links)
Denna rapport jämför två nätverksarkitekturer för artificiella neurala nätverk vars uppgift är att realisera ett styrsystem för ett fordon som det även skall lära sig att styra. Jämförelsen bygger på utförda experiment där de båda nätverken fick lära sig att styra ett fordon längs en slumpgenererad väg. Båda nätverken bygger på belöningsbaserad inlärning för att lära sig lösa uppgiften. Resultatet av utvärderingen visar både att nätverken inte hade några problem med att lära sig att styra fordonet och att de inte krävde lång tid för att kunna lära sig hur fordonet skulle styras. Resultaten visar inte heller att någon skillnad fanns i vare sig tillförlitlighet eller generaliseringsförmåga hos de båda nätverksarkitekturerna.
|
Page generated in 0.104 seconds