Leerling:
Lieke Visser en Lennox van den Oord
School:
Het 4e gymnasium, Amsterdam
Docent:
R. Sier
In dit profielwerkstuk onderzoeken we hoe een computer het kaartspel hartenjagen kan leren via machine learning. We bestuderen zowel Qlearning (met een tabel) als Deep Q-learning (met een neuraal netwerk) en implementeren beide methoden zelf, zonder bestaande modules.
Na een theoretische uitleg over neurale netwerken en reinforcement learning, inclusief concepten zoals gradient descent en Monte Carlo, beschrijven we onze implementatie in Python.
Onze experimenten tonen dat de Q-learning speler beter presteert dan willekeurig spel, terwijl de Deep Q-speler instabiel blijkt. Daarnaast wilden we dit werkstuk toegankelijk maken voor anderen, omdat wij dit complexe en steeds relevantere onderwerp zelf moeilijk vonden om te doorgronden. In de discussie verkennen we verbeteringsmogelijkheden voor Deep Qlearning.