4e prijs 2025 - 3i Award

De ultieme kaartspeler

Leerling:

Lieke Visser en Lennox van den Oord

School:

Het 4e gymnasium, Amsterdam

Docent:

R. Sier

In dit profielwerkstuk onderzoeken we hoe een computer het kaartspel hartenjagen kan leren via machine learning. We bestuderen zowel Qlearning (met een tabel) als Deep Q-learning (met een neuraal netwerk) en implementeren beide methoden zelf, zonder bestaande modules.

Na een theoretische uitleg over neurale netwerken en reinforcement learning, inclusief concepten zoals gradient descent en Monte Carlo, beschrijven we onze implementatie in Python.

Onze experimenten tonen dat de Q-learning speler beter presteert dan willekeurig spel, terwijl de Deep Q-speler instabiel blijkt. Daarnaast wilden we dit werkstuk toegankelijk maken voor anderen, omdat wij dit complexe en steeds relevantere onderwerp zelf moeilijk vonden om te doorgronden. In de discussie verkennen we verbeteringsmogelijkheden voor Deep Qlearning.

Klik hier voor een korte video van het PWS.