Jan Spoelstra
In deze rubriek staat TW stil bij opmerkelijke feiten, die een verrassende blik werpen op de lopende actualiteit. Deze keer viel me tijdens het kijken van één van de vele online schaaktoernooien voor de wereldtop op dat zelflerende algoritmen het schaakspel ingrijpend veranderen.
In de podcast Perpetual Chess omschreef de Nederlandse schaakgrootmeester Erwin l’Ami hoe hij computers inzet bij het voorbereiden van schaakpartijen. Het geheim? Er staan continu twee computers in zijn huis te rekenen. L’ami geeft aan schaakengine Stockfish te gebruiken voor het brute rekenwerk; een Monte Carlo tree search die simpelweg alle redelijke zetten uitprobeert en de resulterende stellingen evalueert. Voor de meer ‘menselijke kant’ gebruikt hij het meer intuïtieve Leela Chess Zero, een zelflerend algoritme dat inspiratie heeft gehaald uit de manier waarop AlhpaZero van Google zichzelf schaken heeft geleerd.
Het boek Gamechanger (2019) gaat bijvoorbeeld in op hoe AlphaZero zichzelf het spel heeft aangeleerd en de baanbrekende strategieën waarmee de AI komt aanzetten. Aan de ene kant zie je dan hoe AlphaZero solide openingen waar de mens tientallen boeken over schreef, opnieuw uitvindt in enkele uren. Maar wat boeiender is dat zelflerende algoritmes buiten de gebaande paden ‘denken’. Vaak gaan de randpionnen naar voren, dikwijls offert het programma pion na pion om er bewegelijkheid van de stukken voor terug te krijgen en soms zie je offers voorbijkomen die pas in het eindspel een klein voordeel opleveren. Bovenal lapt AI de numerieke waardes die wij mensen aan de stukken geven volledig aan zijn laars.
‘Een mix van herontdekking van schaaktheorie en totale verbijstering over de strategie waar AI mee komt’, zo noemen de auteurs van het boek Gamechanger het in februari 2019 in de uitzending van Perpetual Chess. Het is ook boeiend om te zien hoe schakers hun spel hierdoor aanpassen. Maar daar zitten grenzen aan. Zo geeft één van de auteurs van Gamechanger aan dat ze hopeloos de mist in ging toen ze AlphaZero’s strategie van oprukkende randpionnen kopieerde.