Das Nim-Spiel
Das Nim-Spiel
-
Tag
AI, AIKI, unplugged
-
Zyklus
ES-INF, ES-SUP
-
Schwierigkeitsgrad
Intermediate
-
Fachbereich
Informatik
-
Medium
Lesson Plans
-
Medienkompetenzen
Informationen und Daten, Kommunikation und Zusammenarbeit, Erstellen von Inhalten
Material
- Zehn Gegenstände (Stifte, Münzen, Knöpfe usw.)
- Acht Becher, beschriftet von 3 bis 10, mit je drei zusammengefalteten Zetteln, auf denen jeweils 1, 2 oder 3 steht
- Ein Becher, beschriftet mit der Zahl 2, mit zwei Zetteln, auf denen jeweils 1 oder 2 steht
Bezug zum Lehrplan
Funktionsweise von KI-Systemen (verstärkendes Lernen) verstehen
Medienkompetenzen
1.2 Daten, Informationen und digitale Inhalte analysieren und bewerten
2.1 Mit anderen zusammenarbeiten
3.3 Modellieren, strukturieren undkodieren
Bezug zum Alltag
Beim maschinellen Lernen erstellt ein KI-System Schlussfolgerungen aufgrund bestimmter Merkmale der ihm zur Verfügung stehenden Daten. Eine Methode des maschinellen Lernens
ist das verstärkende oder bestärkende Lernen. So, wie der Mensch durch Interaktion mit der Umwelt und durch wiederholte Belohnungen und Bestrafungen lernt, so lernen auch KISysteme
anhand des verstärkenden Lernens.
Die Systeme erfassen zuerst die Zustände ihrer Umwelt und führen eine Aktion aus. Daraufhin erhält das System von Regeln eine Belohnung oder eine Bestrafung. Bei einer Belohnung
führt das System die Aktion häufiger aus, bei einer Bestrafung weniger oft. Nach vielen Durchgängen bleiben nur die Aktionen übrig, die zu einer Belohnung führen: Das System hat
eigenständig gelernt.
Ähnliche Lernstrategien benutzt der Mensch auch im Alltag: Strafen in der Schule, gute Noten bei einem Test, Strafzettel im Straßenverkehr, Punkteführerschein und viele andere.
Ablauf
Die Lernenden bilden Zweierteams. Die Lehrperson erklärt die Regeln des Nim-Spiels:
Die zehn Gegenstände werden vor den zwei Spielenden ausgelegt. Sie nehmen abwechselnd einen, zwei oder drei Gegenstände weg. Wer den letzten Gegenstand nimmt, hat verloren.
Anschließend spielen die Lernenden mehrfach das Spiel und versuchen Gewinnstrategien herauszufinden.
Dann erklärt die Lehrperson, dass KI-Systeme eigenständig Gewinnstrategien erkennen können. Dazu brauchen sie als Eingabe nur die Regeln. Die Lehrperson gibt jeder Gruppe das
vorbereitete Material (Becher mit Zetteln).
Die Lernenden entscheiden, wer den ersten Spielzug macht: Das KI-System oder sie. Wenn die KI an der Reihe ist, zählen sie, wie viele Stifte übrig sind, und nehmen aus dem Becher
mit dieser Zahl einen beliebigen Zettel heraus.
Die Zahl darauf ist die Anzahl der Stifte, die die KI nimmt. Am Ende des Spiels werden alle Zettel in den Becher zurück gelegt. Bei dieser Spielweise ist die KI leicht zu schlagen, da sie nur
zufällige Entscheidungen trifft, die manchmal sehr schlecht sein können.
Die KI muss also trainiert werden, damit sie besser wird. Dazu wird sie für eine schlechte Entscheidung bestraft: Gespielt wird wie vorhin, doch wenn die KI verliert, wird am Ende des Spiels
der Zettel der letzten Aktion nicht mehr in den Becher zurückgelegt. Die KI lernt, dass dies eine schlechte Entscheidung war und wird sie daher nicht wiederholen. Jeder Becher muss allerdings mindestens einen Zettel enthalten. Sollte der Becher leer sein, wird der entsprechende Zettel zurückgelegt und stattdessen der Zettel des vorherigen Spielzugs weggenommen.
Wenn das Spiel oft genug gespielt wird, wird am Ende jeder Becher nur noch einen Zettel enthalten: der perfekte Zug in dieser Situation.
Die KI ist vollständig trainiert und gewinnt immer dann, wenn sie als Erste spielt, und verliert nur dann, wenn die Lernenden als Erste spielen und perfekte Entscheidungen treffen.
Tipps & Tricks
Das Prinzip des verstärkenden Lernens kann auch über eine einfache digitale Version des Bauernschachs (Schlag das Krokodil) erarbeitet werden: https://www.stefanseegerer.de/schlag-das-krokodil/
Weiterführende Links
https://www.i-am.ai/de/build-your-own-ai.html
https://www.plattform-lernende-systeme.de/video-tutorials.html