Q-Learning
Der Roboter kann sich in jedem Spielzug entweder ein Feld nach oben, unten, links oder rechts bewegen (diagonal ist nicht möglich).
Das Ziel ist es, den kürzesten Weg zum Gold zu finden.
Dabei muss er Hindernisse wie Steine und Spielfeldränder vermeiden.