
Ein Agent lernt durch Belohnungen, die besten Aktionen in einer Umgebung auszuführen.

Q-Learning und SARSA sind Algorithmen für unüberwachtes Lernen.

Baroque art features strong contrasts, while Rococo art prefers more subtle transitions

Baroque art is generally larger in scale than Rococo art