Steffen Puhlmann:
Verbesserung der Lauftrajektorien von humanoiden, Fußball spielenden Robotern mit Hilfe von Reinforcement Learning
Inhalt
Die FUmanoids sind humanoide, Fußball spielende Roboter an der Freien Universität Berlin. Sie treten jährlich im RoboCup gegen andere Teams an. Der zweibeiige Gang ist dabe die enizige erlaubte Fortbewegungsmethode und deshalb von besonderer Wichtigkeit. In dieser Arbeit wird das bestehende Laufsystem durch Reinforcement Learning Algorithmen erweitert. Nach dem Prinzip des Trial-and-Error führen die Roboter Aktionen aus, welche die vorgefertigten Bewegungsmuster beeinflussen. Dafür werden Belohnungen oder Bestrafungen vergeben. Die im Laufe der Zeit gesammelten Erfahrungen werden ausgenutzt, wodurch sich das Laufen verbessert. Es wird dargelegt, wie das Reinforcement Learning in die Laufbewegung eingreift und wie die Bestandteile des Lernprozesses realisiert werden.