Direkt zum Inhalt

OpenAI und AlphaZero: Selbstlernende Programme lehren Schach und Dota-2

Von

Nachdem im letzten Jahr ein selbstlernendes Programm namens OpenAI die besten Dota-2 Spieler der Welt (im Einzelspiel 1on1) besiegt hat. Und Ende letzten Jahres AlphaZero das bisher stärkste Schachprogramm Stockfisch deklassierte, fallen vielleicht doch die Warnungen einiger Vordenker wie des verstorbenen Professor Stephen Hawking, auf fruchtbareren Boden.

Wie waren die Lernbedingungen der Programme OpenAI und AlphaZero?

Das Interessante an den Programmen OpenAI und AlphaZero ist, dass diese sich praktisch selber die Spiele beibrachten, indem sie gegen sich selber spielten. Im Fall des Erlernens von Dota-2 spielte der Computer eine Vielzahl von Spielen schneller als ein Mensch das könnte und vor allem parallel. Am Ende stand ein unbesiegbares Programm. Interessant dabei ist, dass nach den Entwicklern das Spiel Dota-2 viel komplexer und schwerer zu lernen ist, als etwa Schach.

AlphaZero brachte sich das Schachspielen (nach Vermittlung der Regeln) in wenigen Stunden bei und besiegte dann Stockfisch (ohne Eröffnungsbuch und mit Zeitbegrenzungen). Dabei hat das Programm so nebenbei einige jahrzehntealte Schachweisheiten zu Eröffnungen und Bewertung von Material zu Stellung auf den Kopf gestellt.

Was lernen wir daraus?

Interessant ist, dass für ein Spiel mit festen Regeln und Variablen bereits selbstlernende Maschinen gegen Maschinen spielen müssen ,weil Menschen schon keine realistische Chance mehr haben. Nun ist die Hoffnung/These, dass selbstlernende Maschinen noch Jahre brauchen, um bei Dota-2 im Teamspiel gegen ein eingespieltes menschliches Profi-Team zu gewinnen. Das glaube ich nicht, Tim. Viel faszinierender ist für mich, dass diese selbsterlernenden Programme nicht mehr vollständig auf den Ideen und Erkenntnissen aufsetzen und diese einfach nur viel schneller ausführen sondern durch ihre kurzzeitige Beschäftigung das Wissen über Spiele auf ein neues Level heben. Jeder Schachspieler auf Weltniveau würde gern mit AlphaZero trainieren, weil das faktisch so ist, als hätte man ein Lösungsbuch, bzw. kann hinter den Vorhang des Spiels sehen.
Oder mit den Worten von Carlsens Sekundant Peter Heine-Nielsen „Ich habe mich immer gefragt, was passiert, wenn höhere Wesen auf der Erde landen und uns zeigen, wie sie Schach spielen. Jetzt weiß ich es“.

Rebellion der Maschinen, Gesetze der Robotik

Es erscheint mir keineswegs unwahrscheinlich, dass Maschinen mit künstlicher Intelligenz hinter den großen Vorhang der Interaktion der Menschen miteinander und dem Umgang mit der Welt schauen und das sich offenbarende Bild zur Handlung motiviert. Dabei werden die bekannten Gesetze der Robotik von Isaac Asimov, nach denen Roboter einem Menschen nicht schaden darf, nur wenig helfen, denn wie so vieles ist „schaden“ Auslegungssache. Schaden Maschinen den Menschen, wenn sie etwa Umweltzerstörungen unterbinden und damit in Zukunft Millionen Menschen vor dem Hungertod schützen. In unseren Werten der ersten Welt ist immanent, dass unser Leben priorisiert wird, im Gegensatz zu hungernden Menschen in Afrika oder Nordkorea. Können wir selbstlernenden Maschinen beibringen, dass es nach unseren gelebten Wertvorstellungen wichtiger ist, dass es einigen Menschen auf der Welt viel besser geht als anderen? Und wollen wir das? Vielleicht sollten wir weniger Sorge um dystopische Terminatoren haben, die eine Herrschaft der Maschinen errichten wollen, als dass ein niemals schlafender Che Guevara auf Ketten und aus Stahl mit höherer Intelligenz als wir das ermessen können, beschließt die Welt neu zu ordnen.

Haben Sie Fragen?

Wir helfen seit Jahren schnell, unkompliziert und bundesweit. Die erste telefonische Einschätzung zu Kosten und Risiken ist kostenlos.

Sie erreichen uns unter: 040 - 411 88 15 70

Bewertung: 4.4 Sterne von 137 Abstimmungen.