AlphaGo Zero 01.03.2018, 14:01 Uhr

KI spielt besser als die Weltmeister

Die KI-Software AlphaGo der Google-Tochter DeepMind gewinnt mit Leichtigkeit jedes Match gegen die besten Schach- und Go-Spieler der Welt. com! professional zeigt die KI im Detail.
(Quelle: Anusorn Nakdee / Shutterstock.com)
Künstliche Intelligenz ist in aller Munde, doch die Intelligenz etwa von digitalen Assistenten ist derzeit eher noch auf Kleinkindniveau. Das wahre Potenzial zeigt die KI-Software AlphaGo der Google-Tochter DeepMind, insbesondere die jüngste Version AlphaGo Zero. Diese wurde mit Hilfe eines neuronalen Netzwerks, Deep Learning und der Baumsuchtechnik Monte Carlo Tree Search (MCTS) binnen weniger Wochen zum weltbesten Go-Spieler, binnen weniger Tage zum weltbesten Schachspieler.
Tensor Processing Unit (TPU) ist ein auf Machine Learning zugeschnittener Spezial-Chip.
Quelle: Google

Eckdaten

  • Die KI-Software AlphaGo wurde zum weltbesten Spieler für drei unterschiedliche Spiele: Go, Schach und Shogi
  • Es gibt bislang vier AlphaGo-Versionen: Fan, Lee, Master und Zero
  • Herzstück der jüngsten Version Zero ist ein Algorithmus, bei dem sich das Programm durch Spiele gegen sich selbst rasant verbessert

Details rund um AlphaGo

  1. Weltmeisterliches Schach: Im November verteidigt Schach-Weltmeister Magnus Carlsen in London seinen Titel gegen einen Herausforderer. Gegen AlphaGo Zero hätten beide keine Chance. Die KI-Software besiegte kürzlich Stockfish, den Computerschach-Weltmeister des Jahres 2016, der auch schon jedem Menschen überlegen ist, mit 28 zu 0 bei 72 Remis.
  2. Selbstlernend: Herausragend an AlphaGo Zero ist seine Lernfähigkeit. Zero spielte vier Tage lang Millionen Partien gegen sich selbst, bevor es Stockfish besiegte („Reinforcement Learning“). Das Besondere daran: AlphaGo Zero wurde nicht wie frühere Programme anhand unzäh­liger Partien von Schachmeistern trainiert; auch eine Bibliothek mit Schacheröffnungen stand ihm nicht zur Verfügung. Seine Programmierer hatten ihm lediglich die Schachregeln sowie einen Belohnungsmechanismus implementiert (für Siege gab es Punkte).
  3. Bester Go-Spieler aller Zeiten: Go ist noch wesentlich komplexer als Schach. Trotzdem gelang es AlphaGo Fan und Lee 2015 als erstem Programm überhaupt, menschliche Go-Meister zu schlagen. Gegen die jüngste Version AlphaGo Zero hat kein Go-Profi mehr eine Chance.
  4. Tensor Processing Unit (TPU): Die TPU ist ein von Google entwickelter, auf Machine Learning zugeschnittener Spezial-Chip. Die erste Genera­tion schafft 91,75 TeraFLOPS, die zweite 180 TeraFLOPS. Damit sind sie viel schneller als herkömmliche CPUs und GPUs. Für das Training vor dem Match gegen Stockfish nutzte AlphaGo Zero 5000 TPUs der ersten und 64 TPUs der zweiten Generation. Im Spiel gegen Stockfish kamen vier TPUs zum Einsatz.
  5. Der Kopf hinter AlphaGo Zero: Der 1976 in London geborene Demis Hassabis ist Schachwunderkind, Informatiker, Computerspiel-Entwickler („Theme Park“), KI-Forscher, Neurowissenschaftler sowie Mitgründer von DeepMind Technologies, das 2014 für rund 400 Millionen Dollar von Google übernommen worden ist.





Das könnte Sie auch interessieren