Vor einigen Tagen, im Januar 2019, wurde ein weiterer Meilenstein von Google’s Deepmind im Bereich der Künstlichen Intelligenzen eindrucksvoll präsentiert. In einem Livestream wurde die neue KI namens AlphaStar vorgestellt, eine Starcraft 2 spielende Intelligenz. Mal vom Einsatzgebiet abgesehen ist die Art und Handlungskomplexität der KI ein riesiger Schritt vorwärts.

In meiner Schnell geschaut #3 Episode habe ich über Deepind’s AlphaGo geschrieben, die das Brettspiel Go gemeistert hatte. Wer Go und das Spielprinzip kennt, sowie Starcraft 2, kann den Unterschied der Komplexität dieser Spiele vielleicht erahnen. Go hat mit dem 19×19 Feldern großem Spielfeld, der Eindeutigkeit von Aktionen und dem Prinzip des rundenbasierten Spielens eine „berechenbare Größe und Komplexität“. Starcraft als Echtzeitstrategiespiel mit einer schier unbegrenzten Menge an Möglichkeiten in jeder Sekunde (oder sogar Millisekunde in intensiven Spielmomenten) scheint hier noch chaotischer zu sein. Economy, Einheiten mit ihren Fertigkeiten, Gebäude, Spielfeldkontrolle, Mikro- und Makromanagement, Taktiken und Kontertaktiken, Bewegungssteuerung… absolut chaotisch, der Realität gar nicht mehr so weit entfernt.

In diesem Tweet von @Liv_Boeree wird die Komplexität versucht in Zahlen zu packen:

Die Werte müssen jetzt nicht stimmen, es kommt ja immer darauf an, wie man diese berechnet. Das Deepmind Team spricht von 1026 Möglichkeiten zu jedem Zeitpunkt im Spiel (Starcraft 2) und verfolgt damit eine andere Rechnung. Die Hürden für das System wurden aber deutlich gemacht:

The need to balance short and long-term goals and adapt to unexpected situations, poses a huge challenge for systems that have often tended to be brittle and inflexible. Mastering this problem requires breakthroughs in several AI research challenges including:

  • Game theory: StarCraft is a game where, just like rock-paper-scissors, there is no single best strategy. As such, an AI training process needs to continually explore and expand the frontiers of strategic knowledge.
  • Imperfect information:Unlike games like chess or Go where players see everything, crucial information is hidden from a StarCraft player and must be actively discovered by “scouting”.
  • Long term planning: Like many real-world problems cause-and-effect is not instantaneous. Games can also take anywhere up to one hour to complete, meaning actions taken early in the game may not pay off for a long time.
  • Real time: Unlike traditional board games where players alternate turns between subsequent moves, StarCraft players must perform actions continually as the game clock progresses.
  • Large action space: Hundreds of different units and buildings must be controlled at once, in real-time, resulting in a combinatorial space of possibilities. On top of this, actions are hierarchical and can be modified and augmented. Our parameterization of the game has an average of approximately 10 to the 26 legal actions at every time-step.

Due to these immense challenges, StarCraft has emerged as a “grand challenge” for AI research.

Quelle: deepmind.com

Hier ist der Stream, in dem die KI gegen 2 professionelle Spieler antritt, jeweils in 5 Spielen, und dabei alle 10 Spiele gewinnt:

Im Detail gibt es hier viel zu Lernen, ich kann den Artikel von Deepmind und das ganze Thema definitiv empfehlen. Es ist wirklich erstaunlich und respektabel, wie weit die Entwicklungen hier in so kurzer Zeit gekommen sind und die Anwendungsgebiete nähern sich immer weiter der Komplexität der realen Welt an.

Alle bisherigen Schnell geschaut Folgen

Alle bisherigen Folgen

Libratus – AI for strategic reasoning with imperfect information

Nachdem ich in Schnell geschaut #3: Google Deep Mind – Self Learning AI Explained bereits die AI vorgestellt habe, die in GO gegen den weltbesten Spieler gewinnt, geht es nun mit Poker weiter. Poker stellt in Hinblick auf AI vs Humans die nächste Stufe dar. Spiele wie Schach und GO besitzen eine klare Struktur, die jederzeit für beide Spieler komplett sichtbar ist, es gibt praktisch keine versteckten Informationen. Poker dagegen besitzt sowohl versteckte Spielelemente (die Handkarten der Gegenspieler) als auch fehlende Informationen (die Karten des Spiels) und es kommt die Komponente Zufall dazu. Somit ist dieses Spiel noch schwerer zu berechnen.
Erst vor wenigen Tagen, Ende Januar 2017, fand ein Event namens „Brains Vs. Artificial Intelligence: Upping the Ante“ im Rivers Casino in Pittsburgh statt. Vier professionelle Poker-Spieler gegen eine AI namens Libratus der Carnegie Mellon University (CMU). Die AI gewinnt, mit großem Abstand.
Weiterlesen