Libratus – AI for strategic reasoning with imperfect information
Nachdem ich in Schnell geschaut #3: Google Deep Mind – Self Learning AI Explained bereits die AI vorgestellt habe, die in GO gegen den weltbesten Spieler gewinnt, geht es nun mit Poker weiter. Poker stellt in Hinblick auf AI vs Humans die nächste Stufe dar. Spiele wie Schach und GO besitzen eine klare Struktur, die jederzeit für beide Spieler komplett sichtbar ist, es gibt praktisch keine versteckten Informationen. Poker dagegen besitzt sowohl versteckte Spielelemente (die Handkarten der Gegenspieler) als auch fehlende Informationen (die Karten des Spiels) und es kommt die Komponente Zufall dazu. Somit ist dieses Spiel noch schwerer zu berechnen.
Erst vor wenigen Tagen, Ende Januar 2017, fand ein Event namens „Brains Vs. Artificial Intelligence: Upping the Ante“ im Rivers Casino in Pittsburgh statt. Vier professionelle Poker-Spieler gegen eine AI namens Libratus der Carnegie Mellon University (CMU). Die AI gewinnt, mit großem Abstand.
“The best AI’s ability to do strategic reasoning with imperfect information has now surpassed that of the best humans,” Sandholm said.
Anfangs lagen die Spieler noch vorne, Tag 4 bis 6 liefen besonders gut. Jedoch ging es ab Tag 7 steil bergab, bis zum Ende des Turniers. Grund dafür ist eine neue Strategie des Lernens für diese AI. Statt Schwächen der Gegner zu suchen und auszunutzen, wurden eigene Schwächen der AI über Nacht analysiert und bereinigt.
The event was surrounded by speculation about how Libratus was able to improve day to day during the competition. It turns out it was the pros themselves who taught Libratus about its weaknesses.
“After play ended each day, a meta-algorithm analyzed what holes the pros had identified and exploited in Libratus’ strategy,” Sandholm said. “It then prioritized the holes and algorithmically patched the top three using the supercomputer each night. This is very different than how learning has been used in the past in poker. Typically researchers develop algorithms that try to exploit the opponent’s weaknesses. In contrast, here the daily improvement is about algorithmically fixing holes in our own strategy.”
Mehr Infos und Artikel auch bei Wikipedia.
Alle bisherigen Schnell geschaut Folgen
Alle bisherigen Folgen
> Schnell geschaut #6: Libratus Poker AI vs Humans
Schnell geschaut #5: Elon Musk’s Rules For Success
Schnell geschaut #4: Admiral William H. McRaven an der University of Texas 2014
Schnell geschaut #3: Google Deep Mind – Self Learning AI Explained
Schnell geschaut #2: SpaceX Milestone
Schnell geschaut #1: Amazon Logistik