Version vom 29. April 2010, 11:24 Uhr

Inhaltsverzeichnis

Ideensammlung zum Computer-Go-Seminar des HPI

Ferstlegung Termin und Teilnehmer (http://doodle.com/rxhszz8r8k3tmbg2)
Ausarbeitung der Gruppenaufteilung (zusammenarbeitende Gruppen ~ jeweils 2-3 Mitglieder)
- Gruppen aufteilen in Optimierung verschiedener Parameter (beispielsweise dynamisches Komi), Parallelisierung, zusätzliche Lösungsstrategien zu MCTS o.ä. (dafür nötig eine Grundimplementierung, also mit mCTS und Verständnis aller Teilnehmer wie MCTS arbeitet)
Festlegen des OS für die Hardware
!!!!!!!!!!!!!!!!! Basic-Player evaluieren + nochmal nachfragen ob es noch weitere gibt !!!!!!!!!!!!!!!!!!!!!!!!!!!!
SVN Gastaccounts für teilnehmende Ifis anlegen
Eventuelle Kooperation mit BS-Lehrstuhl (Parallelisierung) ---> Dr. Martin von Löwis
Vortragsthemen für 3 Gruppen (a ~ 2 Personen) ausarbeiten, hierfür Auswahl der wichtigsten Themen und wichtigsten Paper (diese sollen am Anfang gehalten werden)

(Pingoin)
Golem!
God/Got/Gott (muss man sich nur nocha usdenken wofür das angeblich stehen sollen)

Monte Carlo Tree Search & co.
- dynamisches Komi
Parallelisierung (Thread / Cluster)
Tsume Go
direction of play
statische Evaluationsfunktionen
Kombination von verschiedenen Ansätzen (MCTS, direction of play, statische Evaluation...)
Parameter Tuning
Evaluieren des Players (menschliche / computer- Gegner)

zuerst einführender Vortrag von Manju
jede der Gruppen hält einen vertiefenden Vortrag über ein Thema (schon zu Beginn des Semester ---> Ausarbeitung vorher)
Danach wird das Basisprinzip implementiert (MCTS), dies muss von allen umfassend verstanden werden (auch wenn nciht alle implementierne können)
Aufteilung in Gruppen und arbeiten an einzelnen themen (--> todos)

(Auszug aus den Veröffentlichungen der letzten Jahre)

@@ Zeile 61: / Zeile 61: @@
 (Auszug aus den Veröffentlichungen der letzten Jahre)
-=== Monte Carlo Tree Search (1.Vortrag) ===
+==== Monte Carlo Tree Search (1.Vortrag) ====
 * [http://www.lri.fr/~gelly/paper/SylvainGellyThesis.pdf PHD: A CONTRIBUTION TO REINFORCEMENT LEARNING; APPLICATION TO COMPUTER-GO (SYLVAIN GELLY)] '''MUST-READ''' Kapitel 4
 * [http://www.personeel.unimaas.nl/G-chaslot/papers/newMath.pdf PROGRESSIVE STRATEGIES FOR MONTE-CARLO TREE SEARCH (Chaslot et.al)]
@@ Zeile 80: / Zeile 80: @@
 * [http://www.geocities.jp/hideki_katoh/publications/gpw08-private.pdf Parallel Monte-Carlo Tree Search with Simulation Servers (KATO, TAKEUCHI)]
 * [http://hal.archives-ouvertes.fr/docs/00/28/78/67/PDF/icin08.pdf THE PARALLELIZATION OF MONTE-CARLO PLANNING (S. Gelly et.al)]
+* [http://webdocs.cs.ualberta.ca/~emarkus/publications/enzenberger-mueller-acg12.pdf A Lock-free Multithreaded Monte-Carlo Tree Search Algorithm (Martin Müller et.al)]
-=== Other ===
+==== Other ====
 * [http://www.unimaas.nl/games/files/phd/Van%20der%20Werf_thesis.pdf PHD: AI techniques for the game of Go (2004) (Erik van der Werf)]
 * [http://books.nips.cc/papers/files/nips17/NIPS2004_0747.pdf Modelling Uncertainty in the Game of Go (David H. Stern et.al)]