ComputerGo

Aus GoVB

(Unterschied zwischen Versionen)
Wechseln zu: Navigation, Suche
(Literatur)
(Literatur)
Zeile 61: Zeile 61:
 
(Auszug aus den Veröffentlichungen der letzten Jahre)
 
(Auszug aus den Veröffentlichungen der letzten Jahre)
  
=== Monte Carlo Tree Search (1.Vortrag) ===
+
==== Monte Carlo Tree Search (1.Vortrag) ====
 
* [http://www.lri.fr/~gelly/paper/SylvainGellyThesis.pdf PHD: A CONTRIBUTION TO REINFORCEMENT LEARNING; APPLICATION TO COMPUTER-GO (SYLVAIN GELLY)] '''MUST-READ''' Kapitel 4
 
* [http://www.lri.fr/~gelly/paper/SylvainGellyThesis.pdf PHD: A CONTRIBUTION TO REINFORCEMENT LEARNING; APPLICATION TO COMPUTER-GO (SYLVAIN GELLY)] '''MUST-READ''' Kapitel 4
 
* [http://www.personeel.unimaas.nl/G-chaslot/papers/newMath.pdf PROGRESSIVE STRATEGIES FOR MONTE-CARLO TREE SEARCH (Chaslot et.al)]
 
* [http://www.personeel.unimaas.nl/G-chaslot/papers/newMath.pdf PROGRESSIVE STRATEGIES FOR MONTE-CARLO TREE SEARCH (Chaslot et.al)]
Zeile 80: Zeile 80:
 
* [http://www.geocities.jp/hideki_katoh/publications/gpw08-private.pdf Parallel Monte-Carlo Tree Search with Simulation Servers (KATO, TAKEUCHI)]
 
* [http://www.geocities.jp/hideki_katoh/publications/gpw08-private.pdf Parallel Monte-Carlo Tree Search with Simulation Servers (KATO, TAKEUCHI)]
 
* [http://hal.archives-ouvertes.fr/docs/00/28/78/67/PDF/icin08.pdf THE PARALLELIZATION OF MONTE-CARLO PLANNING (S. Gelly et.al)]
 
* [http://hal.archives-ouvertes.fr/docs/00/28/78/67/PDF/icin08.pdf THE PARALLELIZATION OF MONTE-CARLO PLANNING (S. Gelly et.al)]
 +
* [http://webdocs.cs.ualberta.ca/~emarkus/publications/enzenberger-mueller-acg12.pdf A Lock-free Multithreaded Monte-Carlo Tree Search Algorithm (Martin Müller et.al)]
  
=== Other ===
+
==== Other ====
 
* [http://www.unimaas.nl/games/files/phd/Van%20der%20Werf_thesis.pdf PHD: AI techniques for the game of Go (2004) (Erik van der Werf)]
 
* [http://www.unimaas.nl/games/files/phd/Van%20der%20Werf_thesis.pdf PHD: AI techniques for the game of Go (2004) (Erik van der Werf)]
 
* [http://books.nips.cc/papers/files/nips17/NIPS2004_0747.pdf Modelling Uncertainty in the Game of Go (David H. Stern et.al)]
 
* [http://books.nips.cc/papers/files/nips17/NIPS2004_0747.pdf Modelling Uncertainty in the Game of Go (David H. Stern et.al)]

Version vom 29. April 2010, 11:24 Uhr

Inhaltsverzeichnis

Computer-Go am HPI

Ideensammlung zum Computer-Go-Seminar des HPI

ToDos

  • Ferstlegung Termin und Teilnehmer (http://doodle.com/rxhszz8r8k3tmbg2)
  • Ausarbeitung der Gruppenaufteilung (zusammenarbeitende Gruppen ~ jeweils 2-3 Mitglieder)
    • Gruppen aufteilen in Optimierung verschiedener Parameter (beispielsweise dynamisches Komi), Parallelisierung, zusätzliche Lösungsstrategien zu MCTS o.ä. (dafür nötig eine Grundimplementierung, also mit mCTS und Verständnis aller Teilnehmer wie MCTS arbeitet)
  • Festlegen des OS für die Hardware
  •  !!!!!!!!!!!!!!!!! Basic-Player evaluieren + nochmal nachfragen ob es noch weitere gibt !!!!!!!!!!!!!!!!!!!!!!!!!!!!
  • SVN Gastaccounts für teilnehmende Ifis anlegen
  • Eventuelle Kooperation mit BS-Lehrstuhl (Parallelisierung) ---> Dr. Martin von Löwis
  • Vortragsthemen für 3 Gruppen (a ~ 2 Personen) ausarbeiten, hierfür Auswahl der wichtigsten Themen und wichtigsten Paper (diese sollen am Anfang gehalten werden)

Eckpunkte

Bot-Name

  • (Pingoin)
  • Golem!
  • God/Got/Gott (muss man sich nur nocha usdenken wofür das angeblich stehen sollen)

Teilnehmer

  • Mailinglist: http://lists.hpi.uni-potsdam.de/listinfo/go2010
  • 6 - 10 Teilnehmer
  • Interessenten:
    • Marius Schneider
    • Tobias Pfeiffer
    • Martin Büttner
    • Martin Köppelmann
    • Lars Wassermann
    • Maximilian Schneider?
    • Henning Klein
    • Andre Kunze
    • Thomas Bünger
    • Simon Völcker
    • Lena Herrscheid
    • Jossekin Beilharz

mögliche Vertiefungsgebiete

  • Monte Carlo Tree Search & co.
    • dynamisches Komi
  • Parallelisierung (Thread / Cluster)
  • Tsume Go
  • direction of play
  • statische Evaluationsfunktionen
  • Kombination von verschiedenen Ansätzen (MCTS, direction of play, statische Evaluation...)
  • Parameter Tuning
  • Evaluieren des Players (menschliche / computer- Gegner)

Aufbau (Ideen)

  • zuerst einführender Vortrag von Manju
  • jede der Gruppen hält einen vertiefenden Vortrag über ein Thema (schon zu Beginn des Semester ---> Ausarbeitung vorher)
  • Danach wird das Basisprinzip implementiert (MCTS), dies muss von allen umfassend verstanden werden (auch wenn nciht alle implementierne können)
  • Aufteilung in Gruppen und arbeiten an einzelnen themen (--> todos)

Literatur

(Auszug aus den Veröffentlichungen der letzten Jahre)

Monte Carlo Tree Search (1.Vortrag)

Patterns und statische Evaluationsfunktionen (2.Vortrag)

Parallelisierung (3.Vortrag)

Other

Basicplayer

Links

online spielen

Community

andere Player

something else

Meine Werkzeuge
Ansichten