ComputerGo

Aus GoVB

(Unterschied zwischen Versionen)
Wechseln zu: Navigation, Suche
(Basicplayer)
(Literatur)
Zeile 63: Zeile 63:
 
=== Monte Carlo Tree Search ===
 
=== Monte Carlo Tree Search ===
 
* [http://www.lri.fr/~gelly/paper/SylvainGellyThesis.pdf PHD: A CONTRIBUTION TO REINFORCEMENT LEARNING; APPLICATION TO COMPUTER-GO (SYLVAIN GELLY)] '''MUST-READ''' Kapitel 4
 
* [http://www.lri.fr/~gelly/paper/SylvainGellyThesis.pdf PHD: A CONTRIBUTION TO REINFORCEMENT LEARNING; APPLICATION TO COMPUTER-GO (SYLVAIN GELLY)] '''MUST-READ''' Kapitel 4
* [http://www.lri.fr/~teytaud/eg.pdf Combining expert, offline, transient and online knowledge in Monte-Carlo exploration (Chaslot et.al)]
 
 
* [http://www.personeel.unimaas.nl/G-chaslot/papers/newMath.pdf PROGRESSIVE STRATEGIES FOR MONTE-CARLO TREE SEARCH (Chaslot et.al)]
 
* [http://www.personeel.unimaas.nl/G-chaslot/papers/newMath.pdf PROGRESSIVE STRATEGIES FOR MONTE-CARLO TREE SEARCH (Chaslot et.al)]
 
* [http://www.personeel.unimaas.nl/G-chaslot/papers/crossmcICGA.pdf CROSS-ENTROPY FOR MONTE-CARLO TREE SEARCH (Chaslot et.al)]
 
* [http://www.personeel.unimaas.nl/G-chaslot/papers/crossmcICGA.pdf CROSS-ENTROPY FOR MONTE-CARLO TREE SEARCH (Chaslot et.al)]
Zeile 71: Zeile 70:
 
* [http://www.inference.phy.cam.ac.uk/ph347/CPGS-Report_Hennig.pdf Monte Carlo Temperature Discovery Search for Combinatorial Games (Philipp Hennig)]
 
* [http://www.inference.phy.cam.ac.uk/ph347/CPGS-Report_Hennig.pdf Monte Carlo Temperature Discovery Search for Combinatorial Games (Philipp Hennig)]
 
* [http://remi.coulom.free.fr/CG2006/CG2006.pdf Efficient Selectivity and Backup Operators in Monte-Carlo Tree Search (Rémi Coulom, Crazy Stones)]
 
* [http://remi.coulom.free.fr/CG2006/CG2006.pdf Efficient Selectivity and Backup Operators in Monte-Carlo Tree Search (Rémi Coulom, Crazy Stones)]
 +
 +
==== Patterns und statische Evaluationsfunktionen ====
 
* [http://remi.coulom.free.fr/Amsterdam2007/MMGoPatterns.pdf Computing Elo Ratings of Move Patterns in the Game of Go (Rémi Coulom, Crazy Stones)]
 
* [http://remi.coulom.free.fr/Amsterdam2007/MMGoPatterns.pdf Computing Elo Ratings of Move Patterns in the Game of Go (Rémi Coulom, Crazy Stones)]
* [http://pasky.or.cz/~pasky/go/compgo-r2.pdf Current Approaches in Computer Go (Slides) (Petr Baudis)]
+
* [http://www.lri.fr/~teytaud/eg.pdf Combining expert, offline, transient and online knowledge in Monte-Carlo exploration (Chaslot et.al)]
 +
* [http://lie.math.brocku.ca/twolf/papers/IEEE10.pdf A Dynamical Systems Approach for Static Evaluation in Go (Thomas Wolf)]
  
 
==== Parallelisierung ====
 
==== Parallelisierung ====
Zeile 86: Zeile 88:
 
* [http://webdocs.cs.ualberta.ca/~mmueller/ps/yoshizoe.pdf Lambda Depth-first Proof Number Search and its Application to Go (Yoshizoe, Kishimoto, M. Müller)]
 
* [http://webdocs.cs.ualberta.ca/~mmueller/ps/yoshizoe.pdf Lambda Depth-first Proof Number Search and its Application to Go (Yoshizoe, Kishimoto, M. Müller)]
 
* [http://www.science.uva.nl/research/ias/alumni/m.sc.theses/theses/EmilNijhuis.pdf MSc Thesis: Learning Patterns in the Game of Go (Emil H.J. Nijhuis)]
 
* [http://www.science.uva.nl/research/ias/alumni/m.sc.theses/theses/EmilNijhuis.pdf MSc Thesis: Learning Patterns in the Game of Go (Emil H.J. Nijhuis)]
 +
* [http://pasky.or.cz/~pasky/go/compgo-r2.pdf Current Approaches in Computer Go (Slides) (Petr Baudis)]
  
 
== Basicplayer ==
 
== Basicplayer ==

Version vom 29. April 2010, 10:22 Uhr

Inhaltsverzeichnis

Computer-Go am HPI

Ideensammlung zum Computer-Go-Seminar des HPI

ToDos

  • Ferstlegung Termin und Teilnehmer (http://doodle.com/rxhszz8r8k3tmbg2)
  • Ausarbeitung der Gruppenaufteilung (zusammenarbeitende Gruppen ~ jeweils 2-3 Mitglieder)
    • Gruppen aufteilen in Optimierung verschiedener Parameter (beispielsweise dynamisches Komi), Parallelisierung, zusätzliche Lösungsstrategien zu MCTS o.ä. (dafür nötig eine Grundimplementierung, also mit mCTS und Verständnis aller Teilnehmer wie MCTS arbeitet)
  • Festlegen des OS für die Hardware
  •  !!!!!!!!!!!!!!!!! Basic-Player evaluieren + nochmal nachfragen ob es noch weitere gibt !!!!!!!!!!!!!!!!!!!!!!!!!!!!
  • SVN Gastaccounts für teilnehmende Ifis anlegen
  • Eventuelle Kooperation mit BS-Lehrstuhl (Parallelisierung) ---> Dr. Martin von Löwis
  • Vortragsthemen für 3 Gruppen (a ~ 2 Personen) ausarbeiten, hierfür Auswahl der wichtigsten Themen und wichtigsten Paper (diese sollen am Anfang gehalten werden)

Eckpunkte

Bot-Name

  • (Pingoin)
  • Golem!
  • God/Got/Gott (muss man sich nur nocha usdenken wofür das angeblich stehen sollen)

Teilnehmer

  • Mailinglist: http://lists.hpi.uni-potsdam.de/listinfo/go2010
  • 6 - 10 Teilnehmer
  • Interessenten:
    • Marius Schneider
    • Tobias Pfeiffer
    • Martin Büttner
    • Martin Köppelmann
    • Lars Wassermann
    • Maximilian Schneider?
    • Henning Klein
    • Andre Kunze
    • Thomas Bünger
    • Simon Völcker
    • Lena Herrscheid
    • Jossekin Beilharz

mögliche Vertiefungsgebiete

  • Monte Carlo Tree Search & co.
    • dynamisches Komi
  • Parallelisierung (Thread / Cluster)
  • Tsume Go
  • direction of play
  • statische Evaluationsfunktionen
  • Kombination von verschiedenen Ansätzen (MCTS, direction of play, statische Evaluation...)
  • Parameter Tuning
  • Evaluieren des Players (menschliche / computer- Gegner)

Aufbau (Ideen)

  • zuerst einführender Vortrag von Manju
  • jede der Gruppen hält einen vertiefenden Vortrag über ein Thema (schon zu Beginn des Semester ---> Ausarbeitung vorher)
  • Danach wird das Basisprinzip implementiert (MCTS), dies muss von allen umfassend verstanden werden (auch wenn nciht alle implementierne können)
  • Aufteilung in Gruppen und arbeiten an einzelnen themen (--> todos)

Literatur

(Auszug aus den Veröffentlichungen der letzten Jahre)

Monte Carlo Tree Search

Patterns und statische Evaluationsfunktionen

Parallelisierung

Other

Basicplayer

Links

online spielen

Community

andere Player

something else

Meine Werkzeuge
Ansichten