Aktuelle Version vom 17. Juni 2010, 10:12 Uhr

Inhaltsverzeichnis

1 Computer-Go am HPI

[Bearbeiten] Computer-Go am HPI

Ideensammlung zum Computer-Go-Seminar des HPI

[Bearbeiten] ToDos

Eventuelle Kooperation mit BS-Lehrstuhl (Parallelisierung) ---> Dr. Martin von Löwis
komplett kompilieren
Baum (da real MCTS)
weiterrechnen während der Gegner dran ist
Performance Monitoring
Gabage Collection beim gegnerischen Zug
eigener MCTS-Thread
Exception 2D-3D

[Bearbeiten] Ideenecke

(hier kann man kurze Ideen die man zum Seminar hat erstmal für alle lesbar zwischenspeichern)

Auf den Systemen dann mindestens GnuGo installieren und die Schnittstelle implementieren um unseren Bot gegen GnuGo spielen zu lassen (GnuGo benutzt wohl kein MCTS sondern Alpha/Beta Suche und wird darum wohl gerne zum evaluieren von MCTS Bots genommen, da GnuGo ja unter Umständen auch bedeutend schneller spielt als menschliche Spieler)
Nur ein Gedanke: JAPARA für Zufallszahlen... research needed
Laut der Mailinglist ( siehe [1] ) bringen transposition tables bei Go wenig bis gar nix. (eher noch mehr Probleme)
So nicht! Fuego mit 100.000 Simulationen/Zug (7-8k) gegen Martin (6k)

[Bearbeiten] Eckpunkte

[Bearbeiten] Bot-Name

Pingoin
Golem!
God/Got/Gott (muss man sich nur noch ausdenken wofür das angeblich stehen sollen)
PoGo (Potsdam Go :P)
Stoned

[Bearbeiten] Teilnehmer

Mailinglist: http://lists.hpi.uni-potsdam.de/listinfo/go2010
6 - 10 Teilnehmer
- Marius Schneider
- Tobias Pfeiffer
- Martin Büttner
- Martin Köppelmann
- Lars Wassermann
- Henning Klein
- Markus Behrens

[Bearbeiten] mögliche Vertiefungsgebiete

Monte Carlo Tree Search & co.
- dynamisches Komi
- UCT/RAVE und Freunde
Parallelisierung (Thread / Cluster)
Tsume Go
direction of play
statische Evaluationsfunktionen
Kombination von verschiedenen Ansätzen (MCTS, direction of play, statische Evaluation...)
Parameter Tuning
Evaluieren des Players (menschliche / computer- Gegner)

[Bearbeiten] Aufbau (Ideen)

zuerst einführender Vortrag von Manju
jede der Gruppen hält einen vertiefenden Vortrag über ein Thema (schon zu Beginn des Semester ---> Ausarbeitung vorher)
Danach wird das Basisprinzip implementiert (MCTS), dies muss von allen umfassend verstanden werden (auch wenn nciht alle implementierne können)
Aufteilung in Gruppen und arbeiten an einzelnen themen
Bot spielt dann auf KGS etc...

[Bearbeiten] Literatur

(Auszug aus den Veröffentlichungen der letzten Jahre)

[Bearbeiten] Monte Carlo Tree Search (1.Vortrag)

[Bearbeiten] Patterns und statische Evaluationsfunktionen (2.Vortrag)

[Bearbeiten] Parallelisierung (3.Vortrag)

[Bearbeiten] Other

PHD: AI techniques for the game of Go (2004) (Erik van der Werf)
Modelling Uncertainty in the Game of Go (David H. Stern et.al)
Learning Position Evaluation for Go with Internal Symmetry Networks (Neuronale Netze) (Alan Blair)
Coevolving Partial Strategies for the Game of Go (Genetic algorithm) (lokale Kopie)
Lambda Depth-first Proof Number Search and its Application to Go (Yoshizoe, Kishimoto, M. Müller)
MSc Thesis: Learning Patterns in the Game of Go (Emil H.J. Nijhuis)
Current Approaches in Computer Go (Slides) (Petr Baudis)

@@ Zeile 4: / Zeile 4: @@
 == ToDos ==
-* Ausarbeitung der Gruppenaufteilung (zusammenarbeitende Gruppen ~ jeweils 2-3 Mitglieder)
-** Gruppen aufteilen in Optimierung verschiedener Parameter, Parallelisierung, zusätzliche Lösungsstrategien zu MCTS o.ä. (dafür nötig eine Grundimplementierung, also mit mCTS und Verständnis aller Teilnehmer wie MCTS arbeitet)
-* Beschaffung von Hardware ---> warum wollten wir nochmal 3 Systeme? Warum nicht nur ens? Warum reichen mitgebrachte Leptops nicht? Vergleichbarkeit?
-* !!!!!!!!!!!!!!!!! Basic-Player evaluieren + nochmal nachfragen ob es noch weitere gibt !!!!!!!!!!!!!!!!!!!!!!!!!!!!
-* SVN Gastaccounts für teilnehmende Ifis anlegen
-* Mailingliste bei HPI admins beantragen (Go2010 passt)
 * Eventuelle Kooperation mit BS-Lehrstuhl (Parallelisierung) ---> Dr. Martin von Löwis
-* Vortragsthemen für 3 Gruppen (a ~ 2 Personen) ausarbeiten, hierfür Auswahl der wichtigsten Themen udn wichtigsten Paper (diese sollen am Anfang gehalten werden)
+* komplett kompilieren
+* Baum (da real MCTS)
+* weiterrechnen während der Gegner dran ist
+* Performance Monitoring
+* Gabage Collection beim gegnerischen Zug
+* eigener MCTS-Thread
+* Exception 2D-3D
+== Ideenecke ==
+(hier kann man kurze Ideen die man zum Seminar hat erstmal für alle lesbar zwischenspeichern)
+* Auf den Systemen dann mindestens GnuGo installieren und die Schnittstelle implementieren um unseren Bot gegen GnuGo spielen zu lassen (GnuGo benutzt wohl kein MCTS sondern Alpha/Beta Suche und wird darum wohl gerne zum evaluieren von MCTS Bots genommen, da GnuGo ja unter Umständen auch bedeutend schneller spielt als menschliche Spieler)
+* Nur ein Gedanke: JAPARA für Zufallszahlen... research needed
+* Laut der Mailinglist ( siehe [http://computer-go.org/pipermail/computer-go/2010-May/000289.html] ) bringen transposition tables bei Go wenig bis gar nix. (eher noch mehr Probleme)
+* So nicht! [http://eyetvision.de/fuego-fail.sgf Fuego mit 100.000 Simulationen/Zug (7-8k) gegen Martin (6k)]
 == Eckpunkte ==
@@ Zeile 18: / Zeile 24: @@
 === Bot-Name ===
-* (Pingoin)
+* '''Pingoin'''
 * Golem!
+* God/Got/Gott (muss man sich nur noch ausdenken wofür das angeblich stehen sollen)
+* PoGo (Potsdam Go :P)
+* Stoned
 === Teilnehmer ===
+* Mailinglist: http://lists.hpi.uni-potsdam.de/listinfo/go2010
 * 6 - 10 Teilnehmer
-* Interessenten:
+** '''Marius Schneider'''
-** Marius Schneider
+** '''Tobias Pfeiffer'''
-** Tobias Pfeiffer
+** '''Martin Büttner'''
-** Martin Büttner
+** '''Martin Köppelmann'''
-** Martin Köppelmann
+** '''Lars Wassermann'''
-** Lars Wassermann
+** '''Henning Klein'''
-** Maximilian Schneider?
+** '''Markus Behrens'''
-** Maximilian Möller?
-** Henning Klein
 === mögliche Vertiefungsgebiete ===
@@ Zeile 38: / Zeile 46: @@
 * Monte Carlo Tree Search & co.
 ** dynamisches Komi
+** UCT/RAVE und Freunde
 * Parallelisierung (Thread / Cluster)
 * Tsume Go
@@ Zeile 45: / Zeile 54: @@
 * Parameter Tuning
 * Evaluieren des Players (menschliche / computer- Gegner)
+=== Aufbau (Ideen) ===
+* zuerst einführender Vortrag von Manju
+* jede der Gruppen hält einen vertiefenden Vortrag über ein Thema (schon zu Beginn des Semester ---> Ausarbeitung vorher)
+* Danach wird das Basisprinzip implementiert (MCTS), dies muss von allen umfassend verstanden werden (auch wenn nciht alle implementierne können)
+* Aufteilung in Gruppen und arbeiten an einzelnen themen
+* Bot spielt dann auf KGS etc...
 == Literatur ==
 (Auszug aus den Veröffentlichungen der letzten Jahre)
-=== Monte Carlo Tree Search ===
+==== Monte Carlo Tree Search (1.Vortrag) ====
-* [http://www.lri.fr/~gelly/paper/SylvainGellyThesis.pdf PHD: A CONTRIBUTION TO REINFORCEMENT LEARNING; APPLICATION TO COMPUTER-GO (SYLVAIN GELLY)]
+* [http://www.lri.fr/~gelly/paper/SylvainGellyThesis.pdf PHD: A CONTRIBUTION TO REINFORCEMENT LEARNING; APPLICATION TO COMPUTER-GO (SYLVAIN GELLY)] '''MUST-READ''' Kapitel 4
-* [http://www.lri.fr/~teytaud/eg.pdf Combining expert, offline, transient and online knowledge in Monte-Carlo exploration (Chaslot et.al)]
 * [http://www.personeel.unimaas.nl/G-chaslot/papers/newMath.pdf PROGRESSIVE STRATEGIES FOR MONTE-CARLO TREE SEARCH (Chaslot et.al)]
 * [http://www.personeel.unimaas.nl/G-chaslot/papers/crossmcICGA.pdf CROSS-ENTROPY FOR MONTE-CARLO TREE SEARCH (Chaslot et.al)]
@@ Zeile 59: / Zeile 75: @@
 * [http://www.inference.phy.cam.ac.uk/ph347/CPGS-Report_Hennig.pdf Monte Carlo Temperature Discovery Search for Combinatorial Games (Philipp Hennig)]
 * [http://remi.coulom.free.fr/CG2006/CG2006.pdf Efficient Selectivity and Backup Operators in Monte-Carlo Tree Search (Rémi Coulom, Crazy Stones)]
+* [http://users.soe.ucsc.edu/~dph/mypubs/AMAFpaperWithRef.pdf All moves as first variations(David P. Helmbold and Aleatha Parker-Wood)]
+==== Patterns und statische Evaluationsfunktionen (2.Vortrag) ====
 * [http://remi.coulom.free.fr/Amsterdam2007/MMGoPatterns.pdf Computing Elo Ratings of Move Patterns in the Game of Go (Rémi Coulom, Crazy Stones)]
-* [http://pasky.or.cz/~pasky/go/compgo-r2.pdf Current Approaches in Computer Go (Slides) (Petr Baudis)]
+* [http://www.lri.fr/~teytaud/eg.pdf Combining expert, offline, transient and online knowledge in Monte-Carlo exploration (Chaslot et.al)]
+* [http://lie.math.brocku.ca/twolf/papers/IEEE10.pdf A Dynamical Systems Approach for Static Evaluation in Go (Thomas Wolf)]
+* [https://webdisk.lclark.edu/drake/publications/GAMEON-07-drake.pdf MOVE ORDERING VS HEAVY PLAYOUTS (Peter Drake et.al)]
+* [http://www.science.uva.nl/research/ias/alumni/m.sc.theses/theses/EmilNijhuis.pdf Learning Patterns in the Game of Go (MSc Thesis Emil H.J. Nijhuis)]
-==== Parallelisierung ====
+==== Parallelisierung (3.Vortrag) ====
 * [http://www.personeel.unimaas.nl/m-winands/documents/multithreadedMCTS2.pdf Parallel Monte-Carlo Tree Search (Chaslot et.al)]
 * [http://www.geocities.jp/hideki_katoh/publications/gpw08-private.pdf Parallel Monte-Carlo Tree Search with Simulation Servers (KATO, TAKEUCHI)]
 * [http://hal.archives-ouvertes.fr/docs/00/28/78/67/PDF/icin08.pdf THE PARALLELIZATION OF MONTE-CARLO PLANNING (S. Gelly et.al)]
+* [http://webdocs.cs.ualberta.ca/~emarkus/publications/enzenberger-mueller-acg12.pdf A Lock-free Multithreaded Monte-Carlo Tree Search Algorithm (Martin Müller et.al)]
-=== Other ===
+==== Other ====
 * [http://www.unimaas.nl/games/files/phd/Van%20der%20Werf_thesis.pdf PHD: AI techniques for the game of Go (2004) (Erik van der Werf)]
 * [http://books.nips.cc/papers/files/nips17/NIPS2004_0747.pdf Modelling Uncertainty in the Game of Go (David H. Stern et.al)]
@@ Zeile 74: / Zeile 97: @@
 * [http://webdocs.cs.ualberta.ca/~mmueller/ps/yoshizoe.pdf Lambda Depth-first Proof Number Search and its Application to Go (Yoshizoe, Kishimoto, M. Müller)]
 * [http://www.science.uva.nl/research/ias/alumni/m.sc.theses/theses/EmilNijhuis.pdf MSc Thesis: Learning Patterns in the Game of Go (Emil H.J. Nijhuis)]
+* [http://pasky.or.cz/~pasky/go/compgo-r2.pdf Current Approaches in Computer Go (Slides) (Petr Baudis)]
 == Basicplayer ==
@@ Zeile 81: / Zeile 105: @@
 ** [https://plug-and-go.dev.java.net/ plug-and-go]
 ** [http://www.google.com/url?sa=D&q=http://cgos.boardspace.net/public/javabot.zip&usg=AFQjCNHAZJiQ-ak-3pwvZRokIF8ID2xhQQ Java-Bot by Don Dailey]
+** [http://gogui.sourceforge.net/doc/reference-dummy.html GoGui-Dummy]
+** [http://legacy.lclark.edu/~drake/Orego.html Orego]
 * C++
 ** [http://sourceforge.net/projects/fuego/ fuego]
@@ Zeile 98: / Zeile 124: @@
 * [http://www.mail-archive.com/computer-go@computer-go.org/info.html Go-Mailingliste]
 * [http://www.dgob.de/yabbse/index.php?board=27.0 DGoB-Forum Computer-Sektion]
+* [http://www.citeulike.org/group/5884/library computer go library]
 === andere Player ===

Aus GoVB

Aktuelle Version vom 17. Juni 2010, 10:12 Uhr

Inhaltsverzeichnis

[Bearbeiten] Computer-Go am HPI

[Bearbeiten] ToDos

[Bearbeiten] Ideenecke

[Bearbeiten] Eckpunkte

[Bearbeiten] Bot-Name

[Bearbeiten] Teilnehmer

[Bearbeiten] mögliche Vertiefungsgebiete

[Bearbeiten] Aufbau (Ideen)

[Bearbeiten] Literatur

[Bearbeiten] Monte Carlo Tree Search (1.Vortrag)

[Bearbeiten] Patterns und statische Evaluationsfunktionen (2.Vortrag)

[Bearbeiten] Parallelisierung (3.Vortrag)

[Bearbeiten] Other

[Bearbeiten] Basicplayer

[Bearbeiten] Links

[Bearbeiten] online spielen

[Bearbeiten] Community

[Bearbeiten] andere Player

[Bearbeiten] something else

Meine Werkzeuge

Ansichten