囲碁プログラムのプレイアウトにパターンを適用

TadaoYamaoka https://blog.hatena.ne.jp/TadaoYamaoka/ TadaoYamaokaの開発日記 https://tadaoyamaoka.hatenablog.com/ AlphaGo 囲碁モンテカルロ木探索前回作った囲碁プログラムのプレイアウトで、プロの棋譜から学習したパターンの確率に応じて手を選択するようにしてみた。はじめ局面全体の合法手について3×3パターンを適用してみたが、まったく強くならない上に、30倍くらい遅くなってしまった。そこで、直前の手の周辺の手に対してだけパターンを適用したところ、ランダムプレイアウトとの対戦では、ほぼ100%勝つようになった。AlphaGoでは、rolloutのpolicyに3×3パターンを静的に適用しているが、他にも直前の手の周辺の12ポイントのダイアモンドやアタリを防ぐ手なども加えている。 3×3パターンを静的に適用するだけでは効果がないのかもしれない… 190 <iframe src="https://hatenablog-parts.com/embed?url=https%3A%2F%2Ftadaoyamaoka.hatenablog.com%2Fentry%2F2016%2F04%2F19%2F224543" title="囲碁プログラムのプレイアウトにパターンを適用 - TadaoYamaokaの開発日記" class="embed-card embed-blogcard" scrolling="no" frameborder="0" style="display: block; width: 100%; height: 190px; max-width: 500px; margin: 10px 0px;"></iframe> Hatena Blog https://hatena.blog 2016-04-19 22:45:43 囲碁プログラムのプレイアウトにパターンを適用 rich https://tadaoyamaoka.hatenablog.com/entry/2016/04/19/224543 1.0 100%