SL policy networkの囲碁プログラムへの適用

TadaoYamaoka https://blog.hatena.ne.jp/TadaoYamaoka/ TadaoYamaokaの開発日記 https://tadaoyamaoka.hatenablog.com/ AlphaGo 囲碁プログラム以前に学習したSL policy networkを囲碁プログラムに適用してみた。特徴を4つに絞って、学習を160万局面で行ったものなので、棋譜との一致度は30%くらいの状態だが、そこそこ効果はあるのではないかと思って試してみた。学習している棋譜は19路盤なので、19路盤でGnuGoと対戦させて確認した。rollout policyのみを適用したプログラムでは9路盤だとGunGoに3割程度勝つことができるが、19路盤では1回も勝てていない。SL policy networkを使えば、1回くらい勝てるようになるかと思って、対戦させてみたが、10回対戦して1勝もあげられなかった。rolloutのみ… 190 <iframe src="https://hatenablog-parts.com/embed?url=https%3A%2F%2Ftadaoyamaoka.hatenablog.com%2Fentry%2F2016%2F08%2F16%2F162023" title="SL policy networkの囲碁プログラムへの適用 - TadaoYamaokaの開発日記" class="embed-card embed-blogcard" scrolling="no" frameborder="0" style="display: block; width: 100%; height: 190px; max-width: 500px; margin: 10px 0px;"></iframe> Hatena Blog https://hatena.blog 2016-08-16 16:20:23 SL policy networkの囲碁プログラムへの適用 rich https://tadaoyamaoka.hatenablog.com/entry/2016/08/16/162023 1.0 100%