将棋AI実験ノート：自己対局時のノードの再利用

TadaoYamaoka https://blog.hatena.ne.jp/TadaoYamaoka/ TadaoYamaokaの開発日記 https://tadaoyamaoka.hatenablog.com/ dlshogi コンピュータ将棋以前に、dlshogiの自己対局でノードの再利用を行うと、テスト損失が上昇する（過学習する）という問題が起きたことを書いた。方策の分布を学習するようにしたため、問題も起きにくくなっている可能性があるので、ノードの再利用（ルートノードはクリア）を行うオプションを追加した（--reuseオプション）。比較再利用ありとなしで1.5億局面生成して、精度を比較してみた。学習済みモデルに対して、方策の分布を学習するようにして追加学習を行った。 8回測定を行い平均をとった。テストデータに、floodgateのレート3500以上の対局の棋譜からサンプリングした856,923局面を使用した。再利用テ… 190 <iframe src="https://hatenablog-parts.com/embed?url=https%3A%2F%2Ftadaoyamaoka.hatenablog.com%2Fentry%2F2021%2F05%2F23%2F164338" title="将棋AI実験ノート：自己対局時のノードの再利用 - TadaoYamaokaの開発日記" class="embed-card embed-blogcard" scrolling="no" frameborder="0" style="display: block; width: 100%; height: 190px; max-width: 500px; margin: 10px 0px;"></iframe> Hatena Blog https://hatena.blog 2021-05-23 16:43:38 将棋AI実験ノート：自己対局時のノードの再利用 rich https://tadaoyamaoka.hatenablog.com/entry/2021/05/23/164338 1.0 100%