週末に3DSもポケモンもなかったのでChainerでDQNを育てた話。

ensekitt https://blog.hatena.ne.jp/ensekitt/ EnsekiTT Blog https://ensekitt.hatenablog.com/ つまりなにしたのブロック崩しなどで一世を風靡したDeep Q NetworkをChainerで実装して、OpenAIの環境で育てた。 youtu.be 基本的な強化学習の流れゲームそのものをEnvironment ゲームで言うプレイヤーをAgent プレイヤーの操作をAction プレイヤーはプレイの結果をゲーム画面を観察、つまりObservationして確認する（日本語に組み込むと変な感じゲーム画面には、ゲームの状態（残りのブロックの画像とか）、Stateが表示される。ゲーム画面には、ゲームのスコア(上がると嬉しいもの)、Rewardも表示される。プレイヤーは操作とゲーム画面の組み合… 190 <iframe src="https://hatenablog-parts.com/embed?url=https%3A%2F%2Fensekitt.hatenablog.com%2Fentry%2F2016%2F11%2F28%2F035827" title="週末に3DSもポケモンもなかったのでChainerでDQNを育てた話。 - EnsekiTT Blog" class="embed-card embed-blogcard" scrolling="no" frameborder="0" style="display: block; width: 100%; height: 190px; max-width: 500px; margin: 10px 0px;"></iframe> https://cdn-ak.f.st-hatena.com/images/fotolife/e/ensekitt/20161128/20161128040019.png Hatena Blog https://hatena.blog 2016-11-28 03:58:27 週末に3DSもポケモンもなかったのでChainerでDQNを育てた話。 rich https://ensekitt.hatenablog.com/entry/2016/11/28/035827 1.0 100%