PyTorchを使って連続値制御の深層強化学習を構築　〜Actor Critic〜

dskomei https://blog.hatena.ne.jp/dskomei/ 見習いデータサイエンティストの隠れ家 https://www.dskomei.com/ AI pytorch 深層強化学習人間と同じように考える機械を作るのは、人間の大きな夢であり、それができるかもしれないと言われているのが強化学習の枠組みです。強化学習は、ディープラーニングを取り入れることでめざましく進化してきました。今回は、そのディープラーニングを使って行う強化学習である深層強化学習を実践していきます。前回は、方策が離散的な場合の Actor Critic モデルを構築しました。そちらが気になる方は前回の記事を是非ご覧ください。 www.dskomei.com 今回は、方策が連続値である場合の深層強化学習のモデルを実装します。方策が連続値と離散値ではモデルの作り方が異なります。離散値の場合は、Actor モデ… 190 <iframe src="https://hatenablog-parts.com/embed?url=https%3A%2F%2Fwww.dskomei.com%2Fentry%2F2022%2F06%2F09%2F171712" title="PyTorchを使って連続値制御の深層強化学習を構築　〜Actor Critic〜 - 見習いデータサイエンティストの隠れ家" class="embed-card embed-blogcard" scrolling="no" frameborder="0" style="display: block; width: 100%; height: 190px; max-width: 500px; margin: 10px 0px;"></iframe> https://cdn-ak.f.st-hatena.com/images/fotolife/d/dskomei/20220609/20220609103344.gif Hatena Blog https://hatena.blog 2022-06-09 17:17:12 PyTorchを使って連続値制御の深層強化学習を構築　〜Actor Critic〜 rich https://www.dskomei.com/entry/2022/06/09/171712 1.0 100%