MicroSoftのゲームのアイテム毎に強化学習する論文を読む

mabonki0725 https://blog.hatena.ne.jp/mabonki0725/ mabonki0725の日記 https://mabonki0725.hatenablog.com/ AI論文ロボテックステニス２時間英語：できず (1) ゲームのアイテム毎に強化学習する論文を読む「Hybrid Reward Architecher for Reinforcement Learning」https://arxiv.org/abs/1706.04208 (1.1) 論文の意図 DQNは画面からDNNで直接特徴量を読み取り、特徴量の変化と得点で強化学習を行うが、複雑な場面の場合には特徴量の変動が読み取り難く容易に学習が進まない。そこでゲームを特徴付けているアイテム毎に分解して強化学習すれば特徴量の変動が簡単に補足でき、効果的な学習ができるとの考えである。具体的にはパックマン・ゲームの場合、パッ… 190 <iframe src="https://hatenablog-parts.com/embed?url=https%3A%2F%2Fmabonki0725.hatenablog.com%2Fentry%2F2017%2F08%2F21%2F080730" title="MicroSoftのゲームのアイテム毎に強化学習する論文を読む - mabonki0725の日記" class="embed-card embed-blogcard" scrolling="no" frameborder="0" style="display: block; width: 100%; height: 190px; max-width: 500px; margin: 10px 0px;"></iframe> http://famicon.s348.xrea.com/entries/19841102_packman/pacman01.png Hatena Blog https://hatena.blog 2017-08-21 08:07:30 MicroSoftのゲームのアイテム毎に強化学習する論文を読む rich https://mabonki0725.hatenablog.com/entry/2017/08/21/080730 1.0 100%