探索を行う協調学習法MAVENの調査と実験

yoshishinnze https://blog.hatena.ne.jp/yoshishinnze/ 暇さえあればアルゴリズムいじり https://yoshishinnze.hatenablog.com/ AI 目次先日の協調学習の問題がうまく解けませんでした。 QMIXでも難しかった原因の仮説ですが、探索があまりされなかったマルチエージェントはお互いの行動の積み重ねで寄り良い行動を探索する必要があるが、お互いの情報の梟雄不足の2点が主要因と考えました。この主要因に強い手法としてMAVEN（Multi-Agent Variational Exploration）というMARL手法が有効と考えました。今回はMAVENについて説明、実装法について説明します。概要 MAVENは、MARLにおける探索を強化するための手法です。2019年に提案され、QMIXなどの価値分解型アルゴリズムと組み合わせ… 190 <iframe src="https://hatenablog-parts.com/embed?url=https%3A%2F%2Fyoshishinnze.hatenablog.com%2Fentry%2F2026%2F04%2F05%2F110516" title="探索を行う協調学習法MAVENの調査と実験 - 暇さえあればアルゴリズムいじり" class="embed-card embed-blogcard" scrolling="no" frameborder="0" style="display: block; width: 100%; height: 190px; max-width: 500px; margin: 10px 0px;"></iframe> https://cdn-ak.f.st-hatena.com/images/fotolife/y/yoshishinnze/20260405/20260405110106.png Hatena Blog https://hatena.blog 2026-04-05 11:05:16 探索を行う協調学習法MAVENの調査と実験 rich https://yoshishinnze.hatenablog.com/entry/2026/04/05/110516 1.0 100%