強化学習について学んでみた。（まとめ）

yamaimo0625 https://blog.hatena.ne.jp/yamaimo0625/ いものやま。 https://yamaimo.hatenablog.jp/ 技術 AI 強化学習まとめということで、長く続いてきたけど、これでオシマイ。これまでの各記事は、以下から。強化学習とは？イントロダクション強化学習のコンセプト基本的な用語の定義「知識利用」と「探査」のバランスの問題非連想的な問題、n本腕バンディット問題 n本腕バンディット問題（プログラム）行動価値の推定と改善 n本腕バンディット問題 - εグリーディ法（プログラム） n本腕バンディット問題 - ソフトマックス法（プログラム）強化学習問題の数学的記述状態遷移のモデル、価値ベクトル、Bellman方程式動的計画法方策評価方策改善レンタカー問題 - 方策反復（プログラム）レンタカー問題 - 価値… 190 <iframe src="https://hatenablog-parts.com/embed?url=https%3A%2F%2Fyamaimo.hatenablog.jp%2Fentry%2F2016%2F01%2F11%2F200000" title="強化学習について学んでみた。（まとめ） - いものやま。" class="embed-card embed-blogcard" scrolling="no" frameborder="0" style="display: block; width: 100%; height: 190px; max-width: 500px; margin: 10px 0px;"></iframe> https://images-fe.ssl-images-amazon.com/images/I/51PNPA99TZL._SL160_.jpg Hatena Blog https://hatena.blog 2016-01-11 20:00:00 強化学習について学んでみた。（まとめ） rich https://yamaimo.hatenablog.jp/entry/2016/01/11/200000 1.0 100%