<?xml version="1.0" encoding="utf-8" standalone="yes"?>
<oembed>
  <author_name>keimina</author_name>
  <author_url>https://blog.hatena.ne.jp/keimina/</author_url>
  <blog_title>Kei Minagawa's Blog</blog_title>
  <blog_url>https://keimina.hatenablog.jp/</blog_url>
  <categories>
    <anon>gym</anon>
    <anon>python</anon>
    <anon>強化学習</anon>
    <anon>Pendulum</anon>
    <anon>ベルマン方程式</anon>
  </categories>
  <description>gymモジュール Pendulum-v0 で、振り子を頂上で止まらせる 目次 1. 前回の記事 1.1. gymモジュール Pendulum-v0 で振り子を等速度で回転させる 1.2. gymモジュール Pendulum-v0 で振り子を揺らす 1.3. gymモジュール Pendulum-v0 で振り子をトルクを与えて静止させる 2. 勉強会で発表したスライド 3. 今回行うこと 4. 解決方法 4.1. 報酬の定義 4.2. 状態遷移確率、方策の表の作成 4.2.1. 表の作成 4.2.2. 状態遷移確率の実際の値を求める 4.2.3. 方策の初期化 4.3. 学習 4.3.1. 理論 …</description>
  <height>190</height>
  <html>&lt;iframe src=&quot;https://hatenablog-parts.com/embed?url=https%3A%2F%2Fkeimina.hatenablog.jp%2Fentry%2F2020%2F06%2F30%2F225138&quot; title=&quot;gymモジュール Pendulum-v0 で、振り子を頂上で止まらせる - Kei Minagawa&amp;#39;s Blog&quot; class=&quot;embed-card embed-blogcard&quot; scrolling=&quot;no&quot; frameborder=&quot;0&quot; style=&quot;display: block; width: 100%; height: 190px; max-width: 500px; margin: 10px 0px;&quot;&gt;&lt;/iframe&gt;</html>
  <image_url>https://raw.githubusercontent.com/keimina/gif/master/gym%E3%83%A2%E3%82%B8%E3%83%A5%E3%83%BC%E3%83%AB_Pendulum-v0_%E6%96%B9%E7%AD%96%E5%8F%8D%E5%BE%A9%E6%B3%95_get_real_P_2.gif</image_url>
  <provider_name>Hatena Blog</provider_name>
  <provider_url>https://hatena.blog</provider_url>
  <published>2020-06-30 22:51:38</published>
  <title>gymモジュール Pendulum-v0 で、振り子を頂上で止まらせる</title>
  <type>rich</type>
  <url>https://keimina.hatenablog.jp/entry/2020/06/30/225138</url>
  <version>1.0</version>
  <width>100%</width>
</oembed>
