<?xml version="1.0" encoding="utf-8" standalone="yes"?>
<oembed>
  <author_name>jotun82</author_name>
  <author_url>https://blog.hatena.ne.jp/jotun82/</author_url>
  <blog_title>jotunの頭の中</blog_title>
  <blog_url>https://jotun82-brain.hatenadiary.org/</blog_url>
  <categories>
  </categories>
  <description>複数の選択肢のうちから一つを選んで実行する場合でも、「迷いながら」の時と「ふっきれた」時がある。「迷いながら」の時は選択しなかったものに対しても未練があるし、また選択した行動の結果はすぐさまもう一方の選択肢の結果と比較される。 「迷い」とか「保留」とは、２つ以上有望な選択肢がある場合に起きうる状態である。強化学習の枠組みでは、行動の価値が近いものがある場合と言えよう。 「迷い」や「保留」が起きる条件は何か？複数の選択肢の価値が拮抗していれば起きるのか？ 単純に拮抗しているだけでなく、ある程度両者の価値が大きいことが前提ではないかと思う。（典型的な強化学習のアルゴリズムでは、価値の差だけが問題に…</description>
  <height>190</height>
  <html>&lt;iframe src=&quot;https://hatenablog-parts.com/embed?url=https%3A%2F%2Fjotun82-brain.hatenadiary.org%2Fentry%2F20120702%2F1341257790&quot; title=&quot;保留とか迷いとか比較の実行とか - jotunの頭の中&quot; class=&quot;embed-card embed-blogcard&quot; scrolling=&quot;no&quot; frameborder=&quot;0&quot; style=&quot;display: block; width: 100%; height: 190px; max-width: 500px; margin: 10px 0px;&quot;&gt;&lt;/iframe&gt;</html>
  <image_url></image_url>
  <provider_name>Hatena Blog</provider_name>
  <provider_url>https://hatena.blog</provider_url>
  <published>2012-07-02 04:36:30</published>
  <title>保留とか迷いとか比較の実行とか</title>
  <type>rich</type>
  <url>https://jotun82-brain.hatenadiary.org/entry/20120702/1341257790</url>
  <version>1.0</version>
  <width>100%</width>
</oembed>
