【下準備】強化学習とはなんだろう

fanta_orange_grape https://blog.hatena.ne.jp/fanta_orange_grape/ AIうぉ－－！(ai-wo-katsuyo-shitai !) https://ai-de-seikei.hatenablog.com/ この記事の内容強化学習についてまとめたい。そのための下準備の記事ポイントとして、物体検出や、自然言語処理や、GANなどとの関係（どこが共通する部分か）など。まだ、めちゃくちゃれべる、です。強化学習とは頭に浮かぶ、例は棒を倒立させる制御テニスゲームみたいなやつ知っていることは何かエージェントがいてアクションに対して、報酬が得られ有名なフレームワークがあるでは、強化学習はどうなっているかと想像すると状態をインプットとして、行動をアウトプットとして出す。上記のアウトプットを出すために、状態に対して、その時にすべき行動をアウトプットできるようにして、その行動によって次の… 190 <iframe src="https://hatenablog-parts.com/embed?url=https%3A%2F%2Fai-de-seikei.hatenablog.com%2Fentry%2F2021%2F12%2F11%2F171242" title="【下準備】強化学習とはなんだろう - AIうぉ－－！(ai-wo-katsuyo-shitai !)" class="embed-card embed-blogcard" scrolling="no" frameborder="0" style="display: block; width: 100%; height: 190px; max-width: 500px; margin: 10px 0px;"></iframe> https://cdn-ak.f.st-hatena.com/images/fotolife/f/fanta_orange_grape/20211211/20211211170921.png Hatena Blog https://hatena.blog 2021-12-11 17:12:42 【下準備】強化学習とはなんだろう rich https://ai-de-seikei.hatenablog.com/entry/2021/12/11/171242 1.0 100%