RubyでシンプルなQ学習

投稿者: | 2016年8月13日

rl0rl2rl1qv

せっかくなので『機械学習と深層学習』を参考に簡単なQ学習を書いてみる。
hoge

プロットにはnumo/gnuplotを使用しました。

〜早熟なタイプ〜

rl0
早熟なタイプが一番多いけど、あまりグラフが凡例に被らないようにコイツにしました。

〜途中でぐんぐん成長するタイプ〜

rl2
見ていて気持ちがいいです。

〜彼の実力はまだ目覚めていないタイプ〜

rl1
俺達の戦いはこれからだ。

200000回ぐらい試行するとQ値もだいたいいい感じに収束するみたいですね。
qv

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です