もふもふ技術部

IT技術系mofmofメディア

強化学習(Reinforcement Learning)

強化学習(Q-Learning)で学習させたオセロAIで、MinMaxアルゴリズムと戦わせる

前回4x4のオセロで最強のAIを作ろうとしたらランダムさんごときにボッコボコされたところからの続きです。 強化学習(Q-Learning)でオセロAIを学習させてみた Q学習 vs ナイーブ Q学習 vs ランダム Q学習(バトルモード) vs 竜王ミニマックス おまけ: Q学習(バ…

強化学習(Q-Learning)でオセロAIを学習させてみた

年2回、毎度楽しみにしている「開発合宿友の会」の開発合宿に来ております。やはりコード書くのはこの上ない幸せですね。 というわけで、前回強化学習(Q-Learning)で四目並べを学習させてみたというのをやってうまくいかなかったので、別のゲームで実装し直…

強化学習(Q-Learning)で四目並べを学習させてみた

ちょっとだけ余暇を確保出来たのでずっと前からやりたかった強化学習をやります。強化学習を使って最強のスマブラ64AIを作って、練習相手になってもらいたいなーと思っているのですが、さすがにいきなりそれは難し過ぎるので、簡単なゲームのAIを作ってみま…

強化学習?でジャンケンの出す手に偏りがあるAさんに高確率で勝つ方法を探す

強化学習に入門したいのですが、入門にちょうどいい難易度の本とか記事とか見当たらなかったんで、簡単そうな問題を考えてそれに強化学習に当てはめて解いてみようと思いました。 あ、Python3.5.2でやってます。 ジャンケンの出す手に偏りがある人に、高確率…