第42回ゲーム情報学研究会で発表してきました

アナリシス & データエンジニアリンググループの辻本です。
7月19, 20日に北海道大学で開催された第42回ゲーム情報学研究会で、ゲームテストプレイAIの強化学習効率化についての取り組みを発表してきました。

発表について

今回は「ターン制コマンドバトルにおける強化学習効率化」という題で発表しました。
ゲームのテストプレイ用のAIを強化学習で学習させようとすると、学習に膨大な時間が必要になります。そのため、イベントの開発期間が短いスマートフォンゲームでは、強化学習によるテストプレイAIを実用化できないという問題があります。そこで、事前に特徴を学習できる要素は事前に学習を済ませ、さらにゲームの特徴に合わせてDQNを変更することで強化学習を効率化するという内容です。

ターン制コマンドバトルにおける強化学習効率化 | PPT

ターン制コマンドバトルにおける強化学習効率化 - Download as a PDF or view online for free

発表後は、ゲームのデバッグに関する新たな評価の観点や手法に関して改善できそうな点のコメントをいただけました。ありがとうございました。

感想

戦略の評価、ゲームの解決、必勝判定の理論、ゲーム初心者への教授法などゲームに関する幅広い分野の発表がありました。理論などに詳しくないため、理解しきれないものもありましたが興味深いものが多かったです。

特に興味深かったのは将棋AIに関する発表で、相手の指し手を予想して先読みをすることで、相手の考慮中に相手とほぼ同等の深さの探索を可能にするという話でした。相手の指し手を数個予想するだけで、意外と当たることに驚きました。

今回の発表を聞いてくださった方から、「普段聞くことが少ない、企業の取り組みや課題を知ることができて興味深かった」という感想をいただけたので、参加した意味があったのかなと思っています。
また、発表できそうなら参加したいと思います。