ikeda lab

楽しませる囲碁プログラム-接待碁AI

背景と目的

 囲碁で上達するためには,自分より強い相手に教えてもらうことが効果的です. しかし単に強いだけの人は,しばしば,たっぷりハンデを与えたうえで手加減なしに初級者を打ちのめし, 場合によっては「なんでそんな手を打つんだ」などと怒りだします(上図). これでは囲碁を続けようと思えず,やめてしまうこともあるでしょう. 中には教え方の上手な人もいますが,比較的少数であり,それが囲碁普及の課題の一つであると考えます.
 そこで本研究では,コンピュータにその教え役をさせて,「勝つこと」ではなく, 「プレイヤを楽しませる」ことを目的とするプログラム(接待碁AI), さらには「プレイヤに教える」ことを目的とするプログラム(指導碁AI)を目指します.

アプローチと結果概要

 まずは,接待碁のために必要となる要素にどんなものがあるのかを調べ,まとめる作業を行いました.
 下図左側は「好み推測」「形勢制御」「自然な着手」「多様な戦略」「着手タイミング」「発話」の6つの要素を考慮するプログラムのイメージです. 実際には,各要素の中にもいろいろな項目があり,全てをいきなり解決することはできません.要素のうちいくつかには成果が出ています.
 まず,機械学習を用いて着手の見た目の(形の)自然さを評価するシステム,着手の良さを評価するシステムを 組み合わせて,「悪くは見えないが最善ではない,うまく形勢をシーソーゲームに導く」ような着手決定法を作成しました. これにより,単純な手加減手法に比べて「あからさまに悪く見える手」を6割ほど削減することができました.
 さらに,「実利派・勢力派」「悲観派・楽観派」などの“棋風”を演出する手法を開発し, 被験者実験を通じて効果を確認しました.


指導碁に向けて

 さらに現在は,上図右側の3つの要素,弱点分析・悪手指摘・例題作成を加えることで,指導碁に向けた研究を行っています. 指導碁では,接待碁と似たようなことに気を付けながら碁を打ったあと,人間プレイヤの悪かった手を指摘する必要があります. 「どの手が悪かったか」「なぜ悪かったのか」「どうなってしまったのか」「どうすればよかったのか」を 下図のように順次説明していくことで,理解を助けるわけです. 悪手の判別や理由付けについては,機械学習の枠組みを用いることができ,すでに良好な結果が確認されています.



研究担当者,業績,リンク等

・本研究はこれまで宍戸崇音,山中翠,Simon Viennotが主に担当しました.
・現在は概ね池田心が担当しています.
・本研究はジャーナル,国際会議論文,研究会論文が採録されています.
 - 池田心:
  楽しませる囲碁・将棋プログラミング
  オペレーションズ・リサーチ学会,Vol.58, no.3, pp. 167-173, 2013-03
 - Kokolo Ikeda, Simon Viennot:
  Production of Various Strategies and Position Control for Monte-Carlo Go,
  IEEE-CIG, pp. 145-152, 2013-08
 - 池田心,Simon Viennot:
  モンテカルロ碁における多様な戦略の演出と形勢の制御 ~接待碁AIに向けて,
  第17回ゲームプログラミングワークショップ,pp. 47-54, (2012-11)
 - 宍戸崇音,池田心,Simon Viennot:
  機械学習を用いた囲碁の着手の日本語表現
  第33回ゲーム情報学研究会,pp. 1-7,(2015-03)
 - 山中 翠,ビエノ シモン,池田 心:
   コンピュータ指導碁のための悪手解説
  第35回ゲーム情報学研究会, (2016-03)
 - 池田心,Simon Viennot, 佐藤直之:
  Detection and Labeling of Bad Moves for Coaching Go, IEEE-CIG, pp.395-401, 2016-09
・本研究では囲碁プログラムNomitanを用いています.Nomitanのページは【こちら】です.