楽しませる・教える囲碁プログラム　接待碁AI・指導碁AI：JAIST池田研

楽しませる囲碁プログラム-接待碁AI

背景と目的

　囲碁で上達するためには，自分より強い相手に教えてもらうことが効果的です．しかし単に強いだけの人は，しばしば，たっぷりハンデを与えたうえで手加減なしに初級者を打ちのめし，場合によっては「なんでそんな手を打つんだ」などと怒りだします（上図）．これでは囲碁を続けようと思えず，やめてしまうこともあるでしょう．中には教え方の上手な人もいますが，比較的少数であり，それが囲碁普及の課題の一つであると考えます．
　そこで本研究では，コンピュータにその教え役をさせて，「勝つこと」ではなく，「プレイヤを楽しませる」ことを目的とするプログラム（接待碁AI），さらには「プレイヤに教える」ことを目的とするプログラム（指導碁AI）を目指します．

アプローチと結果概要

　まずは，接待碁のために必要となる要素にどんなものがあるのかを調べ，まとめる作業を行いました．
　下図左側は「好み推測」「形勢制御」「自然な着手」「多様な戦略」「着手タイミング」「発話」の6つの要素を考慮するプログラムのイメージです．実際には，各要素の中にもいろいろな項目があり，全てをいきなり解決することはできません．要素のうちいくつかには成果が出ています．
　まず，機械学習を用いて着手の見た目の（形の）自然さを評価するシステム，着手の良さを評価するシステムを組み合わせて，「悪くは見えないが最善ではない，うまく形勢をシーソーゲームに導く」ような着手決定法を作成しました．これにより，単純な手加減手法に比べて「あからさまに悪く見える手」を6割ほど削減することができました．
　さらに，「実利派・勢力派」「悲観派・楽観派」などの“棋風”を演出する手法を開発し，被験者実験を通じて効果を確認しました．

指導碁に向けて

　さらに現在は，上図右側の3つの要素，弱点分析・悪手指摘・例題作成を加えることで，指導碁に向けた研究を行っています．指導碁では，接待碁と似たようなことに気を付けながら碁を打ったあと，人間プレイヤの悪かった手を指摘する必要があります．「どの手が悪かったか」「なぜ悪かったのか」「どうなってしまったのか」「どうすればよかったのか」を下図のように順次説明していくことで，理解を助けるわけです．悪手の判別や理由付けについては，機械学習の枠組みを用いることができ，すでに良好な結果が確認されています．

研究担当者，業績，リンク等

・本研究はこれまで宍戸崇音，山中翠，Simon Viennotが主に担当しました．
・現在は概ね池田心が担当しています．
・本研究はジャーナル，国際会議論文，研究会論文が採録されています．
　- 池田心：
　　楽しませる囲碁・将棋プログラミング，
　　オペレーションズ・リサーチ学会，Vol.58, no.3, pp. 167-173, 2013-03
　- Kokolo Ikeda, Simon Viennot:
　　Production of Various Strategies and Position Control for Monte-Carlo Go,
　　IEEE-CIG, pp. 145-152, 2013-08
　- 池田心，Simon Viennot:
　　モンテカルロ碁における多様な戦略の演出と形勢の制御　～接待碁AIに向けて，
　　第17回ゲームプログラミングワークショップ，pp. 47-54, (2012-11)
　- 宍戸崇音，池田心，Simon Viennot:
　　機械学習を用いた囲碁の着手の日本語表現
　　第33回ゲーム情報学研究会，pp. 1-7，(2015-03)
　- 山中　翠，ビエノ　シモン，池田　心:
　　コンピュータ指導碁のための悪手解説
　　第35回ゲーム情報学研究会, (2016-03)
　- 池田心，Simon Viennot, 佐藤直之:
　　Detection and Labeling of Bad Moves for Coaching Go, IEEE-CIG, pp.395-401, 2016-09
・本研究では囲碁プログラムNomitanを用いています．Nomitanのページは【こちら】です．