楽しませる囲碁プログラム-接待碁AI

背景と目的
囲碁で上達するためには,自分より強い相手に教えてもらうことが効果的です. しかし単に強いだけの人は,しばしば,たっぷりハンデを与えたうえで手加減なしに初級者を打ちのめし, 場合によっては「なんでそんな手を打つんだ」などと怒りだします(上図). これでは囲碁を続けようと思えず,やめてしまうこともあるでしょう. 中には教え方の上手な人もいますが,比較的少数であり,それが囲碁普及の課題の一つであると考えます.そこで本研究では,コンピュータにその教え役をさせて,「勝つこと」ではなく, 「プレイヤを楽しませる」ことを目的とするプログラム(接待碁AI), さらには「プレイヤに教える」ことを目的とするプログラム(指導碁AI)を目指します.
アプローチと結果概要
まずは,接待碁のために必要となる要素にどんなものがあるのかを調べ,まとめる作業を行いました.下図左側は「好み推測」「形勢制御」「自然な着手」「多様な戦略」「着手タイミング」「発話」の6つの要素を考慮するプログラムのイメージです. 実際には,各要素の中にもいろいろな項目があり,全てをいきなり解決することはできません.要素のうちいくつかには成果が出ています.
まず,機械学習を用いて着手の見た目の(形の)自然さを評価するシステム,着手の良さを評価するシステムを 組み合わせて,「悪くは見えないが最善ではない,うまく形勢をシーソーゲームに導く」ような着手決定法を作成しました. これにより,単純な手加減手法に比べて「あからさまに悪く見える手」を6割ほど削減することができました.
さらに,「実利派・勢力派」「悲観派・楽観派」などの“棋風”を演出する手法を開発し, 被験者実験を通じて効果を確認しました.

指導碁に向けて
さらに現在は,上図右側の3つの要素,弱点分析・悪手指摘・例題作成を加えることで,指導碁に向けた研究を行っています. 指導碁では,接待碁と似たようなことに気を付けながら碁を打ったあと,人間プレイヤの悪かった手を指摘する必要があります. 「どの手が悪かったか」「なぜ悪かったのか」「どうなってしまったのか」「どうすればよかったのか」を 下図のように順次説明していくことで,理解を助けるわけです. 悪手の判別や理由付けについては,機械学習の枠組みを用いることができ,すでに良好な結果が確認されています.
研究担当者,業績,リンク等
・本研究はこれまで宍戸崇音,山中翠,Simon Viennotが主に担当しました.・現在は概ね池田心が担当しています.
・本研究はジャーナル,国際会議論文,研究会論文が採録されています.
- 池田心:
楽しませる囲碁・将棋プログラミング,
オペレーションズ・リサーチ学会,Vol.58, no.3, pp. 167-173, 2013-03
- Kokolo Ikeda, Simon Viennot:
Production of Various Strategies and Position Control for Monte-Carlo Go,
IEEE-CIG, pp. 145-152, 2013-08
- 池田心,Simon Viennot:
モンテカルロ碁における多様な戦略の演出と形勢の制御 ~接待碁AIに向けて,
第17回ゲームプログラミングワークショップ,pp. 47-54, (2012-11)
- 宍戸崇音,池田心,Simon Viennot:
機械学習を用いた囲碁の着手の日本語表現
第33回ゲーム情報学研究会,pp. 1-7,(2015-03)
- 山中 翠,ビエノ シモン,池田 心:
コンピュータ指導碁のための悪手解説
第35回ゲーム情報学研究会, (2016-03)
- 池田心,Simon Viennot, 佐藤直之:
Detection and Labeling of Bad Moves for Coaching Go, IEEE-CIG, pp.395-401, 2016-09
・本研究では囲碁プログラムNomitanを用いています.Nomitanのページは【こちら】です.