担当:真隅 暁
日時:1/8(金) 15:30-
場所:5Fコラボ2
内容:Battle of the Sexes Game における
   intertemporal cooperation の実現

概要:

協働行動の実現のためには,各主体が互いに行動を調整することが必
要となるが,利害対立下ではこれに加えて,実現される協働行動に対
する選好が各主体ごとに異なるという特徴がある.
このような状況において,現実の人間集団の観察や動物行動実験では,
各主体の選好を反映した複数種類の協働行動が交互に繰り返し実現さ
れる事例(intertemporal cooperation (i.c.) と呼ぶ)が報告されており,
協働行動の持続的な実現に対する(適応的な)意義が議論されている.
  
これを受けて先行研究では,無限回繰り返しの BoS において i.c. が
ナッシュ均衡となり得るような戦略の存在が理論的に示されているが,
この戦略自体の実現可能性や,これとは別の実現のされ方の有無につ
いては明らかでない.また,別の先行研究では,利害対立のないゲー
ムにおいて強化学習プレイヤー同士の繰り返しの相互作用を通じて協
働行動が実現され得ることが示されている.

これらを踏まえて本研究では,強化学習プレイヤーによる無限回繰り
返しの対称な BoS において,i.c. が実現される条件,およびその性質
を明らかにすることを目指す.具体的には,i.c. の実現可能性と効率
性を指標とし,これらが学習パラメータと利得構造に応じてどのよう
な定性的振る舞いを示すかを分析する.
分析の結果,学習パラメータについて,i.c.はプレイヤーの記憶が中程
度の場合に実現されることがわかった.また,利得構造に関しては,
(1)協働が失敗した際の損失が大きくなるほど i.c. の実現可能性が低く
なること,(2)その一方で効率性は上がり得ること,(3)プレイヤー間の
利害対立の程度が大きいほど効率的になり得ること,(4)その一方で
実現可能性はほぼ変化しないこと,などがわかった.


Speaker: Akira Masumi
Date & Hour: 8 Jan. (Fri) 15:30-
Title: Intertemporal cooperation with reinforcement learning
   in symmetric battle of the sexes game