LearningInGames のバックアップの現在との差分(No.1)

バックアップ一覧
差分を表示
ソースを表示
バックアップを表示
LearningInGames へ行く。
- 1 (2014-06-24 (火) 13:00:27)
- 2 (2014-06-24 (火) 13:03:40)

追加された行はこの色です。
削除された行はこの色です。

[[Research topics]]

* Learning in Game-theoretic Situations [#v3287507]

** 拡張された情報理論(多変量双方向情報理論 (Hidaka, 2012))に基づく概念モデル形成過程のモデル化 [#heb99484]
** 学習するエージェントによる繰り返し囚人のジレンマの解析 [#k39e1e3c]
-【キーワード】囚人のジレンマ，強化学習，マルコフ過程

従来、社会的ジレンマのモデルとしてゲーム理論を用い、協調行動の発生が議論されてきた。本研究では、各プレイヤーが報酬により行動を変える強化学習の枠組みを仮定し、代表的なゲームの一つである繰り返し囚人のジレンマを検討した。すべてのプレイヤーの行動履歴を状態遷移行列で表現し、そのダイナミクスを分析した。その結果、より長い行動履歴に基づき学習するほど、協調行動が安定して発生することが明らかになった。

【キーワード】知識獲得，仮説生成，情報理論，非線形力学系，時系列解析


**Related papers (See also [[other publications>Publications]]/ 関連する発表論文 ([[その他の論文など>Publications]]) [#cd693d64]

#todo('',%LearningInGames%)