人工知能は人狼の夢を見るか~人狼知能セミナー20141119
DESCRIPTION
人狼知能セミナー用資料です. 人狼知能プロジェクトの概要が説明されています. 人狼知能作成方法の詳細は下記の資料をご覧ください. 人狼知能プロジェクト・プロトコル解説 http://www.slideshare.net/HirotakaOsawa/ss-42049489 人狼知能エージェント作成方法 http://www.slideshare.net/kengo009/ss-42039883TRANSCRIPT
人工知能は人狼の夢を見るか?~人狼知能プロジェクト~
鳥海不二夫,梶原健吾,稲葉通将
大澤博隆,片上大輔,篠田孝祐
人狼知能セミナー2014/11/18
恐ろしい夜がやってきました
• この村には,人間の姿に化けられる人喰い人狼が潜んでいる
• 人狼は人間と同じ姿をしており,昼間には区別がつかず,夜になると村人たちを一人ずつ襲っていく
• 村人たちは疑心暗鬼になりながら,話し合いによって人狼と思われる人物を1人ずつ処刑していくことにした・・・
「汝は人狼なりや」カバーストーリー
コンピュータvs人間の歴史
• 1997年チェス
–ディープブルーがチェスチャンピオンに勝利
• 2013年将棋
– コンピュータがプロ棋士に勝利
• 2050年サッカー
–ロボットによるチームが
ワールドカップ優勝チームに勝利(予定)
コンピュータvs人間の歴史
• 2001年
– HAL9000の反乱
• 2004年
– SkyNetによる核戦争勃発
• 2005年
–ステルス戦闘機「F/A-37タロン」の暴走
• 2050年
– MATRIXによる人類支配
完全ゲームvs不完全ゲーム
• 完全情報ゲーム
–お互いの情報が完全に与えられているゲーム
–将棋,囲碁,チェスなど
–すでにコンピュータが人間を上回るものが多い
• 不完全情報ゲーム
–ゲーム情報が完全には与えられていないゲーム
–推論の対象が多岐にわたる
–定型的な研究の場は少ない
人狼知能プロジェクト
• 「人間と自然なコミュニケーションを取りながら人狼をプレイできるエージェントの構築」
–より高度な知能の創出
–より高度なコミュニケーションの実現
新しいエージェントの標準問題として
人狼とは(1/3)
• 村人に隠れた人狼を見つけ出す
• 人間13人vs人狼3匹
• 勝利条件–村人陣営:人狼を全員処刑する
–人狼陣営:村人陣営の数を人狼以下にする
• 与えられる情報–村人には自分の役のみ(誰が人狼であるかは不明)
–人狼陣営には誰が人狼の情報
11
人狼とは(2/3)
• 誰が人狼かを一定時間の対話で推測
• 各ターンごとに以下の行動が可能
–全体:人狼と疑わしいプレイヤー1人を追放
–人狼:毎晩一人村人を襲撃(ゲームから脱落)
• 村人:会話をヒントに人狼を追放
• 人狼:追放されないように村人
のフリをする
人狼とは(3/3)
• プレイヤー役職(能力)– 村人:能力無し
– 占い師:毎ターン一人のプレイヤーが人狼かどうか知ることが出来る
– 霊媒師:前回追放したプレイヤーが人狼かどうか知ることが出来る
– 狩人:毎ターン一人を人狼の襲撃から守る
– 人狼:毎ターン誰かを襲撃できる
– 狂人:能力は無いが,人狼陣営に所属
• 能力を駆使して所属する陣営を勝利させる
13
対面人狼・オンライン人狼
カード型人狼:パーティゲーム
• 一試合十数分程度– 短い会話で嘘がつけるか
• 顔が見える環境での競争– 相手の性格や反応を見る
• 狼同士の会話はジェスチャ
オンライン型人狼:言語ゲーム
• 一試合数日間– 熟慮した発言が可能
• キャラクターによる匿名化– 性別や見た目の影響排除
• 狼同士の会話を平衡で行う– コミュニケーションミスの排除
不完全情報ゲームとしての人狼
• 人狼のゲーム性–場に与えられた情報の非対称性
• 人狼は村人より多くの情報を持つ
–説得・協調• 相手に情報を与えて信頼を得る
–思考の多段階の予測• 自分がこう思っていると相手が思っているだろう
• コンピュータと人の対戦自体にまだ壁が存在–思考だけでは無い様々な課題
人狼ゲームの特徴
1. 客観視点での情報不確定性
– 完全情報ゲームとの違い
人狼ゲームの特徴
2. 推理:他者の意図のモデル化
– 文脈からの真偽の判断
– 重み付けは各プレイヤーが行う
人狼ゲームの特徴
3. 説得:他者から見た自己のモデル化
人狼知能実現のための課題
• エージェントの対話プロトコル設計• 推論と思考
– モデル化した行動(自分は占い師と名乗る,誰々は人狼だと思うと指摘する,など)の思考
– 他人の行動の理解– 戦略の構築(強化学習,データ分析)
• 自然言語処理– プロトコル上の行動の自然言語化,自然言語の理解
• ヒューマン・エージェント・インタラクション(HAI)– エージェントインターフェースの実装– 映像や音声による表現
• エージェント同士を競わせるプラットフォームの開発
人狼知能実現のための課題
• エージェントの対話プロトコル設計• 推論と思考
– モデル化した行動(自分は占い師と名乗る,誰々は人狼だと思うと指摘する,など)の思考
– 他人の行動の理解– 戦略の構築(強化学習,データ分析)
• 自然言語処理– プロトコル上の行動の自然言語化,自然言語の理解
• ヒューマン・エージェント・インタラクション(HAI)– エージェントインターフェースの実装– 映像や音声による表現
• エージェント同士を競わせるプラットフォームの開発
人狼対戦サーバ
• 人狼知能をエージェントとして互いに対戦可能なサーバ
• 将来的には人間との対戦も実現
人狼サーバ人狼プロトコル
人狼プロトコル
翻訳モジュール
自然言語
感情表現モジュール
人狼プロトコル 表情
人工知能は人狼を夢を見るか
• 人工知能エージェントによる人狼の対戦
–人工知能は人狼をプレイ可能か
–人工知能は人狼を学習可能か
• 提案プロトコル・サーバを用いて確認
–村人陣営,人狼陣営双方のエージェントを作成
–お互いを対戦させ,学習を行う
–最終的に得られた戦略を評価
シンプルな人狼のモデル化
• 人狼のシンプル化
–発話:特に必要な発話のみ
• 役職のカミングアウト
• 能力によって得られた情報の共有
• 疑っている対象の報告
– 疑い度:プレイヤーの状態から人狼らしさを推測
• Q学習を用いて戦略を学習
34
Q
? !
学習内容
• 襲撃,処刑等の対象選択方法
• 発話内容
• 人狼側が嘘をついて装う役職
• プレイヤーの疑い度
35
人狼・学習無 人狼・学習有
人間・学習無 38.6% 22.3%
人間・学習有 52.9% 36.4%
結果(1/3)
• 学習の有無による人間側の勝率の変化
戦略の学習によって勝率の向上が得られた
36
結果(2/3)
• 人狼側の戦略ごとの人間側の勝率の変化
• 実データと比較して高い相関(0.766)
→人間に近い戦略の学習に成功37
結果(3/3)
• 上級者が用いる手法の発見
– 生き残り人数が5人の時、襲撃における最適戦略
↓
“誰も襲わない”
高度な戦略の学習が可能であることを発見
38
人狼知能を作ろう
• 今日の目標
– 人狼知能エージェントを作ってみよう
– 自分の作った人狼知能と対戦してみよう
– 他の人が作ったエージェントと競ってみよう
• 今後の予定
– 10:15 - 11:00: ルール・プロトコル説明とインストール
– 11:15 - 12:00: サンプルエージェント説明
– 13:00 - :エージェント作成
– 16:00 - : 大会の開催