コンピュータ囲碁の仕組み ~ 将棋との違い ~

24
ココココココココココココ ココココココ ココ コ 2014 コ 6 コ 21 コ 歌歌歌歌 .tech#4

Upload: kaloni

Post on 05-Jan-2016

40 views

Category:

Documents


0 download

DESCRIPTION

コンピュータ囲碁の仕組み ~ 将棋との違い ~. 山下 宏 201 4 年 6 月 21 日 歌舞伎座 .tech#4. 私について. 電王戦で豊島さんと YSS で対戦しました。 将棋だけでなく囲碁も作っています。 コンピュータ囲碁の大会 (UEC 杯、 2014 年 3 月開催、全 16 チーム ) 1 位 Zen ( 天頂の囲碁 ) 日本 2 位 CrazyStone ( 最強の囲碁 ) フランス 3 位 Aya → 私のプログラム 世界トップクラスではないが、そこそこ上位。 - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: コンピュータ囲碁の仕組み ~ 将棋との違い ~

コンピュータ囲碁の仕組み ~ 将棋との違い ~

山下 宏

2014 年 6 月 21 日歌舞伎座 .tech#4

Page 2: コンピュータ囲碁の仕組み ~ 将棋との違い ~

私について

電王戦で豊島さんと YSS で対戦しました。将棋だけでなく囲碁も作っています。コンピュータ囲碁の大会 (UEC 杯、 2014 年

3 月開催、全 16 チーム ) 1 位 Zen ( 天頂の囲碁 ) 日本 2 位 CrazyStone ( 最強の囲碁 ) フランス 3 位 Aya → 私のプログラム

世界トップクラスではないが、そこそこ上位。

というわけで囲碁のお話です。

Page 3: コンピュータ囲碁の仕組み ~ 将棋との違い ~

将棋の局面評価

+286

局面を直接数値に変換

Page 4: コンピュータ囲碁の仕組み ~ 将棋との違い ~

囲碁の局面評価

将棋と同じく直接変換

黒の13目勝ち

2006年まではこの手法だった

Page 5: コンピュータ囲碁の仕組み ~ 将棋との違い ~

コンピュータの棋力の推移

Page 6: コンピュータ囲碁の仕組み ~ 将棋との違い ~

モンテカルロ法を利用した囲碁ソフトが登場

2006年に囲碁は何が起こったか?

Page 7: コンピュータ囲碁の仕組み ~ 将棋との違い ~

モンテカルロ法とは?

乱数を使って数値計算を行う手法 何度も繰り返すことで正解に近づく 円周率( π )の計算など

Page 8: コンピュータ囲碁の仕組み ~ 将棋との違い ~

モンテカルロ法を使った囲碁の仕組み

1.乱数で黒石、白石を交互に置く

2.打つ場所がなくなったら終了

3.点数を計算する

4.1 . - 3 . を何度も繰り返す

(実際のサンプルを表示)

Page 9: コンピュータ囲碁の仕組み ~ 将棋との違い ~

モンテカルロ法での局面評価

乱数で最後まで打ってみる黒の45目勝ち

1000 回繰り返すと 675 回黒が勝つ

Page 10: コンピュータ囲碁の仕組み ~ 将棋との違い ~

9 路でのシミュレーション

初期局面 30 手目 終局図

Page 11: コンピュータ囲碁の仕組み ~ 将棋との違い ~

19 路でも基本は同じ

初期局面 100 手目 終局図

Page 12: コンピュータ囲碁の仕組み ~ 将棋との違い ~

シミュレーションの精度を上げる

囲碁知識を利用 アタリを逃げる、石を取る 直前の相手の手の近くに打つ 石のパターン(3x3など)

プロの棋譜から着手確率を調べる

高確率 低確率

アタリ

Page 13: コンピュータ囲碁の仕組み ~ 将棋との違い ~

黒石の着手確率

数値が大きいほど着手確率が高い

Page 14: コンピュータ囲碁の仕組み ~ 将棋との違い ~

パターンを利用したサンプル

サンプルを再生

Page 15: コンピュータ囲碁の仕組み ~ 将棋との違い ~

単純乱数(上)と囲碁っぽい乱数

単純乱数(上)は途中図がひどい。最後はどちらも同じ感じ

Page 16: コンピュータ囲碁の仕組み ~ 将棋との違い ~

シミュレーションが強さを決める

1手に10000回のシミュレーション 純粋乱数 ・・・ 15級 囲碁知識を利用 ・・・ 2段

シミュレーション = 評価関数 将棋 ・・・ 評価関数の正確さ 囲碁 ・・・ シミュレーションの正確さ

Page 17: コンピュータ囲碁の仕組み ~ 将棋との違い ~

将棋の木探索

深さ1、2、3と順番に深く読んでいく

Page 18: コンピュータ囲碁の仕組み ~ 将棋との違い ~

囲碁の木探索

開始局面から最終局面へ、を何度も繰り返す

Page 19: コンピュータ囲碁の仕組み ~ 将棋との違い ~

将棋と囲碁の手の選択(木探索)

将棋 平均可能手数、 80 手(最大 593 手) すべての可能な手を読む 見込みのない手は浅い読みで打ち切り

囲碁 平均可能手数、 250 手(最大 361 手) 木探索では上位 30 手程度しか調べない 読みぬけの危険あり

Page 20: コンピュータ囲碁の仕組み ~ 将棋との違い ~

モンテカルロ法+探索は応用範囲が広い

ルールだけの実装で評価関数を作れる囲碁以外でも

アマゾン、 Lines of Action 、さめがめ多人数ゲームでも

カタンの開発者たち、ハーツリアルタイムゲームでも有効

Ms. Pac-Man

Page 21: コンピュータ囲碁の仕組み ~ 将棋との違い ~

Ms. Pac-Man

一番高得点になる行動を選ぶ

知識ベースのソフトを破り最高得点を取得

Page 22: コンピュータ囲碁の仕組み ~ 将棋との違い ~

現在のコンピュータ囲碁の棋力

アマチュアの県代表レベル 98%以上のアマチュアはもう勝てない

プロとは4子でいい勝負 将棋だと飛香落ち程度に相当

将棋に比べて10年遅れている感じ

Page 23: コンピュータ囲碁の仕組み ~ 将棋との違い ~

まとめ

囲碁はモンテカルロ法で壁を超えた。将棋も囲碁もプロ ( 人間のエキスパート ) の

手を真似することで強くなった。 意味は分からずとも上級者の真似をするのは大事

将棋は全幅探索。囲碁は選択探索。モンテカルロ法+木探索は応用範囲が広い

ゲームによって向き不向きがある 将棋では初段程度でうまくいってない

Page 24: コンピュータ囲碁の仕組み ~ 将棋との違い ~

ご静聴ありがとうございました