コンピュータ囲碁の仕組み～将棋との違い～

コンピュータ囲碁の仕組み～将棋との違い～

山下宏

2014 年 6 月 21 日歌舞伎座 .tech#4

私について

電王戦で豊島さんと YSS で対戦しました。将棋だけでなく囲碁も作っています。コンピュータ囲碁の大会 (UEC 杯、 2014 年

3 月開催、全 16 チーム ) 1 位 Zen ( 天頂の囲碁 ) 日本 2 位 CrazyStone ( 最強の囲碁 ) フランス 3 位 Aya → 私のプログラム

世界トップクラスではないが、そこそこ上位。

というわけで囲碁のお話です。

将棋の局面評価

＋２８６

局面を直接数値に変換

囲碁の局面評価

将棋と同じく直接変換

黒の１３目勝ち

２００６年まではこの手法だった

コンピュータの棋力の推移

モンテカルロ法を利用した囲碁ソフトが登場

２００６年に囲碁は何が起こったか？

モンテカルロ法とは？

乱数を使って数値計算を行う手法何度も繰り返すことで正解に近づく円周率（ π ）の計算など

モンテカルロ法を使った囲碁の仕組み

１．乱数で黒石、白石を交互に置く

２．打つ場所がなくなったら終了

３．点数を計算する

４．１ . －３ . を何度も繰り返す

（実際のサンプルを表示）

モンテカルロ法での局面評価

乱数で最後まで打ってみる黒の４５目勝ち

1000 回繰り返すと 675 回黒が勝つ

9 路でのシミュレーション

初期局面 30 手目終局図

19 路でも基本は同じ

初期局面 100 手目終局図

シミュレーションの精度を上げる

囲碁知識を利用アタリを逃げる、石を取る直前の相手の手の近くに打つ石のパターン（３ｘ３など）

プロの棋譜から着手確率を調べる

高確率低確率

アタリ

黒石の着手確率

数値が大きいほど着手確率が高い

パターンを利用したサンプル

サンプルを再生

単純乱数（上）と囲碁っぽい乱数

単純乱数（上）は途中図がひどい。最後はどちらも同じ感じ

シミュレーションが強さを決める

１手に１００００回のシミュレーション純粋乱数・・・１５級囲碁知識を利用・・・２段

シミュレーション＝評価関数将棋・・・評価関数の正確さ囲碁・・・シミュレーションの正確さ

将棋の木探索

深さ１、２、３と順番に深く読んでいく

囲碁の木探索

開始局面から最終局面へ、を何度も繰り返す

将棋と囲碁の手の選択（木探索）

将棋平均可能手数、 80 手（最大 593 手）すべての可能な手を読む見込みのない手は浅い読みで打ち切り

囲碁平均可能手数、 250 手（最大 361 手）木探索では上位 30 手程度しか調べない読みぬけの危険あり

モンテカルロ法＋探索は応用範囲が広い

ルールだけの実装で評価関数を作れる囲碁以外でも

アマゾン、 Lines of Action 、さめがめ多人数ゲームでも

カタンの開発者たち、ハーツリアルタイムゲームでも有効

Ms. Pac-Man

Ms. Pac-Man

一番高得点になる行動を選ぶ

知識ベースのソフトを破り最高得点を取得

現在のコンピュータ囲碁の棋力

アマチュアの県代表レベル９８％以上のアマチュアはもう勝てない

プロとは４子でいい勝負将棋だと飛香落ち程度に相当

将棋に比べて１０年遅れている感じ

まとめ

囲碁はモンテカルロ法で壁を超えた。将棋も囲碁もプロ ( 人間のエキスパート ) の

手を真似することで強くなった。意味は分からずとも上級者の真似をするのは大事

将棋は全幅探索。囲碁は選択探索。モンテカルロ法＋木探索は応用範囲が広い

ゲームによって向き不向きがある将棋では初段程度でうまくいってない

ご静聴ありがとうございました

コンピュータ囲碁の仕組み ～ 将棋との違い ～

Documents

コンピュータ囲碁の仕組み～将棋との違い～