第27回世界コンピュータ将棋選手権 gan将棋アピール … · shoginet概要...

7

第27回世界コンピュータ将棋選手権 GAN将棋アピール文章 Katsuki Ohto 2017/5/4

Upload: phamdiep

Post on 02-Jul-2018

226 views

Category:

Documents

0 download

Report

Download

Embed Size (px):

TRANSCRIPT

Page 1: 第27回世界コンピュータ将棋選手権 GAN将棋アピール … · SHOGINET概要 •ShogiNet… ディープラーニングで学習した1手も読まない将棋方策関数プログラム。

第27回世界コンピュータ将棋選手権GAN将棋アピール文章Katsuki Ohto 2017/5/4

Page 2: 第27回世界コンピュータ将棋選手権 GAN将棋アピール … · SHOGINET概要 •ShogiNet… ディープラーニングで学習した1手も読まない将棋方策関数プログラム。

GAN将棋コンセプト

• GAN (Generative Adversarial Network) を使って評価関数を学習したいと思ってこの名前で登録

• Ponanza Chainer発表後、既存ライブラリ + ディープラーニングで強くする方向に方針転換

• Tensorflowライブラリを使ったディープラーニング方策単体のプログラムShogiNetが一応動くところまでいったが、それ以上は何もできませんでした

• そういうわけで次頁からはShogiNetの紹介に移ります

Page 3: 第27回世界コンピュータ将棋選手権 GAN将棋アピール … · SHOGINET概要 •ShogiNet… ディープラーニングで学習した1手も読まない将棋方策関数プログラム。

SHOGINET概要

• ShogiNet … ディープラーニングで学習した1手も読まない将棋方策関数プログラム。2017/5/2時点でfloodgateでのレート(最近2週間)は1370程度

• 学習元データ…プロ棋譜6万局、floodgateの棋譜5万局、uuunuuunさんの公開棋譜2万局程度（計 1700 万局面） uuunuuunさんありがとうございます

• 全ての(局面, 手)からのシンプルな教師あり学習。王手ラッシュまで再現…教師の手との一致率 51.8% (非合法手も候補に入れると 48.4 %)

• ベースにはAperyプログラムを利用、http://github.com/YuriCat/aperyの nn ブランチで管理しています

Page 4: 第27回世界コンピュータ将棋選手権 GAN将棋アピール … · SHOGINET概要 •ShogiNet… ディープラーニングで学習した1手も読まない将棋方策関数プログラム。

SHOGINETのネットワーク

• 一致率が最も高い最新モデル（の各層）は以下のような構成で、全13層、内部は192チャネルです

• 将棋の駒は様々な動き方をするので、それに合わせて色々な形の畳み込みフィルターを使っています（図は一部）

1x1

3x3

3x51x9INPUT

concat

add

ReLU

BN

OUTPUT

Page 5: 第27回世界コンピュータ将棋選手権 GAN将棋アピール … · SHOGINET概要 •ShogiNet… ディープラーニングで学習した1手も読まない将棋方策関数プログラム。

SHOGINETの入力

• ニューラルネットへの入力画像は 11 x 11 のサイズ(盤端にパディングあり) で以下の計107チャネル後手番の場合は盤面を反転させて入力

盤上の駒 14 × 2持ち駒 (歩は4枚、香桂銀金は2枚を限度とし、超過は無視) 16 × 2盤上の駒の利き 14 × 2香車、角系、飛車系の隠れた利き 3 × 2各マスに利いている駒の数 (自分と相手で別々、最大3つまで考慮) 3 × 2AperyのCheckInfo::dcBB 1 AperyのCheckInfo::pinned 1歩のある筋 1 × 2成りゾーン 1 × 2盤内 1

Page 6: 第27回世界コンピュータ将棋選手権 GAN将棋アピール … · SHOGINET概要 •ShogiNet… ディープラーニングで学習した1手も読まない将棋方策関数プログラム。

SHOGINETの出力

• 駒の移動元と移動先を最終層で別々に出力• 移動元盤面 11 × 11 + 持ち駒 7 の計 128 クラス• 移動先盤面 11 × 11 × 駒種 14 (成駒含む) の計 1694 クラス• 移動先を駒種別に分けることで、「ここにこの駒があればいいな」という感覚の獲得を目指しています

• 移動元、移動先のそれぞれを分類問題とし softmax cross entropy を誤差関数として学習

• 合法手集合からの分類ではないこと、2つの分類問題に分割していることで少々いびつな感じです

• 実行時は移動元と移動先でそれぞれ確率を出力し掛け合わせて手のスコアとします

Page 7: 第27回世界コンピュータ将棋選手権 GAN将棋アピール … · SHOGINET概要 •ShogiNet… ディープラーニングで学習した1手も読まない将棋方策関数プログラム。

感想

• ネットワークの構成や入出力を色々といじってみましたが、それ以前のデータの量と質の問題がとても大きいようです

• 現在は教師の手に一様に合わせるだけの学習ですが、より発展させてネットワークの弱点（探索するプログラムが選んだ手の価値の差が大きい局面）を重点的に学習するとさらに強くなると思います

• 序盤が綺麗で、中盤以降は頑張れば勝てそう、劣勢でも逆転の目があり絶望感がない（どうせ読めてないし）ということで人間の対戦相手としては面白い存在だと感じました

数値最適化手法のコンピュータ将棋への応用 ...数値最適化手法のコンピュータ将棋への応用 2012年6月16日早稲田大学数学教育学会講演会

軍人将棋ルール研究 - BIGLOBEsak/kotengame/gunjinshougi_rule...8 ----- ＜第一期のルール＞本書では、軍人将棋のルールを、大きく4つに分類してみたいと思います。

将棋ソフトウェアにおける棋譜データの利用と機械 …将棋ソフトウェアにおける棋譜データの利用と機械学習佐藤佳州筑波大学システム情報工学研究科

学生支援・課外活動紹介 - 国立高専機構 ......クラブ活動文化部（4）吹奏楽囲碁将棋ロボコン天文・コンクール、定期演奏会、高専将棋大会，高専ロボコン大会

第5回夏休み将棋合宿 · 2017. 11. 28. · 第5回夏休み将棋合宿 8月5日(土)、6(日)に、1泊2日で京都平安ホテルにて、京都梅津支部主催の第5回夏休み将棋合宿を行い

コンピュータ将棋プログラム Bonanza...2 • 強い将棋プログラムを無料で公開 • プログラムの動作がユニーク何故こんな事になってしまったのだろう。Bonanza

きふわらべアピール文書コーディング・テクニックをPRするのね · 第30回世界コンピュータ将棋選手権きふわらべアピール文書 202003月30日

中四国学生将棋大会 · 第101 回中四国学生将棋大会開催日 2019 年5 月4 日～6 日開催場所 50 周年記念館主幹岡山大学

韩国传奇棋手李世石宣布退役 · 娱体 2019.11.20星期三责编邓鹏伟美编焦英电话 86777777 韩国棋院消息，著名棋手李世石昨日正式向韩国棋院递交了“辞职申

詰将棋魔法...詰将棋魔法 1 9 9 7 年看寿賞受賞作品「伏龍」参加型トークイベントスペシャルゲストさん（詰将棋作家）県立武道館

将棋盤のマス目と駒の読み方kishikaisei.jp/pdf/rule.pdf＜弥栄町将棋愛好会配布資料＞ 1 / 3 将棋盤のマス目と駒の読み方マス目は縦横9×9＝81あります。

メカ女子将棋 - denou.jp · メカ女子将棋PR文書 15 Julia言語部分 Julia言語でプログラムを記述します。C/C++ 言語部分はccallという仕組みで呼び出します

コンピュータ将棋プログラム Bonanza2 • 強い将棋プログラムを無料で公開 • プログラムの動作がユニーク何故こんな事になってしまったのだろう。Bonanza

下棋找高手 135 159

コンピュータ将棋の技術と - cybernet.co.jp · 棋譜の指手を真似られるように調整プログラムの指手との一致率を高くする棋譜以外の手を選ばない

Web Fairy Paradise1 Web Fairy Paradise 0 今月のフェアリー詰将棋・第123 回WFP 作品展（再掲）・第124 回WFP 作品展・推理将棋第130 回出題結果発表

ぎこう将棋ソフト「技巧」 - denou.jp · 棋譜から手筋を学習しています。 Ø 激指の手法*5（2値分類）を拡張した手法です。 Ø 例えば、以下のような手筋の確率を学習しています。

军营运动场的吸引力从何而来 - 81.cn · 述》里写道，他自幼喜欢下围棋，围棋成了他终生的爱好。由于难以找到合适的对手，他就双手执棋子，自己跟自己

将棋の認知科学的研究（2 ——次の一手実験からの考察 · poral chunk”. Our research suggests that Shogi players become stronger by acquiring these temporal

2015/5/20 『観る将（指すのではなく観る専門の将棋ファンのこ …gakuso.provost.nagoya-u.ac.jp/assets/img/... · 2015/5/20 『観る将（指すのではなく観る専門の将棋ファンのこと

第5回夏休み将棋合宿 - 日本将棋連盟¬¬5回夏休み将棋合宿 8月5日(土)、6(日)に、1泊2日で京都平安ホテルにて、京都梅津支部主催の第5回夏休み将棋合宿を行い

第17回詰将棋解答選手権初級戦（オンライン会場）成績一覧 · 2020. 4. 12. · 第17回詰将棋解答選手権初級戦（オンライン会場）成績一覧

将棋雑話幸田露伴 - Coocanappleorange.cafe.coocan.jp/kouda-rohan/shogi-zatsuwa.pdf-3-らば将といふべし、王と将と混称するの理あるまじとて将棋の諸

・はじめに（会長あいさつ）……………………………1 · 手芸・折り紙・お手玉づくり化粧教室・将棋・囲碁介護教室短期協働友愛訪問

柿木将棋の詰将棋の機能 - kakinoki.o.oo7.jpkakinoki.o.oo7.jp/free/KakinokiShogiTsume.pdf · 1 柿木将棋の詰将棋の機能 2017/08/12 柿木義一 1 柿木将棋（主にpc版）の歴史

世界の将棋NEWS - shogi-isps.orgshogi-isps.org/shinchaku/files/Paneltalk_kitao.pdf · Madoka KITAO 2 2015/10/3 2010年から将棋と一緒に旅をしてきました「将棋を世界に広めたい」

逆算法に基づく詰将棋の列挙

Press Release GROUP NEWS - pdf.irpocket.compdf.irpocket.com/C3272/lZkL/TT7k/p4B1.pdf · ペシャル企画とし、将棋棋士・投資家の桐谷広人氏、将棋棋士九段の加藤一三氏によるトークショーも開催さ

第17回詰将棋解答選手権一般戦（オンライン会場）成績一覧 · 2020. 4. 12. · 第17回詰将棋解答選手権一般戦（オンライン会場）成績一覧

メカ女子将棋Julia tokyo#1

ricoh joryuouza 2017 2kyoku zenyasai event s - shogi.osakashogi.osaka/wp-content/uploads/2017/09/ricoh... · お問い合わせ（公社）日本将棋連盟関西本部主催：株式会社リコー／公益社団法人将棋連盟

外国人にとっての将棋 - shogi-isps.orgshogi-isps.org/shinchaku/files/Paneltalk_Karolina.pdf · 世界に将棋を普及するために. 外国の将棋の現状（FESA) 私の場合

一般化将棋・チェス・囲碁問題の定数時間アルゴリ …一般化将棋・チェス・囲碁問題の定数時間アルゴリズム ITO Hiro (伊藤大雄) The University

「最強東大将棋4 －完全版－」 · 「最強東大将棋4 －完全版－」は2001年8月に株式会社毎日コミュニケーションズより13,440円（税込）で

詰将棋パラダイス記本紀結果発表2016-03 表紙詰将棋.....93 フェアリーランド.....97 6 2016年6月号通巻723号詰将棋表紙詰将棋..... 0 キッズルーム