グラフ構造データを 対象とした 解釈可能決定集合...

22
グラフ構造データを 対象とした 解釈可能決定集合の拡張 5416063 松山航太

Upload: others

Post on 02-Jun-2020

0 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: グラフ構造データを 対象とした 解釈可能決定集合 …tozaki.is.chs.nihon-u.ac.jp/thesis/2019/5416063_slide.pdfH, Lakkaraju, et al : 『Interpretable Decision Sets:

グラフ構造データを対象とした

解釈可能決定集合の拡張5416063 松山航太

Page 2: グラフ構造データを 対象とした 解釈可能決定集合 …tozaki.is.chs.nihon-u.ac.jp/thesis/2019/5416063_slide.pdfH, Lakkaraju, et al : 『Interpretable Decision Sets:

H, Lakkaraju, et al : 『Interpretable Decision Sets: A Joint Framework for Description and Prediction』,KDD '16(2016)

機械学習の解釈性研究

Interpretable Decision Sets

Graph Interpretable Decision Sets(本手法)

グラフ構造データへの適用

Page 3: グラフ構造データを 対象とした 解釈可能決定集合 …tozaki.is.chs.nihon-u.ac.jp/thesis/2019/5416063_slide.pdfH, Lakkaraju, et al : 『Interpretable Decision Sets:

○○=Y and ××=Y then c1○○=N then c2××=N and △△=N then c2

○○=Y and ××=Y then c1××=N and △△=N then c2

1.ルール集合の獲得

2.適切な部分集合の獲得

○○ ×× … class

D1 No Yes … c1

D2 Yes No … c2

… … … … …

ルール集合S

データセットD

解釈可能決定集合R

クラス相関ルール(if-thenルール)

を用いてルールセットを獲得

評価関数���, ��に従ってRを選択

�∗ � �� �, � � ⊆� � ����

Page 4: グラフ構造データを 対象とした 解釈可能決定集合 …tozaki.is.chs.nihon-u.ac.jp/thesis/2019/5416063_slide.pdfH, Lakkaraju, et al : 『Interpretable Decision Sets:

評価関数∗ ⊆�

� ����

出⼒となる選択ルール集合

クラス相関ルールの全体集合Sの部分集合

� ��

���

データセット

重み(�� ≥0) 各観点からの評価

Page 5: グラフ構造データを 対象とした 解釈可能決定集合 …tozaki.is.chs.nihon-u.ac.jp/thesis/2019/5416063_slide.pdfH, Lakkaraju, et al : 『Interpretable Decision Sets:

○○=Y and ××=Y then c1××=N and △△=N then c2△△=N then c2

集合サイズ(小さいほど高評価)

=

Page 6: グラフ構造データを 対象とした 解釈可能決定集合 …tozaki.is.chs.nihon-u.ac.jp/thesis/2019/5416063_slide.pdfH, Lakkaraju, et al : 『Interpretable Decision Sets:

�� �, � � ���� · � − � ��� !ℎ # ∈

ルールの本体部の⻑さ(短いほど高評価)

○○=Y and ××=Y then c1××=N and △△=N then c2△△=N then c2

� ��� !ℎ # � 2 + 2 + 1 ∈ � 5

Page 7: グラフ構造データを 対象とした 解釈可能決定集合 …tozaki.is.chs.nihon-u.ac.jp/thesis/2019/5416063_slide.pdfH, Lakkaraju, et al : 『Interpretable Decision Sets:

�) �, � � * · � � − � +,�#�-. #� , #/ 0, 1∈

�2/30�31

�5 �, � � * · � � − � +,�#�-.�#� , #/� 0, 1∈

�2/30631

ルール#○○=Y then c1

ルール#′××=Y then c2

○○ ×× … class

d1 Y Y … C1

d2 Y N … C2

d3 N Y … c2

データセットD

cover(r)d1

d2

cover(r’)d1

d3

8 =1d1

+,�#�-. #, #′ � 9+,�#�#� ∩ 9+,�#�#′�

ルールの説明範囲の重複度合い(小さいほど高評価)

Page 8: グラフ構造データを 対象とした 解釈可能決定集合 …tozaki.is.chs.nihon-u.ac.jp/thesis/2019/5416063_slide.pdfH, Lakkaraju, et al : 『Interpretable Decision Sets:

�; �, � � � 1(∃# � �=, 9� ∈ � =>9ℎ !ℎ-! 9 � 9´)38∈@

○○=Y and ××=Y then c1○○=N and △△=Y then c2

○○=Y and ××=Y then c1○○=Y and △△=Y then c1

c1,c2両方

c1のみ

クラスの網羅性(⼤きいほど高評価)

=2

=1

Page 9: グラフ構造データを 対象とした 解釈可能決定集合 …tozaki.is.chs.nihon-u.ac.jp/thesis/2019/5416063_slide.pdfH, Lakkaraju, et al : 『Interpretable Decision Sets:

�A �, � � * · � − � |C�9+##�9!- 9+,�#�#�| ∈ ルール#

○○=Y then c1

cover(r)d1

d2

○○ ×× … class

d1 Y Y … Y

d2 Y N … N

d3 N N … N

Incorrect-cover(r)

d2

誤分類される事例数(小さいほど高評価)

1

Page 10: グラフ構造データを 対象とした 解釈可能決定集合 …tozaki.is.chs.nihon-u.ac.jp/thesis/2019/5416063_slide.pdfH, Lakkaraju, et al : 『Interpretable Decision Sets:

���,E�∈F

r1:○○=Y then c1r2:××=N then c2

correct-cover(r1)

d1

correct-cover(r2)

d2 d3

� |{d1, d2, d3}| =3

○○ ×× … class

d1 Y Y … c1

d2 Y N … c2

d3 N N … c3

データセットD

事例の被覆度(⼤きいほど高評価)

Page 11: グラフ構造データを 対象とした 解釈可能決定集合 …tozaki.is.chs.nihon-u.ac.jp/thesis/2019/5416063_slide.pdfH, Lakkaraju, et al : 『Interpretable Decision Sets:

劣モジュラ最⼤化問題� から � は全て劣モジュラ関数既存のアルゴリズム(SLS等)で計算可能

∗ ⊆� � ����

劣モジュラ関数︓台集合:G, �, H ⊆ G, � ⊆ H, C ⊈ Y

Page 12: グラフ構造データを 対象とした 解釈可能決定集合 …tozaki.is.chs.nihon-u.ac.jp/thesis/2019/5416063_slide.pdfH, Lakkaraju, et al : 『Interpretable Decision Sets:

IDS(従来手法) GIDS(本研究)

○○=Y and ××=Y then c1○○=N then c2××=N and △△=N then c1

○○=Y and ××=Y then c1××=N and △△=N then c2

g1=Y and g2=Y then c1g3=Y then c2

g2=Y and g3=Y then c2…

1.ルール集合の獲得

2.適切な部分集合の獲得

○○ ×× … class

D1 No Yes … Y

D2 Yes No … N

… … … … …

G3G2G1

g1=Y and g2=Y then c1g3=Y then c2

グラフを考慮した評価関数の拡張

グラフデータのトランザクション化

Page 13: グラフ構造データを 対象とした 解釈可能決定集合 …tozaki.is.chs.nihon-u.ac.jp/thesis/2019/5416063_slide.pdfH, Lakkaraju, et al : 『Interpretable Decision Sets:

グラフ構造データのトランザクション化

G3

G2

G1

g1 g2 g3

G1 Yes Yes Yes

G2 Yes No No

G3 Yes Yes Yes

グラフデータ

頻出部分グラフ

Page 14: グラフ構造データを 対象とした 解釈可能決定集合 …tozaki.is.chs.nihon-u.ac.jp/thesis/2019/5416063_slide.pdfH, Lakkaraju, et al : 『Interpretable Decision Sets:

評価関数の拡張評価関数をルール中のグラフの形状を考慮するよう拡張

g1=Y and g2=Y then c1g2=Y and g3=Y then c2…

r1

r2 and

and

then c2

then c1

g1

g3g2

g2

Page 15: グラフ構造データを 対象とした 解釈可能決定集合 …tozaki.is.chs.nihon-u.ac.jp/thesis/2019/5416063_slide.pdfH, Lakkaraju, et al : 『Interpretable Decision Sets:

�K �, � � ��L��� − #-.ℎ=CM� # �

and then c1ルールr

グラフサイズ(小さいほど高評価)

Page 16: グラフ構造データを 対象とした 解釈可能決定集合 …tozaki.is.chs.nihon-u.ac.jp/thesis/2019/5416063_slide.pdfH, Lakkaraju, et al : 『Interpretable Decision Sets:

N

and then c1

ノードラベルの種類数(多いほど高評価)

Page 17: グラフ構造データを 対象とした 解釈可能決定集合 …tozaki.is.chs.nihon-u.ac.jp/thesis/2019/5416063_slide.pdfH, Lakkaraju, et al : 『Interpretable Decision Sets:

グラフ非類似度(⼤きいほど高評価)�O

and and then c1

グラフ編集距離(Graph edit distance)

{GED(g1,g2) + GED(g2,g3) + GED(g1,g3) } / 3

=

r =

#-.ℎ PC==CQC�-#C!R # � 1|S|T� � LU�� C, V�

��,�/∈S

Page 18: グラフ構造データを 対象とした 解釈可能決定集合 …tozaki.is.chs.nihon-u.ac.jp/thesis/2019/5416063_slide.pdfH, Lakkaraju, et al : 『Interpretable Decision Sets:

実験設定

IDS

GIDS

比較解釈性精度

GIDS

GIDS-f8

GIDS-f9

GIDS-f10

比較解釈性精度

拡張の有無の比較

各関数の有無の比較

グラフデータ

S∗

∗S∗

SWXK∗

SWXYZ∗

SWXN∗

Page 19: グラフ構造データを 対象とした 解釈可能決定集合 …tozaki.is.chs.nihon-u.ac.jp/thesis/2019/5416063_slide.pdfH, Lakkaraju, et al : 『Interpretable Decision Sets:

データセット:Homes間取り図グラフ玄関

廊下

居間

洗⾯・風呂

洗 居

データ数:480件(Y,N各クラス240件ずつ)T, Ozaki:Extraction of Characteristic Subgraph Patterns with Support Threshold from Databases of Floor Plans, Cander2019

Page 20: グラフ構造データを 対象とした 解釈可能決定集合 …tozaki.is.chs.nihon-u.ac.jp/thesis/2019/5416063_slide.pdfH, Lakkaraju, et al : 『Interpretable Decision Sets:

実験設定

クラス相関ルールS

68607件

グラフデータセット

DクラスY67706件

クラスN901件

ランダムサンプリング

クラスY500件

クラスN500件

×10

IDS

GIDS

gSpan

トランザクションデータ

Page 21: グラフ構造データを 対象とした 解釈可能決定集合 …tozaki.is.chs.nihon-u.ac.jp/thesis/2019/5416063_slide.pdfH, Lakkaraju, et al : 『Interpretable Decision Sets:

IDS精度(AUC) 0.52重複率 :�), �5 0.35非被覆率 :�� 0.22ルール⻑ :�� 2.95集合サイズ :�� 2.00クラス数割合: �; 1.00グラフサイズ:�K 11.95ノード種数 :�N 7.80非類似度 :��O 0.26

GIDS ¬f8 ¬f9 ¬f100.58 0.52 0.58 0.580.00 0.35 0.00 0.000.11 0.22 0.11 0.113.00 2.95 3.00 3.004.20 2.00 4.20 4.201.00 1.00 1.00 1.00

10.94 12.25 10.88 10.949.40 7.90 9.30 9.400.50 0.27 0.50 0.50

グラフサイズ ノード種類数 グラフ非類似度

解釈性尺度

・グラフサイズの関数を除くと性能が⼤きく下がる

・他の関数は誤差レベルの貢献

Page 22: グラフ構造データを 対象とした 解釈可能決定集合 …tozaki.is.chs.nihon-u.ac.jp/thesis/2019/5416063_slide.pdfH, Lakkaraju, et al : 『Interpretable Decision Sets:

まとめ・IDSのグラフ構造データへの拡張

-精度、解釈性の向上

今後の課題・追加実験・λの最適化・主観評価