取引履歴の解析に基づくbitcoinのサービス 識別⼿...

2
取引履歴の解析に基づくBitcoinのサービス 識別⼿法 慶應義塾⼤学 理⼯学部 情報⼯学科 豊⽥健太郎 / [email protected] 特性評価 提案⼿法 [1] 研究⽬的 仮想通貨による犯罪フォレンジクスのために,与えられたBitcoinアドレスが含まれる取引履歴を 解析・処理し,教師あり学習によりそのBitcoinアドレスがどのような犯罪・サービスに使⽤され ているかを識別する⼿法を開発しています [1] K. Toyoda et al., “Multi-class Bitcoin-enabled Service Identification Based on Transaction History Summarization,” in Proc of. IEEE International Conference on Blockchain 2018. 1. Webからのデータ収集 様々な⽬的に使⽤されているBitcoinアドレスを収集 3. 取引履歴の抽出 ユーザ毎にBitcoin取引履歴の抽出 4. 取引履歴の特徴抽出 ユーザ毎に取引の特徴抽出 (取引頻度,送受の割合,送受額の⼤きさ…) 5. 機械学習 取引の特徴の違いを教師あり学習により学習し, Bitcoinアドレス毎にサービスを識別 1NjnG69E8y...:取引所 168SKtdY1V...:マイニングプール 1JCXSd9L8... :ギャンブリング 168SKtdY1V... 1BUEGKXuN... ... Bitcoin Blockchain 1NjnG69E8y... 14SWYt7Diq... ... 1JCXSd9L8... 197udecm... ... 2. アドレス・クラスタリング 同⼀ユーザが保持する複数のBitcoinアドレスを推定 データセット:Webから収集し,マニュアルでラベル付加した計26,313件のBitcoinアドレス 識別器: Random Forests (#Trees = 100) 評価項⽬: 10-fold 交差検証で求めた正答率 (サービス毎にBitcoinアドレスを正しく識別した割合) 取引所 ギャンブル フォセット マーケットプレイス 投資詐欺 ロンダリング マイニングプール 取引所 フォセット ギャンブル 投資詐欺 マーケットプレイス ロンダリング マイニングプール 取引所 0.41 0.04 0.14 0.12 0.17 0.05 0.06 フォセット 0.04 0.80 0.04 0.09 0 0 0.03 ギャンブル 0.10 0.06 0.54 0.15 0.11 0 0.05 投資詐欺 0.04 0.12 0.09 0.72 0.01 0 0.02 マーケットプレイス 0.05 0 0.08 0 0.85 0.02 0 ロンダリング 0.02 0 0 0 0.04 0.94 0.01 マイニングプール 0.12 0.09 0.06 0.03 0 0.01 0.70

Upload: others

Post on 24-Jul-2020

0 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: 取引履歴の解析に基づくBitcoinのサービス 識別⼿ …取引履歴の解析に基づくBitcoinのサービス 識別 法 慶應義塾 学理 学部情報 学科豊 健太郎/toyoda@ics.keio.ac.jp

取引履歴の解析に基づくBitcoinのサービス識別⼿法

慶應義塾⼤学理⼯学部情報⼯学科豊⽥健太郎 /�[email protected]

特性評価

提案⼿法[1]

研究⽬的仮想通貨による犯罪フォレンジクスのために,与えられたBitcoinアドレスが含まれる取引履歴を解析・処理し,教師あり学習によりそのBitcoinアドレスがどのような犯罪・サービスに使⽤されているかを識別する⼿法を開発しています

[1] K. Toyoda et al., “Multi-class Bitcoin-enabled Service Identif ication Based on Transaction History Summarization,” in Proc of. IEEE International Conference on Blockchain 2018.

1.�Webからのデータ収集様々な⽬的に使⽤されているBitcoinアドレスを収集

3.�取引履歴の抽出ユーザ毎にBitcoin取引履歴の抽出

4.�取引履歴の特徴抽出ユーザ毎に取引の特徴抽出

(取引頻度,送受の割合,送受額の⼤きさ…)

5.�機械学習取引の特徴の違いを教師あり学習により学習し,

Bitcoinアドレス毎にサービスを識別

1NjnG69E8y...:取引所

168SKtdY1V...:マイニングプール

1JCXSd9L8...��:ギャンブリング

•168SKtdY1V...•1BUEGKXuN...• ...

Bitcoin�Blockchain •1NjnG69E8y...•14SWYt7Diq...• ...

•1JCXSd9L8...•197udecm...• ...

2.�アドレス・クラスタリング同⼀ユーザが保持する複数のBitcoinアドレスを推定

データセット:Webから収集し,マニュアルでラベル付加した計26,313件のBitcoinアドレス識別器:Random�Forests�(#Trees�=�100)評価項⽬:10-fold 交差検証で求めた正答率 (サービス毎にBitcoinアドレスを正しく識別した割合)

取引所 ギャンブル フォセットマーケットプレイス 投資詐欺ロンダリングマイニングプール

取引所 フォセット ギャンブル 投資詐欺 マーケットプレイス ロンダリング マイニングプール取引所 0.41 0.04 0.14 0.12 0.17 0.05 0.06フォセット 0.04 0.80 0.04 0.09 0 0 0.03ギャンブル 0.10 0.06 0.54 0.15 0.11 0 0.05投資詐欺 0.04 0.12 0.09 0.72 0.01 0 0.02マーケットプレイス 0.05 0 0.08 0 0.85 0.02 0ロンダリング 0.02 0 0 0 0.04 0.94 0.01マイニングプール 0.12 0.09 0.06 0.03 0 0.01 0.70

Page 2: 取引履歴の解析に基づくBitcoinのサービス 識別⼿ …取引履歴の解析に基づくBitcoinのサービス 識別 法 慶應義塾 学理 学部情報 学科豊 健太郎/toyoda@ics.keio.ac.jp

Bitcoinの取引履歴の時系列解析:Pirate@40の⾼利息投資プログラムの例

慶應義塾⼤学理⼯学部情報⼯学科豊⽥健太郎 /�[email protected]

特性評価

提案⼿法:Bitcoinの取引履歴の時系列解析⼿法 [2]

研究背景

異常検知により検知すべき主なイベント:1. 2011年12⽉17⽇ ホームページを公開2. 2012年 4⽉10⽇ BTCST�(Bitcoin�Saving�&�Trust)と名称変更3. 2012年 7⽉2⽇ 週利を7%から5%に引き下げ4. 2012年 7⽉23⽇ Pirate@40から最後の投稿5. 2012年 8⽉26⽇ 配当を停⽌

3.�取引履歴の抽出推定したBitcoinアドレスが含まれる取引履歴を抽出

Bitcoin�Blockchain

•1JCXSd9L8...•197udecm...•...

2.�アドレス・クラスタリング分析対象アドレスのユーザが保持する複数のBitcoinアドレスを推定

• Bitcoinはアドレス間で送⾦を⾏う仮想通貨として急速に普及しています

• Bitcoinアドレスの作成は個⼈情報を必要としないため,違法商品の取引決済,投資詐欺 (⾼利息投資プログラム)などに悪⽤されるケースが報告されています

• そこでフォレンジクスの観点から,分析対象のBitcoinアドレスが含まれる取引履歴を時系列解析し,取引の傾向の変化度を算出する⼿法が求められています

1.�分析対象アドレスの決定アドレス:1JCXSd9L8...

Web

site

was

up

Ren

amed

to B

TCST

Rul

e ch

ange

d

Fina

l pos

t by

Pira

te@

40

Def

unct

0.3

0.6

0.9

1.2

2011−112011−1

22012−0

12012−0

22012−0

32012−0

42012−0

52012−0

62012−0

72012−0

82012−0

9

Date

Scor

e

010203040

2011−1

1201

1−12201

2−01201

2−02201

2−03201

2−04201

2−05201

2−06201

2−07201

2−08201

2−09

Date

Value

0.0

0.2

0.4

2011−1

1201

1−12201

2−01201

2−02201

2−03201

2−04201

2−05201

2−06201

2−07201

2−08201

2−09

Date

Value

0.000.250.500.75

2011−1

1201

1−12201

2−01201

2−02201

2−03201

2−04201

2−05201

2−06201

2−07201

2−08201

2−09

Date

Value

0.250.500.751.00

2011−1

1201

1−12201

2−01201

2−02201

2−03201

2−04201

2−05201

2−06201

2−07201

2−08201

2−09

Date

Value

4.�取引履歴の特徴量を時系列で抽出取引の特徴抽出(取引頻度,送受の割合,…)�をウィンドウ毎に算出

5.�取引の異常度を算出複数の特徴から変化度(異常度)を算出

特徴量1

特徴量2

異常度

[1] R. Jiang et al., “Anomaly Localization for Network Data Streams with Graph Joint Sparse PCA,” in ACM KDD 2011.[2] K. Toyoda et al., “Time Series Analysis for Bitcoin Transactions: The Case of Pirate@40's HYIP Scheme,” in IEEE ICDMW 2018.

Pirate@40の取引履歴から算出した4つの特徴量の時系列変化

4つの特徴量から⼿法[1]で算出した異常度の変化と5つのイベント

Source: The Wall Street Journal,

Pirate@40の⾼利息投資プログラムとは:• ハンドルネーム (Pirate@40)による投資詐欺

• 週利7%の⾼利息投資プログラム• 2011年11⽉にFirst�Pirate�Saving�&�Trustとして登場

• 2012年8⽉に利息の配当を停⽌• 2013年,⽶国SECが告発