素人がdeep learningと他の機械学習の性能を比較してみた

15

Upload: motivic

Post on 20-Aug-2015

16.602 views

Category:

Data & Analytics


0 download

TRANSCRIPT

Page 1: 素人がDeep Learningと他の機械学習の性能を比較してみた
Page 2: 素人がDeep Learningと他の機械学習の性能を比較してみた

誰よお前?

•ツイッターID: @MOTIVIC_

•株式会社ALBERT 主任研究員

•代数幾何を使って因果推論の研究をしてるよ

•統計ゆるふわ勢

•機械学習はICMLにリジェクトくらったレベルの素人

かじゅある

ゆるふわツイートしてます

Page 3: 素人がDeep Learningと他の機械学習の性能を比較してみた

2012年位からDEEP LEARNINGが流行ってますね

前回のMLCTのLTでも出てましたし

Page 4: 素人がDeep Learningと他の機械学習の性能を比較してみた

特徴量抽出も自動でやってくれるので

画像、音声、言語などの分野で大活躍

しているようで

Page 5: 素人がDeep Learningと他の機械学習の性能を比較してみた

でも画像、音声、言語

のようなデータは扱っ

たことがないから凄さ

がよく分からないお…

Page 6: 素人がDeep Learningと他の機械学習の性能を比較してみた

だからもっと簡単な

(DEEP LEARNINGが

そもそも必要無さそう

な)データセットで性能

を調べてみたお!

Page 7: 素人がDeep Learningと他の機械学習の性能を比較してみた

まずは分類問題のHELLO WORLD

IRISデータ

Page 8: 素人がDeep Learningと他の機械学習の性能を比較してみた

KPIは?

•2-FOLD CROSS VALIDATIONでエラー率を計算

•ランダムにデータを半分に分割して上記の計算を

5,000回繰り返した

•RとH2Oでシミュレーションしたよ

Page 9: 素人がDeep Learningと他の機械学習の性能を比較してみた

比較した手法

•DEEP LEARNING(DL)

•CART

•RANDOM FOREST(RF)

•EXTREMELY RANDOMIZED TREES (ET)

•SVM

•NEURAL NETWORK(NN)

Page 10: 素人がDeep Learningと他の機械学習の性能を比較してみた

DEEP LEARNINGのパラメータはどう決めたんだよ?

活性化関数と

DROPOUTの部分

だけイジイジして他

はデフォルトだお

Page 11: 素人がDeep Learningと他の機械学習の性能を比較してみた

結果

Page 12: 素人がDeep Learningと他の機械学習の性能を比較してみた

BREAST CANCER データ

Page 13: 素人がDeep Learningと他の機械学習の性能を比較してみた

BREAST CANCER データ

•サンプルサイズは683

•データはこんな感じ

Clump

Thickness

Uniformity

of Cell

Size

Uniformity

of Cell

Shape

Marginal

Adhesion

Single

Epithelial

Cell Size

Bare

Nuclei

Bland

Chromatin

Normal

NucleoliMitoses Class

1-10 1-10 1-10 1-10 1-10 1-10 1-10 1-10 1-10 良性/

悪性

Page 14: 素人がDeep Learningと他の機械学習の性能を比較してみた

結果

Page 15: 素人がDeep Learningと他の機械学習の性能を比較してみた

まとめ

•DEEP LEARNINGは簡単な分類問題でも性能が良かった

•まじめにチューニングすればもっと性能上がると思うよ