sar精度70% その先へ

26
SAR 精精 70% 精精精精 @fmkz___

Upload: kazufumi-ohkawa

Post on 21-Feb-2017

956 views

Category:

Science


1 download

TRANSCRIPT

Page 1: SAR精度70% その先へ

SAR精度 70% その先へ

@fmkz___

Page 2: SAR精度70% その先へ

自己紹介

• 色々やります• インフォマティクスとビジュアライゼーションに興味がある

• 梅雨のエヴァコラボでモンストに飽きたけど最近のエヴァコラボ第二弾で復活w

Page 3: SAR精度70% その先へ
Page 4: SAR精度70% その先へ
Page 5: SAR精度70% その先へ

その先へ☆

Page 6: SAR精度70% その先へ

Deep Learningの何がアツイか?• 特徴の抽出をやってくれる

• (画像認識だと SIFTとか )cLogPとか職人がよく考えて構築した特徴量を使わなくても、もっとプリミティブなデータからうまく特徴量を学習してくれるのが一番大きいと思う。

Page 7: SAR精度70% その先へ

画像認識だと

http://www.slideshare.net/fullscreen/takmin/building-highlevelfeatures/1

Page 8: SAR精度70% その先へ

特徴量抽出を簡単に説明すると

次元の圧縮

Page 9: SAR精度70% その先へ

詳しくはこれを読むといい

Page 10: SAR精度70% その先へ

Merck Molecular Activity Challenge

Page 11: SAR精度70% その先へ

Kaggleのコンテスト

Page 12: SAR精度70% その先へ
Page 13: SAR精度70% その先へ

特徴量の抽出やってない…

Page 14: SAR精度70% その先へ

SVMと精度変わらんし、、、

Page 15: SAR精度70% その先へ

特徴量抽出で大きく精度改善するのかな?

データ見てみよう

Page 16: SAR精度70% その先へ

データを見る

Page 17: SAR精度70% その先へ

一万次元以上あるけどやたら疎

Page 18: SAR精度70% その先へ

多分これ

Page 19: SAR精度70% その先へ

AP and DP• AP–ペア(下の)–元素名、隣接した重原子の数、 π電子数により識別された原子

• DP–カチオンとかアニオンとかドナーとアクセプターの 7種の識別

Page 20: SAR精度70% その先へ

情報結構落ちてるんじゃないの?

この状況下で特徴量の抽出したとして精度が向上するかは非常に疑

Page 21: SAR精度70% その先へ

改めて SARにおける認識とは• 画像認識は画像の画素のベクトル (RGB)が与えられ認識する

• SARにおける認識は、化合物が与えられた場合にそれを何らかのベクトル表現として与え、それから認識する

• また、ヒトが似ている似ていないを判断するのではなく認識するのはタンパク質であるところも異なる

Page 22: SAR精度70% その先へ

分子認識

• 分子が認識するための特徴量抽出のための情報をインプットとして入力する必要があるんじゃないのか?

• グラフ情報でいいのか?

Page 23: SAR精度70% その先へ

重ね合わせの問題

• 実際にはタンパク質と化合物の結合状態を考慮する必要があるが

• 学習させる過程で解決するのか• インプットの段階でよろしくやっておくのか

• という問題も残る

Page 24: SAR精度70% その先へ

プリミティブな記述子?

• 量子化学計算から出てきた軌道の型とその係数をそのまま使うというのはどうだろうか?

• コンフォメーションの問題は残るが…–結合空間の静電場が特殊で、真空中では取らないコンフォメーションで結合していたりする

Page 25: SAR精度70% その先へ

SARでDeepLearningするには• Inputをどうするか?–重ね合わせの問題–効果的な特徴量抽出のできるような

• どういうモデルにするか–深さとか

Page 26: SAR精度70% その先へ

まとめ

• SARにおける DeepLearningは夢があると思う

• 次回は TensorFlowとか Chainerのハンズオンでもやりたい

• 誰かよろしくw