イタリアでパスタを食べた話
DESCRIPTION
NPCA LT 2014/07/17TRANSCRIPT
イタリアでパスタを食べた話
Hiromu Yakura
10時間7時間
ドバイ5時間
4時間 合計 26時間
San Lorenzo in Banale
•トレンティーノ=アルト・アディジェ州
•スイスとかオーストリアと隣接
•山間の小さな町
イタリアのいいところ
•ピザがうまい
イタリアのいいところ
•ピザがうまい
•ジェラートがうまい
1.5 ユーロ(200円)
イタリアのいいところ
•ピザがうまい
•ジェラートがうまい
•パスタがうまい
tagliatelle
genovese
penne
rigatoni
farfalle
tortellini
cannelloni
lasagne
gnocchi
イタリアのいいところ
•ピザがうまい
•ジェラートがうまい
•パスタがうまい
イタリアのいいところ
•ピザがうまい
•ジェラートがうまい
•パスタがうまい
•飽きる
フローチャート開始
サラダを食べたい
パスタを食べる
まだ食べたい
メインディッシュを食べる
まだ食べたい
デザートを食べる
オリーブオイルとバルサミコ酢でサラダを食べる
注いでもらう
注いでもらう
フローチャート開始
サラダを食べたい
パスタを食べる
まだ食べたい
メインディッシュを食べる
まだ食べたい
デザートを食べる
オリーブオイルとバルサミコ酢でサラダを食べる
注いでもらう
注いでもらう
フローチャート開始
サラダを食べたい
パスタを食べる
まだ食べたい
メインディッシュを食べる
まだ食べたい
デザートを食べる
オリーブオイルとバルサミコ酢でサラダを食べる
注いでもらう
注いでもらう毎食必ず
パスタが出る
パスタに飽きる
• 20泊滞在
•ランチとディナーで毎回パスタが出る
パスタに飽きる
• 20泊滞在
•ランチとディナーで毎回パスタが出る
•40食ほど食べた
まとめ
•イタリアに行く時はパスタを毎日食べる覚悟をする
•めっちゃしぇかが食べたくなる
•インスタントのとんこつラーメンとか持っていくとよかったかも
•ジェラートとピザはうまい
閑話休題
イタリアでしたこと
•講義 (1.5週間)
• Web Development Hands-on
• Bioinformatics
•開発 (1.5週間)
Bioinformatics
•生命情報科学
• Biology + Informatics
Bioinformatics
•生命情報科学
• Biology + Informatics (安易な発想)
Bioinformatics
•生命情報科学
• Biology + Informatics (安易な発想)
•今回扱ったのは,特にmetagenomics
ヒトゲノム計画
• 1990年にアメリカ政府が発表したプロジェクト
•人間の遺伝子データをすべて解析する
• 15年での完了を目標とする
ヒトゲノム計画
• 1990年にアメリカ政府が発表したプロジェクト
•人間の遺伝子データをすべて解析する
• 15年での完了を目標とする
• 2000年に完了がアナウンスされた
•ショットガン・シークエンス法
ショットガン・シークエンシング法
•長いRNA配列を読み取るための方法
•前提
•読み取れるRNAの長さには制限がある
• RNAの複製は簡単
ショットガン・シークエンシング法
T A A G C G C A A T A G T T A C G A
ショットガン・シークエンシング法
T A A G C G C A A T A G T T A C G A
T A A G C G C A A T A G T T A C G A
ショットガン・シークエンシング法
T A A G C G C A A T A G T T A C G A
T A A G C G C A A T A G T T A C G A
T A A G C G C A A T A G
T T A C G A
ショットガン・シークエンシング法
T A A G C G C A A T A G T T A C G A
T A A G C G C A A T A G T T A C G A
T A A G C G C A A T A G
T T A C G A
T A A G C G
C A A T A G T T A C G A
ショットガン・シークエンシング法
T A A G C G C A A T A G
T T A C G A
T A A G C G
C A A T A G T T A C G A
ショットガン・シークエンシング法
T A A G C G C A A T A G
T T A C G A
T A A G C G
C A A T A G T T A C G A
部分列が一致している
ショットガン・シークエンシング法
T A A G C G C A A T A G
T T A C G A
T A A G C G
C A A T A G T T A C G A
ショットガン・シークエンシング法
T A A G C G C A A T A G
T T A C G A
T A A G C G
C A A T A G T T A C G A
次の配列はCAATAGから始まるっぽい
ショットガン・シークエンシング法
T A A G C G C A A T A G
T T A C G A
T A A G C G
C A A T A G T T A C G A
次の配列はCAATAGから始まるっぽい
ショットガン・シークエンシング法
T A A G C G C A A T A G
T T A C G A
T A A G C G C A A T A G T T A C G A
次の配列はCAATAGから始まるっぽい
ショットガン・シークエンシング法
T A A G C G C A A T A G
T T A C G A
T A A G C G C A A T A G T T A C G A
ショットガン・シークエンシング法
T A A G C G C A A T A G
T T A C G A
T A A G C G C A A T A G T T A C G A
次の配列はTTACGAから始まるっぽい
ショットガン・シークエンシング法
T A A G C G C A A T A G
T T A C G A
T A A G C G C A A T A G T T A C G A
次の配列はTTACGAから始まるっぽい
ショットガン・シークエンシング法
T A A G C G C A A T A G T T A C G A
T A A G C G C A A T A G T T A C G A
次の配列はTTACGAから始まるっぽい
ショットガン・シークエンシング法
T A A G C G C A A T A G T T A C G A
T A A G C G C A A T A G T T A C G A
DNA配列の復元ができた
ショットガン・シークエンス法
•神
•実際のケースでは数百万もの断片をつなげる
ショットガン・シークエンス法
•神
•実際のケースでは数百万もの断片をつなげる
計算量爆発
ショットガン・シークエンス法
•神
•実際のケースでは数百万もの断片をつなげる
計算量爆発
アプローチを考えてみる
•接尾辞と接頭辞がつながっているものを探していく
アプローチを考えてみる
•接尾辞と接頭辞がつながっているものを探していく
•さっきの例
T A A G C G C A A T A G
C A A T A G T T A C G A
アプローチを考えてみる
•接尾辞と接頭辞がつながっているものを探していく
•さっきの例
T A A G C G C A A T A G
C A A T A G T T A C G A
接尾辞
接頭辞
アプローチを考えてみる
•簡単なサンプルを考えてみる
•すべての断片の長さは6
•共通する接(頭|尾)辞が2以上ならつなげる
A A T T A C
A C G A A G
A C T A G G
A G A C A A
G C C T A C
アプローチを考えてみる
•とりあえずグラフに落としこむ
接頭辞と接尾辞で辺を張る
ハミルトンパス
ハミルトンパス
•与えられたグラフのすべての頂点を1度だけ通る閉路
•同じ辺を2回通ってはいけない
•通らない辺があってもよい
ハミルトンパス
ちょっと待った
ハミルトンパス
• NP完全
ハミルトンパス
•NP完全
ハミルトンパス
•NP完全
ハミルトンパス
•NP完全
おそい
de Bruijn Graph
•まず,すべての断片をk配列ずつに分ける
k = 2の場合
de Bruijn Graph
•同じ頂点を連結する
de Bruijn Graph
•すべての辺を1度だけ通るパスを見つける
GC-CC-CT-TA-AC-CA-AA-AG-GA-AC-CG-GA-AA
元の配列: GCCTACAAGACGAA
何が嬉しいのか
•すべての辺を1度だけ通るパス
•オイラーパス
何が嬉しいのか
•すべての辺を1度だけ通るパス
•オイラーパス
• O(E)
何が嬉しいのか
•すべての辺を1度だけ通るパス
•オイラーパス
•O(E)
何が嬉しいのか
•すべての辺を1度だけ通るパス
•オイラーパス
•O(E)
de Bruijn Graph
• Next Generation Sequencingを支える重要なアルゴリズム
•こういったアルゴリズムを必要としない短いDNAだけを対象とするアプローチも
• 16S Sequencing
•リボソームに含まれる16S RNAを解析
まとめ
• RNA解析にもアルゴリズムが重要
•機械学習などもBioinformaticsではすごく使われてる
•何百万もの微生物の分布をRNA解析で調べそのデータを元にClassificationとか
•こういった場合は,特徴量が多すぎるのでFeature Rankingが重要になってくる
おまけ: 開発したものの話
Children Omics Dysbiosis Evaluation System
•シーケンサーからの生データをアップロードして
•自動で微生物群の分布を解析して
•機械学習で解析 & ビジュアライゼーション
•腸内細菌感染症の診断
新規性
•すべてAmazon EC2にデプロイ
• Master Serverでジョブ管理
• Slave Serverで計算処理
•オンデマンドでSlaveサーバーを増やせる
新規性
•新しいビジュアライゼーション
• three.jsで系統樹を表現
• Oculus Riftを主成分分析にインテグレート
担当した部分
•システム設計
•クラウドデプロイ
•分散システム
•サーバー設定
さいごに
イタリア人
イタリア人
スクフェスサイコー
イタリア人
スクフェスサイコー
お前ラブライブ見てないとかまじかよ
イタリア人
なんで日本人の癖にエヴァみてないの,正気?
イタリア人
なんで日本人の癖にエヴァみてないの,正気?
お前,日本帰ったらかならずエヴァ見ろよ
イタリア人
なんで日本人の癖にエヴァみてないの,正気?
お前,日本帰ったらかならずエヴァ見ろよ
lain面白いよねエヴァの次にいいアニメ
結論
•海外に長期滞在する前に日本文化に詳しくなっておこう
•エヴァンゲリオン
•ラブライブ
•serial experiments lain
参考資料
• http://gcat.davidson.edu/phast/#methods
• https://webvalley.fbk.eu/static/media/uploads/presentations/16sequencing_webvalley.pptx
• http://webvalley.fbk.eu/static/media/uploads/presentations/shotgun_metagenomics.pptx
• http://webvalley.fbk.eu/static/media/uploads/presentations/Microbial%20Genome%20Assembly.pptx
• http://d.hatena.ne.jp/hoxo_m/20100930/p1