googlecolaboratory を用いた解析系の構築//qiita.com/tomo_makes/items/b3c60b10f7b25a0a5935...
TRANSCRIPT
Google Colaboratoryを用いた解析系の構築
Edited by Hiroaki Yoshinobu on 2018.2.9
※ブラウザはGoogle ChromeかFirefoxを推奨します(推奨されてます)
Colaboratory – Googleのサイトページはこちら
https://colab.research.google.com/notebooks/welcome.ipynb#recent=true
ノートブックへのリンクはこちらhttps://colab.research.google.com/notebook#fileId=1t-DagdULTQi9KaWBA98L50Tmvzpyk9or&scrollTo=5UeXDca2e74N
CRISPR-Cas9の標的サイトの同定にColaboratoryによる解析系を用いた場合
• 本解析例ではGT-Scan2 APIを共に用いている。
• データの前処理までの操作が簡潔になるようなAPIを選択して、Note book上でのデータ解析に移行すると合理的。
• APIが存在しない場合、40GBまでFreeなDisk spaceが与えられるため、gitや独自のサーバー上にAppをdeployしておき、頓用でDisk中にdownload/installするという解析も可能ではある。
https://qiita.com/tomo_makes/items/b3c60b10f7b25a0a5935
無償でGPUを使用した解析を行うことも可能
個人レベルではまず困らないほどの解析環境を提供してくれている。
複数セッションの使い分けが可能
個人 -> クラウドの移行期程度のレベルの解析時において非常に強力
一晩(12hrs)で前日荒らしまくった環境がリセットされる。
試行錯誤の爪痕
短時間で環境がresetされることの利点
• 解析系に応じてVirtual Machineを自分で用意する必要性がない。• 内部のパッケージのクラッシュが続いたことによる影響を自動で取り消せる。• 環境構築の練習になり、パッケージのマネジメント能力が身につく。
短時間で環境がresetされることの欠点
• いちいち構築しなおすのが面倒• 解析にかけられる時間が限られる(利点とも考えられるが)• 実行コマンドをノートブック上に残す必要があり、(再現するには)煩雑なノートとなる。