初めてのrna-seq解析 - filgen, inc....rna-seq解析...

42
初めてのRNA-Seq解析 ~ROSALINDを使用したNGSデータクラウド解析~ フィルジェン株式会社 バイオインフォマティクス部 ([email protected]) 2019.5

Upload: others

Post on 15-Mar-2020

1 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: 初めてのRNA-Seq解析 - Filgen, Inc....RNA-seq解析 次世代シークエンサー(NGS)を使用して、生物学的サンプル中のRNAの存在と量を明らかにする手法

初めてのRNA-Seq解析~ROSALINDを使用したNGSデータクラウド解析~

フィルジェン株式会社 バイオインフォマティクス部

([email protected])

2019.5

Page 2: 初めてのRNA-Seq解析 - Filgen, Inc....RNA-seq解析 次世代シークエンサー(NGS)を使用して、生物学的サンプル中のRNAの存在と量を明らかにする手法

RNA-seq解析

次世代シークエンサー(NGS)を使用して、生物学的サンプル中のRNAの存在と量を明らかにする手法

大量のデータの処理が必要

コマンドラインや多くのパラメータ設定などバイオインフォマティクス知識が必要

解析のために高度なスペックのPCが必要

多くの解析ツール使用すると時間がかかる

はこれらの課題をクリア

Page 3: 初めてのRNA-Seq解析 - Filgen, Inc....RNA-seq解析 次世代シークエンサー(NGS)を使用して、生物学的サンプル中のRNAの存在と量を明らかにする手法

ROSALINDとは・バイオインフォマティクススキルを使用せずに、データセットを分析して解釈するために設計されたゲノム解析プラットフォーム

・RNA-Seq解析やChIP-Seq、Small RNA-seqをはじめとしたサービスを展開

BioIT-World 2018で「People's Choice - Best of Show」賞を受賞

バイオインフォマティクススキルは不要

NGSデータクラウド解析サービス

ライフサイエンス業界向けの革新的な製品ソリューションの中で最高のものを表彰

実験設計から解釈までをパイプライン化

サンプルの情報入力とシークエンスデータのインポートだけでパスウェイ・疾患・GOなど様々な結果を同時解析!

高スペックPCは不要

解析はクラウド型で高速に計算され一度に様々なデータ解釈を得られるので時間も短縮

さらにWeb解析ツールなのでインターネット環境があればログイン可能

最小限の費用で解析

解析は回数制。必要に応じた解析回数でOK

ご自身でのNGS解析や受託解析等と組み合わせることでユーザーに合わせたデータ解釈を得ることが可能

Page 4: 初めてのRNA-Seq解析 - Filgen, Inc....RNA-seq解析 次世代シークエンサー(NGS)を使用して、生物学的サンプル中のRNAの存在と量を明らかにする手法

解析ワークフロー

Uploding Data

ROSALINDは、サンプルの情報入力とシークエンスデータ(Fastq)のインポートを行うだけで、簡単にシークエンスデータの生物学的意義を調べることができます。

QC Check

ROSALIND はすべての実験で補完的かつ視覚的なQCレポートを提供します。直感的なQCグラフとコンタミネーション検出レポートを使用してサンプルの品質を確認したら、サンプルあたりの小額の料金を支払って実験のロックを解除し、分析データの統計処理を開始します。

Differential Expression Analysis

RNA-seqの全経路、疾患およびGene ontologyを用いて、トランスクリプトーム解釈についてのより深い洞察を得ることができます。さらに他の同僚、チーム、機関とデータを共有することもできます。

RNA-seq配列データ

(Fastq)

Page 5: 初めてのRNA-Seq解析 - Filgen, Inc....RNA-seq解析 次世代シークエンサー(NGS)を使用して、生物学的サンプル中のRNAの存在と量を明らかにする手法

Uploding Data

On EXPERIMNT

実験データについて情報を入力します。実験名や生物種、ライブラリー調整に使用したキット名を記入します。

On SAMPLE

個々のサンプルについて情報を入力します。サンプル名やその属性、グループ分けなど

Page 6: 初めてのRNA-Seq解析 - Filgen, Inc....RNA-seq解析 次世代シークエンサー(NGS)を使用して、生物学的サンプル中のRNAの存在と量を明らかにする手法

Uploding Data

On ANALYSIS

解析条件を入力します。属性、グループ分けなどの条件より統計解析の際比較する条件設定やファイルのアップロードを実行できます。

✔単純な生物学的な質問に答えることで、解析準備が整います。

Page 7: 初めてのRNA-Seq解析 - Filgen, Inc....RNA-seq解析 次世代シークエンサー(NGS)を使用して、生物学的サンプル中のRNAの存在と量を明らかにする手法

Uploding Data On EXPERIMNT

実験名と実験内容について入力 解析内容を選択

解析内容:RNA-seqは次世代シークエンサーより出力される生データ(FASTQ)を読み取るかすでに発現値が算出された表を読み込み解析する解析(Processed Counts)が選択できます。

またNanoString社のnCounterのパネル解析より得られたシークエンスデータ解析も可能です。

Page 8: 初めてのRNA-Seq解析 - Filgen, Inc....RNA-seq解析 次世代シークエンサー(NGS)を使用して、生物学的サンプル中のRNAの存在と量を明らかにする手法

Uploding Data On EXPERIMNT

生物種とゲノムビルドを選択します。対応生物種は弊社HPにて紹介しています。

ライブラリー調整に使用した

・キットのメーカー・製品名・製品ロット

を入力します。

Page 9: 初めてのRNA-Seq解析 - Filgen, Inc....RNA-seq解析 次世代シークエンサー(NGS)を使用して、生物学的サンプル中のRNAの存在と量を明らかにする手法

Uploding Data On EXPERIMNT

Replicateの有無全サンプル数を入力します。

サンプルの属性を選択します。

※Replicateは反復するデータ数(n数)を意味し全サンプル中に存在するかの有無を選択します。

control

Test

n=3

n=3

Replicate 【 Yes 】

処理年齢動物モデルバッチ細胞株投与量病期健康状態表現型性別タイムコース

など様々な属性を複数組み合わせることで次の群分けの項目でスムーズに分けることができます。

Page 10: 初めてのRNA-Seq解析 - Filgen, Inc....RNA-seq解析 次世代シークエンサー(NGS)を使用して、生物学的サンプル中のRNAの存在と量を明らかにする手法

Uploding Data On SAMPLE

サンプル名と実験室内でのサンプル名の入力します。

-Sample Name:サンプル名-Laboratory Identifier:研究室でのサンプル名・番号など

Replicateの選択します。

control

Test

Page 11: 初めてのRNA-Seq解析 - Filgen, Inc....RNA-seq解析 次世代シークエンサー(NGS)を使用して、生物学的サンプル中のRNAの存在と量を明らかにする手法

Uploding Data On SAMPLE

1サンプルずつ属性に対しての情報を入力します。このメタデータは、次に出てくる群分けに不可欠です。

例)control-Test など

これまで指定したサンプルデータが表示されます。データを確認後次のステップに移ります。

Page 12: 初めてのRNA-Seq解析 - Filgen, Inc....RNA-seq解析 次世代シークエンサー(NGS)を使用して、生物学的サンプル中のRNAの存在と量を明らかにする手法

Uploding Data On ANALYSIS

ドラッグアンドドロップでデータセットを作成します。前項目で作成した属性を加えることで簡単に群分けができます。もちろん、サンプルを個々に指定して群分けすることもできます。

比較のためのデータセットを作成します。

作成後次のステップに進みます。

Page 13: 初めてのRNA-Seq解析 - Filgen, Inc....RNA-seq解析 次世代シークエンサー(NGS)を使用して、生物学的サンプル中のRNAの存在と量を明らかにする手法

Uploding Data On ANALYSIS

データをアップロードします。

FASTQ、GZ、およびGZIPファイルに対応しています。

✔単純な生物学的な質問に答えることで、解析準備が整います。

クリックしデータを選択することでデータのアップロードがスタートします。

シングルエンド・ペアエンドを選択

Page 14: 初めてのRNA-Seq解析 - Filgen, Inc....RNA-seq解析 次世代シークエンサー(NGS)を使用して、生物学的サンプル中のRNAの存在と量を明らかにする手法

解析ワークフロー

Uploding Data

ROSALINDは、サンプルの情報入力とシークエンスデータ(Fastq)のインポートを行うだけで、簡単にシークエンスデータの生物学的意義を調べることができます。

QC Check

ROSALIND はすべての実験で補完的かつ視覚的なQCレポートを提供します。直感的なQCグラフとコンタミネーション検出レポートを使用してサンプルの品質を確認したら、サンプルあたりの小額の料金を支払って実験のロックを解除し、分析データの統計処理を開始します。

Differential Expression Analysis

RNA-seqの全経路、疾患およびGene ontologyを用いて、トランスクリプトーム解釈についてのより深い洞察を得ることができます。さらに他の同僚、チーム、機関とデータを共有することもできます。

RNA-seq配列データ

(Fastq)

Page 15: 初めてのRNA-Seq解析 - Filgen, Inc....RNA-seq解析 次世代シークエンサー(NGS)を使用して、生物学的サンプル中のRNAの存在と量を明らかにする手法

QC Check

インポート時に設定した内容が表示されます。

解析が終了すると登録したメールアドレスに解析完了のメールが届きROSALINDのprojectに作成した実験データを閲覧できるようになります。

Page 16: 初めてのRNA-Seq解析 - Filgen, Inc....RNA-seq解析 次世代シークエンサー(NGS)を使用して、生物学的サンプル中のRNAの存在と量を明らかにする手法

QC Check

サンプル相関ヒートマップ

データ行、列にはサンプル間の相関値が含まれ、最も濃い青が最も強い相関を表します。

上軸の樹状図は、サンプルのクラスタリングを示します。密接に関連しているサンプル(つまり、同じReplicateグループ内のサンプル)

がプロット内で強く相関していること、および樹状図の最も近い部分であることがわかります。

バイオリンプロット

実験の各サンプルの正規化されていない遺伝子数の対数の分布を表示するために、ボックスプロットをバイオリンプロットに重ねています。

ボックスプロットは要約統計量のみをグラフ化しますが、バイオリンプロットはデータの実際の分布を示します。

Page 17: 初めてのRNA-Seq解析 - Filgen, Inc....RNA-seq解析 次世代シークエンサー(NGS)を使用して、生物学的サンプル中のRNAの存在と量を明らかにする手法

QC Check

ゲノム領域

このプロットは、マッピングされたリードがゲノム全体の遺伝子機能にどのように分布しているかを示しています。

含まれるゲノム領域は以下のとおりです。・5 'UTRエクソン(5' UTR)・遺伝子間領域・イントロン・3 'UTRエクソン(3' UTR)・タンパク質をコードするエクソン(Coding Exon)

MDSプロット

多次元尺度構成法(MDS)プロットは、一組のオブジェクト間の近接性(すなわち、類似性または距離)のパターンの視覚的表現です。この場合は、実験内のサンプル間の発現差をプロットします。

Page 18: 初めてのRNA-Seq解析 - Filgen, Inc....RNA-seq解析 次世代シークエンサー(NGS)を使用して、生物学的サンプル中のRNAの存在と量を明らかにする手法

QC Check

ファイルアップロード時に設定したサンプルを見ることができます。

生データやROSALINDで解析されたデータをサンプルごとにダウンロードできます。

注) Rawファイル(FASTQ / BAM)は実験が分析を完了した後30日間までダウンロード有効です。

✔ ✔

Page 19: 初めてのRNA-Seq解析 - Filgen, Inc....RNA-seq解析 次世代シークエンサー(NGS)を使用して、生物学的サンプル中のRNAの存在と量を明らかにする手法

QC Check

QC情報が確認できます。また、表のエクセルファイルのダウンロードが可能です。またQCの情報までは料金が発生しないので安心して解析に進むことができます。

確認できるQC情報は以下のとおりです。

・Reads サンプルに対するリードの合計数。・Q30 品質スコアが30以上の塩基の割合。この値はリード長さ全体にわたる平均であり、リードの終わりに向かってエラー率は増加します。・Reads Too Short トリミング後に短すぎたために破棄されたリード数の割合。・Bases Trimmed トリミングによって除去された塩基の数の割合。・Aligned 参照ゲノムに整列したトリミングされたリードの総数の割合。・Duplicates 重複している整列したリードの総数の割合。

✔ここまで無料で解析できます!

Page 20: 初めてのRNA-Seq解析 - Filgen, Inc....RNA-seq解析 次世代シークエンサー(NGS)を使用して、生物学的サンプル中のRNAの存在と量を明らかにする手法

解析ワークフロー

Uploding Data

ROSALINDは、サンプルの情報入力とシークエンスデータ(Fastq)のインポートを行うだけで、簡単にシークエンスデータの生物学的意義を調べることができます。

QC Check

ROSALIND はすべての実験で補完的かつ視覚的なQCレポートを提供します。直感的なQCグラフとコンタミネーション検出レポートを使用してサンプルの品質を確認したら、サンプルあたりの小額の料金を支払って実験のロックを解除し、分析データの統計処理を開始します。

Differential Expression Analysis

RNA-seqの全経路、疾患およびGene ontologyを用いて、トランスクリプトーム解釈についてのより深い洞察を得ることができます。さらに他の同僚、チーム、機関とデータを共有することもできます。

RNA-seq配列データ

(Fastq)

Page 21: 初めてのRNA-Seq解析 - Filgen, Inc....RNA-seq解析 次世代シークエンサー(NGS)を使用して、生物学的サンプル中のRNAの存在と量を明らかにする手法

Differential Expression Analysis

ロックを解除することでより詳細な実験結果を得ることができます。ロック解除には購入したユニットを使用します。

解除後は正規化データの表の閲覧・Differential Expression 結果の閲覧の選択画面に移ります。

使用可能なユニット数(この場合28ユニット) 今回の分析で必要なユニット数

(この場合6ユニット必要)

全てのサンプルの正規化されたデータの閲覧ができます。

発現変動のあった遺伝子について様々な視点から結果を閲覧することができます。

(比較のため2サンプル以上のデータが必要です。)

ロック解除前ロック解除後

Page 22: 初めてのRNA-Seq解析 - Filgen, Inc....RNA-seq解析 次世代シークエンサー(NGS)を使用して、生物学的サンプル中のRNAの存在と量を明らかにする手法

Differential Expression Analysis

NORMALIZED EXPRESSIONでは正規化されたすべての遺伝子の表を閲覧することができます。またカンマ区切りファイルでダウンロードも可能です。

任意の遺伝子を検索できます。

サンプル名遺伝子情報最上列をクリックすることで表の並べ替えができます。

Page 23: 初めてのRNA-Seq解析 - Filgen, Inc....RNA-seq解析 次世代シークエンサー(NGS)を使用して、生物学的サンプル中のRNAの存在と量を明らかにする手法

Differential Expression Analysis

このアイコンより各遺伝子の箱ひげ図を閲覧できます。Import時に設定した属性もしくはReplicateのグループ間で比較を行うことができます。

箱ひげ図の他、選択した遺伝子に対する各サンプルの正規化ごの発現量を棒グラフにしたデータを閲覧できます。

pig形式で図を保存できます。

Page 24: 初めてのRNA-Seq解析 - Filgen, Inc....RNA-seq解析 次世代シークエンサー(NGS)を使用して、生物学的サンプル中のRNAの存在と量を明らかにする手法

Differential Expression Analysis

✔Differential Expression 結果では様々な視点からデータの解釈が可能です。

発現変動のあった遺伝子リスト 選択した遺伝子の詳細結果 変動のあった遺伝子の様々なデータベース詳細結果

Page 25: 初めてのRNA-Seq解析 - Filgen, Inc....RNA-seq解析 次世代シークエンサー(NGS)を使用して、生物学的サンプル中のRNAの存在と量を明らかにする手法

Differential Expression Analysis

✔発現変動のあった遺伝子リストでは遺伝子の並べ替えやフィルターによる調節ができます。

GROUP BYよりクラスターによる表示に切り替えることができます。

SORT BYより並べ替えの条件を変更することができます。

FILTERの⊕より新たなフィルターを作成できます。フィルターは・フィルター名・上下方調整の数値・p-Adjもしくはp-Valueの値 を設定できます。APPLYをクリック後SAVE&RUN ANALYSISで設定したフィルターが保存されます。

フィルターは作成後保存され別の解析に使用することもできます。

Page 26: 初めてのRNA-Seq解析 - Filgen, Inc....RNA-seq解析 次世代シークエンサー(NGS)を使用して、生物学的サンプル中のRNAの存在と量を明らかにする手法

Differential Expression Analysis

画面下の表示では簡単な遺伝子の情報が表示されます。

フィルターの条件と変動のあった遺伝子遺総数

現在選択している遺伝子名

Fold ChangeとP-Adj

現在選択している遺伝子の説明

ボルケーノプロット・MAプロット選択した遺伝子のプロットが大きく表示されます。

正規化リストと同様に選択した遺伝子に対して

発現量の棒グラフ、箱ひげ図が表示されます。

PNG、SVGファイルでダウンロードできます。

Page 27: 初めてのRNA-Seq解析 - Filgen, Inc....RNA-seq解析 次世代シークエンサー(NGS)を使用して、生物学的サンプル中のRNAの存在と量を明らかにする手法

Differential Expression Analysis

PNG、SVGファイルでダウンロードできます。

ヒートマップ選択した遺伝子に該当するレーンが赤く表示されます。

様々なデータベースへのアクセスパスウェイ・Gene ontology・タンパク質など様々なデータベースにアクセスできます。ここでは関連するTop5の結果が表示されます。

Page 28: 初めてのRNA-Seq解析 - Filgen, Inc....RNA-seq解析 次世代シークエンサー(NGS)を使用して、生物学的サンプル中のRNAの存在と量を明らかにする手法

Differential Expression Analysis

パスウェイ解析

様々なデータベースへのアクセス先よりパスウェイ解析が実行できます。

現在(19.6)下記のパスウェイ検索が可能です。

・WikiPathways

・Kegg(アカデミックユーザー限定)

・REACTOME

・BIOCYC

虫メガネアイコンを選択するとより詳細な結果を見ることができます。

Page 29: 初めてのRNA-Seq解析 - Filgen, Inc....RNA-seq解析 次世代シークエンサー(NGS)を使用して、生物学的サンプル中のRNAの存在と量を明らかにする手法

Differential Expression Analysis

任意の経路を選択するとそれに対応する変動を示した遺伝子が左側のリストに表示されます。

Page 30: 初めてのRNA-Seq解析 - Filgen, Inc....RNA-seq解析 次世代シークエンサー(NGS)を使用して、生物学的サンプル中のRNAの存在と量を明らかにする手法

Differential Expression Analysis

虫メガネアイコンを選択するとデータベースの外部サイトにアクセスすることができます。WikiPathways・Keggの場合はROSALIND内で結果を表示することができます。

※Keggはアカデミックユーザーのみ使用可

Page 31: 初めてのRNA-Seq解析 - Filgen, Inc....RNA-seq解析 次世代シークエンサー(NGS)を使用して、生物学的サンプル中のRNAの存在と量を明らかにする手法

Differential Expression Analysis

WikiPathWay・Keggの場合ROSALIND内で表示することが可能です。発現のUP、DOWNや左側の遺伝子を選択することで遺伝子の強調表示が可能です。

※Keggはアカデミックユーザーのみ使用可

Page 32: 初めてのRNA-Seq解析 - Filgen, Inc....RNA-seq解析 次世代シークエンサー(NGS)を使用して、生物学的サンプル中のRNAの存在と量を明らかにする手法

Differential Expression Analysis

REACTOME

BIOCYC

Page 33: 初めてのRNA-Seq解析 - Filgen, Inc....RNA-seq解析 次世代シークエンサー(NGS)を使用して、生物学的サンプル中のRNAの存在と量を明らかにする手法

Differential Expression Analysis

PROTEINS

Protein Interactions

Interpro

PRINTSProsite

SMARTPfam

Gene3D

OTHER

Lipid Maps

MSigDB

Chromosome Location

GENE ONTOLOGYBiological Process、Cellular Component、Molecular Functionについて表示可能AmiGO 2を使用したGO検索

様々なデータベースで解析結果を解釈することができます。

Page 34: 初めてのRNA-Seq解析 - Filgen, Inc....RNA-seq解析 次世代シークエンサー(NGS)を使用して、生物学的サンプル中のRNAの存在と量を明らかにする手法

Differential Expression Analysis

ROSALINDはAdvaita社のiPathway Guideと連携しています。

iPathway Guideによるデータの閲覧も可能対応生物種:Homo sapiens、Mus musclus、Rattus norvegicus

様々なデータベースでの一覧よりADVAITA BIOINFORMATICSの選択後虫メガネアイコンを選択

ADVAITA社のページに移行するのでアカウントを作成後ログインします。

再度ROSALINDでADVAITAへアクセスする虫メガネアイコンを選択するとAdvaita社より共有のメールが届きます。

Page 35: 初めてのRNA-Seq解析 - Filgen, Inc....RNA-seq解析 次世代シークエンサー(NGS)を使用して、生物学的サンプル中のRNAの存在と量を明らかにする手法

Differential Expression Analysis

accept shareすることでROSALINDの解析データをiPathway Guideに表示させることができます。

iPathway Guide結果画面

Page 36: 初めてのRNA-Seq解析 - Filgen, Inc....RNA-seq解析 次世代シークエンサー(NGS)を使用して、生物学的サンプル中のRNAの存在と量を明らかにする手法

Differential Expression Analysis

パスウェイ検索

GO解析

Page 37: 初めてのRNA-Seq解析 - Filgen, Inc....RNA-seq解析 次世代シークエンサー(NGS)を使用して、生物学的サンプル中のRNAの存在と量を明らかにする手法

Differential Expression Analysis

病原検索

予測miRNA分析

Page 38: 初めてのRNA-Seq解析 - Filgen, Inc....RNA-seq解析 次世代シークエンサー(NGS)を使用して、生物学的サンプル中のRNAの存在と量を明らかにする手法

データの共有

プロジェクト単位でデータの共有が可能です。

共有したいプロジェクトを選択します。

Page 39: 初めてのRNA-Seq解析 - Filgen, Inc....RNA-seq解析 次世代シークエンサー(NGS)を使用して、生物学的サンプル中のRNAの存在と量を明らかにする手法

データの共有

共有先のメールアドレスを入力することで同じ実験結果を共有することができます。

Page 40: 初めてのRNA-Seq解析 - Filgen, Inc....RNA-seq解析 次世代シークエンサー(NGS)を使用して、生物学的サンプル中のRNAの存在と量を明らかにする手法

・バイオインフォマティクススキルを使用せずに、データ解析の全プロセスを解析することができます。

・高スペックPCなしで解析できます。

・サンプル回数制なので最小限の費用で解析可能プロジェクトや受託サービスと組み合わせてもご使用できます。

・本日のデモデータは以下より閲覧可能です。(登録なしで閲覧可能です。)

https://filgen.onramp.bio/explore

【弊社HP ROSALIND紹介ページ】

Page 41: 初めてのRNA-Seq解析 - Filgen, Inc....RNA-seq解析 次世代シークエンサー(NGS)を使用して、生物学的サンプル中のRNAの存在と量を明らかにする手法

同様な操作性でChIP-Seq・Small RNA-Seq解析が可能です。

利用料金も共通です。

ChIP-Seq

・ヒートマップ、TSSプロットノート、ピーク分布図、FRiPスコアなどのデータの視覚化・サンプル間のピーク検出比較ベン図、Binding Heatmap、モチーフ解析、Gene Ontology term enrichment検索・ChIP-Seq-Tracksによる柔軟なピークや染色体の表示

Small RNA-Seq

・正規化後の発現解析データの表による表示・ヒートマップ、MDSプロット、ボルケーノプロット,構造図などのデータ視覚化・予測される影響を受ける遺伝子の特定・検証された影響を受ける遺伝子のレビュー・病気と薬物の関連性の探索

Page 42: 初めてのRNA-Seq解析 - Filgen, Inc....RNA-seq解析 次世代シークエンサー(NGS)を使用して、生物学的サンプル中のRNAの存在と量を明らかにする手法

お問い合わせ先:フィルジェン株式会社

TEL 052-624-4388 (9:00~17:00)

FAX 052-624-4389

E-mail: [email protected]