metaseq: rna-seqデータにおけるメタアナリシス解析パッケージ

16
metaSeq: RNA-seqデータにおける メタアナリシス解析パッケージ [email protected]#9

Upload: antiplastics

Post on 07-May-2015

1.160 views

Category:

Documents


6 download

TRANSCRIPT

Page 1: metaSeq: RNA-seqデータにおけるメタアナリシス解析パッケージ

metaSeq: RNA-seqデータにおけるメタアナリシス解析パッケージ

[email protected]#9

Page 2: metaSeq: RNA-seqデータにおけるメタアナリシス解析パッケージ

自己紹介名前: 露崎弘毅 (つゆざき こうき)所属: 東京理科大学大学院 薬学研究科 D2専門: バイオインフォマティクス、システムバイオロジー

緑膿菌バイオフィルム形成

抗生物質

薬物耐性?

Page 3: metaSeq: RNA-seqデータにおけるメタアナリシス解析パッケージ

BioCHackathon

@antiplastics

@dritoshi @chikudaisei

@chalkless

ItoshiNikaido

RIKEN

GotaMorota

UW-medison

KokiTsuyuzaki

TUS

TakeruNakazato

DBCLS

Bioconductorのパッケージを開発するハッカソン

Page 4: metaSeq: RNA-seqデータにおけるメタアナリシス解析パッケージ

遺伝子アノテーション

ゲノムワイドな実験(オミックス)

RNA-seqChIP-seq

DNA MicroarraySNP array

CAGESAGE

自分が興味ある遺伝子のリスト

HNRNPRZNF436TFEA3ASAP3E2F2ID3

GALEHMGCLFUCA1CNR2

...

アノテーション = 注釈をつける

こいつらは一体何者?

どんな機能に関わっているか

どこのパスウェイか

どんな転写因子結合サイトを有するか

Page 5: metaSeq: RNA-seqデータにおけるメタアナリシス解析パッケージ

MeSHMedical Subject Headings

PubMedの注釈情報

Page 6: metaSeq: RNA-seqデータにおけるメタアナリシス解析パッケージ

MeSHによる遺伝子アノテーション

2344562123521515535153155123135761646667

...

CancerStem CellInternetSoftware

USA...

Gene PubMed MeSH

HNRNPRZNF436TFEA3ASAP3E2F2

...

GeneとMeSHを対応づける

gendoogene2pubmed

LicensedPubMed

Page 7: metaSeq: RNA-seqデータにおけるメタアナリシス解析パッケージ

これまで開発に携わったパッケージ

MeSH.db: MeSHデータ全般

org.MeSH.XXX.db: 119生物種のGeneID-MeSHIDの対応関係

meshr: MeSHエンリッチメント解析

metaSeq: RNA-seqメタアナリシス

MeSH関連

Page 8: metaSeq: RNA-seqデータにおけるメタアナリシス解析パッケージ

今後の予定

metaSeqはBioconductor2.13 (2013/10/15)に公開

MeSH関連はBioconductor 2.14 (2014/4/XX) にて公開予定

JSBi2013 (2013/10/29-31)でmetaSeqはポスター発表で、MeSHR関連については、BioHackコンペディションhttps://github.com/dbcls/jsbi2013/wiki/BioHackにて話す予定

Page 9: metaSeq: RNA-seqデータにおけるメタアナリシス解析パッケージ

RNA-seq (1/2)

© 2011 DBCLS Licensed under CC 表示 2.1 日本

次世代シーケンサー(NGS)

シーケンシング

マッピング

定量化参照ゲノム

e.g., hg19 (UCSC), GRCh37 (Ensembl)

... ATGCATGCTACGAAGCT ...

GCTACGAA

GCTACGAA

Gene XのmRNA

PCR増幅断片化

AAAAAAAAAA

GCTGTACACGTCAAACTC

CAGCTGCAC ACACTGCACCCCACACTTTGCATGCTA

CTCAGAAC

Gene Xには2つのリードがマップされた!

TGCATGCTA

ショートリード

Page 10: metaSeq: RNA-seqデータにおけるメタアナリシス解析パッケージ

RNA-seq (2/2)

統計解析

DESeqedgeR

cuffdiff ...

© 2011 DBCLS Licensed under CC 表示 2.1 日本

対象群 (無処置) 処置群 (薬物投与)

C_1 C_2 C_3 T_1 T_2 T_3

1/2-BSRNA4 2 1 2 1 3 4

A1BG 0 2 1 0 0 1

A1BG-AS1 23 12 42 1 2 4

ZZZ3 12 12 32 124 104 96

tAKR 21 32 41 10 12 58

p-value

0.67

0.35

0.04

0.02

0.11

q-value

0.53

0.32

0.020

0.012

0.25

FDR制御

BHQ-value

LFDR

e.g., 30000行 (遺伝子数) × 6列 (サンプル数) 発現変動遺伝子 (DEGs)(q < 0.1)

Page 11: metaSeq: RNA-seqデータにおけるメタアナリシス解析パッケージ

“meta”-analysisとは?meta-analysis = analysis of analysis

どのデータからも検出される再現性が高いDEGsを取得する事ができる

C_1 C_2 C_3 T_1 T_2 T_31/2-

BSRNA42 1 2 1 3 4

A1BG 0 2 1 0 0 1A1BG-AS1 23 12 42 1 2 4

ZZZ3 12 12 32 124 104 96tAKR 21 32 41 10 12 58

C_1 C_2 C_3 T_1 T_2 T_31/2-

BSRNA43 2 1 2 2 4

A1BG 0 5 4 1 1 2A1BG-AS1 19 10 31 3 4 4

ZZZ3 32 21 31 86 35 64tAKR 21 46 24 14 56 21

C_1 C_2 C_3 T_1 T_2 T_31/2-

BSRNA43 4 6 2 5 3

A1BG 4 2 2 3 2 2A1BG-AS1 21 21 36 5 5 4

ZZZ3 21 21 25 152 135 112tAKR 20 30 41 21 21 53

+ +

StudyA StudyB StudyC

DEGs

出所が異なる(e.g., 異なる機関)から出たRNA-seqデータを統合して解析する

Page 12: metaSeq: RNA-seqデータにおけるメタアナリシス解析パッケージ

p値の統合Fisher’s method

p1p2p3p4

meta-p統合 Χ^2検定

Page 13: metaSeq: RNA-seqデータにおけるメタアナリシス解析パッケージ

w1 × Z1

Stouffer’s method(重み付け有り)

p値の統合

p1p2p3p4

Z1Z2Z3Z4

w2 × Z2w3 × Z3w4 × Z4

meta-p統合 Z検定

Z

重み付け変換

サンプルサイズによる重み付け

Page 14: metaSeq: RNA-seqデータにおけるメタアナリシス解析パッケージ

乳癌データにおけるエンリッチメント解析の結果

4つの乳癌研究のメタアナリシス

データによっては有意にならないものもある

統合によりどのデータでも安定して有意にできている

Page 15: metaSeq: RNA-seqデータにおけるメタアナリシス解析パッケージ

パッケージ化NOISeq

metaSeq

Page 16: metaSeq: RNA-seqデータにおけるメタアナリシス解析パッケージ

まとめ

メタアナリシスとは複数の研究データの統合解析

metaSeqでRNA-seqのメタアナリシスができる

Bioconductor page : http://www.bioconductor.org/packages/devel/bioc/html/metaSeq.html

GitHup page : https://github.com/kokitsuyuzaki/metaSeq