i. ゲノミクス 01...- 2 - ゲノミクス de novoシーケンス解析 製品概要 de...

37
I. ゲノミクス ................................................................................................................ 01 1. De novo シーケンス解析 ............................................................................................................. 02 2. 全ゲノムリシーケンス解析 ......................................................................................................... 08 3. ヒト全ゲノムリシーケンス解析 (Illumina HiSeq X Ten) ............................................................. 10 4. エキソーム & ターゲット領域シーケンス解析 (Illumina HiSeq 2000........................................ 12 5. CGComplete Genomics)エキソーム解析 .............................................................................. 16 6. RAD-Seq 解析 ............................................................................................................................. 18 7. Optical Mapping .......................................................................................................................... 21 8. FFPE ゲノムシーケンス解析 ...................................................................................................... 23 9. Single cell シーケンス解析 .......................................................................................................... 25 10. 単純反復配列遺伝子座の開発...................................................................................................... 28 11. メタゲノム解析 ........................................................................................................................... 29 12. 16S rDNA 解析 (Illumina HiSeq 2000........................................................................................ 31 13. GBSGenotyping by sequencing............................................................................................. 33 14. PacBio RS II 次世代シーケンス解析 ........................................................................................... 35 II. トランスクリプトミクス .......................................................................................... 37 1. トランスクリプトームシーケンス解析 ........................................................................................ 38 2. RNA-Seq (Quantification) 解析.................................................................................................... 42 3. 真核 Small RNA 解析................................................................................................................... 44 4. MicroRNA および mRNA の統合解析 .......................................................................................... 47 5. FFPE RNA-Seq トランスクリプトーム解析 ............................................................................... 49 6. Long Non-Coding RNA シーケンス解析...................................................................................... 52 7. メタトランスクリプトミクス解析 .............................................................................................. 54 8. RIP-Seq 解析............................................................................................................................... 56 III. エピジェネティックス .............................................................................................. 58 1. 全ゲノム Bisulfite メチル化解析 .................................................................................................. 59 2. Reduced Representation Bisulfite Sequencing (RRBS).............................................................. 61 3. MeDIP-seq 解析 .......................................................................................................................... 63 4. ChIP-seq 解析 ............................................................................................................................. 65 IV. 付録........................................................................................................................... 67

Upload: others

Post on 07-Aug-2020

0 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: I. ゲノミクス 01...- 2 - ゲノミクス De novoシーケンス解析 製品概要 De novoシーケンシングは、参照配列のない生物種のゲノム配列を取得できます。動物・植物・微生物の全ゲノムデー

I. ゲノミクス ................................................................................................................ 011. De novo シーケンス解析 ............................................................................................................. 022. 全ゲノムリシーケンス解析 ......................................................................................................... 083. ヒト全ゲノムリシーケンス解析 (Illumina HiSeq X Ten) ............................................................. 104. エキソーム & ターゲット領域シーケンス解析 (Illumina HiSeq 2000) ........................................ 125. CG(Complete Genomics)エキソーム解析 .............................................................................. 166. RAD-Seq 解析 ............................................................................................................................. 187. Optical Mapping .......................................................................................................................... 218. FFPE ゲノムシーケンス解析 ...................................................................................................... 239. Single cell シーケンス解析 .......................................................................................................... 2510. 単純反復配列遺伝子座の開発 ...................................................................................................... 2811. メタゲノム解析 ........................................................................................................................... 2912. 16S rDNA 解析 (Illumina HiSeq 2000) ........................................................................................ 3113. GBS(Genotyping by sequencing) ............................................................................................. 3314. PacBio RS II 次世代シーケンス解析 ........................................................................................... 35

II. トランスクリプトミクス .......................................................................................... 371. トランスクリプトームシーケンス解析 ........................................................................................ 382. RNA-Seq (Quantification) 解析 .................................................................................................... 423. 真核 Small RNA 解析 ................................................................................................................... 444. MicroRNA および mRNA の統合解析 .......................................................................................... 475. FFPE RNA-Seq トランスクリプトーム解析 ............................................................................... 496. Long Non-Coding RNA シーケンス解析 ...................................................................................... 527. メタトランスクリプトミクス解析 .............................................................................................. 548. RIP-Seq 解析 ............................................................................................................................... 56

III. エピジェネティックス .............................................................................................. 581. 全ゲノム Bisulfite メチル化解析 .................................................................................................. 592. Reduced Representation Bisulfite Sequencing (RRBS) .............................................................. 613. MeDIP-seq 解析 .......................................................................................................................... 634. ChIP-seq 解析 ............................................................................................................................. 65

IV. 付録 ........................................................................................................................... 67

目 次

Page 2: I. ゲノミクス 01...- 2 - ゲノミクス De novoシーケンス解析 製品概要 De novoシーケンシングは、参照配列のない生物種のゲノム配列を取得できます。動物・植物・微生物の全ゲノムデー

- 01 -

ゲノミクス

ゲノミクス1

De novo シーケンス解析全ゲノムリシーケンス解析

ヒト全ゲノムリシーケンス解析 (Illumina HiSeq X Ten)

エキソーム&ターゲット領域シーケンス解析 (Illumina HiSeq 2000)

CG(Complete Genomics)エキソーム解析

RAD-Seq解析

Optical Mapping

FFPEゲノムシーケンス解析

Single cellシーケンス解析

単純反復配列遺伝子座の開発

メタゲノム解析

16S rDNA解析 (Illumina HiSeq 2000)

GBS(Genotyping by sequencing)

PacBio RS II次世代シーケンス解析

Page 3: I. ゲノミクス 01...- 2 - ゲノミクス De novoシーケンス解析 製品概要 De novoシーケンシングは、参照配列のない生物種のゲノム配列を取得できます。動物・植物・微生物の全ゲノムデー

- 2 -

ゲノミクス

De novo シーケンス解析

製品概要De novo シーケンシングは、参照配列のない生物種のゲノム配列を取得できます。動物・植物・微生物の全ゲノムデー

タを取得するために、データ解析を用いて全ゲノムマップを組み立てます。全ゲノムシーケンシングは生物種を解

明するための、最も効率的な手法の一つです。

技術特長 • ハイスループット・高効率・低コスト

• 高カバー率・高精度

• BGI が独自に開発した SOAPdenovo2 でのアセンブリー

• 植物や動物のDe novo シーケンシングプロジェクトを何百件も完成させた BGI チームの豊かな研究経験

ワークフロー

1.動植物のDe novo シーケンシングゲノムの特徴に基づき精密なゲノムマップを作成するには、2 つ方法(コモンとコンプレックス)があります。

• ゲノムサーベイ

ゲノムサーベイは、特徴不明なゲノムを解析するために必要な方法です。

ゲノム DNA

ライブラリー作製

(170bp/500bp/800bp)

シーケンシング(101PE)

データフィルタリング

K-mer 深度分布解析による

ゲノムサイズの予測

GC 深度分布の解析

アセンブリー

ヘテロ接合率の予測

ゲノムサーベイの結果によって、ゲノムの種類を決めます。

ゲノム種類 ゲノムサイズ 倍数性 ヘテロ接合度 重複配列コンテンツ GC コンテンツ

コモン ≦ 3Gb 一倍体・二倍体 < 0.5% < 50% 35% ~ 65%コンプレックス > 3Gb 二倍体・多倍体 ≧ 0.5% ≧ 50% < 35%・> 65%

• コモンゲノムの場合

ゲノムサーベイ

サイズが異なるライブラリーの作製

2-20kb mate-pair

ペアエンドシーケンシングでカバレッジ60×を獲得

SOAPdenovoでのアセンブリー

ゲノム解析

図 1 コモンゲノムのワークフロー

Page 4: I. ゲノミクス 01...- 2 - ゲノミクス De novoシーケンス解析 製品概要 De novoシーケンシングは、参照配列のない生物種のゲノム配列を取得できます。動物・植物・微生物の全ゲノムデー

- 3 -

ゲノミクス

・アセンブリーの指標

ゲノムサイズ(GS) アセンブリーの指標

GS ≦ 300Mbコンティグ N50 ≧ 20Kb

スカフォード N50 ≧ 600Kb 300Mb < GS ≦ 1500Mb

(鳥類以外)

コンティグ N50 ≧ 20Kb スカフォード N50 ≧ 600Kb

1500Mb < GS ≦ 3000Mb(哺乳類以外)

コンティグ N50 ≧ 20Kb スカフォード N50 ≧ 300Kbコンティグ N50 ≧ 10Kb

スカフォード N50 ≧ 150Kb

GS < 1600Mb(鳥類)コンティグ N50 ≧ 20Kb スカフォード N50 ≧ 2Mb

GS < 3200Mb(哺乳類)

コンティグ N50 ≧ 20Kb スカフォード N50 ≧ 5Mb

• コンプレックスゲノムの場合

ゲノムサーベイ

ペアエンドシーケンシングでカバレッジ50×以上を獲得

SOAPdenovoでのアセンブリー

BAC/Fosmidライブラリーの作製・プーリング

50×以上ショットガンシーケンシング

BAC/Forsmidショットガンアセンブリー

全ゲノムアセンブリーおよびBAC/Forsmidとの統合

ゲノム解析ドラフトマップ

BAC/Fosmidアセンブリー

高品質マップ

サイズが異なるライブラリーの作製

2-20kb mate-pair

図 2 コンプレックスゲノムのワークフロー

・アセンブリーの指標

 コンティグ N50 ≧ 20Kb、スカフォード N50 ≧ 300Kb

2.微生物のDe novo シーケンシング • 真菌のDe novo シーケンシング

サンプル品質検査

カバレッジ 30 x

カバレッジ 50 x

NGS

NGS

DNA

短鎖インサートライブラリーの作製

アセンブリーの難易度の評価及び

データ解析を続行するかどうかの判定

オプションデータ解析

プライマリアセンブリー

データフィルタリング

アドバンスドアセンブリー

Page 5: I. ゲノミクス 01...- 2 - ゲノミクス De novoシーケンス解析 製品概要 De novoシーケンシングは、参照配列のない生物種のゲノム配列を取得できます。動物・植物・微生物の全ゲノムデー

- 4 -

ゲノミクス

・アセンブリーの指標 (アドバンスドアセンブリーをする前にプライマリアセンブリーが必要です。アドバンスドアセンブリー

の指標は、プライマリアセンブリーの結果によって決定されます)。

指標 プライマリアセンブリーアドバンスドアセンブリー

(指標は菌株の特徴により決定)

スカフォード N50シーケンシング深度 ≧ 50x (ライブラリーのサイズ≦

500bp)

シーケンシング深度 ≧ 100x

プライマリアセンブリー N50 アドバンスドアセンブリー N50

0 ~ 30Kb ≧ 100Kb

30 ~ 50Kb ≧ 100Kb/300Kb

50 ~ 100Kb

≧ 100Kb/300Kb(GS < 100Mb、

N50 ≧ 100Kb/300Kb/500Kbが選択できます)

100 ~ 300Kb 300Kb/500Kb/1Mb

300 ~ 500Kb ≧ 500Kb/1Mb

• 細菌のDe novo シーケンシング(HiSeq プラットフォーム)

・アドバンスドアセンブリー

DNA

短鎖インサートライブラリーの作製

オプションデータ解析

プライマリアセンブリー

データフィルタリング

アドバンスドアセンブリー

サンプル品質検査

カバレッジ 100 x NGS

・アセンブリーの指標

種類 指標

アドバンスドアセンブリー

シーケンシング深度 ≧ 100x染色体・染色質ゲノム カバレッジ ≧ 95%遺伝子領域(相関性の高い配列)カバレッジ ≧ 98%

正常な GC コンテンツ

( 35% ≦ GC ≦ 65% )GS ≦ 5Mb スカフォード数< 1005Mb < GS < 10Mb スカフォード数< 150

異常な GC コンテンツ

( GC < 35%、GC > 65% )GS ≦ 5Mb スカフォード数< 2005Mb < GS < 10Mb スカフォード数< 300

Page 6: I. ゲノミクス 01...- 2 - ゲノミクス De novoシーケンス解析 製品概要 De novoシーケンシングは、参照配列のない生物種のゲノム配列を取得できます。動物・植物・微生物の全ゲノムデー

- 5 -

ゲノミクス

・コンプリートマップ

・アセンブリーの指標

種類 指標

プライマリアセンブリー シーケンシング深度 ≧ 100x

アドバンスドアセンブリーシーケンシング深度≧ 150xスカフォード数< 45

コンプリートマップシーケンシング深度 ≧ 200xコンティグ=1、 ギャップ =0

※細菌のコンプリートマップ:1 コンティグ配列および PCR のバリデーション

1.アセンブリー • K-mer 深度分布解析とゲノムサイズの推定

• ゲノムヘテロ接合率の推定

• 初歩的なアセンブリー

• GC-Depth 分布の解析

• シーケンス深度の分布

2.アノテーション • 反復配列のアノテーション

• 遺伝子予測

• 遺伝子機能のアノテーション

• ncRNA の アノテーション

3.動植物進化解析 • オルソロガス遺伝子集団の同定

( 動物 : TreeFam、植物 : OrthoMCL)

• 系統発生解析

• 種分化の時間推定

• 全ゲノムアライメント分析 ( ゲノムシンテニー )

• セグメント重複 ( 動物 : WGAC、植物 : WGD)

4.微生物のオプションデータ解析 • GC skew を含むゲノムマップの作成

• シンテニー解析

• 遺伝子ファミリー解析

• CRISPR 予測

• ゲノムアイランド予測

• 溶原ファージ予測

• 分泌タンパク質予測

データ解析

サンプル情報PCR

... ...

OM

サンプル準備

ライブラリー作製

シーケンシング

ゲノムアセンブリー

1スカフォード 1コンティグ コンプリートマップ

Page 7: I. ゲノミクス 01...- 2 - ゲノミクス De novoシーケンス解析 製品概要 De novoシーケンシングは、参照配列のない生物種のゲノム配列を取得できます。動物・植物・微生物の全ゲノムデー

- 6 -

ゲノミクス

技術パラメーター

1.サンプル要件

サンプル DNA ( タンパク質・RNA などの混入無し )

サンプル量

短鎖ライブラリー (170 ~ 800bp) ≧ 3μg( 微生物≧ 2.5ng/μL)

長鎖ライブラリー (2Kb) ≧ 20μg

長鎖ライブラリー (5 ~ 6Kb) ≧ 20μg

長鎖ライブラリー (10Kb) ≧ 30μg

長鎖ライブラリー (20Kb、40Kb) ≧ 60μg

PCR-free ライブラリー ≧ 10μg

サンプル濃度短鎖ライブラリー (170 ~ 800bp) ≧ 30ng/μL ( 微生物≧ 25ng/μL)

長鎖ライブラリー (2 ~ 40Kb) ≧ 133ng/μL

サンプル純度 OD260/280=1.8 ~ 2.0

※ライブラリー作製が困難と判断される場合がありますので、予備のサンプルの同梱を推奨しています。

※具体的なサンプルの必要量については問い合わせください。

2. シーケンス解析:51PE・101PE

3. 推奨ライブラリーサイズ 短鎖ライブラリー:170bp・500bp・800bp 長鎖ライブラリー:2Kb・5Kb・10Kb・20Kb・40Kb

納品物1. シーケンシング結果 (clean data) は FASTQ ファイルで納品

2. 納品データ例

G+C content

160

150

140

130

120

110

100

90

80

70

60

50

40

30

20

Aver

age

sequ

enci

ng d

epth

0.25 0.3 0.35 0.4 0.45 0.5 0.55 0.6 0.65 0.7 0.75

Sequencing depth

Per

cent

age

of g

enom

e

図 4 シーケンス深度の分布図 3 GC含量とシーケンス深度の関係

Page 8: I. ゲノミクス 01...- 2 - ゲノミクス De novoシーケンス解析 製品概要 De novoシーケンシングは、参照配列のない生物種のゲノム配列を取得できます。動物・植物・微生物の全ゲノムデー

- 7 -

ゲノミクス

Sequence divergence rate (%)

Per

cent

age

of g

enom

e

Number of gene families

納期

動物 / 植物 Survey:2 ヶ月 コモンゲノム:3 ヶ月~ 6 ヶ月 複雑なゲノム:1 年

真菌シーケンシングのみ:

約 7 週間

プライマリアセンブリー:

約 7 週間

アドバンスドアセンブリー:

約 11 週間

細菌プライマリアセンブリー:

約 7 週間

アドバンスドアセンブリー:

約 9 週間

コンプリートマップ:

約 13 週間

図 6 異なるゲノムにおけるオルソロガス遺伝子

(複製された遺伝子は一つと見なす )

図 5 シーケンスの発散率

Page 9: I. ゲノミクス 01...- 2 - ゲノミクス De novoシーケンス解析 製品概要 De novoシーケンシングは、参照配列のない生物種のゲノム配列を取得できます。動物・植物・微生物の全ゲノムデー

- 8 -

ゲノミクス

全ゲノムリシーケンス解析

製品概要全ゲノムリシーケンシングは塩基配列が既知の物種をシーケンシングし、個体や集団レベルで差異性分析を行う技

術です。リシーケンシングの短リード・ペアエンドリード及び異なるインサートサイズのライブラリー作製によって、

遺伝子配列の差異や構造変異を全面的に検出できます。全ゲノムリシーケンシングは動植物の育種・集団進化・創薬・

疾患研究・臨床診断などの領域で最も役に立つ方法の一つです。

技術特長 • 多様な変異の検出:SNP・InDel・SV・CNV の検出

• 新たな変異の発見:チップと比べ、新しい変異を検出可能

• 高コストパフォーマンス:de novo シーケンシングと比べ、納期が短く低コスト

ワークフロー

ゲノム DNA

ライブラリー作製

シーケンシング

クリーンデータ

アライメント

生物学解析

• 産出データの統計

• カバー率の統計

• データの深度分布

• アライメント結果統計

可視化

• SNP・InDel・SV・CNV 検出

• SNP・InDel・SV・CNV アノテーション • SNP・InDel・SV・CNV 解析

生データ

品質管理、データのフィルタリング

1.標準データ解析 • アノテーション

• データの統計

• SNP コール・アノテーション・統計

2.オプション解析(農業研究領域) • 変異検出

• 点突然変異

• 集団進化

• GeneticMap 作製

• BinMap 作製

• HapMap 作製

• 全ゲノム関連分析

3.オプション解析(健康と疾患研究領域) • 人種群のオプション解析

• 癌のオプション解析

• 複雑疾患のオプション解析

• 単一遺伝子疾患研究のオプション解析

4.カスタマイズ • お客様のご要望に合わせ、データ解析をカスタマイ

ズします。

データ解析

Page 10: I. ゲノミクス 01...- 2 - ゲノミクス De novoシーケンス解析 製品概要 De novoシーケンシングは、参照配列のない生物種のゲノム配列を取得できます。動物・植物・微生物の全ゲノムデー

- 9 -

ゲノミクス

技術パラメーター

1.サンプル要件

サンプル DNA

サンプル量動植物・ヒト

≧ 2.5μg

サンプル濃度 ≧ 25ng/μL

サンプル純度 OD260/280=1.8 ~ 2.0

※ライブラリー作製が困難と判断される場合がありますので、予備のサンプルの同梱を推奨しています。

2.シーケンス解析:101PE・126PE

3. 推奨ライブラリーサイズ:500bp

納品物1. シーケンシング結果 (clean data) は FASTQ ファイルで納品 2. 納品データ例

Chromosome

Seq

uenc

lng

dept

h(X

)

GC

(%)

Depth(X)

Per

cent

age(

%)

納期ライブラリー作製・シーケンシング・標準データ解析:約 10 週間

※サンプル数が 10 以上の場合は、プロジェクトの規模により納期が異なりますので、別途お問い合わせください。

図 1 各染色体における GC含量率とシーケンス深度の有効分布 図 2 シーケンス深度の分布

Page 11: I. ゲノミクス 01...- 2 - ゲノミクス De novoシーケンス解析 製品概要 De novoシーケンシングは、参照配列のない生物種のゲノム配列を取得できます。動物・植物・微生物の全ゲノムデー

- 10 -

ゲノミクス

ヒト全ゲノムリシーケンス解析 (Illumina HiSeq X Ten)

製品概要

 Illumina HiSeq X Ten は 2014 年 1 月に発表された、Illumina 社の最新型のシーケンシングシステムです。このプ

ラットフォームは驚異的なテクノロジーのブレイクスクールをもち、1 つの施設で 1 年間に数万サンプルの処理能力

を提供することで比類ない規模の研究を可能にします。HiSeq® 2500 のパフォーマンスと比べて 10 倍以上に相当す

る 1 日あたりのスループットを産出するなど、ハイスループット・高品質・高カバレッジ・低コストといった特長

を持っています。

 HiSeq X Ten システムは超ハイスループットシーケンサー HiSeq 10 台で構成され、年間 18,000 ゲノムを解読する

ことができます。HiSeq X Ten は研究者に更に大規模なヒトゲノムシーケンシングを提供でき、癌や複雑な疾病など

に関する遺伝変異の研究を新たなレベルに進めることができます。

技術特長 • ハイスピードなシーケンシング

• ハイスループット、ビッグデータ

• 高精度(99.9% 以上)

• ロングリード

アプリケーション現在、ヒトゲノムリシーケンシングのみを提供しています。

データ解析

1.標準データ解析 • シーケンシングデータの基礎解析

• SNP/InDel コール・アノテーション・統計

2.オプションデータ解析 • ジェネラルオプションデータ解析

• 腫瘍、メンデル遺伝病、複雑疾患オプション解析

• 集団遺伝オプション解析

3.カスタム解析

データ品質(参考)

Sample name Raw read Effective(%) Error(%) Q20(%) Q30(%) GC(%)

Human-1 39087255 99.24 0.03;0.04 96.92;94.02 92.56;87.24 43.32;43.30

Human-2 36099281 99.25 0.03;0.05 96.93;93.31 92.27;86.53 43.29;43.24

Human-3 31890227 99.27 0.02;0.05 97.08;92.54 92.96;85.71 43.27;43.24

Human-4 39036347 99.24 0.02;0.04 97.23;93.68 93.26;87.19 43.30;43.25

Page 12: I. ゲノミクス 01...- 2 - ゲノミクス De novoシーケンス解析 製品概要 De novoシーケンシングは、参照配列のない生物種のゲノム配列を取得できます。動物・植物・微生物の全ゲノムデー

- 11 -

ゲノミクス

技術パラメーター

サンプル要件サンプル DNA(分解やコンタミネーションがないこと)

サンプル量 ≧ 3μg

サンプル濃度 ≧ 50ng/μL

サンプル純度 OD260/280 ≧ 1.8

シーケンス解析 150PE

QC Q30 ≧ 75%

納品物1. シーケンシング結果 (clean data) は FASTQ ファイルで納品

2. 結果報告書

納期ライブラリー作製・シーケンシング・標準データ解析:約 8 週間

Page 13: I. ゲノミクス 01...- 2 - ゲノミクス De novoシーケンス解析 製品概要 De novoシーケンシングは、参照配列のない生物種のゲノム配列を取得できます。動物・植物・微生物の全ゲノムデー

- 12 -

ゲノミクス

エキソーム &ターゲット領域シーケンス解析(Illumina HiSeq 2000)

製品概要エキソーム & ターゲット領域シーケンス解析は、特殊プローブを利用し、お客様が興味を持つタンパク質コーディ

ング領域 DNA 或いはある特定配列をキャプチャー・濃縮後にシーケンシングするというゲノミクス分析方法です。

この方法によって、指定したエキソーム & ターゲット領域の遺伝情報を獲得でき、エキソーム領域の研究効率を飛

躍的に向上させ、研究コストを大幅に減少させます。主に、疾患と集団進化に関するコーディング領域の構造変異

の研究で利用されます。公共データベースのエキソームデータと照合することで、変異構造間の関連性と病原性の

メカニズムをより良く解明できます。

技術特長 • 高カバー率:ターゲット領域のカバー率は 98% 以上

• 高精度:単一塩基まで識別可能

• 高コストパフォーマンス:全ゲノムシーケンシングと比べ、はるかに低コスト

ワークフロー

ゲノム DNA

ターゲット領域とエキソームキャプチャー

ライブラリー作製

シーケンシング

生データ品質管理、

データのフィルタリング

クリーンデータ

シーケンス深度統計

シーケンス均一性の統計分析

アノテーション:

• SNP のコールとアノテーション

• InDel のコールとアノテーション

• SIFT アミノ酸予測

• アミノ酸置換予測

Page 14: I. ゲノミクス 01...- 2 - ゲノミクス De novoシーケンス解析 製品概要 De novoシーケンシングは、参照配列のない生物種のゲノム配列を取得できます。動物・植物・微生物の全ゲノムデー

- 13 -

ゲノミクス

技術パラメーター

1. サンプル要件

※ライブラリー作製が困難と判断される場合がありますので、予備のサンプルの同梱を推奨しています。

2. キャプチャープラットフォーム • エキソーム

SureSelect Human All Exon Roche NimbleGen SeqCap EZ Exome SureSelect Mouse All Exon

Agilent V3(50M) v2.0(44M) Agilent Mouse(50M)

Agilent V4(51M) v3.0(64M)

Agilent V4+UTRs(71M) Exome+UTR(64M Exon+32M UTR)

Agilent V5(50M) Monkey Array(50M)

Agilent V5+UTR(75M) Maize Exome, Barley Exome, Wheat Exome, Soy Exome, Mouse Exome

1. 標準データ解析

エキソーム

• アダプターと低品質データを除去

• データとゲノムのアライメント

• データの産量統計解析、シーケンス深度解析、均一

性解析

• InDel、SNP 変異の検出

• InDel、SNP の RefGene アノテーション

• InDel、SNP データベース解析

• SNP 保守性の予測と病原性解析(ヒトサンプルのみ)

• 遺伝子の中の SNP 分布解析

• 遺伝子の中の InDel 分布解析

ターゲット領域

• アダプター、コンタミ配列と低品質リードを除去

• シーケンシング結果の評価

• SNP、InDel の検出、アノテーションと統計

• SNP 保守性の予測と病原性解析(ヒトサンプルのみ)

2.オプションデータ解析エキソーム

ヒトサンプル:

• メンデル遺伝病データ解析

• 複雑疾患、腫瘍データ解析

動植物サンプル:

• 全ゲノム関連解析 (GWAS)

集団進化オプション解析

• 他の解析をご希望の場合はお問い合わせください

• ターゲット領域

ヒトサンプル:

• 非コード領域 SNP、InDel のアノテーションと統計

(ENCODE データベース)

• 腫瘍、メンデル遺伝病、複雑疾患オプション解析

• 集団進化オプション解析

動植物サンプル:

• InDel の検出、アノテーションと統計

• ハプロタイピング:連鎖不平衡、ハプロタイプブ

• ロック推定

3. カスタマイズ • 複雑疾患カスタム解析

• 家系サンプルに基づく de novo 突然変異解析

データ解析

サンプル DNA

サンプル量 ≧ 2.5μg

サンプル濃度 37.5 ng/μL

サンプル純度 OD260/280 = 1.8 ~ 2.0

Page 15: I. ゲノミクス 01...- 2 - ゲノミクス De novoシーケンス解析 製品概要 De novoシーケンシングは、参照配列のない生物種のゲノム配列を取得できます。動物・植物・微生物の全ゲノムデー

- 14 -

ゲノミクス

• ターゲット領域

主要キャプチャーチップとキット カスタマーキット

Agilent SureSelect XT Custom Kit Agilent SureSelectXT Human Kinome Panel Kit

NimbleGen SeqCap EZ Choice XL library Agilent SureSelect XT X-chromosome Kit

NimbleGen SeqCap EZ Choice library

3. シーケンス解析:101PE

納品物1. シーケンシング結果 (clean data) は FASTQ ファイルで納品

2. 結果報告書

3. 納品データ例

表 1 SNPアノテーション一覧

ChrID PositionQuality score

ChainCodon phase

dbSNP or not

Ref AllelesSupporting

readsGene Name

MutType Codon ChangeResidue Change

Function

Chr1 743132 51 + - rs3115861 C G/G 10 - Hom - - intergenic

Chr1 798494 50 + - rs11240779 G A/A 18 - Hom - - intergenic

Chr1 1142976 92 + 2 rs12036216 G G/A 40763 SDF4 Het-one 'CTC ≧ CTT' 'Leu ≧ Leu' synonymous-coding

Chr1 1148494 99 + 2 rs6603781 A G/G 58 SDF4 Hom 'GAT ≧ GAC' 'Asp ≧ Asp' synonymous-coding

Chr1 1158006 56 + 1 snp1 G G/A 40668 B3GALT6 Het-one 'CGG ≧ CAG' 'Arg ≧ Gln' missense

Chr1 1235867 75 + - rs2296474 A G/G 133 PUSL1 Hom - - intron

Chr1 1236166 99 + 2 rs41285824 G G/A 40804 PUSL1 Het-one 'ACG ≧ ACA' 'Thr ≧ Thr' synonymous-coding

Chr1 1239050 92 + 2 rs12142199 G A/A 52 CPSF3L Hom 'TTC ≧ TTT' 'Phe ≧ Phe' synonymous-coding

Chr1 1244299 37 + 2 rs1886773 A G/G 5 CPSF3L Hom 'TAT ≧ TAC' 'Tyr ≧ Tyr' synonymous-coding

Chr1 1244306 38 + 1 rs1886772 G A/A 15 CPSF3L Hom 'CCG ≧ CTG' 'Pro ≧ Leu' missense

Chr1 1244704 99 + 2 rs10907179 C G/G 55 CPSF3L Hom 'GGG ≧ GGC' 'Gly ≧ Gly' synonymous-coding

表 2 InDelアノテーション一覧

ChrIDStart

positionEnd

positionSupporting

readsChain

Codon phase

ID Status Indel type Bases MutType Name Function

Chr1 869026 869036 3 + 1 indel1 novel -11 GCCCGCCCTCA Hete SAMD11 frameshift

Chr1 1100850 1100850 53 + - indel2 novel 1 C Hete - intergenic

Chr1 1637753 1637753 66 + 0 rs35961525 -8 6 TTTCTT Hete CDC2L2 frameshift

Chr1 1642925 1643927 8 + - rs35174499 -1 -3 GCG Homo CDC2L2 intron

Chr1 3535035 3535053 13 + - indel3 novel -19 TTCTGGGAGCTCCTCCCCC Hete TPRG1L utr-3

Chr1 3589610 3589610 29 + - indel4 novel -1 G Hete TP73 intron

Chr1 6093011 6093011 28 + - indel5 novel -1 G Hete CHD5 intron

Chr1 6175552 6175553 34 + - rs3035703 -2 -2 CA Hete RPL22 intron

Chr1 9693277 9693277 13 + - rs34885574 0 -2 AG Hete PIK3CD intron

Chr1 10279793 10279793 4 + - indel7 novel -1 T Hete KIF1B intron

Chr1 10347704 10347704 7 + - indel8 novel -1 T Homo KIF1B intron

Page 16: I. ゲノミクス 01...- 2 - ゲノミクス De novoシーケンス解析 製品概要 De novoシーケンシングは、参照配列のない生物種のゲノム配列を取得できます。動物・植物・微生物の全ゲノムデー

- 15 -

ゲノミクス

図 1 TCC内の STAG2遺伝子体細胞突然変異とコピー数の変化

図 2 エキソーム(ALL)とコーディング領域(CDS)における InDelの長さの分布

納期 • エキソームシーケンス解析

 キャプチャー・ライブラリー作製・シーケンシング・標準データ解析:約 8 週間(100 サンプル以下)

• ターゲット領域シーケンス解析

 チップカスタム・ライブラリー作製・シーケンシング:お問い合わせください。

※ターゲット領域サイズ =1Mb

※ BGI はアジレント・テクノロジー社認定のサービスプロバイダです。

InDel length distribution (All) InDel length distribution (CDS)

Num

ber

Num

ber

InDel length (bp) InDel length (bp)

Page 17: I. ゲノミクス 01...- 2 - ゲノミクス De novoシーケンス解析 製品概要 De novoシーケンシングは、参照配列のない生物種のゲノム配列を取得できます。動物・植物・微生物の全ゲノムデー

- 16 -

ゲノミクス

CG(Complete Genomics)エキソーム解析

製品概要Complete Genomics シーケンス解析システムは、高品質な新型ハイスループットシーケンシングプラットフォーム

で DNA Nanoball Arrays(DNBTM)テクノロジーと Combinatorial Probe-Anchor Ligation (cPAL) テクノロジーを採用

したことにより、塩基のエラー率を 10 万分の 1 まで減らすことに成功しました。また独自の強力な情報分析ツール

を搭載することで、より正確な変異解析と解析タイプの多様化を実現しました。BGI は現在、このプラットフォー

ムでエキソーム解析のサービスを提供しています。既に 15,000 件超のヒトゲノム解析を完成し、多くの顧客から高

い評価を得ています。

技術特長 • 高精度、エラー率は 10 万分の 1

• local de novo アセンブリー技術に基づいて変異種類を測定、より精確な結果を提供

• 変異を精確に検出できる、変異が所属する対立遺伝子の認識が可能

• CG プラットフォームの感度は 99.5%

• エキソームのカバレッジは 99%

• 再現性が高く、安定した品質

ワークフロー

サンプル

ライブラリー作製

品質検査

ライブラリーの品質管理

DNA Nanoball Arrays と cPAL シーケンシング

シーケンス DNBs リード

アライメント

local de novo アセンブリー

SNP コールと

アノテーション

InDel コールと

アノテーション

somatic SNP コール

とアノテーション

somatic InDel コール

とアノテーション

Page 18: I. ゲノミクス 01...- 2 - ゲノミクス De novoシーケンス解析 製品概要 De novoシーケンシングは、参照配列のない生物種のゲノム配列を取得できます。動物・植物・微生物の全ゲノムデー

- 17 -

ゲノミクス

データ解析

1. 標準データ解析

• アライメント評価

• SNP コール

• SNP アノテーション(genes、ncRNAs、dbSNP allele frequency など )

• SNP の統計

• InDel コール

• InDel アノテーション(genes、ncRNAs、dbSNP allele frequency など)

• InDel の統計

技術パラメーター

1. サンプル要件

2.キャプチャープラットフォーム:BGI kit, Agilent SureSelect, NumbleGen SeqCap EZ ※推奨シーケンシング深度:100x

納品物1. シーケンシング結果

2. 結果報告書

納期ライブラリー作製・シーケンシング・標準データ解析:約 7 週間

サンプル ゲノム DNA( コンタミネーションなし)

サンプル量 ≧ 3μg

サンプル濃度 ≧ 37.5 ng/μL

Page 19: I. ゲノミクス 01...- 2 - ゲノミクス De novoシーケンス解析 製品概要 De novoシーケンシングは、参照配列のない生物種のゲノム配列を取得できます。動物・植物・微生物の全ゲノムデー

- 18 -

ゲノミクス

RAD-Seq解析

製品概要RAD は Restriction-site Associated DNA の略で、制限酵素認識部位に関わる DNA です。RAD-Seq とは 、 酵素カッ

トされた RAD tag をハイスループットシーケンシングする技術です 。 この技術を用いることで 、 ゲノムの複雑さ

を大幅に減少させられるだけでなく、リファレンスゲノムの制限に影響されず高密度の SNP 部位を検出できます。

SNP サイトの分子マーカー技術に基づいた RAD-Seq は費用対効果が高く安定性に優れており、集団進化・遺伝子

地図の作成・Quantitative Trait Locus (QTL) マッピングや染色体 scaffold 作成の補助などの領域で利用されます。

技術特長 • 高密度・高カバー率:全ゲノムにわたる分子マーカーの獲得

• 高精度:徹底した品質管理とフィルター基準により、高精度な SNP の取得が可能

• 高コストパフォーマンス:特に大きいサンプルの研究に適用

• 高効率:集団進化研究や大きいサンプルのマップ作成は 3 ~ 4 ヶ月で完成可能

ワークフロー

ゲノムワイド関連解析(GWAS)■ 遺伝子型欠失データ処理(Imputation)■ GWAS 解析

■ 性状に関する遺伝子のスクリーニング

■ 候補遺伝子の機能アノテーション

ゲノム DNA

酵素カットとライブラリー作製

シーケンシング

生データ

オプション

データ解析

標準データ解析

品質管理、データのフィルタリング

クリーンデータ

アセンブリー(参照配列なし) アライメント(参照配列あり)

■ RNA tag の産出データ統計

■ 個体と集団の RAD tag クラスター(参照配列なし)/   アライメント(参照配列あり)

■ SNP の検出、アノテーションと統計

■ SNP の分類

集団進化研究

■ 集団遺伝構造の解析

■ 系統発生樹の分析

■ 主成分分析(PCA)■ 連鎖不平衡分析(LD)

遺伝地図の作成

■ ジェノタイピング

■ 遺伝地図の作成

■ QTL マッピング(表現型

のデータが必要) ■ 遺伝地図のアセンブリー

■ (元の遺伝地図が必要)

Page 20: I. ゲノミクス 01...- 2 - ゲノミクス De novoシーケンス解析 製品概要 De novoシーケンシングは、参照配列のない生物種のゲノム配列を取得できます。動物・植物・微生物の全ゲノムデー

- 19 -

ゲノミクス

データ解析

1.標準データ解析 • シーケンシングデータの基礎解析

• RAD tag 産出データの統計

• 参照配列のない生物種の場合:個体と集団 RAD tag のクラスター

• 参照配列のある生物種の場合:参照配列とのアライメント

• SNP の検出・アノテーション・統計

• SNP の分類

2.オプションデータ解析――遺伝地図の作成 • ジェノタイピング

• 遺伝地図の作成

• QTL マッピング(表現型のデータが必要)

• 遺伝地図のアセンブリー(元の遺伝地図が必要)

3.オプションデータ解析――集団進化研究 • 系統発生樹の分析 (Phylogeny tree)

• 集団構造の分析(Structure)

• 主成分分析(PCA)

• 連鎖不平衡分析(LD)

4.オプションデータ解析――ゲノムワイド関連解析(GWAS) • 遺伝子型欠失データ処理 (Imputation)

• GWAS 解析

• 性状に関する遺伝子のスクリーニング

• 候補遺伝子の機能アノテーション

技術パラメーター

1.サンプル要件

※ライブラリー作製が困難と判断される場合がありますので、予備のサンプルの同梱を推奨しています。

2.推奨ライブラリーサイズ:300 ~ 500bp

サンプル DNA( コンタミネーションなし)

サンプル量 1.0μg/ 回

サンプル濃度 ≧ 25ng/µL

Page 21: I. ゲノミクス 01...- 2 - ゲノミクス De novoシーケンス解析 製品概要 De novoシーケンシングは、参照配列のない生物種のゲノム配列を取得できます。動物・植物・微生物の全ゲノムデー

- 20 -

ゲノミクス

納品物1. シーケンシング結果 (clean data) は FASTQ ファイルで納品

2. 結果報告書

3. 納品データ例

図 1 組み換えの切断点の位置判定

図 2  RAD、RAD+SSR/STS、SSR/STSにおける遺伝地図比較

納期遺伝地図と集団進化:約 12 週間

GWAS 解析:約 16 週間

Page 22: I. ゲノミクス 01...- 2 - ゲノミクス De novoシーケンス解析 製品概要 De novoシーケンシングは、参照配列のない生物種のゲノム配列を取得できます。動物・植物・微生物の全ゲノムデー

- 21 -

ゲノミクス

動植物1. 酵素カットの結果分析

2. データのアセンブリーと解析

3. Scaffold の位置づけ

微生物1. 酵素カットの結果分析

2. データのアセンブリーと解析

• OM マップ

• Scaffold の位置付け

• 比較ゲノミクスの解析

• 菌株の分類

Optical Mapping

製品概要Optical mapping(OM)は制限酵素切断地図に基づいて、マイクロナノ加工技術を用い、単一 DNA 分子をチップに

固定させ制限酵素で切断した後、DNA 断片の長さや位置を蛍光標識して検出します。そして、DNA 断片を組み合わ

せて遺伝子地図を作成します。その遺伝子地図を利用して、scaffold との位置をアライメントして比較ゲノム解析を

行います。全ゲノム制限酵素地図は配列の位置を迅速に確定できるので、比較ゲノミクス解析・データアセンブリー

の補助・菌株の分類などで幅広く利用されています。

技術特長 • 制限酵素地図はアセンブリーの補助的な手段で、ゲノム配列が不要

• 高精度・高信頼度:制限酵素地図は物理情報を利用して断片を位置づけ

ワークフロー

ゲノム DNA

品質管理

制限酵素カット

蛍光標識とデータ収集

アノテーション

と生物学解析

動植物 :• アセンブリーと解析 • Scaffold の位置付け

微生物 :• OM マップの作成

• Scaffold の位置付け

• 比較ゲノミクスの解析 • 菌株の分類

データ解析

Page 23: I. ゲノミクス 01...- 2 - ゲノミクス De novoシーケンス解析 製品概要 De novoシーケンシングは、参照配列のない生物種のゲノム配列を取得できます。動物・植物・微生物の全ゲノムデー

- 22 -

ゲノミクス

技術パラメーター

サンプル要件

※ライブラリー作製が困難と判断される場合がありますので、予備のサンプルの同梱を推奨しています。

納品物納品データ例

Blue regions indicate similarities between different isolates.

White regions indicate differences between different isolates. Detailed view

図 1 比較ゲノミクスの解析

図 2 OMマップ

納期動植物:約 10 週間

微生物:約 6 週間

動植物 DNA バンド ≧ 250Kb

微生物細菌 DNA サイズ ≧ 150Kb

サンプル濃度 5 ~ 10 DNA/image

Page 24: I. ゲノミクス 01...- 2 - ゲノミクス De novoシーケンス解析 製品概要 De novoシーケンシングは、参照配列のない生物種のゲノム配列を取得できます。動物・植物・微生物の全ゲノムデー

- 23 -

ゲノミクス

FFPEゲノムシーケンス解析

製品概要 ホルマリン固定パラフィン包埋 (FFPE) サンプルは一般的な疾病診断と科学研究用の材料として、数年間保存でき

ます。しかしながら、FFPE サンプルの固定化および保存のプロセスは、希に核酸の分解と塩基変化を起こします。

 これまで、FFPE サンプルから抽出した DNA はアレイに基づいて解析されていましたが、容量や固定ターゲット

に問題があり、良好なパフォーマンスが得られませんでした。次世代シーケンス解析技術を用いた FFPE サンプル

の解析は原因不明の疾病のメカニズムの解明を促進し、生物工学の研究を進展させます。

技術特長 • サンプルの量が少ない場合も解析可能:全ゲノムリシーケンシング(WGRS)、全エキソームシーケンシング(WES)

では最低 200ng • ハイスループット

• FFPE サンプルの専門的なデータ解析

• マルチオミクス技術を利用した全面的・系統的な解析

ワークフロー

FFPE サンプル切片

パラフィン除去

プロテアーゼ K 消化

DNA 抽出・精製

サンプル検査

ライブラリー作製

シーケンシング

データ解析

技術パラメーター

1.サンプル要件ヒト・マウス・ラット

サンプル DNA(RNA にコンタミネーションがないこと)

サンプル量全エキソームシーケンス解析 & ターゲット領域シーケンス解析 全ゲノムリシーケンス解析

≧ 1µg ≧ 500ng

サンプル濃度 ≧ 10ng/µL ≧ 10ng/µL

2. DNA抽出キット:FFPE サンプル- QIAamp® DNA FFPE Tissue Kit (QIAGEN)

3.解析プラットフォーム:Illumina HiSeq

Page 25: I. ゲノミクス 01...- 2 - ゲノミクス De novoシーケンス解析 製品概要 De novoシーケンシングは、参照配列のない生物種のゲノム配列を取得できます。動物・植物・微生物の全ゲノムデー

- 24 -

ゲノミクス

2.全エキソームシーケンス解析 レーン 1. D2000 マーカー

レーン 2. 胃癌の隣接組織の FF サンプル DNAレーン 3. 胃癌の隣接組織の FFPE サンプル DNAレーン 4. λ Hind III DNA マーカー

FFPE DNA のバンドが FF DNA の

バンドより下に泳動し、分解したこ

とを示しています。

図 1 胃癌の隣接組織の新鮮凍結(FF)サンプルおよび  FFPEサンプルを抽出した DNAの電気泳動図

レーン 1.D2000 マーカー

レーン 2.FF サンプルのエキソーム

キャプチャーライブラリー

レーン 3.FFPE サンプルのエキソーム

    キャプチャーライブラリー

レーン 4.50bp ラダー DNA マーカー

ライブラリー作製の結果、FFPE サ

ンプルと FF サンプルのライブラリー

は高い類似性が見られました。

図 2 胃癌の隣接組織の FFおよび FFPEサンプルのエキソームキャプチャーライブラリーの電気泳動図

1 2 3 4 1 2 3 4

表 2 FFPEサンプルと FFサンプルの全エキソームシーケンシング (WES)データの比較

Samples Raw Data(M)Mapped Data(M)

Mapped Rate(%)

Mean Depth of Target Region(x)

Coverage of Target

Region(%)

Coverage of Target Region

≥ 10× (%)

Capture Specificity(%)

FFPE 1419.41 1165.91 82.14 18.61 93.31 65.52 65.22

FF 1763.11 1490.43 84.53 23.33 94.84 74.14 64.07

SampleRaw Data

(Gb)Clean Data

(Gb)Conversion Rate(%)

Sequencing Fold(X)

Mapped Rate(%)

Depth(X)Coverage ≥

10X(%)FFPE-1 212.28 194.21 91.49 63.77 72.43 25.17 88.47FFPE-2 130.71 120.18 91.94 37.63 73.71 24.84 92.61FFPE-3 175.94 162.18 92.18 51.61 79.38 37.35 95.80Average - - 91.87 - 75.17 29.12 92.29

Non-FFPEs - - 90 - 85 30 95

解析種類- BGIの実績

1.全ゲノムリシーケンス解析

表 1 FFPEサンプルと non-FFPEサンプルの全ゲノムリシーケンシング (WGRS)データの比較

668 562287122.23% 1.88%95.89%

FF FFPE

158 7840 1581.94% 1.94%96.12%

FF FFPE

図 3 FFPEサンプルと FFサンプルのノーマル SNP (対立遺伝子の深度> 4×)の一致性

図 4 FFPEサンプルと FFサンプルの高品質 SNP (対立遺伝子の深度> 20×、品質スコア> 20)の一致性

3.ターゲット領域シーケンス解析

Page 26: I. ゲノミクス 01...- 2 - ゲノミクス De novoシーケンス解析 製品概要 De novoシーケンシングは、参照配列のない生物種のゲノム配列を取得できます。動物・植物・微生物の全ゲノムデー

- 25 -

ゲノミクス

Single cellシーケンス解析

製品概要 Single cell シーケンス解析は全ゲノム増幅(WGA)および次世代シーケンス解析を利用し、腫瘍細胞の異種性を

分析する、単細胞のゲノム情報を解析する新しい方法です。

 腫瘍組織内の遺伝的構造の解析および腫瘍発達中の主要な変化を同定するのは、腫瘍の細胞異種性特質により困

難だと考えられています。Single cell シーケンス解析はこれまでの方法で生じていたボトルネックを解決し、複雑な

細胞複合体の遺伝的な変異の解析を中心に、単細胞のゲノムをシーケンス解析することによって癌の腫瘍進化を調

べます。

技術特長 • 少量のインプット DNA(単細胞の DNA 量若しくはそれ以上の量)

• Pre-implantation genetic diagnosis (PGD) のターゲット領域において有効な費用対効果

• 単細胞シーケンス解析の豊富な経験

• 高質量および高精度(multiple displacement amplification: MDA、エラー率:10-6 ~ 10-7)

• 高カバレッジ:95% 以上

• 単一サンプルを 100 万倍まで拡大可能

• 拡大産物は 10Kbp 以上、多種の変異を検出可能

• 安定した技術、高い重複率100

80

60

40

20

00 5 10 15 20

Cov

erag

e(%

)

SC1SC2Control

Sequencing depth of chromosome(X)

図 1 単細胞のmultiple displacement amplification (MDA)産物(SC1と SC2)および 非増幅ゲノム DNA(コントロール)のシーケンシングカバレッジの回復の比較

ワークフロー

単細胞の分離

DNA 抽出

全ゲノム増幅

次世代シーケンシング

データ解析

Page 27: I. ゲノミクス 01...- 2 - ゲノミクス De novoシーケンス解析 製品概要 De novoシーケンシングは、参照配列のない生物種のゲノム配列を取得できます。動物・植物・微生物の全ゲノムデー

- 26 -

ゲノミクス

増幅方法

dNTPs プライマー Phi29 DNAポリメラーゼ

インプットDNA プライマーと鋳型DNAの結合 DNA重合反応の開始

DNA重合反応の継続相補鎖の置換新プライマーと新DNA鎖の結合新DNA鎖のDNA重合反応

図 2 Phi29 DNAポリメラーゼによりゲノム DNAを増幅するマルチプル置換増幅(MDA)

技術パラメーター

1.サンプル要件

組織サンプル 手術等で採取後、直ちに -80℃で保存(保存期間:1 年以内)

全血(あるいは骨髄)サンプル 5mL 以上(凝固しないよう -80℃で保存)

細胞液あるいは細胞系サンプル 106 細胞

腫瘍サンプル推奨サイズ:1 ~ 2cm3

(抽出が困難・貴重なサンプル:5mm3 以上)

分離された単一細胞

無菌 DNase/RNase free PCR チューブ (0.2mL) で保存。

・溶剤は PBS(DAPI,EB free) を使用のこと( 2µL 以下)

・-80℃で保存(保存期間:1 週間以内)

・ドライアイスを同梱して輸送

※単細胞の増幅効率に影響のある染色・標識等で分離した際は、 事前に BGI までご連絡ください。

2. シーケンス解析:101PE

3. 推奨データ量:リシーケンス深度≧ 30X

応用および BGIの実績 • 微量の臨床サンプルのプロファイリング

• 腫瘍内の異種性の解析および医化学療法の指導

• 腫瘍の発達に伴う癌細胞の進化の解析

Page 28: I. ゲノミクス 01...- 2 - ゲノミクス De novoシーケンス解析 製品概要 De novoシーケンシングは、参照配列のない生物種のゲノム配列を取得できます。動物・植物・微生物の全ゲノムデー

- 27 -

ゲノミクス

納期100 サンプル以下(30X):約 12 週間

BGIの実績例 1 骨髄増殖癌

典型的 JAK2- 陰性骨髄増殖癌患者の 90 個の単細胞の全エ

キソームシーケンスを解析したところ、本態性血小板血症

(ET)の関連遺伝子「SESN2」および「NTRK1」の変異体

候補が観察され、腫瘍進化に関与することが示唆されまし

た。

図 3 JAK2-陰性骨髄増殖癌の Single-Cellエキソーム シーケンス解析および単クローン進化

Hou, Y., Song, L., Zhu, P., Zhang, B., et al. Single-cell exome sequencing and monoclonal evolution of a JAK2-negative myeloproliferative neoplasm. Cell. 2012, 148, 873-85.

BGIの実績例 2 明細胞型腎細胞癌

明細胞型腎細胞癌患者の 25 個の腫瘍細胞および体細胞を

全エキソームシーケンス解析したところ、腫瘍細胞の異種

性は系群を形成せず、「VHL」および「PBRM1」など重要

な遺伝子変異は出現しませんでした。

図 4 Single-Cell エキソームシーケンス解析による 腎腫瘍の単塩基変異の観察

Xu, X., Hou, Y., Yin, X., et al. Single-cell exome sequencing reveals single-nucleot ide mutat ion characteristics of a kidney tumor. Cell. 2012, 148, 886-95.

Page 29: I. ゲノミクス 01...- 2 - ゲノミクス De novoシーケンス解析 製品概要 De novoシーケンシングは、参照配列のない生物種のゲノム配列を取得できます。動物・植物・微生物の全ゲノムデー

- 28 -

ゲノミクス

ワークフロー データ解析

標準データ解析 • データフィルタリング

• マルチプル配列のアセンブリー

• 非反復の SSR 遺伝子座の分離

• 遺伝子座とプライマーの結果

オプションデータ解析 • 隣接領域の抽出

• 相同配列の集約

• マルチプル配列のアセンブリー

• 多型性遺伝子座の発見

• 多型性遺伝子座のプライマー設計と結果

カスタマイズ • お客様のご要望に合わせ、データ解析をカスタマイ

ズします。

単純反復配列遺伝子座の開発

製品概要 単純反復配列(simple sequence repeat、SSR)は、原核生物と真核生物のゲノムに広く存在する短い縦列型反復

配列からなるもので、多型性に富んでいます。SSR マーカーは重要な断片長多型分子マーカー技術として、遺伝子

育種・集団進化研究・遺伝子多様性・分子生態学などの分野で利用されます。

 BGI は、次世代シーケンシング技術に基づいた SSR 遺伝子座の開発の新たな研究方法を提供します。HiSeqTM シー

ケンシングプラットフォームによる全ゲノム範囲の低深度シーケンシングでは、SOAPdenovo ソフトウェアで短配

列アセンブリーを行い、高品質なゲノム情報を獲得できます。遺伝子座の探索とプライマー設計を通じて、SSR マー

カーシステムが効率的に構築されます。

技術特長 • 高い費用対効果:低価格で大量の SSR 遺伝子座を獲得可能

• 高効率:1 ~ 2 ヶ月の短納期

• 高品質なデータと低偽陽性率:アセンブリーされた高品質なスカフォールドから SSR 遺伝子座を探索

• 多型性遺伝子座の開発:親世代或いは両集団からの代表個体を利用して、多型性遺伝子座を開発可能

ゲノム DNA

ライブラリー作製

シーケンシング

データ解析

(平均シーケンス深度 10X)

アセンブリー

遺伝子座とプライマー

の結果

非反復の SSR 遺伝子座

の探索アライメント

多型性遺伝子座プライマー設計

非多型性の分析

多型性の分析

納期オプションデータ解析を含まない場合:約 9 週間

オプションデータ解析を含む場合(サンプル数≦ 3 個):約 11 週間

Page 30: I. ゲノミクス 01...- 2 - ゲノミクス De novoシーケンス解析 製品概要 De novoシーケンシングは、参照配列のない生物種のゲノム配列を取得できます。動物・植物・微生物の全ゲノムデー

- 29 -

ゲノミクス

Ⅰメタゲノム解析

製品概要メタゲノム解析では、微生物相構造多様性や、微生物群集ゲノムの構成と機能、特定環境における代謝経路などを

調べることができます。

技術特長 • 高コストパフォーマンス

• 広い研究範囲:培養できない生物の研究制限がなくなり、環境内全ての微生物を調査可能。

また環境微生物相多様性の情報獲得だけではなく、遺伝子機能活性の研究も可能。

• 納期が短く、高効率

ワークフロー

データ解析

データの処理 • アダプターと低品質データの除去

• ホストのゲノムのコンタミネーションの除去

• データの統計

サンプル

ライブラリーの作製

クラスターの準備とシーケンシング

生データ

クリーンデータ

アセンブリー

アセンブリー報告

複数サンプルの比較と分析

非冗長性の遺伝子カタログの作製

ゲノム機能分析

機能アノテーション (KEGG、CAZy、eggNOG)

抗生物質の耐性因子の分析

品質検査

アセンブリの評価

ゲノム成分分析

転位因子分析

サンプル分類に関る有意要因のスクリーニング(遺伝子、機能)

ロファージ分析

主成分分析(PCA)

遺伝子予測

クラスタリング

ORF

種の構成と存在量

結果報告書

ライブラリーの品質管理

Page 31: I. ゲノミクス 01...- 2 - ゲノミクス De novoシーケンス解析 製品概要 De novoシーケンシングは、参照配列のない生物種のゲノム配列を取得できます。動物・植物・微生物の全ゲノムデー

- 30 -

ゲノミクス

標準データ解析 • アセンブリー

• メタゲノム構成種の定量

• ゲノムの構成(遺伝子・転移因子予測)

• NR 遺伝子一覧作製

• ゲノム機能解析

◆ KEGG データベースに基づく代謝経路解析

◆ CAZy(carbohybrate-Active Enzymes)データベースに基づく糖質分解酵素解析

◆ eggNOG(evolutionary genealogy of genes: Non-supervised Orthologous Groups)データベースに基づくオーソログ遺伝子解析

◆ 抗生物質の耐性因子の分析

• 複数のサンプルの比較と分析

オプションデータ解析 • お客様のご要望に合わせ、データ解析をカスタマイズします。

技術パラメーター1.サンプル要件

2.シーケンス解析:Illumina HiSeq・MiSeq3.推奨ライブラリーサイズ:150 ~ 180bp(複雑環境)/350bp(単純環境)

納品物

1. シーケンシング結果(clean data)は FASTQ ファイルで納品

2. 納品データ例

納期

※オプションデータ解析をご希望の場合は、別途お問い合わせください。

※サンプルの送付が数回に渡る場合、納期は最終サンプル到着からの起算となります。

※サンプル数が 100 以上の場合は、別途お問い合わせください。

サンプル量 ≧ 2µgサンプル濃度 ≧ 30ng/µL

図 1 人類腸管マイクロバイオームのカバレッジ 図 2 T2D腸管微生物相の分類と機能

サンプル数 データ解析なし 標準データ解析あり

1 ~ 50 約 8 週間 約 11 週間

51 ~ 100 約 10 週間 約 14 週間

Page 32: I. ゲノミクス 01...- 2 - ゲノミクス De novoシーケンス解析 製品概要 De novoシーケンシングは、参照配列のない生物種のゲノム配列を取得できます。動物・植物・微生物の全ゲノムデー

- 31 -

ゲノミクス

Ⅰ16S rDNA解析 (Illumina HiSeq 2000)

製品概要16S rDNA は細菌分類学の研究で一般的に用いられている「分子の時計」です。16S rDNA 配列の変異と含有量を測

定することで、環境サンプルの群集多様性の情報を解読できます。16S rDNA に基づいた解析は、微生物の分類鑑定、

生態研究などの分野で重要な役割を果たしています。

技術特長 • 操作が簡単:菌株の分離が不要

• 高精度

• ハイスループット:データ産出量が多く、高効率

ワークフロー

PCR 増幅

ライブラリー作製

シーケンス解析

データ解析

データ解析

標準データ解析 • データの統計

アダプターと低品質データを除去

プライマー配列を除去

産出データと品質管理

ペアエンドリードをアセンブリーしてタグを獲得

• 種の構成とアバンダンス解析

種のアノテーション

種(或いは OTU)のアバンダンス解析(門綱目科属種から比較統計)

• サンプル複雑度解析

単一サンプルの複雑度解析(α多様性解析)

サンプル間の複雑度比較解析(β多様性解析、サンプル数≧ 2)サンプル間の複雑度差異主要因子解析(主成分分析、サンプル数≧ 3)異なるサンプルの種構成クラスター分析(サンプル数≧ 3)

オプションデータ解析 • お客様のご要望に合わせ、データ解析をカスタマイズします。

ゲノム DNA

Page 33: I. ゲノミクス 01...- 2 - ゲノミクス De novoシーケンス解析 製品概要 De novoシーケンシングは、参照配列のない生物種のゲノム配列を取得できます。動物・植物・微生物の全ゲノムデー

- 32 -

ゲノミクス

技術パラメーター

サンプル要件

納品物

1. シーケンシング結果(clean data)は FASTQ ファイルで納品

2. 納品データ例

図 1 ミスマッチを持つタグのミスマッチ率とエラー率

納期

※オプションデータ解析をご希望の場合は、別途お問い合わせください。

※サンプル数が 100 以上の場合は、別途お問い合わせください。

サンプル種類 DNA・16S rDNA V6 領域の PCR 産物

サンプル量 ≧ 1µgサンプル濃度 ≧ 10ng/µL

サンプル数 データ解析なし 標準データ解析あり

4 ~ 50 約 8 週間 約 9 週間

51 ~ 100 約 10 週間 約 11 週間

Page 34: I. ゲノミクス 01...- 2 - ゲノミクス De novoシーケンス解析 製品概要 De novoシーケンシングは、参照配列のない生物種のゲノム配列を取得できます。動物・植物・微生物の全ゲノムデー

- 33 -

ゲノミクス

GBS(Genotyping by sequencing)

製品概要 Genotyping by sequencing (GBS) は Illumina 次世代シーケンス解析を使ったシンプルな高度マルチプレックスシ

ステムです。遺伝子解析時に、大量の SNP を見つけることが可能です。

 このシステムの特長は簡略化されたサンプル調整・従来よりも少ない PCR・少ない処理工程・サイズの分画が不要・

バーコード化が低価格であることです。制限酵素を使用することによりゲノムの複雑さを低下させ、ゲノムの中で

の重複を避けることができます。GBS は将来的に動植物の育種や保護、地球上の種や集団の調査に応用させること

も可能です。

技術特長 • 簡単、迅速

• 簡素化されたコンピュータ解析

• 高精度な SNP コーリング

• 低コスト

• 微量のサンプルで解析可能

ゲノム DNA

制限酵素処理

ライブラリー作製

シーケンシング

クリーンデータ

標準データ解析(SNP 解析など)

オプションデータ解析

生データ

クラスター

(参照配列無し)

アライメント

(参照配列有り)

図 1 ライブラリー作製の流れ

図 2 GBSアダプターと酵素

ワークフロー

Page 35: I. ゲノミクス 01...- 2 - ゲノミクス De novoシーケンス解析 製品概要 De novoシーケンシングは、参照配列のない生物種のゲノム配列を取得できます。動物・植物・微生物の全ゲノムデー

- 34 -

ゲノミクス

技術パラメーター1.サンプル要件

2.シーケンス解析:Illumina HiSeq

納品物1. シーケンシング結果(clean data)は FASTQ ファイルで納品

2. 結果報告書

3. 納品データ例

表 1 ジェノタイピングの結果

record_ID position P1 P2 sample 1 sample 1 sample nrecord_1 50 a b a a ... brecord_4 20 a b a b ... arecord_7 21 a b a - ... arecord_8 51 a b b a ... a

record_10 41 a b a a ... arecord_11 19 a b a a ... a

【データの見方】

1 行目:タイトル、2 行目~:SNP マーカー

1 列目:SNP マーカーを持つ GBS タグのラベルの ID2 列目:GBS タグ内の SNP の位置

3・4 列目:親の遺伝子型

5 列目~:世代の遺伝子型、「-」は損失したデータ

納期

ライブラリー作製・シーケンシング・標準データ解析:約 8 週間

標準データ解析 • シーケンシングデータの基礎解析

• tag 産出データの統計

• 個体 tag のクラスター

• 集団 tag のクラスター

• SNP の検出

オプションデータ解析――遺伝子地図作成 • ジェノタイピング

• 遺伝地図の統合

• QTL マッピング

• 遺伝地図のアセンブリー

オプションデータ解析――集団進化研究 • 系統発生樹の解析

アプリケーション • 遺伝子連鎖分析

• 集団分析:系統図、集団構造解析、主成分分析

• 連鎖不平衡分析(LD)

• ゲノムワイド関連解析(GWAS)等

データ解析

サンプル DNA( コンタミネーションなし)

サンプル量 300ng/ 回サンプル濃度 ≧ 25ng/µL

• 集団構造の分析

• 主成分分析(PCA)

Page 36: I. ゲノミクス 01...- 2 - ゲノミクス De novoシーケンス解析 製品概要 De novoシーケンシングは、参照配列のない生物種のゲノム配列を取得できます。動物・植物・微生物の全ゲノムデー

- 35 -

ゲノミクス

PacBio RS II次世代シーケンス解析

製品概要 PacBio RS II は 1 分子レベルでリアルタイムに塩基を読み取ることができ(SMRT® DNA シーケンシング技術)、

塩基修飾も同時に検出できるシーケンサーです。ほかのどの技術よりもはるかに長いリードが出力されます。

 GC バイアスの無いキロベース単位の超ロングリードが均一のカバレッジで出力されることにより、バクテリアだ

けでなく、それ以上のゲノムサイズの生物の de novo アセンブリーに大きく貢献します。

技術特長 • 簡単、迅速:1 セルあたりのシーケンシング反応時間は 3 時間未満

• 1 分子レベルのリアルタイム解析

• カスタマイズが可能

シーケンシング原理

リアルタイムに塩基を読み取る際に得られるカイネティクス情報から、塩基修飾も同時に検出することが可能。

Page 37: I. ゲノミクス 01...- 2 - ゲノミクス De novoシーケンス解析 製品概要 De novoシーケンシングは、参照配列のない生物種のゲノム配列を取得できます。動物・植物・微生物の全ゲノムデー

- 36 -

ゲノミクス

アプリケーション • 全長ゲノム配列決定

• ターゲットリシーケンシング

• ゲノムバリエーション解析:

 連続する繰り返し配列のシーケンス

 アイソフォーム全長シーケンス

 完全長 16S シーケンシング

 構造変異やコピー数変異の検出、SNP の検出と確認、低頻度の変異の検出

 複合変異とハプロタイプフェ-ジング

• エピゲノム分野への応用

技術パラメーターサンプル要件

※凍結融解は最小限にし、紫外線照射や蛍光標識をせず、pH6 ~ 9 の環境下で、高温を避けて保存してください。

※キレート剤 (EDTA など)・2 価金属イオン (Mg2+ など )・変性剤(グアニジン塩、フェノールなど)・洗剤(ヘム、腐植酸、ポリフェ

ノールなど)が入らないようにして下さい。

※電気泳動写真を必ず添付してください。

納期ライブラリー作製・シーケンシング:約 8 週間

サンプル ゲノム DNA( 不溶性物質・RNA の混入なし)

サンプル量 2 ~ 10Kb:5µg/SMRT Cell11 ~ 20Kb:10µg/SMRT Cell

サンプル濃度 ≧ 30ng/μLサンプル純度 OD260/280=1.8 ~ 2.0、OD260/230=2.0 ~ 2.2