i. ゲノミクス 01...- 2 - ゲノミクス de novoシーケンス解析 製品概要 de...
TRANSCRIPT
I. ゲノミクス ................................................................................................................ 011. De novo シーケンス解析 ............................................................................................................. 022. 全ゲノムリシーケンス解析 ......................................................................................................... 083. ヒト全ゲノムリシーケンス解析 (Illumina HiSeq X Ten) ............................................................. 104. エキソーム & ターゲット領域シーケンス解析 (Illumina HiSeq 2000) ........................................ 125. CG(Complete Genomics)エキソーム解析 .............................................................................. 166. RAD-Seq 解析 ............................................................................................................................. 187. Optical Mapping .......................................................................................................................... 218. FFPE ゲノムシーケンス解析 ...................................................................................................... 239. Single cell シーケンス解析 .......................................................................................................... 2510. 単純反復配列遺伝子座の開発 ...................................................................................................... 2811. メタゲノム解析 ........................................................................................................................... 2912. 16S rDNA 解析 (Illumina HiSeq 2000) ........................................................................................ 3113. GBS(Genotyping by sequencing) ............................................................................................. 3314. PacBio RS II 次世代シーケンス解析 ........................................................................................... 35
II. トランスクリプトミクス .......................................................................................... 371. トランスクリプトームシーケンス解析 ........................................................................................ 382. RNA-Seq (Quantification) 解析 .................................................................................................... 423. 真核 Small RNA 解析 ................................................................................................................... 444. MicroRNA および mRNA の統合解析 .......................................................................................... 475. FFPE RNA-Seq トランスクリプトーム解析 ............................................................................... 496. Long Non-Coding RNA シーケンス解析 ...................................................................................... 527. メタトランスクリプトミクス解析 .............................................................................................. 548. RIP-Seq 解析 ............................................................................................................................... 56
III. エピジェネティックス .............................................................................................. 581. 全ゲノム Bisulfite メチル化解析 .................................................................................................. 592. Reduced Representation Bisulfite Sequencing (RRBS) .............................................................. 613. MeDIP-seq 解析 .......................................................................................................................... 634. ChIP-seq 解析 ............................................................................................................................. 65
IV. 付録 ........................................................................................................................... 67
目 次
- 01 -
ゲノミクス
Ⅰ
◆
ゲノミクス1
De novo シーケンス解析全ゲノムリシーケンス解析
ヒト全ゲノムリシーケンス解析 (Illumina HiSeq X Ten)
エキソーム&ターゲット領域シーケンス解析 (Illumina HiSeq 2000)
CG(Complete Genomics)エキソーム解析
RAD-Seq解析
Optical Mapping
FFPEゲノムシーケンス解析
Single cellシーケンス解析
単純反復配列遺伝子座の開発
メタゲノム解析
16S rDNA解析 (Illumina HiSeq 2000)
GBS(Genotyping by sequencing)
PacBio RS II次世代シーケンス解析
- 2 -
ゲノミクス
Ⅰ
De novo シーケンス解析
製品概要De novo シーケンシングは、参照配列のない生物種のゲノム配列を取得できます。動物・植物・微生物の全ゲノムデー
タを取得するために、データ解析を用いて全ゲノムマップを組み立てます。全ゲノムシーケンシングは生物種を解
明するための、最も効率的な手法の一つです。
技術特長 • ハイスループット・高効率・低コスト
• 高カバー率・高精度
• BGI が独自に開発した SOAPdenovo2 でのアセンブリー
• 植物や動物のDe novo シーケンシングプロジェクトを何百件も完成させた BGI チームの豊かな研究経験
ワークフロー
1.動植物のDe novo シーケンシングゲノムの特徴に基づき精密なゲノムマップを作成するには、2 つ方法(コモンとコンプレックス)があります。
• ゲノムサーベイ
ゲノムサーベイは、特徴不明なゲノムを解析するために必要な方法です。
ゲノム DNA
ライブラリー作製
(170bp/500bp/800bp)
シーケンシング(101PE)
データフィルタリング
K-mer 深度分布解析による
ゲノムサイズの予測
GC 深度分布の解析
アセンブリー
ヘテロ接合率の予測
ゲノムサーベイの結果によって、ゲノムの種類を決めます。
ゲノム種類 ゲノムサイズ 倍数性 ヘテロ接合度 重複配列コンテンツ GC コンテンツ
コモン ≦ 3Gb 一倍体・二倍体 < 0.5% < 50% 35% ~ 65%コンプレックス > 3Gb 二倍体・多倍体 ≧ 0.5% ≧ 50% < 35%・> 65%
• コモンゲノムの場合
ゲノムサーベイ
サイズが異なるライブラリーの作製
2-20kb mate-pair
ペアエンドシーケンシングでカバレッジ60×を獲得
SOAPdenovoでのアセンブリー
ゲノム解析
図 1 コモンゲノムのワークフロー
- 3 -
ゲノミクス
Ⅰ
・アセンブリーの指標
ゲノムサイズ(GS) アセンブリーの指標
GS ≦ 300Mbコンティグ N50 ≧ 20Kb
スカフォード N50 ≧ 600Kb 300Mb < GS ≦ 1500Mb
(鳥類以外)
コンティグ N50 ≧ 20Kb スカフォード N50 ≧ 600Kb
1500Mb < GS ≦ 3000Mb(哺乳類以外)
コンティグ N50 ≧ 20Kb スカフォード N50 ≧ 300Kbコンティグ N50 ≧ 10Kb
スカフォード N50 ≧ 150Kb
GS < 1600Mb(鳥類)コンティグ N50 ≧ 20Kb スカフォード N50 ≧ 2Mb
GS < 3200Mb(哺乳類)
コンティグ N50 ≧ 20Kb スカフォード N50 ≧ 5Mb
• コンプレックスゲノムの場合
ゲノムサーベイ
ペアエンドシーケンシングでカバレッジ50×以上を獲得
SOAPdenovoでのアセンブリー
BAC/Fosmidライブラリーの作製・プーリング
50×以上ショットガンシーケンシング
BAC/Forsmidショットガンアセンブリー
全ゲノムアセンブリーおよびBAC/Forsmidとの統合
ゲノム解析ドラフトマップ
BAC/Fosmidアセンブリー
高品質マップ
サイズが異なるライブラリーの作製
2-20kb mate-pair
図 2 コンプレックスゲノムのワークフロー
・アセンブリーの指標
コンティグ N50 ≧ 20Kb、スカフォード N50 ≧ 300Kb
2.微生物のDe novo シーケンシング • 真菌のDe novo シーケンシング
サンプル品質検査
カバレッジ 30 x
カバレッジ 50 x
NGS
NGS
DNA
短鎖インサートライブラリーの作製
アセンブリーの難易度の評価及び
データ解析を続行するかどうかの判定
オプションデータ解析
プライマリアセンブリー
データフィルタリング
アドバンスドアセンブリー
- 4 -
ゲノミクス
Ⅰ
・アセンブリーの指標 (アドバンスドアセンブリーをする前にプライマリアセンブリーが必要です。アドバンスドアセンブリー
の指標は、プライマリアセンブリーの結果によって決定されます)。
指標 プライマリアセンブリーアドバンスドアセンブリー
(指標は菌株の特徴により決定)
スカフォード N50シーケンシング深度 ≧ 50x (ライブラリーのサイズ≦
500bp)
シーケンシング深度 ≧ 100x
プライマリアセンブリー N50 アドバンスドアセンブリー N50
0 ~ 30Kb ≧ 100Kb
30 ~ 50Kb ≧ 100Kb/300Kb
50 ~ 100Kb
≧ 100Kb/300Kb(GS < 100Mb、
N50 ≧ 100Kb/300Kb/500Kbが選択できます)
100 ~ 300Kb 300Kb/500Kb/1Mb
300 ~ 500Kb ≧ 500Kb/1Mb
• 細菌のDe novo シーケンシング(HiSeq プラットフォーム)
・アドバンスドアセンブリー
DNA
短鎖インサートライブラリーの作製
オプションデータ解析
プライマリアセンブリー
データフィルタリング
アドバンスドアセンブリー
サンプル品質検査
カバレッジ 100 x NGS
・アセンブリーの指標
種類 指標
アドバンスドアセンブリー
シーケンシング深度 ≧ 100x染色体・染色質ゲノム カバレッジ ≧ 95%遺伝子領域(相関性の高い配列)カバレッジ ≧ 98%
正常な GC コンテンツ
( 35% ≦ GC ≦ 65% )GS ≦ 5Mb スカフォード数< 1005Mb < GS < 10Mb スカフォード数< 150
異常な GC コンテンツ
( GC < 35%、GC > 65% )GS ≦ 5Mb スカフォード数< 2005Mb < GS < 10Mb スカフォード数< 300
- 5 -
ゲノミクス
Ⅰ
・コンプリートマップ
・アセンブリーの指標
種類 指標
プライマリアセンブリー シーケンシング深度 ≧ 100x
アドバンスドアセンブリーシーケンシング深度≧ 150xスカフォード数< 45
コンプリートマップシーケンシング深度 ≧ 200xコンティグ=1、 ギャップ =0
※細菌のコンプリートマップ:1 コンティグ配列および PCR のバリデーション
1.アセンブリー • K-mer 深度分布解析とゲノムサイズの推定
• ゲノムヘテロ接合率の推定
• 初歩的なアセンブリー
• GC-Depth 分布の解析
• シーケンス深度の分布
2.アノテーション • 反復配列のアノテーション
• 遺伝子予測
• 遺伝子機能のアノテーション
• ncRNA の アノテーション
3.動植物進化解析 • オルソロガス遺伝子集団の同定
( 動物 : TreeFam、植物 : OrthoMCL)
• 系統発生解析
• 種分化の時間推定
• 全ゲノムアライメント分析 ( ゲノムシンテニー )
• セグメント重複 ( 動物 : WGAC、植物 : WGD)
4.微生物のオプションデータ解析 • GC skew を含むゲノムマップの作成
• シンテニー解析
• 遺伝子ファミリー解析
• CRISPR 予測
• ゲノムアイランド予測
• 溶原ファージ予測
• 分泌タンパク質予測
データ解析
サンプル情報PCR
... ...
OM
サンプル準備
ライブラリー作製
シーケンシング
ゲノムアセンブリー
1スカフォード 1コンティグ コンプリートマップ
- 6 -
ゲノミクス
Ⅰ
技術パラメーター
1.サンプル要件
サンプル DNA ( タンパク質・RNA などの混入無し )
サンプル量
短鎖ライブラリー (170 ~ 800bp) ≧ 3μg( 微生物≧ 2.5ng/μL)
長鎖ライブラリー (2Kb) ≧ 20μg
長鎖ライブラリー (5 ~ 6Kb) ≧ 20μg
長鎖ライブラリー (10Kb) ≧ 30μg
長鎖ライブラリー (20Kb、40Kb) ≧ 60μg
PCR-free ライブラリー ≧ 10μg
サンプル濃度短鎖ライブラリー (170 ~ 800bp) ≧ 30ng/μL ( 微生物≧ 25ng/μL)
長鎖ライブラリー (2 ~ 40Kb) ≧ 133ng/μL
サンプル純度 OD260/280=1.8 ~ 2.0
※ライブラリー作製が困難と判断される場合がありますので、予備のサンプルの同梱を推奨しています。
※具体的なサンプルの必要量については問い合わせください。
2. シーケンス解析:51PE・101PE
3. 推奨ライブラリーサイズ 短鎖ライブラリー:170bp・500bp・800bp 長鎖ライブラリー:2Kb・5Kb・10Kb・20Kb・40Kb
納品物1. シーケンシング結果 (clean data) は FASTQ ファイルで納品
2. 納品データ例
G+C content
160
150
140
130
120
110
100
90
80
70
60
50
40
30
20
Aver
age
sequ
enci
ng d
epth
0.25 0.3 0.35 0.4 0.45 0.5 0.55 0.6 0.65 0.7 0.75
Sequencing depth
Per
cent
age
of g
enom
e
図 4 シーケンス深度の分布図 3 GC含量とシーケンス深度の関係
- 7 -
ゲノミクス
Ⅰ
Sequence divergence rate (%)
Per
cent
age
of g
enom
e
Number of gene families
納期
動物 / 植物 Survey:2 ヶ月 コモンゲノム:3 ヶ月~ 6 ヶ月 複雑なゲノム:1 年
真菌シーケンシングのみ:
約 7 週間
プライマリアセンブリー:
約 7 週間
アドバンスドアセンブリー:
約 11 週間
細菌プライマリアセンブリー:
約 7 週間
アドバンスドアセンブリー:
約 9 週間
コンプリートマップ:
約 13 週間
図 6 異なるゲノムにおけるオルソロガス遺伝子
(複製された遺伝子は一つと見なす )
図 5 シーケンスの発散率
- 8 -
ゲノミクス
Ⅰ
全ゲノムリシーケンス解析
製品概要全ゲノムリシーケンシングは塩基配列が既知の物種をシーケンシングし、個体や集団レベルで差異性分析を行う技
術です。リシーケンシングの短リード・ペアエンドリード及び異なるインサートサイズのライブラリー作製によって、
遺伝子配列の差異や構造変異を全面的に検出できます。全ゲノムリシーケンシングは動植物の育種・集団進化・創薬・
疾患研究・臨床診断などの領域で最も役に立つ方法の一つです。
技術特長 • 多様な変異の検出:SNP・InDel・SV・CNV の検出
• 新たな変異の発見:チップと比べ、新しい変異を検出可能
• 高コストパフォーマンス:de novo シーケンシングと比べ、納期が短く低コスト
ワークフロー
ゲノム DNA
ライブラリー作製
シーケンシング
クリーンデータ
アライメント
生物学解析
• 産出データの統計
• カバー率の統計
• データの深度分布
• アライメント結果統計
可視化
• SNP・InDel・SV・CNV 検出
• SNP・InDel・SV・CNV アノテーション • SNP・InDel・SV・CNV 解析
生データ
品質管理、データのフィルタリング
1.標準データ解析 • アノテーション
• データの統計
• SNP コール・アノテーション・統計
2.オプション解析(農業研究領域) • 変異検出
• 点突然変異
• 集団進化
• GeneticMap 作製
• BinMap 作製
• HapMap 作製
• 全ゲノム関連分析
3.オプション解析(健康と疾患研究領域) • 人種群のオプション解析
• 癌のオプション解析
• 複雑疾患のオプション解析
• 単一遺伝子疾患研究のオプション解析
4.カスタマイズ • お客様のご要望に合わせ、データ解析をカスタマイ
ズします。
データ解析
- 9 -
ゲノミクス
Ⅰ
技術パラメーター
1.サンプル要件
サンプル DNA
サンプル量動植物・ヒト
≧ 2.5μg
サンプル濃度 ≧ 25ng/μL
サンプル純度 OD260/280=1.8 ~ 2.0
※ライブラリー作製が困難と判断される場合がありますので、予備のサンプルの同梱を推奨しています。
2.シーケンス解析:101PE・126PE
3. 推奨ライブラリーサイズ:500bp
納品物1. シーケンシング結果 (clean data) は FASTQ ファイルで納品 2. 納品データ例
Chromosome
Seq
uenc
lng
dept
h(X
)
GC
(%)
Depth(X)
Per
cent
age(
%)
納期ライブラリー作製・シーケンシング・標準データ解析:約 10 週間
※サンプル数が 10 以上の場合は、プロジェクトの規模により納期が異なりますので、別途お問い合わせください。
図 1 各染色体における GC含量率とシーケンス深度の有効分布 図 2 シーケンス深度の分布
- 10 -
ゲノミクス
Ⅰ
ヒト全ゲノムリシーケンス解析 (Illumina HiSeq X Ten)
製品概要
Illumina HiSeq X Ten は 2014 年 1 月に発表された、Illumina 社の最新型のシーケンシングシステムです。このプ
ラットフォームは驚異的なテクノロジーのブレイクスクールをもち、1 つの施設で 1 年間に数万サンプルの処理能力
を提供することで比類ない規模の研究を可能にします。HiSeq® 2500 のパフォーマンスと比べて 10 倍以上に相当す
る 1 日あたりのスループットを産出するなど、ハイスループット・高品質・高カバレッジ・低コストといった特長
を持っています。
HiSeq X Ten システムは超ハイスループットシーケンサー HiSeq 10 台で構成され、年間 18,000 ゲノムを解読する
ことができます。HiSeq X Ten は研究者に更に大規模なヒトゲノムシーケンシングを提供でき、癌や複雑な疾病など
に関する遺伝変異の研究を新たなレベルに進めることができます。
技術特長 • ハイスピードなシーケンシング
• ハイスループット、ビッグデータ
• 高精度(99.9% 以上)
• ロングリード
アプリケーション現在、ヒトゲノムリシーケンシングのみを提供しています。
データ解析
1.標準データ解析 • シーケンシングデータの基礎解析
• SNP/InDel コール・アノテーション・統計
2.オプションデータ解析 • ジェネラルオプションデータ解析
• 腫瘍、メンデル遺伝病、複雑疾患オプション解析
• 集団遺伝オプション解析
3.カスタム解析
データ品質(参考)
Sample name Raw read Effective(%) Error(%) Q20(%) Q30(%) GC(%)
Human-1 39087255 99.24 0.03;0.04 96.92;94.02 92.56;87.24 43.32;43.30
Human-2 36099281 99.25 0.03;0.05 96.93;93.31 92.27;86.53 43.29;43.24
Human-3 31890227 99.27 0.02;0.05 97.08;92.54 92.96;85.71 43.27;43.24
Human-4 39036347 99.24 0.02;0.04 97.23;93.68 93.26;87.19 43.30;43.25
- 11 -
ゲノミクス
Ⅰ
技術パラメーター
サンプル要件サンプル DNA(分解やコンタミネーションがないこと)
サンプル量 ≧ 3μg
サンプル濃度 ≧ 50ng/μL
サンプル純度 OD260/280 ≧ 1.8
シーケンス解析 150PE
QC Q30 ≧ 75%
納品物1. シーケンシング結果 (clean data) は FASTQ ファイルで納品
2. 結果報告書
納期ライブラリー作製・シーケンシング・標準データ解析:約 8 週間
- 12 -
ゲノミクス
Ⅰ
エキソーム &ターゲット領域シーケンス解析(Illumina HiSeq 2000)
製品概要エキソーム & ターゲット領域シーケンス解析は、特殊プローブを利用し、お客様が興味を持つタンパク質コーディ
ング領域 DNA 或いはある特定配列をキャプチャー・濃縮後にシーケンシングするというゲノミクス分析方法です。
この方法によって、指定したエキソーム & ターゲット領域の遺伝情報を獲得でき、エキソーム領域の研究効率を飛
躍的に向上させ、研究コストを大幅に減少させます。主に、疾患と集団進化に関するコーディング領域の構造変異
の研究で利用されます。公共データベースのエキソームデータと照合することで、変異構造間の関連性と病原性の
メカニズムをより良く解明できます。
技術特長 • 高カバー率:ターゲット領域のカバー率は 98% 以上
• 高精度:単一塩基まで識別可能
• 高コストパフォーマンス:全ゲノムシーケンシングと比べ、はるかに低コスト
ワークフロー
ゲノム DNA
ターゲット領域とエキソームキャプチャー
ライブラリー作製
シーケンシング
生データ品質管理、
データのフィルタリング
クリーンデータ
シーケンス深度統計
シーケンス均一性の統計分析
アノテーション:
• SNP のコールとアノテーション
• InDel のコールとアノテーション
• SIFT アミノ酸予測
• アミノ酸置換予測
- 13 -
ゲノミクス
Ⅰ
技術パラメーター
1. サンプル要件
※ライブラリー作製が困難と判断される場合がありますので、予備のサンプルの同梱を推奨しています。
2. キャプチャープラットフォーム • エキソーム
SureSelect Human All Exon Roche NimbleGen SeqCap EZ Exome SureSelect Mouse All Exon
Agilent V3(50M) v2.0(44M) Agilent Mouse(50M)
Agilent V4(51M) v3.0(64M)
Agilent V4+UTRs(71M) Exome+UTR(64M Exon+32M UTR)
Agilent V5(50M) Monkey Array(50M)
Agilent V5+UTR(75M) Maize Exome, Barley Exome, Wheat Exome, Soy Exome, Mouse Exome
1. 標準データ解析
エキソーム
• アダプターと低品質データを除去
• データとゲノムのアライメント
• データの産量統計解析、シーケンス深度解析、均一
性解析
• InDel、SNP 変異の検出
• InDel、SNP の RefGene アノテーション
• InDel、SNP データベース解析
• SNP 保守性の予測と病原性解析(ヒトサンプルのみ)
• 遺伝子の中の SNP 分布解析
• 遺伝子の中の InDel 分布解析
ターゲット領域
• アダプター、コンタミ配列と低品質リードを除去
• シーケンシング結果の評価
• SNP、InDel の検出、アノテーションと統計
• SNP 保守性の予測と病原性解析(ヒトサンプルのみ)
2.オプションデータ解析エキソーム
ヒトサンプル:
• メンデル遺伝病データ解析
• 複雑疾患、腫瘍データ解析
動植物サンプル:
• 全ゲノム関連解析 (GWAS)
集団進化オプション解析
• 他の解析をご希望の場合はお問い合わせください
• ターゲット領域
ヒトサンプル:
• 非コード領域 SNP、InDel のアノテーションと統計
(ENCODE データベース)
• 腫瘍、メンデル遺伝病、複雑疾患オプション解析
• 集団進化オプション解析
動植物サンプル:
• InDel の検出、アノテーションと統計
• ハプロタイピング:連鎖不平衡、ハプロタイプブ
• ロック推定
3. カスタマイズ • 複雑疾患カスタム解析
• 家系サンプルに基づく de novo 突然変異解析
データ解析
サンプル DNA
サンプル量 ≧ 2.5μg
サンプル濃度 37.5 ng/μL
サンプル純度 OD260/280 = 1.8 ~ 2.0
- 14 -
ゲノミクス
Ⅰ
• ターゲット領域
主要キャプチャーチップとキット カスタマーキット
Agilent SureSelect XT Custom Kit Agilent SureSelectXT Human Kinome Panel Kit
NimbleGen SeqCap EZ Choice XL library Agilent SureSelect XT X-chromosome Kit
NimbleGen SeqCap EZ Choice library
3. シーケンス解析:101PE
納品物1. シーケンシング結果 (clean data) は FASTQ ファイルで納品
2. 結果報告書
3. 納品データ例
表 1 SNPアノテーション一覧
ChrID PositionQuality score
ChainCodon phase
dbSNP or not
Ref AllelesSupporting
readsGene Name
MutType Codon ChangeResidue Change
Function
Chr1 743132 51 + - rs3115861 C G/G 10 - Hom - - intergenic
Chr1 798494 50 + - rs11240779 G A/A 18 - Hom - - intergenic
Chr1 1142976 92 + 2 rs12036216 G G/A 40763 SDF4 Het-one 'CTC ≧ CTT' 'Leu ≧ Leu' synonymous-coding
Chr1 1148494 99 + 2 rs6603781 A G/G 58 SDF4 Hom 'GAT ≧ GAC' 'Asp ≧ Asp' synonymous-coding
Chr1 1158006 56 + 1 snp1 G G/A 40668 B3GALT6 Het-one 'CGG ≧ CAG' 'Arg ≧ Gln' missense
Chr1 1235867 75 + - rs2296474 A G/G 133 PUSL1 Hom - - intron
Chr1 1236166 99 + 2 rs41285824 G G/A 40804 PUSL1 Het-one 'ACG ≧ ACA' 'Thr ≧ Thr' synonymous-coding
Chr1 1239050 92 + 2 rs12142199 G A/A 52 CPSF3L Hom 'TTC ≧ TTT' 'Phe ≧ Phe' synonymous-coding
Chr1 1244299 37 + 2 rs1886773 A G/G 5 CPSF3L Hom 'TAT ≧ TAC' 'Tyr ≧ Tyr' synonymous-coding
Chr1 1244306 38 + 1 rs1886772 G A/A 15 CPSF3L Hom 'CCG ≧ CTG' 'Pro ≧ Leu' missense
Chr1 1244704 99 + 2 rs10907179 C G/G 55 CPSF3L Hom 'GGG ≧ GGC' 'Gly ≧ Gly' synonymous-coding
表 2 InDelアノテーション一覧
ChrIDStart
positionEnd
positionSupporting
readsChain
Codon phase
ID Status Indel type Bases MutType Name Function
Chr1 869026 869036 3 + 1 indel1 novel -11 GCCCGCCCTCA Hete SAMD11 frameshift
Chr1 1100850 1100850 53 + - indel2 novel 1 C Hete - intergenic
Chr1 1637753 1637753 66 + 0 rs35961525 -8 6 TTTCTT Hete CDC2L2 frameshift
Chr1 1642925 1643927 8 + - rs35174499 -1 -3 GCG Homo CDC2L2 intron
Chr1 3535035 3535053 13 + - indel3 novel -19 TTCTGGGAGCTCCTCCCCC Hete TPRG1L utr-3
Chr1 3589610 3589610 29 + - indel4 novel -1 G Hete TP73 intron
Chr1 6093011 6093011 28 + - indel5 novel -1 G Hete CHD5 intron
Chr1 6175552 6175553 34 + - rs3035703 -2 -2 CA Hete RPL22 intron
Chr1 9693277 9693277 13 + - rs34885574 0 -2 AG Hete PIK3CD intron
Chr1 10279793 10279793 4 + - indel7 novel -1 T Hete KIF1B intron
Chr1 10347704 10347704 7 + - indel8 novel -1 T Homo KIF1B intron
- 15 -
ゲノミクス
Ⅰ
図 1 TCC内の STAG2遺伝子体細胞突然変異とコピー数の変化
図 2 エキソーム(ALL)とコーディング領域(CDS)における InDelの長さの分布
納期 • エキソームシーケンス解析
キャプチャー・ライブラリー作製・シーケンシング・標準データ解析:約 8 週間(100 サンプル以下)
• ターゲット領域シーケンス解析
チップカスタム・ライブラリー作製・シーケンシング:お問い合わせください。
※ターゲット領域サイズ =1Mb
※ BGI はアジレント・テクノロジー社認定のサービスプロバイダです。
InDel length distribution (All) InDel length distribution (CDS)
Num
ber
Num
ber
InDel length (bp) InDel length (bp)
- 16 -
ゲノミクス
Ⅰ
CG(Complete Genomics)エキソーム解析
製品概要Complete Genomics シーケンス解析システムは、高品質な新型ハイスループットシーケンシングプラットフォーム
で DNA Nanoball Arrays(DNBTM)テクノロジーと Combinatorial Probe-Anchor Ligation (cPAL) テクノロジーを採用
したことにより、塩基のエラー率を 10 万分の 1 まで減らすことに成功しました。また独自の強力な情報分析ツール
を搭載することで、より正確な変異解析と解析タイプの多様化を実現しました。BGI は現在、このプラットフォー
ムでエキソーム解析のサービスを提供しています。既に 15,000 件超のヒトゲノム解析を完成し、多くの顧客から高
い評価を得ています。
技術特長 • 高精度、エラー率は 10 万分の 1
• local de novo アセンブリー技術に基づいて変異種類を測定、より精確な結果を提供
• 変異を精確に検出できる、変異が所属する対立遺伝子の認識が可能
• CG プラットフォームの感度は 99.5%
• エキソームのカバレッジは 99%
• 再現性が高く、安定した品質
ワークフロー
サンプル
ライブラリー作製
品質検査
ライブラリーの品質管理
DNA Nanoball Arrays と cPAL シーケンシング
シーケンス DNBs リード
アライメント
local de novo アセンブリー
SNP コールと
アノテーション
InDel コールと
アノテーション
somatic SNP コール
とアノテーション
somatic InDel コール
とアノテーション
- 17 -
ゲノミクス
Ⅰ
データ解析
1. 標準データ解析
• アライメント評価
• SNP コール
• SNP アノテーション(genes、ncRNAs、dbSNP allele frequency など )
• SNP の統計
• InDel コール
• InDel アノテーション(genes、ncRNAs、dbSNP allele frequency など)
• InDel の統計
技術パラメーター
1. サンプル要件
2.キャプチャープラットフォーム:BGI kit, Agilent SureSelect, NumbleGen SeqCap EZ ※推奨シーケンシング深度:100x
納品物1. シーケンシング結果
2. 結果報告書
納期ライブラリー作製・シーケンシング・標準データ解析:約 7 週間
サンプル ゲノム DNA( コンタミネーションなし)
サンプル量 ≧ 3μg
サンプル濃度 ≧ 37.5 ng/μL
- 18 -
ゲノミクス
Ⅰ
RAD-Seq解析
製品概要RAD は Restriction-site Associated DNA の略で、制限酵素認識部位に関わる DNA です。RAD-Seq とは 、 酵素カッ
トされた RAD tag をハイスループットシーケンシングする技術です 。 この技術を用いることで 、 ゲノムの複雑さ
を大幅に減少させられるだけでなく、リファレンスゲノムの制限に影響されず高密度の SNP 部位を検出できます。
SNP サイトの分子マーカー技術に基づいた RAD-Seq は費用対効果が高く安定性に優れており、集団進化・遺伝子
地図の作成・Quantitative Trait Locus (QTL) マッピングや染色体 scaffold 作成の補助などの領域で利用されます。
技術特長 • 高密度・高カバー率:全ゲノムにわたる分子マーカーの獲得
• 高精度:徹底した品質管理とフィルター基準により、高精度な SNP の取得が可能
• 高コストパフォーマンス:特に大きいサンプルの研究に適用
• 高効率:集団進化研究や大きいサンプルのマップ作成は 3 ~ 4 ヶ月で完成可能
ワークフロー
ゲノムワイド関連解析(GWAS)■ 遺伝子型欠失データ処理(Imputation)■ GWAS 解析
■ 性状に関する遺伝子のスクリーニング
■ 候補遺伝子の機能アノテーション
ゲノム DNA
酵素カットとライブラリー作製
シーケンシング
生データ
オプション
データ解析
標準データ解析
品質管理、データのフィルタリング
クリーンデータ
アセンブリー(参照配列なし) アライメント(参照配列あり)
■ RNA tag の産出データ統計
■ 個体と集団の RAD tag クラスター(参照配列なし)/ アライメント(参照配列あり)
■ SNP の検出、アノテーションと統計
■ SNP の分類
集団進化研究
■ 集団遺伝構造の解析
■ 系統発生樹の分析
■ 主成分分析(PCA)■ 連鎖不平衡分析(LD)
遺伝地図の作成
■ ジェノタイピング
■ 遺伝地図の作成
■ QTL マッピング(表現型
のデータが必要) ■ 遺伝地図のアセンブリー
■ (元の遺伝地図が必要)
- 19 -
ゲノミクス
Ⅰ
データ解析
1.標準データ解析 • シーケンシングデータの基礎解析
• RAD tag 産出データの統計
• 参照配列のない生物種の場合:個体と集団 RAD tag のクラスター
• 参照配列のある生物種の場合:参照配列とのアライメント
• SNP の検出・アノテーション・統計
• SNP の分類
2.オプションデータ解析――遺伝地図の作成 • ジェノタイピング
• 遺伝地図の作成
• QTL マッピング(表現型のデータが必要)
• 遺伝地図のアセンブリー(元の遺伝地図が必要)
3.オプションデータ解析――集団進化研究 • 系統発生樹の分析 (Phylogeny tree)
• 集団構造の分析(Structure)
• 主成分分析(PCA)
• 連鎖不平衡分析(LD)
4.オプションデータ解析――ゲノムワイド関連解析(GWAS) • 遺伝子型欠失データ処理 (Imputation)
• GWAS 解析
• 性状に関する遺伝子のスクリーニング
• 候補遺伝子の機能アノテーション
技術パラメーター
1.サンプル要件
※ライブラリー作製が困難と判断される場合がありますので、予備のサンプルの同梱を推奨しています。
2.推奨ライブラリーサイズ:300 ~ 500bp
サンプル DNA( コンタミネーションなし)
サンプル量 1.0μg/ 回
サンプル濃度 ≧ 25ng/µL
- 20 -
ゲノミクス
Ⅰ
納品物1. シーケンシング結果 (clean data) は FASTQ ファイルで納品
2. 結果報告書
3. 納品データ例
図 1 組み換えの切断点の位置判定
図 2 RAD、RAD+SSR/STS、SSR/STSにおける遺伝地図比較
納期遺伝地図と集団進化:約 12 週間
GWAS 解析:約 16 週間
- 21 -
ゲノミクス
Ⅰ
動植物1. 酵素カットの結果分析
2. データのアセンブリーと解析
3. Scaffold の位置づけ
微生物1. 酵素カットの結果分析
2. データのアセンブリーと解析
• OM マップ
• Scaffold の位置付け
• 比較ゲノミクスの解析
• 菌株の分類
Optical Mapping
製品概要Optical mapping(OM)は制限酵素切断地図に基づいて、マイクロナノ加工技術を用い、単一 DNA 分子をチップに
固定させ制限酵素で切断した後、DNA 断片の長さや位置を蛍光標識して検出します。そして、DNA 断片を組み合わ
せて遺伝子地図を作成します。その遺伝子地図を利用して、scaffold との位置をアライメントして比較ゲノム解析を
行います。全ゲノム制限酵素地図は配列の位置を迅速に確定できるので、比較ゲノミクス解析・データアセンブリー
の補助・菌株の分類などで幅広く利用されています。
技術特長 • 制限酵素地図はアセンブリーの補助的な手段で、ゲノム配列が不要
• 高精度・高信頼度:制限酵素地図は物理情報を利用して断片を位置づけ
ワークフロー
ゲノム DNA
品質管理
制限酵素カット
蛍光標識とデータ収集
アノテーション
と生物学解析
動植物 :• アセンブリーと解析 • Scaffold の位置付け
微生物 :• OM マップの作成
• Scaffold の位置付け
• 比較ゲノミクスの解析 • 菌株の分類
データ解析
- 22 -
ゲノミクス
Ⅰ
技術パラメーター
サンプル要件
※ライブラリー作製が困難と判断される場合がありますので、予備のサンプルの同梱を推奨しています。
納品物納品データ例
Blue regions indicate similarities between different isolates.
White regions indicate differences between different isolates. Detailed view
図 1 比較ゲノミクスの解析
図 2 OMマップ
納期動植物:約 10 週間
微生物:約 6 週間
動植物 DNA バンド ≧ 250Kb
微生物細菌 DNA サイズ ≧ 150Kb
サンプル濃度 5 ~ 10 DNA/image
- 23 -
ゲノミクス
Ⅰ
FFPEゲノムシーケンス解析
製品概要 ホルマリン固定パラフィン包埋 (FFPE) サンプルは一般的な疾病診断と科学研究用の材料として、数年間保存でき
ます。しかしながら、FFPE サンプルの固定化および保存のプロセスは、希に核酸の分解と塩基変化を起こします。
これまで、FFPE サンプルから抽出した DNA はアレイに基づいて解析されていましたが、容量や固定ターゲット
に問題があり、良好なパフォーマンスが得られませんでした。次世代シーケンス解析技術を用いた FFPE サンプル
の解析は原因不明の疾病のメカニズムの解明を促進し、生物工学の研究を進展させます。
技術特長 • サンプルの量が少ない場合も解析可能:全ゲノムリシーケンシング(WGRS)、全エキソームシーケンシング(WES)
では最低 200ng • ハイスループット
• FFPE サンプルの専門的なデータ解析
• マルチオミクス技術を利用した全面的・系統的な解析
ワークフロー
FFPE サンプル切片
パラフィン除去
プロテアーゼ K 消化
DNA 抽出・精製
サンプル検査
ライブラリー作製
シーケンシング
データ解析
技術パラメーター
1.サンプル要件ヒト・マウス・ラット
サンプル DNA(RNA にコンタミネーションがないこと)
サンプル量全エキソームシーケンス解析 & ターゲット領域シーケンス解析 全ゲノムリシーケンス解析
≧ 1µg ≧ 500ng
サンプル濃度 ≧ 10ng/µL ≧ 10ng/µL
2. DNA抽出キット:FFPE サンプル- QIAamp® DNA FFPE Tissue Kit (QIAGEN)
3.解析プラットフォーム:Illumina HiSeq
- 24 -
ゲノミクス
Ⅰ
2.全エキソームシーケンス解析 レーン 1. D2000 マーカー
レーン 2. 胃癌の隣接組織の FF サンプル DNAレーン 3. 胃癌の隣接組織の FFPE サンプル DNAレーン 4. λ Hind III DNA マーカー
FFPE DNA のバンドが FF DNA の
バンドより下に泳動し、分解したこ
とを示しています。
図 1 胃癌の隣接組織の新鮮凍結(FF)サンプルおよび FFPEサンプルを抽出した DNAの電気泳動図
レーン 1.D2000 マーカー
レーン 2.FF サンプルのエキソーム
キャプチャーライブラリー
レーン 3.FFPE サンプルのエキソーム
キャプチャーライブラリー
レーン 4.50bp ラダー DNA マーカー
ライブラリー作製の結果、FFPE サ
ンプルと FF サンプルのライブラリー
は高い類似性が見られました。
図 2 胃癌の隣接組織の FFおよび FFPEサンプルのエキソームキャプチャーライブラリーの電気泳動図
1 2 3 4 1 2 3 4
表 2 FFPEサンプルと FFサンプルの全エキソームシーケンシング (WES)データの比較
Samples Raw Data(M)Mapped Data(M)
Mapped Rate(%)
Mean Depth of Target Region(x)
Coverage of Target
Region(%)
Coverage of Target Region
≥ 10× (%)
Capture Specificity(%)
FFPE 1419.41 1165.91 82.14 18.61 93.31 65.52 65.22
FF 1763.11 1490.43 84.53 23.33 94.84 74.14 64.07
SampleRaw Data
(Gb)Clean Data
(Gb)Conversion Rate(%)
Sequencing Fold(X)
Mapped Rate(%)
Depth(X)Coverage ≥
10X(%)FFPE-1 212.28 194.21 91.49 63.77 72.43 25.17 88.47FFPE-2 130.71 120.18 91.94 37.63 73.71 24.84 92.61FFPE-3 175.94 162.18 92.18 51.61 79.38 37.35 95.80Average - - 91.87 - 75.17 29.12 92.29
Non-FFPEs - - 90 - 85 30 95
解析種類- BGIの実績
1.全ゲノムリシーケンス解析
表 1 FFPEサンプルと non-FFPEサンプルの全ゲノムリシーケンシング (WGRS)データの比較
668 562287122.23% 1.88%95.89%
FF FFPE
158 7840 1581.94% 1.94%96.12%
FF FFPE
図 3 FFPEサンプルと FFサンプルのノーマル SNP (対立遺伝子の深度> 4×)の一致性
図 4 FFPEサンプルと FFサンプルの高品質 SNP (対立遺伝子の深度> 20×、品質スコア> 20)の一致性
3.ターゲット領域シーケンス解析
- 25 -
ゲノミクス
Ⅰ
Single cellシーケンス解析
製品概要 Single cell シーケンス解析は全ゲノム増幅(WGA)および次世代シーケンス解析を利用し、腫瘍細胞の異種性を
分析する、単細胞のゲノム情報を解析する新しい方法です。
腫瘍組織内の遺伝的構造の解析および腫瘍発達中の主要な変化を同定するのは、腫瘍の細胞異種性特質により困
難だと考えられています。Single cell シーケンス解析はこれまでの方法で生じていたボトルネックを解決し、複雑な
細胞複合体の遺伝的な変異の解析を中心に、単細胞のゲノムをシーケンス解析することによって癌の腫瘍進化を調
べます。
技術特長 • 少量のインプット DNA(単細胞の DNA 量若しくはそれ以上の量)
• Pre-implantation genetic diagnosis (PGD) のターゲット領域において有効な費用対効果
• 単細胞シーケンス解析の豊富な経験
• 高質量および高精度(multiple displacement amplification: MDA、エラー率:10-6 ~ 10-7)
• 高カバレッジ:95% 以上
• 単一サンプルを 100 万倍まで拡大可能
• 拡大産物は 10Kbp 以上、多種の変異を検出可能
• 安定した技術、高い重複率100
80
60
40
20
00 5 10 15 20
Cov
erag
e(%
)
SC1SC2Control
Sequencing depth of chromosome(X)
図 1 単細胞のmultiple displacement amplification (MDA)産物(SC1と SC2)および 非増幅ゲノム DNA(コントロール)のシーケンシングカバレッジの回復の比較
ワークフロー
単細胞の分離
DNA 抽出
全ゲノム増幅
次世代シーケンシング
データ解析
- 26 -
ゲノミクス
Ⅰ
増幅方法
dNTPs プライマー Phi29 DNAポリメラーゼ
インプットDNA プライマーと鋳型DNAの結合 DNA重合反応の開始
DNA重合反応の継続相補鎖の置換新プライマーと新DNA鎖の結合新DNA鎖のDNA重合反応
図 2 Phi29 DNAポリメラーゼによりゲノム DNAを増幅するマルチプル置換増幅(MDA)
技術パラメーター
1.サンプル要件
組織サンプル 手術等で採取後、直ちに -80℃で保存(保存期間:1 年以内)
全血(あるいは骨髄)サンプル 5mL 以上(凝固しないよう -80℃で保存)
細胞液あるいは細胞系サンプル 106 細胞
腫瘍サンプル推奨サイズ:1 ~ 2cm3
(抽出が困難・貴重なサンプル:5mm3 以上)
分離された単一細胞
無菌 DNase/RNase free PCR チューブ (0.2mL) で保存。
・溶剤は PBS(DAPI,EB free) を使用のこと( 2µL 以下)
・-80℃で保存(保存期間:1 週間以内)
・ドライアイスを同梱して輸送
※単細胞の増幅効率に影響のある染色・標識等で分離した際は、 事前に BGI までご連絡ください。
2. シーケンス解析:101PE
3. 推奨データ量:リシーケンス深度≧ 30X
応用および BGIの実績 • 微量の臨床サンプルのプロファイリング
• 腫瘍内の異種性の解析および医化学療法の指導
• 腫瘍の発達に伴う癌細胞の進化の解析
- 27 -
ゲノミクス
Ⅰ
納期100 サンプル以下(30X):約 12 週間
BGIの実績例 1 骨髄増殖癌
典型的 JAK2- 陰性骨髄増殖癌患者の 90 個の単細胞の全エ
キソームシーケンスを解析したところ、本態性血小板血症
(ET)の関連遺伝子「SESN2」および「NTRK1」の変異体
候補が観察され、腫瘍進化に関与することが示唆されまし
た。
図 3 JAK2-陰性骨髄増殖癌の Single-Cellエキソーム シーケンス解析および単クローン進化
Hou, Y., Song, L., Zhu, P., Zhang, B., et al. Single-cell exome sequencing and monoclonal evolution of a JAK2-negative myeloproliferative neoplasm. Cell. 2012, 148, 873-85.
BGIの実績例 2 明細胞型腎細胞癌
明細胞型腎細胞癌患者の 25 個の腫瘍細胞および体細胞を
全エキソームシーケンス解析したところ、腫瘍細胞の異種
性は系群を形成せず、「VHL」および「PBRM1」など重要
な遺伝子変異は出現しませんでした。
図 4 Single-Cell エキソームシーケンス解析による 腎腫瘍の単塩基変異の観察
Xu, X., Hou, Y., Yin, X., et al. Single-cell exome sequencing reveals single-nucleot ide mutat ion characteristics of a kidney tumor. Cell. 2012, 148, 886-95.
- 28 -
ゲノミクス
Ⅰ
ワークフロー データ解析
標準データ解析 • データフィルタリング
• マルチプル配列のアセンブリー
• 非反復の SSR 遺伝子座の分離
• 遺伝子座とプライマーの結果
オプションデータ解析 • 隣接領域の抽出
• 相同配列の集約
• マルチプル配列のアセンブリー
• 多型性遺伝子座の発見
• 多型性遺伝子座のプライマー設計と結果
カスタマイズ • お客様のご要望に合わせ、データ解析をカスタマイ
ズします。
単純反復配列遺伝子座の開発
製品概要 単純反復配列(simple sequence repeat、SSR)は、原核生物と真核生物のゲノムに広く存在する短い縦列型反復
配列からなるもので、多型性に富んでいます。SSR マーカーは重要な断片長多型分子マーカー技術として、遺伝子
育種・集団進化研究・遺伝子多様性・分子生態学などの分野で利用されます。
BGI は、次世代シーケンシング技術に基づいた SSR 遺伝子座の開発の新たな研究方法を提供します。HiSeqTM シー
ケンシングプラットフォームによる全ゲノム範囲の低深度シーケンシングでは、SOAPdenovo ソフトウェアで短配
列アセンブリーを行い、高品質なゲノム情報を獲得できます。遺伝子座の探索とプライマー設計を通じて、SSR マー
カーシステムが効率的に構築されます。
技術特長 • 高い費用対効果:低価格で大量の SSR 遺伝子座を獲得可能
• 高効率:1 ~ 2 ヶ月の短納期
• 高品質なデータと低偽陽性率:アセンブリーされた高品質なスカフォールドから SSR 遺伝子座を探索
• 多型性遺伝子座の開発:親世代或いは両集団からの代表個体を利用して、多型性遺伝子座を開発可能
ゲノム DNA
ライブラリー作製
シーケンシング
データ解析
(平均シーケンス深度 10X)
アセンブリー
遺伝子座とプライマー
の結果
非反復の SSR 遺伝子座
の探索アライメント
多型性遺伝子座プライマー設計
非多型性の分析
多型性の分析
納期オプションデータ解析を含まない場合:約 9 週間
オプションデータ解析を含む場合(サンプル数≦ 3 個):約 11 週間
- 29 -
ゲノミクス
Ⅰメタゲノム解析
製品概要メタゲノム解析では、微生物相構造多様性や、微生物群集ゲノムの構成と機能、特定環境における代謝経路などを
調べることができます。
技術特長 • 高コストパフォーマンス
• 広い研究範囲:培養できない生物の研究制限がなくなり、環境内全ての微生物を調査可能。
また環境微生物相多様性の情報獲得だけではなく、遺伝子機能活性の研究も可能。
• 納期が短く、高効率
ワークフロー
データ解析
データの処理 • アダプターと低品質データの除去
• ホストのゲノムのコンタミネーションの除去
• データの統計
サンプル
ライブラリーの作製
クラスターの準備とシーケンシング
生データ
クリーンデータ
アセンブリー
アセンブリー報告
複数サンプルの比較と分析
非冗長性の遺伝子カタログの作製
ゲノム機能分析
機能アノテーション (KEGG、CAZy、eggNOG)
抗生物質の耐性因子の分析
品質検査
アセンブリの評価
ゲノム成分分析
転位因子分析
サンプル分類に関る有意要因のスクリーニング(遺伝子、機能)
ロファージ分析
主成分分析(PCA)
遺伝子予測
クラスタリング
ORF
種の構成と存在量
結果報告書
ライブラリーの品質管理
- 30 -
ゲノミクス
Ⅰ
標準データ解析 • アセンブリー
• メタゲノム構成種の定量
• ゲノムの構成(遺伝子・転移因子予測)
• NR 遺伝子一覧作製
• ゲノム機能解析
◆ KEGG データベースに基づく代謝経路解析
◆ CAZy(carbohybrate-Active Enzymes)データベースに基づく糖質分解酵素解析
◆ eggNOG(evolutionary genealogy of genes: Non-supervised Orthologous Groups)データベースに基づくオーソログ遺伝子解析
◆ 抗生物質の耐性因子の分析
• 複数のサンプルの比較と分析
オプションデータ解析 • お客様のご要望に合わせ、データ解析をカスタマイズします。
技術パラメーター1.サンプル要件
2.シーケンス解析:Illumina HiSeq・MiSeq3.推奨ライブラリーサイズ:150 ~ 180bp(複雑環境)/350bp(単純環境)
納品物
1. シーケンシング結果(clean data)は FASTQ ファイルで納品
2. 納品データ例
納期
※オプションデータ解析をご希望の場合は、別途お問い合わせください。
※サンプルの送付が数回に渡る場合、納期は最終サンプル到着からの起算となります。
※サンプル数が 100 以上の場合は、別途お問い合わせください。
サンプル量 ≧ 2µgサンプル濃度 ≧ 30ng/µL
図 1 人類腸管マイクロバイオームのカバレッジ 図 2 T2D腸管微生物相の分類と機能
サンプル数 データ解析なし 標準データ解析あり
1 ~ 50 約 8 週間 約 11 週間
51 ~ 100 約 10 週間 約 14 週間
- 31 -
ゲノミクス
Ⅰ16S rDNA解析 (Illumina HiSeq 2000)
製品概要16S rDNA は細菌分類学の研究で一般的に用いられている「分子の時計」です。16S rDNA 配列の変異と含有量を測
定することで、環境サンプルの群集多様性の情報を解読できます。16S rDNA に基づいた解析は、微生物の分類鑑定、
生態研究などの分野で重要な役割を果たしています。
技術特長 • 操作が簡単:菌株の分離が不要
• 高精度
• ハイスループット:データ産出量が多く、高効率
ワークフロー
PCR 増幅
ライブラリー作製
シーケンス解析
データ解析
データ解析
標準データ解析 • データの統計
アダプターと低品質データを除去
プライマー配列を除去
産出データと品質管理
ペアエンドリードをアセンブリーしてタグを獲得
• 種の構成とアバンダンス解析
種のアノテーション
種(或いは OTU)のアバンダンス解析(門綱目科属種から比較統計)
• サンプル複雑度解析
単一サンプルの複雑度解析(α多様性解析)
サンプル間の複雑度比較解析(β多様性解析、サンプル数≧ 2)サンプル間の複雑度差異主要因子解析(主成分分析、サンプル数≧ 3)異なるサンプルの種構成クラスター分析(サンプル数≧ 3)
オプションデータ解析 • お客様のご要望に合わせ、データ解析をカスタマイズします。
ゲノム DNA
- 32 -
ゲノミクス
Ⅰ
技術パラメーター
サンプル要件
納品物
1. シーケンシング結果(clean data)は FASTQ ファイルで納品
2. 納品データ例
図 1 ミスマッチを持つタグのミスマッチ率とエラー率
納期
※オプションデータ解析をご希望の場合は、別途お問い合わせください。
※サンプル数が 100 以上の場合は、別途お問い合わせください。
サンプル種類 DNA・16S rDNA V6 領域の PCR 産物
サンプル量 ≧ 1µgサンプル濃度 ≧ 10ng/µL
サンプル数 データ解析なし 標準データ解析あり
4 ~ 50 約 8 週間 約 9 週間
51 ~ 100 約 10 週間 約 11 週間
- 33 -
ゲノミクス
Ⅰ
GBS(Genotyping by sequencing)
製品概要 Genotyping by sequencing (GBS) は Illumina 次世代シーケンス解析を使ったシンプルな高度マルチプレックスシ
ステムです。遺伝子解析時に、大量の SNP を見つけることが可能です。
このシステムの特長は簡略化されたサンプル調整・従来よりも少ない PCR・少ない処理工程・サイズの分画が不要・
バーコード化が低価格であることです。制限酵素を使用することによりゲノムの複雑さを低下させ、ゲノムの中で
の重複を避けることができます。GBS は将来的に動植物の育種や保護、地球上の種や集団の調査に応用させること
も可能です。
技術特長 • 簡単、迅速
• 簡素化されたコンピュータ解析
• 高精度な SNP コーリング
• 低コスト
• 微量のサンプルで解析可能
ゲノム DNA
制限酵素処理
ライブラリー作製
シーケンシング
クリーンデータ
標準データ解析(SNP 解析など)
オプションデータ解析
生データ
クラスター
(参照配列無し)
アライメント
(参照配列有り)
図 1 ライブラリー作製の流れ
図 2 GBSアダプターと酵素
ワークフロー
- 34 -
ゲノミクス
Ⅰ
技術パラメーター1.サンプル要件
2.シーケンス解析:Illumina HiSeq
納品物1. シーケンシング結果(clean data)は FASTQ ファイルで納品
2. 結果報告書
3. 納品データ例
表 1 ジェノタイピングの結果
record_ID position P1 P2 sample 1 sample 1 sample nrecord_1 50 a b a a ... brecord_4 20 a b a b ... arecord_7 21 a b a - ... arecord_8 51 a b b a ... a
record_10 41 a b a a ... arecord_11 19 a b a a ... a
【データの見方】
1 行目:タイトル、2 行目~:SNP マーカー
1 列目:SNP マーカーを持つ GBS タグのラベルの ID2 列目:GBS タグ内の SNP の位置
3・4 列目:親の遺伝子型
5 列目~:世代の遺伝子型、「-」は損失したデータ
納期
ライブラリー作製・シーケンシング・標準データ解析:約 8 週間
標準データ解析 • シーケンシングデータの基礎解析
• tag 産出データの統計
• 個体 tag のクラスター
• 集団 tag のクラスター
• SNP の検出
オプションデータ解析――遺伝子地図作成 • ジェノタイピング
• 遺伝地図の統合
• QTL マッピング
• 遺伝地図のアセンブリー
オプションデータ解析――集団進化研究 • 系統発生樹の解析
アプリケーション • 遺伝子連鎖分析
• 集団分析:系統図、集団構造解析、主成分分析
• 連鎖不平衡分析(LD)
• ゲノムワイド関連解析(GWAS)等
データ解析
サンプル DNA( コンタミネーションなし)
サンプル量 300ng/ 回サンプル濃度 ≧ 25ng/µL
• 集団構造の分析
• 主成分分析(PCA)
- 35 -
ゲノミクス
Ⅰ
PacBio RS II次世代シーケンス解析
製品概要 PacBio RS II は 1 分子レベルでリアルタイムに塩基を読み取ることができ(SMRT® DNA シーケンシング技術)、
塩基修飾も同時に検出できるシーケンサーです。ほかのどの技術よりもはるかに長いリードが出力されます。
GC バイアスの無いキロベース単位の超ロングリードが均一のカバレッジで出力されることにより、バクテリアだ
けでなく、それ以上のゲノムサイズの生物の de novo アセンブリーに大きく貢献します。
技術特長 • 簡単、迅速:1 セルあたりのシーケンシング反応時間は 3 時間未満
• 1 分子レベルのリアルタイム解析
• カスタマイズが可能
シーケンシング原理
リアルタイムに塩基を読み取る際に得られるカイネティクス情報から、塩基修飾も同時に検出することが可能。
- 36 -
ゲノミクス
Ⅰ
アプリケーション • 全長ゲノム配列決定
• ターゲットリシーケンシング
• ゲノムバリエーション解析:
連続する繰り返し配列のシーケンス
アイソフォーム全長シーケンス
完全長 16S シーケンシング
構造変異やコピー数変異の検出、SNP の検出と確認、低頻度の変異の検出
複合変異とハプロタイプフェ-ジング
• エピゲノム分野への応用
技術パラメーターサンプル要件
※凍結融解は最小限にし、紫外線照射や蛍光標識をせず、pH6 ~ 9 の環境下で、高温を避けて保存してください。
※キレート剤 (EDTA など)・2 価金属イオン (Mg2+ など )・変性剤(グアニジン塩、フェノールなど)・洗剤(ヘム、腐植酸、ポリフェ
ノールなど)が入らないようにして下さい。
※電気泳動写真を必ず添付してください。
納期ライブラリー作製・シーケンシング:約 8 週間
サンプル ゲノム DNA( 不溶性物質・RNA の混入なし)
サンプル量 2 ~ 10Kb:5µg/SMRT Cell11 ~ 20Kb:10µg/SMRT Cell
サンプル濃度 ≧ 30ng/μLサンプル純度 OD260/280=1.8 ~ 2.0、OD260/230=2.0 ~ 2.2