[ddbjing33] japanese genotype-phenotype archive の紹介
TRANSCRIPT
Japanese Genotype-phenotype Archive
児玉 悠一Kodama Yuichi, Ph.D
DDBJ センター、アノテータDDBJ center, annotator
2015年11月11日 第33回 DDBJing 講習会 (JST東京)
DDBJ センターが運営するデータベース
INSDC: オープンアクセスデータベース
個人レベルの遺伝型と表現型
JGA
アクセス制限データベース
ヒトデータ審査委員会
DDBJ
アセンブリ
アノテーション
リード
Quality value
アライメント
DRA
BioProjectBioSample
2015年11月11日
DDBJ と NBDC の役割分担
第33回 DDBJing 講習会 (JST東京)
利用制限が必要な個人由来の遺伝型・表現型情報を受付・保存・提供
原則として匿名化されたメタデータを受付
データ提供と利用を NBDC ヒトデータ共有ガイドラインに従って審査
http://trace.ddbj.nig.ac.jp/jga/submission.html
2015年11月11日
NBDC での審査のポイント
第33回 DDBJing 講習会 (JST東京)
インフォームドコンセントにおいて「データの共有」が示されているか?
「データを共有すること」が倫理審査をパスしているか?
申請されたデータの内容と倫理審査の内容が合致しているか?
http://humandbs.biosciencedbc.jp/guidelines/data-sharing-guidelines
「提供」申請審査
研究責任者はこの分野で経験があるか?
施設のセキュリティ対策は適切か?
研究内容は倫理審査をパスしているか?
データの提供者が示すデータ利用の際の制限事項に合致した申請内容か?
(研究分野の限定やデータの保管方法など)
「利用」申請審査
NBDC ヒトデータ共有ガイドライン
http://humandbs.biosciencedbc.jp/dac
ヒトデータ審査委員会 (隔週で開催)
2015年11月11日
アクセス制限データベース
第33回 DDBJing 講習会 (JST東京)
dbGaPDatabase of Genotype and Phenotype
JGA Japanese Genotype-phenotype Archive
EGAEuropean Genome-phenome Archive
JGA と EGA は SRA をベースにした同様のデータモデルを使用
dbGaP と EGA はサマリー情報を交換
INSDC ではない
JGA データモデル
2015年11月11日
JGA データモデル
第33回 DDBJing 講習会 (JST東京)
Data setJGAD
PolicyJGAP
Data set 1
Policy 1
Study
Data 1
Analysis 1
Experiment 1
Sample 1
Submission JGA
StudyJGAS
ExperimentJGAX
SampleJGAN
DataJGAR
AnalysisJGAZ
Data 2
Experiment 2
Sample 2
Analysis 2
アクセッション番号プレフィックス
SRA データモデルを改変
2015年11月11日
JGA Submission
第33回 DDBJing 講習会 (JST東京)
Data setJGAD
PolicyJGAP
Data set 1
Policy 1
Study
Data 1
Analysis 1
Experiment 1
Sample 1
Submission JGA
StudyJGAS
ExperimentJGAX
SampleJGAN
DataJGAR
AnalysisJGAZ
Data 2
Experiment 2
Sample 2
Analysis 2
登録のためだけのオブジェクト
名前や連絡先などの登録者情報と提供開始日
2015年11月11日
JGA Study
第33回 DDBJing 講習会 (JST東京)
Data setJGAD
PolicyJGAP
Data set 1
Policy 1
Study
Data 1
Analysis 1
Experiment 1
Sample 1
Submission JGA
StudyJGAS
ExperimentJGAX
SampleJGAN
DataJGAR
AnalysisJGAZ
Data 2
Experiment 2
Sample 2
Analysis 2
トップレベルのオブジェクトで研究内容・研究費・論文情報を含む
データ提供開始後、研究概要を示すために内容は一般に公開される
2015年11月11日
JGA Experiment
第33回 DDBJing 講習会 (JST東京)
Data setJGAD
PolicyJGAP
Data set 1
Policy 1
Study
Data 1
Analysis 1
Experiment 1
Sample 1
Submission JGA
StudyJGAS
ExperimentJGAX
SampleJGAN
DataJGAR
AnalysisJGAZ
Data 2
Experiment 2
Sample 2
Analysis 2
実験手順・質問票・ライブラリー情報や使用した実験機器など
1つの Sample と複数の Data オブジェクトを連結
2015年11月11日
JGA Sample
第33回 DDBJing 講習会 (JST東京)
Data setJGAD
PolicyJGAP
Data set 1
Policy 1
Study
Data 1
Analysis 1
Experiment 1
Sample 1
Submission JGA
StudyJGAS
ExperimentJGAX
SampleJGAN
DataJGAR
AnalysisJGAZ
Data 2
Experiment 2
Sample 2
Analysis 2
Sample ≧ 個人
匿名化されたドナー ID = 個人、表現型 (性別、年齢や病態など)
2015年11月11日
JGA Data
第33回 DDBJing 講習会 (JST東京)
Data setJGAD
PolicyJGAP
Data set 1
Policy 1
Study
Data 1
Analysis 1
Experiment 1
Sample 1
Submission JGA
StudyJGAS
ExperimentJGAX
SampleJGAN
DataJGAR
AnalysisJGAZ
Data 2
Experiment 2
Sample 2
Analysis 2
個人に対応する (生) データファイル (fastq, bam, アレイデータ) を格納
2015年11月11日
JGA Analysis
第33回 DDBJing 講習会 (JST東京)
Data setJGAD
PolicyJGAP
Data set 1
Policy 1
Study
Data 1
Analysis 1
Experiment 1
Sample 1
Submission JGA
StudyJGAS
ExperimentJGAX
SampleJGAN
DataJGAR
AnalysisJGAZ
Data 2
Experiment 2
Sample 2
Analysis 2
複数の Data もしくは Sample を解析したデータを格納
例: 変異データ (vcf) や表現型をまとめた表
2015年11月11日
JGA Dataset
第33回 DDBJing 講習会 (JST東京)
Data setJGAD
PolicyJGAP
Data set 1
Policy 1
Study
Data 1
Analysis 1
Experiment 1
Sample 1
Submission JGA
StudyJGAS
ExperimentJGAX
SampleJGAN
DataJGAR
AnalysisJGAZ
Data 2
Experiment 2
Sample 2
Analysis 2
Policy が適用される Data と Analysis をまとめる (データ提供の単位)
データ提供開始後、データの概要を示すために内容は一般に公開される
2015年11月11日
JGA Policy
第33回 DDBJing 講習会 (JST東京)
Data setJGAD
PolicyJGAP
Data set 1
Policy 1
Study
Data 1
Analysis 1
Experiment 1
Sample 1
Submission JGA
StudyJGAS
ExperimentJGAX
SampleJGAN
DataJGAR
AnalysisJGAZ
Data 2
Experiment 2
Sample 2
Analysis 2
Dataset に適用される利用制限事項
独自の利用制限事項 (例: 特定の研究のみ) を NBDC ガイドラインに追加したい場合に作成
JGA データ構成の例
2015年11月11日 第33回 DDBJing 講習会 (JST東京)
JGA データ 例1: シンプルなケース
Experiment-Sample-Data セットが「個人データ」に対応
Data: 生データ、Analysis: 解析したデータ
NBDC ガイドラインのみが適用される場合、作成する必要はない
2015年11月11日 第33回 DDBJing 講習会 (JST東京)
JGA データ 例2: NGS とアレイデータ
2015年11月11日
NBDC ガイドライン
第33回 DDBJing 講習会 (JST東京)
JGA データ 例3: 異なる利用制限事項
患者由来の個人レベルデータの利用を特定の研究目的に制限する場合
NBDC ガイドライン + 独自の利用制限事項
特定の研究目的に利用を制限
健常者
患者
JGA へのデータ登録
2015年11月11日
JGA へのデータ登録
第33回 DDBJing 講習会 (JST東京)
NBDC にデータ提供を申請
承認されると有効期限付きのアップロードアカウントが発行される
メタデータは登録用エクセルに記入、JGA で XML を作成
http://trace.ddbj.nig.ac.jp/jga/submission.html
2015年11月11日
JGA へのデータアップロード
第33回 DDBJing 講習会 (JST東京)
メタデータ XML とデータファイルを選択 JGA 登録を選択
アップロードアカウントにログイン
Encrypt & Upload で暗号化 & アップロード
JGA 専用ツールでログイン
データファイルが暗号化され、メタデータ XML とともに SSH でサーバにアップロードされる
メタデータの整合性、データファイルの存在と md5 値がチェックされる
データファイル
メタデータ XML
2015年11月11日
JGA アクセッション番号
第33回 DDBJing 講習会 (JST東京)
プレフィックス メタデータオブジェクト 数字の桁数 例
JGA Submission 11 JGA00000000001
JGAS Study 11 JGAS00000000001
JGAN Sample 11 JGAN00000000001
JGAX Experiment 11 JGAX00000000001
JGAR Data 11 JGAR00000000001
JGAZ Analysis 11 JGAZ00000000001
JGAD Data set 11 JGAD00000000001
JGAP Policy 11 JGAP00000000001
JGA メタデータオブジェクトに対してアクセッション番号を発行
JGAS 番号の論文での引用を推奨
JGA データの利用
2015年11月11日
利用可能な JGA データ一覧
第33回 DDBJing 講習会 (JST東京)
http://humandbs.biosciencedbc.jp/data-use/all-researches-jp
https://ddbj.nig.ac.jp/jga/viewer/view/studies
2015年11月11日
JGA データの利用
第33回 DDBJing 講習会 (JST東京)
NBDC にデータ利用を申請
承認されると有効期限付きのダウンロードアカウントが発行される
http://trace.ddbj.nig.ac.jp/jga/submission.html
2015年11月11日
JGA データのダウンロード
第33回 DDBJing 講習会 (JST東京)
ローカルの保存場所を選択
JGA データセットを選択
ダウンロードアカウントにログイン
Download をクリックし、ダウンロード & 復号化
JGA 専用ツールでログイン
ダウンロード権限が付与されている Data set をリストから選択
Data set をダウンロードし、復号化する
メタデータはウェブサイトにログインして閲覧
https://ddbj.nig.ac.jp/jga/viewer/view/studies
2015年11月11日
JGA ウェブサイト
第33回 DDBJing 講習会 (JST東京)
http://trace.ddbj.nig.ac.jp/contact.html?db=jga
登録について問い合わせる場合には登録者とデータの ID をお知らせください