36th mtg in nibio
Post on 14-Jul-2015
105 Views
Preview:
TRANSCRIPT
2014/9/30
第36回統合DBミーティングIntegrated MTG in NIBIO
1
本日の予定
• Sagace
– アクセス解析
– 新規ファセット項目に加えるDBの是非について
– 進捗報告
• 医薬基盤研内のデータのRDF化
– 難病研究資源バンクのデータのRDF化について
– これまでRDF化したデータの疾患別傾向について
– 外部DBを繋げた検索について
2
新規ファセット項目に加えるDBの是非について
• メンバーの皆さんに調査結果をご報告頂きます。–担当したファセット分類の検索結果の印象
–各データベースの掲載の是非(特に非のものについて,その理由)
–その他気がついた点についての報告
3
医薬基盤研内のデータのRDF化
• 進捗報告–難病研究資源バンクのデータをRDF化
–難病研究資源バンク,実験動物研究資源バンク,希少疾病用医薬品にICD10を付与
– BioPortalのRay FergersonさんからICD10のttl
を入手
– DB毎にどの疾患が多いのか検索
– OMIMと統合して外部のデータを得る
4
難病研究資源バンクのRDF化
@prefix Medical_condition: <http://schema.org/MedicalCondition/> .
@prefix b2rv: <http://bio2rdf.org/bio2rdf_vocabulary:> .
@prefix BioLOD_property_pria315s16i: <http://purl.jp/bio/13/property/pria315s16i/> .
@prefix dbowl: <http://dbpedia.org/ontology/> .
@prefix NIBIO_raredis: <http://www.nibio.go.jp/rarediseaseVocabulary#> .
<http://raredis.nibio.go.jp/bioSample#27>
b2rv:namespace "rareDisease" ;
dbowl:icd10 "D44.1" ;
BioLOD_property_pria315s16i:Institute_Depositor
"京都医療センター"@ja ;
Medical_condition:name "非機能性副腎腫瘍"@ja , "Nonfunctioning adrenal tumor" ;
NIBIO_raredis:ID "0311" ;
NIBIO_raredis:bioSample "Plasma" .
5
難病研究資源バンクのRDF化
• 今後の予定– NIBIO_raredis:bioSample "Plasma" .
– 上記について適切なpredicate,objectのURIが見つかれば置き換えを検討する。
– データ構成,データの増大に合わせてRDFデータも作り変えていく。
– 今回は,ウェブページから表を取り出して作成
– 将来的にはウェブページにマークアップ,クローラーが同時にRDF作成が現実的?
6
ICD10の付与
例:希少疾病用医薬品の場合
以下の様なRDFをトリプルストアに入れると,既存のグラフ(下記ならば<http://www.nibio.go.jp/orphanDrugTarget#7>と統合してくれる。)
@prefix dbowl: <http://dbpedia.org/ontology/> .
@prefix Medical_condition: <http://schema.org/MedicalCondition/> .
<http://www.nibio.go.jp/orphanDrugTarget#7>
Medical_condition:name "動脈管開存症"@ja;
dbowl:icd10 "Q25.0".
7
BioPortal由来のICD10のttlファイル
@prefix skos: <http://www.w3.org/2004/02/skos/core#> .
@prefix owl: <http://www.w3.org/2002/07/owl#> .
@prefix rdfs: <http://www.w3.org/2000/01/rdf-schema#> .
@prefix xsd: <http://www.w3.org/2001/XMLSchema#> .
@prefix umls: <http://bioportal.bioontology.org/ontologies/umls/> .
<http://purl.bioontology.org/ontology/ICD10/S66.9>
a owl:Class ;
skos:prefLabel """Injury of unspecified muscle and tendon at wrist and hand level"""@en ;
skos:notation """S66.9"""^^xsd:string ;
rdfs:subClassOf <http://purl.bioontology.org/ontology/ICD10/S66> ;
umls:cui """C0478316"""^^xsd:string ;
umls:tui """T037"""^^xsd:string ;
umls:hasSTY <http://purl.bioontology.org/ontology/STY/T037> ;
8
検索例1つの疾患IDに幾つのデータが紐づくかデータベース毎に出力
prefix skos: <http://www.w3.org/2004/02/skos/core#>
prefix dbowl: <http://dbpedia.org/ontology/>
prefix b2rv: <http://bio2rdf.org/bio2rdf_vocabulary:>
select ?id ?name ?namespace (count(*) as ?count)
where
{
?s skos:prefLabel ?name;
skos:notation ?id.
?nibio_db dbowl:icd10 ?id;
b2rv:namespace ?namespace.
}
GROUP BY ?id ?name ?namespace
ORDER BY ?id
9
検索結果
10
OMIMとの統合ICD10をキーとしてOMIMのIDや疾患名,遺伝子名を出力
prefix dbowl: <http://dbpedia.org/ontology/>
prefix b2rv: <http://bio2rdf.org/bio2rdf_vocabulary:>
prefix b2ro: <http://bio2rdf.org/omim_vocabulary:>
PREFIX dcterms: <http://purl.org/dc/terms/>
select ?nibio_url ?icd10 ?omim_id ?title ?gene_name
where
{
?nibio_url dbowl:icd10 ?id.
BIND (xsd:string(?id) as ?icd10)
SERVICE<http://omim.bio2rdf.org/sparql>{
?s b2ro:x-icd10 ?o;
b2rv:identifier ?omim_id;
dcterms:title ?title;
b2ro:gene-name ?gene_name.
?o b2rv:identifier ?icd10.
}
}
11
検索結果
12
医薬基盤研内のデータのRDF化
• 外部DBを繋げた検索について– 特許のSPARQL Endpointは情報が不足している。
– Clinical Trialsは現状データを繋ぐとっかかりとなるIDがない。
– 実験動物研究資源バンクのデータとMGIのデータの統合• 系統名,遺伝子名ともにマッチするものが少ない。
• OMIM経由で繋ごうとしたが,一致するIDを見つけられず
– 複数のSPARQL Endpointを経由した検索は現状では難しい(調査継続)
13
今後の予定
• 次回– 10月24日(金)
• トーゴーの日– 10月5日(日)?
• BioHackathon 2014– 11月9日(日)〜14日(金)
• 分子生物学会– 11月25日(火)〜27日(木)
14
top related