38th mtg in nibio
TRANSCRIPT
2014/11/20
第38回統合DBミーティングIntegrated MTG in NIBIO
1
本日の予定
• Sagace
– アクセス解析
– 進捗報告
• 医薬基盤研内のデータのRDF化
– BioHackathon2014の報告
– ICD-10のRDF化について
• 分子生物学会のブース展示
– デモの準備
– 最終確認
2
進捗報告
• チュートリアルの修正
• KNApSAcKの検索結果がRDFa Liteのマークアップを反映 (Thanks to previous MEDALS and NBDC)
• PDBjのRDFa Liteのマークアップに対応したindexの作成開始(Thanks to NBDC)
3
医薬基盤研内のデータのRDF化
• BioHackathon2014の報告
• ICD-10のRDF化
4
BioHackathon
の報告
片山さん@DBCLSの投稿より引用
5
Drug Discovery• 薬と疾患の関連性をLinked Dataと機械学習を組み合わせてスコア化し,疾患(特に希少疾患)に対して使用できそうな新しい薬を見つける取り組み
• http://bit.ly/1t4Jdrw
– 30ページ付近より
6
Ten simple rules for publishing
Linked Data for the Life Sciences• https://github.com/dbcls/bh14/wiki/Ten-simple-rules-for-
publishing-Linked-Data-for-the-Life-Sciences
• 抜粋
–はじめる前にユースケースを作ろう
– Schemaを出そう
– SPARQL endpointで利用可能なデータにしよう
–言葉で検索出来るようなクエリを作ろう
–ライセンスを明示しよう
7
関連の有りそうなTopics
• Node.js framework to query the EBI RDF platform– javascriptを使用してEBIで提供しているRDFの
Schemaをもっと見やすくしようという取り組み
• PDB2Uniprot– Combining SIFTS with wwPDB/RDF using FALDO.
– https://github.com/dbcls/bh14/wiki/PDB2UniProt
• A chemical substance database, Nikkaji– InChIKeyを通じて国内外の化合物データをつなげようという取り組み
– https://drive.google.com/file/d/0B6E9_nujMg6QUXc3V1lhdFotX3M/view
8
ICD-10のRDF化
• BioPortal由来のRDFをベースに
• WHOのデータに準じたRDFを作成
• 工夫した点– UMLS CUIとのマッピング
–バージョン情報の追加
–階層情報の追加
–作業上のコメントを追加
• 修正–凡ミス,rdfs:subClassOfの追加
9
Schema
10
bioportal_ICD10:id
rdf:type
owl:Class
bioportal_STY:sty
xsd:string
bioportal_ICD10:id
rdfs:subClassOf
dcterms:hasVersion
xsd:string
umls:cui
umls:hasSTYumls:tui
xsd:string
sios:prefLabel
skos:notation
xsd:string
xsd:string
bf:classification
rdfs:label
xsd:string
xsd:string
11
A00-B99
A00-A09
A08
V01-Y98
V01-X59
V01-V99
C00-D48
C00-C75
C00-C14
V01-V09
V02
C10
Pattern 1 (Most)
chapter block mid-block small-blockthree-character_categories
four-character_subcategorie
s
V02.1
C10.4
A08.2
Pattern 1 (Some)
Pattern 3 (Rare)
rdfs:subClassOf
分子生物学会のブース展示
• 最終確認
• デモの準備
– Sagace
– TargetMine
– Toxygates
12
今後の予定
• 分子生物学会
– 11月25日(火)〜27日(木)
• 次回の予定
– 12月26日(金)?
13