20151006 トーゴーの日シンポジウム2015 山田 a1x2 · 2017-02-09 ·...
TRANSCRIPT
ポスター19:炭素鎖表現の系統化に基づく単糖および糖鎖構造の包摂関係表現
〇⼭⽥⼀作1)、松原正陽1)、⽊下聖⼦2),3)、成松久3)
1)野⼝研究所 2)創価⼤学 3)産業技術総合研究所 糖鎖技術研究グループトーゴーの⽇シンポジウム2015 〜統合データベースとオープンライフサイエンス〜@東京⼤学弥⽣講堂 ⼀条ホール(東京都⽂京区)
Licensed under a Creative Commons 表示2.1日本 license (c)2015 山田一作(公益財団法人野口研究所)
GlyTouCanAccessionNumber:G00045MO GPIanchorcore
化合物構造• コンポーネントに分割
⾻格構造分類は、ポスター17“天然化合物関連情報にむけた、⽣合成を考慮した化学構造分類とRDF化への取り組み”の分類を利⽤
• コンポーネントを結合
糖鎖SIO:organic molecule GlycoRDF:Compound
単糖SIO:submolecular entity GlycoRDF:Component
グリコシド結合SIO
FALDO
Molecule
Protein
Glycan
Lipid
我々は糖鎖関連データを統合化するために、国際糖鎖構造リポジトリ「GlyTouCan」やセマンティックウェブに対応させた糖鎖構造表記法であるWURCS (the Web3 Unique Representation of Carbohydrate Structures)を開発している。WURCS では、化合物の化学構造の内、糖鎖部分構造のみを対象とし線形⽂字列やResource Description Framework (RDF)などでの表記へ対応させている。さらに、WURCS における糖鎖構造表記の考え⽅を複合糖質など糖鎖以外の構造を含む化合物へと適⽤し、RDF で記述すること、糖鎖構造データと各種化合物データベースの化学構造との関連付けについて検討した。
糖質関連化合物構造のRDFによる統合化
WURCSSec/on
prefix WURCS=
version 2.0
delimiter /
Count 2,4,3
uRES uRESList
RESSeq 1-2-3
LIN LINList
uRESSec/on:[a2122h-1b_2*N]
prefix [
SkeletonCode(SC) a2122h
delimiter -
anomericposiPon 1
anomericsymbol b
separator _
MOD MODList
suffix ]
LINSec/on:a1u2-b4u1*O*~1:n
GLIP a1u2
delimiter -
separator _
MAP *O*
Repeat ~1:n
RESSeqSec/on:1-2-3
uRESID 1
separator -
SkeletonCodeSec/on:a2122h
CarbonDescriptor a,1,2,h
MODSec/on:1-5;2u0*NCC/3=O
LIP 2u0
MAP *NCC/3=O
delimiter -
LIP/GLIPSec/on:a1u2|a2u2%.1:.9%
RESIndex(GLIPonly) a
SCposiPon 1
direcPon u
MAPposiPon 2
separator(fuzzyonly) |
Probability %.1:.9%
RDFで記述
様々な化合物データベースに含まれる化合物を、化学構造の部分⼀致で他のデータベースとつなげることで、完全⼀致ではつながらない化合物をつなぐことが⽬的である。糖鎖データベースと化合物データベースの統合が期待できる。
⽬的
WURCS: Web3.0 Unique Representation of Carbohydrate Structure
WURCS=2.0/2,4,3/[a2122h-1a_1-5_2*N][a1122h-1a_1-5]/1-2-2-2/a4-b1_b6-c1_c2-d1
WURCS-RDF: WURCSの構成要素を⽤いたWURCSのRDF
WURCS構成要素
化合物の扱いは研究対象とする分野により様々であるため、化合物の⾻格構造をもとに部分構造(コンポーネント)に分割し、部分構造(コンポーネント)をつないで化合物の全体の構造をRDFで記述する。
⽅法
糖鎖構造から化合物構造へ
@prefixsio:<hcp://semanPcscience.org/resource/>.@prefixfaldo:<hcp://biohackathon.org/resource/faldo>.@prefixglycan:<hcp://purl.jp/bio/12/glyco/glycan#>.#hascomponentpart[SIO_000369]<hcp://natpros.org/Astragalin/1>
sio:has-component-part<hcp://rdf.glycoinfo.org/glycan/wurcs/WURCS=2.0/1,1,0/[a2122h-1b_1-5]/1/>,<hcp://natpros.org/Flavonol/Kaempferol>.
#iscomponentpartof[SIO_000313]<hcp://rdf.glycoinfo.org/glycan/wurcs/WURCS=2.0/1,1,0/[a2122h-1b_1-5]/1/> sio:is-component-part-of
<hcp://natpros.org/Astragalin/1>.<hcp://natpros.org/Flavonol/Kaempferol>
sio:is-component-part-of<hcp://natpros.org/Astragalin/1>.
#is-connected-to[SIO:000203]component<->component<hcp://rdf.glycoinfo.org/glycan/wurcs/WURCS=2.0/1,1,0/[a2122h-1b_1-5]/1/>
sio:is-connected-to<hcp://natpros.org/Flavonol/Kaempferol>.<hcp://natpros.org/Flavonol/Kaempferol>
sio:is-connected-to<hcp://rdf.glycoinfo.org/glycan/wurcs/WURCS=2.0/1,1,0/[a2122h-1b_1-5]/1/>.#faldo:locaPon<hcp://natpros.org/Flavonol/Kaempferol>
faldo:locaPon<hcp://natpros.org/Flavonol/Kaempferol#loc>.<hcp://rdf.glycoinfo.org/glycan/wurcs/WURCS=2.0/1,1,0/[a2122h-1b_1-5]/1/>
faldo:locaPon<hcp://rdf.glycoinfo.org/glycan/wurcs/WURCS=2.0/1,1,0/[a2122h-1b_1-5]/1/#loc>.#is_directly-connected-to[SIO:000652]faldo:locaPon<->faldo:locaPon<hcp://rdf.glycoinfo.org/glycan/wurcs/WURCS=2.0/1,1,0/[a2122h-1b_1-5]/1/#loc>
sio:is_directly-connected-to<hcp://natpros.org/Flavonol/Kaempferol#loc>.
<hcp://natpros.org/Flavonol/Kaempferol#loc>sio:is_directly-connected-to<hcp://rdf.glycoinfo.org/glycan/wurcs/WURCS=2.0/1,1,0/[a2122h-1b_1-5]/1/#loc>.
#faldo:posiPon<hcp://rdf.glycoinfo.org/glycan/wurcs/WURCS=2.0/1,1,0/[a2122h-1b_1-5]/1/#loc>
faldo:posiPon1;rdf:type faldo:ExactPosiPon.
<hcp://natpros.org/Flavonol/Kaempferol#loc> faldo:posiPon3;rdf:type faldo:ExactPosiPon.
#faldo:reference<hcp://rdf.glycoinfo.org/glycan/wurcs/WURCS=2.0/1,1,0/[a2122h-1b_1-5]/1/#loc>
faldo:reference <hcp://rdf.glycoinfo.org/glycan/wurcs/WURCS=2.0/1,1,0/[a2122h-1b_1-5]/1/>.<hcp://natpros.org/Flavonol/Kaempferol#loc>
faldo:reference<hcp://natpros.org/Flavonol/Kaempferol>.#rdf:type<hcp://rdf.glycoinfo.org/glycan/wurcs/WURCS=2.0/1,1,0/[a2122h-1b_1-5]/1/>
glycan:has_glyco_sequence"WURCS=2.0/1,1,0/[a2122h-1b_1-5]/1/".<hcp://rdf.glycoinfo.org/glycan/wurcs/WURCS=2.0/1,1,0/[a2122h-1b_1-5]/1/> aglycan:Sequence.<hcp://rdf.glycoinfo.org/glycan/wurcs/WURCS=2.0/1,1,0/[a2122h-1b_1-5]/1/#loc>
aglycan:Monosaccharide.
Protein CO
NHCH2CH2OPHO OO
Man Man Man GlcNO
6 α1,2 α1,6 α1,4
OH
OH
OH OHO
α1,6
PO
OHO CH2
HCH2C O
OCC
O
OC14H29
C14H29
Protein CO
NHCH2CH2OPHO OO
Man Man Man GlcNO
6 α1,2 α1,6 α1,4
OH
OH
OH OHO
α1,6
PO
OHO CH2
HCH2C O
OCC
O
OC14H29
C14H29
Protein
SM
Glycan
Lipid
Glycan
Lipid
Protein
SM
Glycan
Lipid
タンパク質糖脂質 GPI anchor
フラボノイド糖
Licensed under a Creative Commons 表示2.1日本 license (c)2015 山田一作(公益財団法人野口研究所)
• WURCS:JChemInfModel.2014Jun23;54(6):1558-66.doi:10.1021/ci400571e.• GlycoRDF:BioinformaPcs.2015Mar15;31(6):919-25.doi:10.1093/bioinformaPcs/btu732.• SIO:JBiomedSemanPcs.2014Mar6;5(1):14.doi:10.1186/2041-1480-5-14.• FALDO:hcps://github.com/JervenBolleman/FALDO.
OH
O
OOH
HO
O OHOOH
OH
OH
Astragalin Kaempferol 3-O-β-D-glucoside
Flavonol
β-D-glucopyranose
KaempferolCarbohydrate
G91079GH
Flavonoid DatabaseMolecule
Flavonol
Carbohydrate
FL5FAANS0001
Kaempferol
G71142DF
Molecule
Protein
Glycan
Lipid
sio:has-component-part sio:SIO_000369 sio:Is-component-part-of sio:SIO_000313
Molecule Component
Component_1sio:is_connected-to sio:SIO_000203 Component_2
faldo:locationComponent Location
faldo:position
faldo:referenceLocation Referencerdf:type rdf:value
Atom_1sio:is_covalentry-connected-to sio:SIO_000334 Atom_2
Location_1sio:is_directly-connected-to sio:SIO_000652 Location_2
つなぎかた
参考⽂献
WURCS=2.0/1,1,0/[a2122h-1b_1-5]/1/
本研究は、国⽴研究開発法⼈科学技術振興機構(JST)・バイオサイエンスデータベースセンター(NBDC)により実施されているライフサイエンスデータベース統合推進事業における「統合化推進プログラム」の助成により実施した。
謝辞
Protein
Glycan
Lipid
部分構造(コンポーネント)を組合せて化合物をつなぐ
owl:sameAsowl:sameAs
G00045MO Molecule
SM
Glycan
Lipid
Protein
owl:sameAs
owl:sameAs