20151006 トーゴーの日シンポジウム2015 山田 a1x2 · 2017-02-09 ·...

2
ポスター19:炭素鎖表現の系統化に基づく単糖および糖鎖構造の包摂関係表現 〇⼭⽥⼀作 1) 、松原正陽 1) 、⽊下聖⼦ 2),3) 、成松久 3) 1)野⼝研究所 2)創価⼤学 3)産業技術総合研究所 糖鎖技術研究グループ トーゴーの⽇シンポジウム2015 〜統合データベースとオープンライフサイエンス〜@東京⼤学弥⽣講堂 ⼀条ホール(東京都⽂京区) Licensed under a Creative Commons 表示2.1日本 license (c)2015 山田一作(公益財団法人野口研究所) GlyTouCan Accession Number: G00045MO GPI anchor core 化合物構造 コンポーネントに分割 ⾻格構造分類は、ポスター17“天然化合物関 連情報にむけた、⽣合成を考慮した化学構造分 類とRDF化への取り組み”の分類を利⽤ コンポーネントを結合 糖鎖 SIO:organic molecule GlycoRDF:Compound 単糖 SIO:submolecular entity GlycoRDF:Component グリコシド結合 SIO FALDO Molecule Protein Glycan Lipid 我々は糖鎖関連データを統合化するために、国際糖鎖構造リポジトリ「GlyTouCan」やセマンティックウェブに対応させた糖鎖構造表記法であるWURCS (the Web3 Unique Representation of Carbohydrate Structures)を開発している。WURCS では、化合物の化学構造の内、糖鎖部分構造のみを対象とし線形⽂字列や Resource Description Framework (RDF)などでの表記へ対応させている。さらに、WURCS における糖鎖構造表記の考え⽅を複合糖質など糖鎖以外の構造を含む 化合物へと適⽤し、RDF で記述すること、糖鎖構造データと各種化合物データベースの化学構造との関連付けについて検討した。 糖質関連化合物構造のRDFによる統合化 WURCS Sec/on prefix WURCS= version 2.0 delimiter / Count 2,4,3 uRES uRES List RESSeq 1-2-3 LIN LIN List uRES Sec/on: [a2122h-1b_2*N] prefix [ SkeletonCode (SC) a2122h delimiter - anomeric posiPon 1 anomeric symbol b separator _ MOD MOD List suffix ] LIN Sec/on: a1u2-b4u1*O*~1:n GLIP a1u2 delimiter - separator _ MAP *O* Repeat ~1:n RESSeq Sec/on: 1-2-3 uRESID 1 separator - SkeletonCode Sec/on: a2122h Carbon Descriptor a,1,2,h MOD Sec/on: 1-5; 2u0*NCC/3=O LIP 2u0 MAP *NCC/3=O delimiter - LIP/GLIP Sec/on: a1u2|a2u2%.1:.9% RES Index (GLIP only) a SC posiPon 1 direcPon u MAP posiPon 2 separator (fuzzy only) | Probability %.1:.9% RDFで記述 様々な化合物データベースに含まれる化合物を、化学構造の部分⼀致で他のデータベー スとつなげることで、完全⼀致ではつながらない化合物をつなぐことが⽬的である。糖 鎖データベースと化合物データベースの統合が期待できる。 ⽬的 WURCS: Web3.0 Unique Representation of Carbohydrate Structure WURCS=2.0/2,4,3/[a2122h-1a_1-5_2*N][a1122h-1a_1-5]/1-2-2-2/a4-b1_b6-c1_c2-d1 WURCS-RDF: WURCSの構成要素を⽤いたWURCSのRDF WURCS構成要素 化合物の扱いは研究対象とする分野により様々であるため、化合物の⾻格構造を もとに部分構造(コンポーネント)に分割し、部分構造(コンポーネント)をつ ないで化合物の全体の構造をRDFで記述する。 ⽅法 糖鎖構造から化合物構造へ

Upload: others

Post on 26-Jun-2020

0 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: 20151006 トーゴーの日シンポジウム2015 山田 A1x2 · 2017-02-09 · ポスター19:炭素鎖表現の系統化に基づく単糖および糖鎖構造の包摂関係表現

ポスター19:炭素鎖表現の系統化に基づく単糖および糖鎖構造の包摂関係表現

〇⼭⽥⼀作1)、松原正陽1)、⽊下聖⼦2),3)、成松久3)

1)野⼝研究所 2)創価⼤学 3)産業技術総合研究所 糖鎖技術研究グループトーゴーの⽇シンポジウム2015 〜統合データベースとオープンライフサイエンス〜@東京⼤学弥⽣講堂 ⼀条ホール(東京都⽂京区)

Licensed under a Creative Commons 表示2.1日本 license (c)2015 山田一作(公益財団法人野口研究所)

GlyTouCanAccessionNumber:G00045MO GPIanchorcore

化合物構造•  コンポーネントに分割

⾻格構造分類は、ポスター17“天然化合物関連情報にむけた、⽣合成を考慮した化学構造分類とRDF化への取り組み”の分類を利⽤

•  コンポーネントを結合

糖鎖SIO:organic molecule GlycoRDF:Compound

単糖SIO:submolecular entity GlycoRDF:Component

グリコシド結合SIO

FALDO

Molecule

Protein

Glycan

Lipid

我々は糖鎖関連データを統合化するために、国際糖鎖構造リポジトリ「GlyTouCan」やセマンティックウェブに対応させた糖鎖構造表記法であるWURCS (the Web3 Unique Representation of Carbohydrate Structures)を開発している。WURCS では、化合物の化学構造の内、糖鎖部分構造のみを対象とし線形⽂字列やResource Description Framework (RDF)などでの表記へ対応させている。さらに、WURCS における糖鎖構造表記の考え⽅を複合糖質など糖鎖以外の構造を含む化合物へと適⽤し、RDF で記述すること、糖鎖構造データと各種化合物データベースの化学構造との関連付けについて検討した。

糖質関連化合物構造のRDFによる統合化

WURCSSec/on

prefix WURCS=

version 2.0

delimiter /

Count 2,4,3

uRES uRESList

RESSeq 1-2-3

LIN LINList

uRESSec/on:[a2122h-1b_2*N]

prefix [

SkeletonCode(SC) a2122h

delimiter -

anomericposiPon 1

anomericsymbol b

separator _

MOD MODList

suffix ]

LINSec/on:a1u2-b4u1*O*~1:n

GLIP a1u2

delimiter -

separator _

MAP *O*

Repeat ~1:n

RESSeqSec/on:1-2-3

uRESID 1

separator -

SkeletonCodeSec/on:a2122h

CarbonDescriptor a,1,2,h

MODSec/on:1-5;2u0*NCC/3=O

LIP 2u0

MAP *NCC/3=O

delimiter -

LIP/GLIPSec/on:a1u2|a2u2%.1:.9%

RESIndex(GLIPonly) a

SCposiPon 1

direcPon u

MAPposiPon 2

separator(fuzzyonly) |

Probability %.1:.9%

RDFで記述

様々な化合物データベースに含まれる化合物を、化学構造の部分⼀致で他のデータベースとつなげることで、完全⼀致ではつながらない化合物をつなぐことが⽬的である。糖鎖データベースと化合物データベースの統合が期待できる。

⽬的

WURCS: Web3.0 Unique Representation of Carbohydrate Structure

WURCS=2.0/2,4,3/[a2122h-1a_1-5_2*N][a1122h-1a_1-5]/1-2-2-2/a4-b1_b6-c1_c2-d1

WURCS-RDF: WURCSの構成要素を⽤いたWURCSのRDF

WURCS構成要素

化合物の扱いは研究対象とする分野により様々であるため、化合物の⾻格構造をもとに部分構造(コンポーネント)に分割し、部分構造(コンポーネント)をつないで化合物の全体の構造をRDFで記述する。

⽅法

糖鎖構造から化合物構造へ

Page 2: 20151006 トーゴーの日シンポジウム2015 山田 A1x2 · 2017-02-09 · ポスター19:炭素鎖表現の系統化に基づく単糖および糖鎖構造の包摂関係表現

@prefixsio:<hcp://semanPcscience.org/resource/>.@prefixfaldo:<hcp://biohackathon.org/resource/faldo>.@prefixglycan:<hcp://purl.jp/bio/12/glyco/glycan#>.#hascomponentpart[SIO_000369]<hcp://natpros.org/Astragalin/1>

sio:has-component-part<hcp://rdf.glycoinfo.org/glycan/wurcs/WURCS=2.0/1,1,0/[a2122h-1b_1-5]/1/>,<hcp://natpros.org/Flavonol/Kaempferol>.

#iscomponentpartof[SIO_000313]<hcp://rdf.glycoinfo.org/glycan/wurcs/WURCS=2.0/1,1,0/[a2122h-1b_1-5]/1/> sio:is-component-part-of

<hcp://natpros.org/Astragalin/1>.<hcp://natpros.org/Flavonol/Kaempferol>

sio:is-component-part-of<hcp://natpros.org/Astragalin/1>.

#is-connected-to[SIO:000203]component<->component<hcp://rdf.glycoinfo.org/glycan/wurcs/WURCS=2.0/1,1,0/[a2122h-1b_1-5]/1/>

sio:is-connected-to<hcp://natpros.org/Flavonol/Kaempferol>.<hcp://natpros.org/Flavonol/Kaempferol>

sio:is-connected-to<hcp://rdf.glycoinfo.org/glycan/wurcs/WURCS=2.0/1,1,0/[a2122h-1b_1-5]/1/>.#faldo:locaPon<hcp://natpros.org/Flavonol/Kaempferol>

faldo:locaPon<hcp://natpros.org/Flavonol/Kaempferol#loc>.<hcp://rdf.glycoinfo.org/glycan/wurcs/WURCS=2.0/1,1,0/[a2122h-1b_1-5]/1/>

faldo:locaPon<hcp://rdf.glycoinfo.org/glycan/wurcs/WURCS=2.0/1,1,0/[a2122h-1b_1-5]/1/#loc>.#is_directly-connected-to[SIO:000652]faldo:locaPon<->faldo:locaPon<hcp://rdf.glycoinfo.org/glycan/wurcs/WURCS=2.0/1,1,0/[a2122h-1b_1-5]/1/#loc>

sio:is_directly-connected-to<hcp://natpros.org/Flavonol/Kaempferol#loc>.

<hcp://natpros.org/Flavonol/Kaempferol#loc>sio:is_directly-connected-to<hcp://rdf.glycoinfo.org/glycan/wurcs/WURCS=2.0/1,1,0/[a2122h-1b_1-5]/1/#loc>.

#faldo:posiPon<hcp://rdf.glycoinfo.org/glycan/wurcs/WURCS=2.0/1,1,0/[a2122h-1b_1-5]/1/#loc>

faldo:posiPon1;rdf:type faldo:ExactPosiPon.

<hcp://natpros.org/Flavonol/Kaempferol#loc> faldo:posiPon3;rdf:type faldo:ExactPosiPon.

#faldo:reference<hcp://rdf.glycoinfo.org/glycan/wurcs/WURCS=2.0/1,1,0/[a2122h-1b_1-5]/1/#loc>

faldo:reference <hcp://rdf.glycoinfo.org/glycan/wurcs/WURCS=2.0/1,1,0/[a2122h-1b_1-5]/1/>.<hcp://natpros.org/Flavonol/Kaempferol#loc>

faldo:reference<hcp://natpros.org/Flavonol/Kaempferol>.#rdf:type<hcp://rdf.glycoinfo.org/glycan/wurcs/WURCS=2.0/1,1,0/[a2122h-1b_1-5]/1/>

glycan:has_glyco_sequence"WURCS=2.0/1,1,0/[a2122h-1b_1-5]/1/".<hcp://rdf.glycoinfo.org/glycan/wurcs/WURCS=2.0/1,1,0/[a2122h-1b_1-5]/1/> aglycan:Sequence.<hcp://rdf.glycoinfo.org/glycan/wurcs/WURCS=2.0/1,1,0/[a2122h-1b_1-5]/1/#loc>

aglycan:Monosaccharide.

Protein CO

NHCH2CH2OPHO OO

Man Man Man GlcNO

6 α1,2 α1,6 α1,4

OH

OH

OH OHO

α1,6

PO

OHO CH2

HCH2C O

OCC

O

OC14H29

C14H29

Protein CO

NHCH2CH2OPHO OO

Man Man Man GlcNO

6 α1,2 α1,6 α1,4

OH

OH

OH OHO

α1,6

PO

OHO CH2

HCH2C O

OCC

O

OC14H29

C14H29

Protein

SM

Glycan

Lipid

Glycan

Lipid

Protein

SM

Glycan

Lipid

タンパク質­糖­脂質 GPI anchor

フラボノイド­糖

Licensed under a Creative Commons 表示2.1日本 license (c)2015 山田一作(公益財団法人野口研究所)

•  WURCS:JChemInfModel.2014Jun23;54(6):1558-66.doi:10.1021/ci400571e.•  GlycoRDF:BioinformaPcs.2015Mar15;31(6):919-25.doi:10.1093/bioinformaPcs/btu732.•  SIO:JBiomedSemanPcs.2014Mar6;5(1):14.doi:10.1186/2041-1480-5-14.•  FALDO:hcps://github.com/JervenBolleman/FALDO.

OH

O

OOH

HO

O OHOOH

OH

OH

Astragalin Kaempferol 3-O-β-D-glucoside

Flavonol

β-D-glucopyranose

KaempferolCarbohydrate

G91079GH

Flavonoid DatabaseMolecule

Flavonol

Carbohydrate

FL5FAANS0001

Kaempferol

G71142DF

Molecule

Protein

Glycan

Lipid

sio:has-component-part sio:SIO_000369 sio:Is-component-part-of sio:SIO_000313

Molecule Component

Component_1sio:is_connected-to sio:SIO_000203 Component_2

faldo:locationComponent Location

faldo:position

faldo:referenceLocation Referencerdf:type rdf:value

Atom_1sio:is_covalentry-connected-to sio:SIO_000334 Atom_2

Location_1sio:is_directly-connected-to sio:SIO_000652 Location_2

つなぎかた

参考⽂献

WURCS=2.0/1,1,0/[a2122h-1b_1-5]/1/

本研究は、国⽴研究開発法⼈科学技術振興機構(JST)・バイオサイエンスデータベースセンター(NBDC)により実施されているライフサイエンスデータベース統合推進事業における「統合化推進プログラム」の助成により実施した。

謝辞

Protein

Glycan

Lipid

部分構造(コンポーネント)を組合せて化合物をつなぐ

owl:sameAsowl:sameAs

G00045MO Molecule

SM

Glycan

Lipid

Protein

owl:sameAs

owl:sameAs