togotable update 2013 - biosciencedbc.jp · 2017-02-09 · data.go v . uk st. andrews resource...
TRANSCRIPT
![Page 1: TogoTable update 2013 - biosciencedbc.jp · 2017-02-09 · data.go v . uk St. Andrews Resource Lists ECS South-ampton EPrints S SW Thesaur us Smart Link Slideshare 2RDF semantic web](https://reader034.vdocuments.pub/reader034/viewer/2022042409/5f25fedc143b4c10ec23d244/html5/thumbnails/1.jpg)
まとめと今後の予定
RDF (Resource Description Framework)とは?
Introduction
TogoTable update 2013*河野信 1, 渡辺敦 2, 山口敦子 1
1 情報・システム研究機構 ライフサイエンス統合データベースセンター , 2 クロスエッジ・システムズMail: [email protected] Twitter ID: orenotwitter
情報・システム研究機構ライフサイエンス統合データベースセンター東京都文京区弥生 2-11-16 東京大学工学部 12 号館 4・5階
トーゴーの日シンポジウム 20132013年 10月 4日 , 5日時事通信ホール Copyright©2013 DBCLS licenced by Creative Commons Attribution-ShareAlike 3.0 Unported License.
As of September 2011
MusicBrainz
(zitgist)
P20
Turismo de
Zaragoza
yovisto
Yahoo! Geo
Planet
YAGO
World Fact-book
El ViajeroTourism
WordNet (W3C)
WordNet (VUA)
VIVO UF
VIVO Indiana
VIVO Cornell
VIAF
URIBurner
Sussex Reading
Lists
Plymouth Reading
Lists
UniRef
UniProt
UMBEL
UK Post-codes
legislationdata.gov.uk
Uberblic
UB Mann-heim
TWC LOGD
Twarql
transportdata.gov.
uk
Traffic Scotland
theses.fr
Thesau-rus W
totl.net
Tele-graphis
TCMGeneDIT
TaxonConcept
Open Library (Talis)
tags2con delicious
t4gminfo
Swedish Open
Cultural Heritage
Surge Radio
Sudoc
STW
RAMEAU SH
statisticsdata.gov.
uk
St. Andrews Resource
Lists
ECS South-ampton EPrints
SSW Thesaur
us
SmartLink
Slideshare2RDF
semanticweb.org
SemanticTweet
Semantic XBRL
SWDog Food
Source Code Ecosystem Linked Data
US SEC (rdfabout)
Sears
Scotland Geo-
graphy
ScotlandPupils &Exams
Scholaro-meter
WordNet (RKB
Explorer)
Wiki
UN/LOCODE
Ulm
ECS (RKB
Explorer)
Roma
RISKS
RESEX
RAE2001
Pisa
OS
OAI
NSF
New-castle
LAASKISTI
JISC
IRIT
IEEE
IBM
Eurécom
ERA
ePrints dotAC
DEPLOY
DBLP (RKB
Explorer)
Crime Reports
UK
Course-ware
CORDIS (RKB
Explorer)CiteSeer
Budapest
ACM
riese
Revyu
researchdata.gov.
ukRen. Energy Genera-
tors
referencedata.gov.
uk
Recht-spraak.
nl
RDFohloh
Last.FM (rdfize)
RDF Book
Mashup
Rådata nå!
PSH
Product Types
Ontology
ProductDB
PBAC
Poké-pédia
patentsdata.go
v.uk
OxPoints
Ord-nance Survey
Openly Local
Open Library
OpenCyc
Open Corpo-rates
OpenCalais
OpenEI
Open Election
Data Project
OpenData
Thesau-rus
Ontos News Portal
OGOLOD
JanusAMP
Ocean Drilling Codices
New York
Times
NVD
ntnusc
NTU Resource
Lists
Norwe-gian
MeSH
NDL subjects
ndlna
myExperi-ment
Italian Museums
medu-cator
MARC Codes List
Man-chester Reading
Lists
Lotico
Weather Stations
London Gazette
LOIUS
Linked Open Colors
lobidResources
lobidOrgani-sations
LEM
LinkedMDB
LinkedLCCN
LinkedGeoData
LinkedCT
LinkedUser
Feedback
LOV
Linked Open
Numbers
LODE
Eurostat (OntologyCentral)
Linked EDGAR
(OntologyCentral)
Linked Crunch-
base
lingvoj
Lichfield Spen-ding
LIBRIS
Lexvo
LCSH
DBLP (L3S)
Linked Sensor Data (Kno.e.sis)
Klapp-stuhl-club
Good-win
Family
National Radio-activity
JP
Jamendo (DBtune)
Italian public
schools
ISTAT Immi-gration
iServe
IdRef Sudoc
NSZL Catalog
Hellenic PD
Hellenic FBD
PiedmontAccomo-dations
GovTrack
GovWILD
GoogleArt
wrapper
gnoss
GESIS
GeoWordNet
GeoSpecies
GeoNames
GeoLinkedData
GEMET
GTAA
STITCH
SIDER
Project Guten-berg
MediCare
Euro-stat
(FUB)
EURES
DrugBank
Disea-some
DBLP (FU
Berlin)
DailyMed
CORDIS(FUB)
Freebase
flickr wrappr
Fishes of Texas
Finnish Munici-palities
ChEMBL
FanHubz
EventMedia
EUTC Produc-
tions
Eurostat
Europeana
EUNIS
EU Insti-
tutions
ESD stan-dards
EARTh
Enipedia
Popula-tion (En-AKTing)
NHS(En-
AKTing) Mortality(En-
AKTing)
Energy (En-
AKTing)
Crime(En-
AKTing)
CO2 Emission
(En-AKTing)
EEA
SISVU
education.data.g
ov.uk
ECS South-ampton
ECCO-TCP
GND
Didactalia
DDC Deutsche Bio-
graphie
datadcs
MusicBrainz
(DBTune)
Magna-tune
John Peel
(DBTune)
Classical (DB
Tune)
AudioScrobbler (DBTune)
Last.FM artists
(DBTune)
DBTropes
Portu-guese
DBpedia
dbpedia lite
Greek DBpedia
DBpedia
data-open-ac-uk
SMCJournals
Pokedex
Airports
NASA (Data Incu-bator)
MusicBrainz(Data
Incubator)
Moseley Folk
Metoffice Weather Forecasts
Discogs (Data
Incubator)
Climbing
data.gov.uk intervals
Data Gov.ie
databnf.fr
Cornetto
reegle
Chronic-ling
America
Chem2Bio2RDF
Calames
businessdata.gov.
uk
Bricklink
Brazilian Poli-
ticians
BNB
UniSTS
UniPathway
UniParc
Taxonomy
UniProt(Bio2RDF)
SGD
Reactome
PubMedPub
Chem
PRO-SITE
ProDom
Pfam
PDB
OMIMMGI
KEGG Reaction
KEGG Pathway
KEGG Glycan
KEGG Enzyme
KEGG Drug
KEGG Com-pound
InterPro
HomoloGene
HGNC
Gene Ontology
GeneID
Affy-metrix
bible ontology
BibBase
FTS
BBC Wildlife Finder
BBC Program
mes BBC Music
Alpine Ski
Austria
LOCAH
Amster-dam
Museum
AGROVOC
AEMET
US Census (rdfabout)
Media
Geographic
Publications
Government
Cross-domain
Life sciences
User-generated content
As of September 2011
MusicBrainz
(zitgist)
P20
Turismo de
Zaragoza
yovisto
Yahoo! Geo
Planet
YAGO
World Fact-book
El ViajeroTourism
WordNet (W3C)
WordNet (VUA)
VIVO UF
VIVO Indiana
VIVO Cornell
VIAF
URIBurner
Sussex Reading
Lists
Plymouth Reading
Lists
UniRef
UniProt
UMBEL
UK Post-codes
legislationdata.gov.uk
Uberblic
UB Mann-heim
TWC LOGD
Twarql
transportdata.gov.
uk
Traffic Scotland
theses.fr
Thesau-rus W
totl.net
Tele-graphis
TCMGeneDIT
TaxonConcept
Open Library (Talis)
tags2con delicious
t4gminfo
Swedish Open
Cultural Heritage
Surge Radio
Sudoc
STW
RAMEAU SH
statisticsdata.gov.
uk
St. Andrews Resource
Lists
ECS South-ampton EPrints
SSW Thesaur
us
SmartLink
Slideshare2RDF
semanticweb.org
SemanticTweet
Semantic XBRL
SWDog Food
Source Code Ecosystem Linked Data
US SEC (rdfabout)
Sears
Scotland Geo-
graphy
ScotlandPupils &Exams
Scholaro-meter
WordNet (RKB
Explorer)
Wiki
UN/LOCODE
Ulm
ECS (RKB
Explorer)
Roma
RISKS
RESEX
RAE2001
Pisa
OS
OAI
NSF
New-castle
LAASKISTI
JISC
IRIT
IEEE
IBM
Eurécom
ERA
ePrints dotAC
DEPLOY
DBLP (RKB
Explorer)
Crime Reports
UK
Course-ware
CORDIS (RKB
Explorer)CiteSeer
Budapest
ACM
riese
Revyu
researchdata.gov.
ukRen. Energy Genera-
tors
referencedata.gov.
uk
Recht-spraak.
nl
RDFohloh
Last.FM (rdfize)
RDF Book
Mashup
Rådata nå!
PSH
Product Types
Ontology
ProductDB
PBAC
Poké-pédia
patentsdata.go
v.uk
OxPoints
Ord-nance Survey
Openly Local
Open Library
OpenCyc
Open Corpo-rates
OpenCalais
OpenEI
Open Election
Data Project
OpenData
Thesau-rus
Ontos News Portal
OGOLOD
JanusAMP
Ocean Drilling Codices
New York
Times
NVD
ntnusc
NTU Resource
Lists
Norwe-gian
MeSH
NDL subjects
ndlna
myExperi-ment
Italian Museums
medu-cator
MARC Codes List
Man-chester Reading
Lists
Lotico
Weather Stations
London Gazette
LOIUS
Linked Open Colors
lobidResources
lobidOrgani-sations
LEM
LinkedMDB
LinkedLCCN
LinkedGeoData
LinkedCT
LinkedUser
Feedback
LOV
Linked Open
Numbers
LODE
Eurostat (OntologyCentral)
Linked EDGAR
(OntologyCentral)
Linked Crunch-
base
lingvoj
Lichfield Spen-ding
LIBRIS
Lexvo
LCSH
DBLP (L3S)
Linked Sensor Data (Kno.e.sis)
Klapp-stuhl-club
Good-win
Family
National Radio-activity
JP
Jamendo (DBtune)
Italian public
schools
ISTAT Immi-gration
iServe
IdRef Sudoc
NSZL Catalog
Hellenic PD
Hellenic FBD
PiedmontAccomo-dations
GovTrack
GovWILD
GoogleArt
wrapper
gnoss
GESIS
GeoWordNet
GeoSpecies
GeoNames
GeoLinkedData
GEMET
GTAA
STITCH
SIDER
Project Guten-berg
MediCare
Euro-stat
(FUB)
EURES
DrugBank
Disea-some
DBLP (FU
Berlin)
DailyMed
CORDIS(FUB)
Freebase
flickr wrappr
Fishes of Texas
Finnish Munici-palities
ChEMBL
FanHubz
EventMedia
EUTC Produc-
tions
Eurostat
Europeana
EUNIS
EU Insti-
tutions
ESD stan-dards
EARTh
Enipedia
Popula-tion (En-AKTing)
NHS(En-
AKTing) Mortality(En-
AKTing)
Energy (En-
AKTing)
Crime(En-
AKTing)
CO2 Emission
(En-AKTing)
EEA
SISVU
education.data.g
ov.uk
ECS South-ampton
ECCO-TCP
GND
Didactalia
DDC Deutsche Bio-
graphie
datadcs
MusicBrainz
(DBTune)
Magna-tune
John Peel
(DBTune)
Classical (DB
Tune)
AudioScrobbler (DBTune)
Last.FM artists
(DBTune)
DBTropes
Portu-guese
DBpedia
dbpedia lite
Greek DBpedia
DBpedia
data-open-ac-uk
SMCJournals
Pokedex
Airports
NASA (Data Incu-bator)
MusicBrainz(Data
Incubator)
Moseley Folk
Metoffice Weather Forecasts
Discogs (Data
Incubator)
Climbing
data.gov.uk intervals
Data Gov.ie
databnf.fr
Cornetto
reegle
Chronic-ling
America
Chem2Bio2RDF
Calames
businessdata.gov.
uk
Bricklink
Brazilian Poli-
ticians
BNB
UniSTS
UniPathway
UniParc
Taxonomy
UniProt(Bio2RDF)
SGD
Reactome
PubMedPub
Chem
PRO-SITE
ProDom
Pfam
PDB
OMIMMGI
KEGG Reaction
KEGG Pathway
KEGG Glycan
KEGG Enzyme
KEGG Drug
KEGG Com-pound
InterPro
HomoloGene
HGNC
Gene Ontology
GeneID
Affy-metrix
bible ontology
BibBase
FTS
BBC Wildlife Finder
BBC Program
mes BBC Music
Alpine Ski
Austria
LOCAH
Amster-dam
Museum
AGROVOC
AEMET
US Census (rdfabout)
Media
Geographic
Publications
Government
Cross-domain
Life sciences
User-generated content
http://purl.uniprot.org/uniprot/P02787
http://en.wikipedia.org/wiki/Human
go:0008199
http://en.wikipedia.org/wiki/Human
taxon:9606 embl:AAA61140.1Serotransferrin 698
HumanHomo sapiens
77064
mRNA 3q21 2097ferric iron binding
up:recommendedName
rdfs:seeAlsotaxon:commoNametaxon:scientificName
up:molecularFunctionup:organismup:massup:length
dc:name
rdfs:seeAlso
embl:sequenceLengthembl:mapembl:moleculeType
up="http://purl.uniport.org/core/”rdfs="http://www.w3.org/2000/01/rdf-schema#"dc="http://purl.org/dc/elements/1.1/"
2. データベース IDを含むセルをクリック 3. ID がどのデータベースの IDであるか指定 4. アノテーションを取得するデータベースを指定
・UniProt (e.g. P08670)
1. 検索キーとなるデータベース IDの追加
5. 取得したいアノテーション属性を選択
6. 指定したアノテーション属性が テーブルの右側に追加される
TogoTable update 2013TogoTable は、表形式データに含まれるバイオデータベースの ID 番号をキーにして、世界各地で提供されている SPARQLエンドポイントからアノテーション情報を取得し、元の表データに追加するウェブツールである。これまでに UniProtの ID番号をキーにして UniProt のアノテーションデータを取得するシステムをプロトタイプとして開発した。Linked Open Dataの特性を活かすべく検索対象SPARQLエンドポイントを追加し、新たに PDB データのアノテーション情報を取得可能にした。また、UniProt に記載されているリンク情報を使って PubMed ID などさまざまなデータベースの ID 番号からUniProtのアノテーション情報を取得可能にした。今後はNBDCで提供されているデータベースアーカイブのデータなどさらに検索対象 SPARQL エンドポイントを拡充していく予定である。
実験データなどのデータベース ID を含むテーブルデータに対して、ID に対応するアノテーション属性情報を自動的に付加するウェブツールを開発した。本システムのバックエンドでは RDF 技術を利用しており、RDF グラフをたどることで、複数のデータベースをまたいだアノテーション属性情報の付加が可能となる。本年は UniProt ID 以外のバイオデータベース ID からの情報取得を実現した。また、検索対象データベースとして PDB を追加した。今後の開発予定として :
- 対象データベースの拡大 (NBDC 提供の DBアーカイブを中心に ) - フィルタリング機能やデータサマライズ機能の実装 - Galaxyとの連携 - ユーザによるクエリの登録・共有システムの実装
- Subject - Predicate - Object の トリプル でデータを表現 - Subject - リソース (URI: Uniform Resource Identifier e.g. URL) - Predicate - オントロジーで表現された関係 (URI) - Object - データ (literal)もしくはリソース (URI)
- 非常にシンプルな表現であるがゆえに、 さまざまなデータを統合するのに向いている Examples: - <http://purl.uniprot.org/uniprot/P02787> <http://purl.uniprot.org/core/recommendedName> "Serotransferrin" - <http://purl.uniprot.org/uniprot/P02787> rdfs:seeAlso <http://purl.uniprot.org/embl-cds/AAA61140.1>
sp
o
The Linking Open Data cloud diagram“Linking Open Data cloud diagram, by Richard Cyganiak and Anja Jentzsch. http://lod-cloud.net/”
Connecting resources enablescross-database search
RDF graph (Example)A graph can be drawn by connecting triples. By using RDF technology, annotation search from different databases becomes easy.
Oval and square represents a resource and literal, respectively. Blee, orange, and green colors mean subject, predicate, and object, respectively.Node with gradation of green and blue is both subject and object. Note that some predicates are modified.
UniProt
NCBI Taxonomy GO
EMBL
TogoTableの使い方
http://togotable.dbcls.jp/
1. タブ区切り形式のテーブルデータを アップロード
2. アノテーション検索対象データベースの追加
2012
2013
・UniProt (P08670)・PDB (1GK6)・PubMed (2251132)・INSDC (AAA61279.1)・RefSeq (NP_003371.2)・UniGene (Hs.455493)・Ensembl (ENST00000224237)・Gene (7431)・KEGG GENES (hsa:7431)・UCSC (uc001iou.2)
http://togotable.dbcls.jp/
3. カラムの並べ替え、非表示・再表示機能の追加
2012 2013