dogan niteの継続的情報公開への取り組みrhodococcus erythropolis pr4 published nbrc...
TRANSCRIPT
微生物ゲノムデータベースDOGANと
NITEの継続的情報公開への取り組み ○市川 夏子、澤野 寿彦、関川 智洋、山崎 秀司、藤田 信之
(独) 製品評価技術基盤機構(NITE)・NBRC Licensed under a Creative Commons表示2.1日本 license (c)2011 市川夏子 (製品評価技術基盤機構)
National Institute of Technology and Evaluation
独立行政法人 製品評価技術基盤機構
カテゴリ 菌株名 解析状況 その他※1 NBRC 番号 DNAリソース※2
食品
黒麹菌 Aspergillus awamori NBRC 4314 ongoing NBRC 4314
麹菌 Aspergillus oryzae RIB40 published Proteome NBRC 100959 clone, gDNA
清酒酵母 Saccharomyces cerevisiae Kyokai no.7 published NBRC 101557
酢酸菌 Acetobacter pasteurianus IFO 3283 published NBRC 3283 clone, gDNA
Gluconacetobacter xylinus NBRC 3288 published NBRC 3288 gDNA
ホモ火落ち乳酸菌 Lactobacillus homohiochii NBRC 13120 ongoing NBRC 13120
醤油乳酸菌 Tetragenococcus halophilus NBRC 12172 published Proteome NBRC 12172 gDNA
スピルリナ Arthrospira (Spirulina) plantensis NIES-39 published Protein sequencing
アミノ酸生産 Corynebacterium efficiens YS-314T published NBRC 100395T clone, gDNA
健康
黄色ブドウ球菌(メチシリン耐性) Staphylococcus aureus MW2 published clone
黄色ブドウ球菌 Staphylococcus aureus N315 published clone
ブドウ球菌(日和見感染菌) Staphylococcus haemolyticus JCSC1435 published clone
抗生物質生産
Kitasatospora setae KM-6054T published NBRC 14216T clone, gDNA
Streptomyces avermitilis MA-4680T published NBRC 14893T gDNA
Actinoplanes missouriensis 431T complete NBRC 102363T
環境・エネルギー
好熱古細菌
Aeropyrum pernix K1T published Proteome NBRC 100138T clone, gDNA
Pyrococcus horikoshii OT3T published NBRC 100139T clone, gDNA
Sulfolobus tokodaii strain 7T published Proteome NBRC 100140T clone, gDNA
好塩性古細菌 Haloarcula japonica TR-1T ongoing NBRC 101032T
メタン生成古細菌 Methanocella paludicola SANAET published NBRC 101707T clone, gDNA
紅色光合成細菌 Rubrivivax gelatinosus IL144 ongoing NBRC 100245
鉄腐食能 Methanococcus maripaludis KA1, OS7 complete Proteome(OS7)
好酸性、金属耐性 Acidiphilium multivorum AIU301T published NBRC 100883T clone
有機溶媒耐性
Kocuria rhizophila DC2201 published Proteome NBRC 103217 clone, gDNA
Rhodococcus erythropolis PR4 published NBRC 100887 clone, gDNA
Rhodococcus opacus B4 published Proteome clone
酸素ストレス耐性 Amphibacillus xylanus NBRC 15112T complete NBRC 15112T
イネ苗立枯細菌病菌 Burkholderia plantarii MAFF301723T ongoing NBRC 104884T
磁性粒子合成菌 Desulfovibrio magneticus RS-1T published NBRC 104933T clone, gDNA
ポリリン酸蓄積菌 Microlunatus phosphovorus NM-1T published NBRC 101784T gDNA
ヘキサクロロシクロヘキサン分解 Sphingobium japonicum UT26S published NBRC 101211 clone, gDNA
リグニン分解 Sphingobium sp. SYK-6 published NBRC 103272
タンパク質生産宿主 Brevibacillus brevis 47 published Proteome NBRC 100599 clone, gDNA
高温アルコール発酵酵母 Kluyveromyces marxianus DMKU3-1042 ongoing
新規分類群
新門アルマティモナデテス門 Armatimonas rosea YO-36 ongoing NBRC 105658T
新門カルディセリカ門 Caldisericum exile AZM16c01T complete NBRC 104410T
新門ジェマティモナデテス門 Gemmatimonas aurantiaca T-27T published Protein sequencing NBRC 100505T clone, gDNA
新目名称未定 Marine actinobacterium YM16-304 complete
プランクトマイセテス門 Phycisphaera mikurensis FYK2301M01T ongoing NBRC 102666T
極限環境
高温排水処理リアクター Anaerolinea thermophila UNI-1T published Protein sequencing NBRC 100420T clone
温泉硫黄芝 Caldilinea aerophila STL-6-O1T ongoing Protein sequencing NBRC 104270T
深海熱水噴出孔 Deferribacter desulfuricans SSM1T published NBRC 101012T clone, gDNA
シジミ消化管 Oscillibacter valericigenes Sjm18-20T published NBRC 101213T
ヒツジルーメン Selenomonas ruminantium subsp. lactilytica TAM6421 ongoing NBRC 103574
深海熱水活動域 Thermosulfidibacter takaii ABI70S6T ongoing NBRC 103674T
http://www.bio.nite.go.jp/dogan/ (FREE)
Sulfolobus tokodaii strain 7のリアノテーション
★ ORFID変更しました。 新旧IDで検索できます.
New ID Old ID Ref New product name
STK_21090 ST2109 ★ 5'-3' nuclease NurA
STK_12905 STS142 archaeal chromatin protein
STK_21060 ST2106 ★ bipolar DNA helicase HerA
STK_12995 chromatin protein Cren7
STK_21070 ST2107 ★ DNA double-strand break repair protein Mre11
STK_14310 ST1431 DNA primase large subunit
STK_09430 ST0943 DNA primase small subunit
STK_13070 ST1307 ★ DNA repair helicase XPD
STK_22800 ST2280 ★ DNA repair helicase XPD
STK_16130 ST1613 ★ DNA-dependent ATPase XPBII
STK_14440 ST1444 ★ Holliday junction resolving enzyme Hjc
STK_04710 ST0471 Orc1/Cdc6 initiator protein 2
STK_21650 ST2165 Orc1/Cdc6 initiator protein 3
STK_04390 ST0439 repair endonuclease XPF
STK_12870 ST1287 ★ ssDNA-dependent ATPase XPBI
Number of spots 154
N-term blocked 33
Undetectable 15
Duplicate 23
Identified protein 81
プロテオーム解析結果概要
2D-page ゲル画像
プロテオーム解析によるstart positionの修正例
② プロテオーム解析
④ リファレンスの追加
24390 (ST2439)
Frame (+)
【CREATE】 STK_24405 (hypothetical protein)
STK_24380 (ST2438)
24400 (ST2440)
24390 (ST2439)
24430 (ST2443)
Identified peptide (1) MKETENEIIIEVPNLPPIKI
以前予測していた start position
Identified peptide (2)
Experimental organism
Supported ORF Pubmed papers
S. tokodaii 180 258
Other homologue 1133 2985
genus Sulfolobus 457 911
other Archaea 434 888
Database Supported ORF
IS finder inertion sequence 67 IS, 52 ORF
CRISPRs database CRISPR, Cas gene 3 CRISPR, 33 ORF
TransportDB transport protein 167 ORF
MEROPS peptidase 64 ORF
CAZy glycosidase, glycosyltransferase 52 ORF
PDB crystal structure 109 ORF
追加されたリファレンスの概要
統合された情報の概要
遺伝子発見ソフトでORFを予測し、相同性を元にマニュアルでORFの妥当性・開始位置を検討した。 130 ORFを新規に作製し、411 ORFの開始位置を変更、140 ORFを削除した。
新規ORFの作製例
S. tokodaii
S. solfataricus chromatin protein
6901 0976 6904 SSO0975
cren7
(ST1299) (ST1300)
13000 STK_12990
New assigned 【CREATE】 STK_12995 chromatin protein Cren7 STK_13005 hypothetical protein
以前予測していたstart position
変更後の start position
pyrC
Start positionの変更例
pyrK pyrB
pyrI
STK_14780 (ST1478)
14790 (ST1479)
(STS177) (ST1480)
14800 14785
①遺伝子予測の再検討
NITEの微生物ゲノム解析とDOGAN公開状況
今年1月から9菌のゲノム情報、2件のプロテオーム情報を公開しました。
Crenarchaeon
S. tokodaii strain 7 (= NBRC100140)
九州・別府温泉から1983年に分離
された好酸性好熱古細菌。至適生育 温度は80℃。至適pHは2.5-3 2001年にNITEによりゲノム解析を行い情報を公開した。
NITEの高精度マニュアルアノテーション
アノテータのコメントを表示
統一されたボキャブラリーでアノテーションを付与
独自のカテゴリーによる機能分類
相同遺伝子のリファレンス情報を付与
その他多様な情報を提供中
① 遺伝子予測の再検討 140 ORFを削除 130 ORFを新規作製 411 ORFの開始位置を修正
② プロテオーム解析 81 ORFのN末ペプチドを同定 23 ORFの開始位置を修正 2 ORFを新規作成
③ 機能推測の再実施 808 ORFのタンパク質名を変更
④ リファレンスの追加 1179 ORFにアノテーションの根拠とした情報を付加
リアノテーション結果概要
【Reference 】 S.solfataricus P2 _SSO6901 chromatin protein Cren7 [PMID: 18096617 etc.]
New assigned
【CHANGE】 STK_25110 (dienelactone hydrolase)
【CHANGE】 STK_14785 (dihydroorotate dehydrogenase electron transfer subunit)
ORFの正確な翻訳開始位置を決めるため、エドマン分解法により タンパク質のN末端解析を行った。 2 ORFを新規に作製し、81 ORFの開始位置を変更した。
Product name Gene name EC number Category Reference
Annotation
UniProtKB 近縁種ゲノム 自ゲノム etc.
InterPro HAMAP SignalP TMHMM SOSUI
Pubmed
IS FINDER CRISPR db TransportDB MEROPS CAZy PDB
KEGG UniProt
clustalW
モチーフ検索
実験情報の検索
各protein DBの統合 gene cluster component pathway の確認
系統解析
相同性検索
相同性根拠となる
実験情報や論文情報を付加
Pubmed UniProt
活性部位等の確認
NITEアノテーションScheme
機能未知から新たに機能予測できた例(一部)
NITEアノテーション手法に基づき、相同性検索、ドメイン検索を 再実施し、機能推測を行った。 808 ORFのタンパク質名を変更した。
③ 機能推測の再実施
★:S. tokodaiiで実験的に機能が確認されているもの
上記のNITEアノテーション手法に基づき、アノテーションの根拠として相同遺伝子のリファレンス情報を追加した。 1179 ORFに対して 3243 報のリファレンス情報を追加した。
2001年のゲノム情報公開以降、他DBで独自の解析がなされて公開されている情報をDOGANに入力し、統合を行った。
①遺伝子予測の再検討
② プロテオーム解析
② プロテオーム解析
③ 機能推測の再実施
④ リファレンスの追加
④ リファレンスの追加
※1 Proteome: プロテオーム解析も実施しています。詳しくは → http://www.bio.nite.go.jp/ngac/project_p.html ※2 clone, gDNA: ゲノムDNAクローンまたはゲノムDNAを分譲しています。詳しくは → http://www.nbrc.nite.go.jp/index.html
-微生物ゲノムデータベースDOGAN-
◎NITEで解析した株のゲノム情報を公開するデータベース ◎アノテータによる高精度マニュアルアノテーションを実施 ◎ゲノム解析機関として国内最大級の公開株数 今年度も続々公開予定 ◎過去公開菌のリアノテーションも実施中
DOGANは今後も高精度な情報を数多く提供することに努めていきます
1998 1999 2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011
Pyrococcus horikosii 1998.4.30
Aeropyrum pernix K1 1999.7.30
Staphylocuccus aureus N315 2001.4.20
Sulfolobus tokodaii strain 7 2001.9.13
Corynebacterium efficiens YS-314 2002.3.29
Staphylocuccus aureus MW2 2002.5.25
Streptomyces avermitilis MA-4680
2003.4.8
Aspergillus oryzae RIB40 2005.12.21
Staphylococcus heamolyticus JCSC1435 2005.6.30
Kocuria rhizophila DC2201 2008.3.31
Brevibacillus brevis 47 Rhodococcus erythropolis PR4 Rhodococcus opacus B4 Gemmatimonas aurantiaca T-27 2009.3.31 Desulfovibrio magneticus RS-1 2009.7.31 Acetobacter pasteurianus 2009.10.20
Methanocella paludicola Kitasatospora setae 2010.1.4 2010.11.11 Deferribacter desulfuricans Salmonella typhimurium 2010.3.5 2010.11.26 Arthrospira platensis Sphingobium japonicum 2010.3.29
Anaerolinea thermophila 2011.1.24 Acidiphilium multivorum 2011.3.29 Microlunatus phosphorus 2011.6.1
DOGAN年表
oGa n~~~
DOGAN-Kun
NITE