Transcript
Page 1: DOGAN NITEの継続的情報公開への取り組みRhodococcus erythropolis PR4 published NBRC 100887 clone, gDNA Rhodococcus opacus B4 published Proteome clone 酸素ストレス耐性

微生物ゲノムデータベースDOGANと

NITEの継続的情報公開への取り組み ○市川 夏子、澤野 寿彦、関川 智洋、山崎 秀司、藤田 信之

(独) 製品評価技術基盤機構(NITE)・NBRC Licensed under a Creative Commons表示2.1日本 license (c)2011 市川夏子 (製品評価技術基盤機構)

National Institute of Technology and Evaluation

独立行政法人 製品評価技術基盤機構

カテゴリ 菌株名 解析状況 その他※1 NBRC 番号 DNAリソース※2

食品

黒麹菌 Aspergillus awamori NBRC 4314 ongoing NBRC 4314

麹菌 Aspergillus oryzae RIB40 published Proteome NBRC 100959 clone, gDNA

清酒酵母 Saccharomyces cerevisiae Kyokai no.7 published NBRC 101557

酢酸菌 Acetobacter pasteurianus IFO 3283 published NBRC 3283 clone, gDNA

Gluconacetobacter xylinus NBRC 3288 published NBRC 3288 gDNA

ホモ火落ち乳酸菌 Lactobacillus homohiochii NBRC 13120 ongoing NBRC 13120

醤油乳酸菌 Tetragenococcus halophilus NBRC 12172 published Proteome NBRC 12172 gDNA

スピルリナ Arthrospira (Spirulina) plantensis NIES-39 published Protein sequencing

アミノ酸生産 Corynebacterium efficiens YS-314T published NBRC 100395T clone, gDNA

健康

黄色ブドウ球菌(メチシリン耐性) Staphylococcus aureus MW2 published clone

黄色ブドウ球菌 Staphylococcus aureus N315 published clone

ブドウ球菌(日和見感染菌) Staphylococcus haemolyticus JCSC1435 published clone

抗生物質生産

Kitasatospora setae KM-6054T published NBRC 14216T clone, gDNA

Streptomyces avermitilis MA-4680T published NBRC 14893T gDNA

Actinoplanes missouriensis 431T complete NBRC 102363T

環境・エネルギー

好熱古細菌

Aeropyrum pernix K1T published Proteome NBRC 100138T clone, gDNA

Pyrococcus horikoshii OT3T published NBRC 100139T clone, gDNA

Sulfolobus tokodaii strain 7T published Proteome NBRC 100140T clone, gDNA

好塩性古細菌 Haloarcula japonica TR-1T ongoing NBRC 101032T

メタン生成古細菌 Methanocella paludicola SANAET published NBRC 101707T clone, gDNA

紅色光合成細菌 Rubrivivax gelatinosus IL144 ongoing NBRC 100245

鉄腐食能 Methanococcus maripaludis KA1, OS7 complete Proteome(OS7)

好酸性、金属耐性 Acidiphilium multivorum AIU301T published NBRC 100883T clone

有機溶媒耐性

Kocuria rhizophila DC2201 published Proteome NBRC 103217 clone, gDNA

Rhodococcus erythropolis PR4 published NBRC 100887 clone, gDNA

Rhodococcus opacus B4 published Proteome clone

酸素ストレス耐性 Amphibacillus xylanus NBRC 15112T complete NBRC 15112T

イネ苗立枯細菌病菌 Burkholderia plantarii MAFF301723T ongoing NBRC 104884T

磁性粒子合成菌 Desulfovibrio magneticus RS-1T published NBRC 104933T clone, gDNA

ポリリン酸蓄積菌 Microlunatus phosphovorus NM-1T published NBRC 101784T gDNA

ヘキサクロロシクロヘキサン分解 Sphingobium japonicum UT26S published NBRC 101211 clone, gDNA

リグニン分解 Sphingobium sp. SYK-6 published NBRC 103272

タンパク質生産宿主 Brevibacillus brevis 47 published Proteome NBRC 100599 clone, gDNA

高温アルコール発酵酵母 Kluyveromyces marxianus DMKU3-1042 ongoing

新規分類群

新門アルマティモナデテス門 Armatimonas rosea YO-36 ongoing NBRC 105658T

新門カルディセリカ門 Caldisericum exile AZM16c01T complete NBRC 104410T

新門ジェマティモナデテス門 Gemmatimonas aurantiaca T-27T published Protein sequencing NBRC 100505T clone, gDNA

新目名称未定 Marine actinobacterium YM16-304 complete

プランクトマイセテス門 Phycisphaera mikurensis FYK2301M01T ongoing NBRC 102666T

極限環境

高温排水処理リアクター Anaerolinea thermophila UNI-1T published Protein sequencing NBRC 100420T clone

温泉硫黄芝 Caldilinea aerophila STL-6-O1T ongoing Protein sequencing NBRC 104270T

深海熱水噴出孔 Deferribacter desulfuricans SSM1T published NBRC 101012T clone, gDNA

シジミ消化管 Oscillibacter valericigenes Sjm18-20T published NBRC 101213T

ヒツジルーメン Selenomonas ruminantium subsp. lactilytica TAM6421 ongoing NBRC 103574

深海熱水活動域 Thermosulfidibacter takaii ABI70S6T ongoing NBRC 103674T

http://www.bio.nite.go.jp/dogan/ (FREE)

Sulfolobus tokodaii strain 7のリアノテーション

★ ORFID変更しました。 新旧IDで検索できます.

New ID Old ID Ref New product name

STK_21090 ST2109 ★ 5'-3' nuclease NurA

STK_12905 STS142 archaeal chromatin protein

STK_21060 ST2106 ★ bipolar DNA helicase HerA

STK_12995 chromatin protein Cren7

STK_21070 ST2107 ★ DNA double-strand break repair protein Mre11

STK_14310 ST1431 DNA primase large subunit

STK_09430 ST0943 DNA primase small subunit

STK_13070 ST1307 ★ DNA repair helicase XPD

STK_22800 ST2280 ★ DNA repair helicase XPD

STK_16130 ST1613 ★ DNA-dependent ATPase XPBII

STK_14440 ST1444 ★ Holliday junction resolving enzyme Hjc

STK_04710 ST0471 Orc1/Cdc6 initiator protein 2

STK_21650 ST2165 Orc1/Cdc6 initiator protein 3

STK_04390 ST0439 repair endonuclease XPF

STK_12870 ST1287 ★ ssDNA-dependent ATPase XPBI

Number of spots 154

N-term blocked 33

Undetectable 15

Duplicate 23

Identified protein 81

プロテオーム解析結果概要

2D-page ゲル画像

プロテオーム解析によるstart positionの修正例

② プロテオーム解析

④ リファレンスの追加

24390 (ST2439)

Frame (+)

【CREATE】 STK_24405 (hypothetical protein)

STK_24380 (ST2438)

24400 (ST2440)

24390 (ST2439)

24430 (ST2443)

Identified peptide (1) MKETENEIIIEVPNLPPIKI

以前予測していた start position

Identified peptide (2)

Experimental organism

Supported ORF Pubmed papers

S. tokodaii 180 258

Other homologue 1133 2985

genus Sulfolobus 457 911

other Archaea 434 888

Database Supported ORF

IS finder inertion sequence 67 IS, 52 ORF

CRISPRs database CRISPR, Cas gene 3 CRISPR, 33 ORF

TransportDB transport protein 167 ORF

MEROPS peptidase 64 ORF

CAZy glycosidase, glycosyltransferase 52 ORF

PDB crystal structure 109 ORF

追加されたリファレンスの概要

統合された情報の概要

遺伝子発見ソフトでORFを予測し、相同性を元にマニュアルでORFの妥当性・開始位置を検討した。 130 ORFを新規に作製し、411 ORFの開始位置を変更、140 ORFを削除した。

新規ORFの作製例

S. tokodaii

S. solfataricus chromatin protein

6901 0976 6904 SSO0975

cren7

(ST1299) (ST1300)

13000 STK_12990

New assigned 【CREATE】 STK_12995 chromatin protein Cren7 STK_13005 hypothetical protein

以前予測していたstart position

変更後の start position

pyrC

Start positionの変更例

pyrK pyrB

pyrI

STK_14780 (ST1478)

14790 (ST1479)

(STS177) (ST1480)

14800 14785

①遺伝子予測の再検討

NITEの微生物ゲノム解析とDOGAN公開状況

今年1月から9菌のゲノム情報、2件のプロテオーム情報を公開しました。

Crenarchaeon

S. tokodaii strain 7 (= NBRC100140)

九州・別府温泉から1983年に分離

された好酸性好熱古細菌。至適生育 温度は80℃。至適pHは2.5-3 2001年にNITEによりゲノム解析を行い情報を公開した。

NITEの高精度マニュアルアノテーション

アノテータのコメントを表示

統一されたボキャブラリーでアノテーションを付与

独自のカテゴリーによる機能分類

相同遺伝子のリファレンス情報を付与

その他多様な情報を提供中

① 遺伝子予測の再検討 140 ORFを削除 130 ORFを新規作製 411 ORFの開始位置を修正

② プロテオーム解析 81 ORFのN末ペプチドを同定 23 ORFの開始位置を修正 2 ORFを新規作成

③ 機能推測の再実施 808 ORFのタンパク質名を変更

④ リファレンスの追加 1179 ORFにアノテーションの根拠とした情報を付加

リアノテーション結果概要

【Reference 】 S.solfataricus P2 _SSO6901 chromatin protein Cren7 [PMID: 18096617 etc.]

New assigned

【CHANGE】 STK_25110 (dienelactone hydrolase)

【CHANGE】 STK_14785 (dihydroorotate dehydrogenase electron transfer subunit)

ORFの正確な翻訳開始位置を決めるため、エドマン分解法により タンパク質のN末端解析を行った。 2 ORFを新規に作製し、81 ORFの開始位置を変更した。

Product name Gene name EC number Category Reference

Annotation

UniProtKB 近縁種ゲノム 自ゲノム etc.

InterPro HAMAP SignalP TMHMM SOSUI

Pubmed

IS FINDER CRISPR db TransportDB MEROPS CAZy PDB

KEGG UniProt

clustalW

モチーフ検索

実験情報の検索

各protein DBの統合 gene cluster component pathway の確認

系統解析

相同性検索

相同性根拠となる

実験情報や論文情報を付加

Pubmed UniProt

活性部位等の確認

NITEアノテーションScheme

機能未知から新たに機能予測できた例(一部)

NITEアノテーション手法に基づき、相同性検索、ドメイン検索を 再実施し、機能推測を行った。 808 ORFのタンパク質名を変更した。

③ 機能推測の再実施

★:S. tokodaiiで実験的に機能が確認されているもの

上記のNITEアノテーション手法に基づき、アノテーションの根拠として相同遺伝子のリファレンス情報を追加した。 1179 ORFに対して 3243 報のリファレンス情報を追加した。

2001年のゲノム情報公開以降、他DBで独自の解析がなされて公開されている情報をDOGANに入力し、統合を行った。

①遺伝子予測の再検討

② プロテオーム解析

② プロテオーム解析

③ 機能推測の再実施

④ リファレンスの追加

④ リファレンスの追加

※1 Proteome: プロテオーム解析も実施しています。詳しくは → http://www.bio.nite.go.jp/ngac/project_p.html ※2 clone, gDNA: ゲノムDNAクローンまたはゲノムDNAを分譲しています。詳しくは → http://www.nbrc.nite.go.jp/index.html

-微生物ゲノムデータベースDOGAN-

◎NITEで解析した株のゲノム情報を公開するデータベース ◎アノテータによる高精度マニュアルアノテーションを実施 ◎ゲノム解析機関として国内最大級の公開株数 今年度も続々公開予定 ◎過去公開菌のリアノテーションも実施中

DOGANは今後も高精度な情報を数多く提供することに努めていきます

1998 1999 2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011

Pyrococcus horikosii 1998.4.30

Aeropyrum pernix K1 1999.7.30

Staphylocuccus aureus N315 2001.4.20

Sulfolobus tokodaii strain 7 2001.9.13

Corynebacterium efficiens YS-314 2002.3.29

Staphylocuccus aureus MW2 2002.5.25

Streptomyces avermitilis MA-4680

2003.4.8

Aspergillus oryzae RIB40 2005.12.21

Staphylococcus heamolyticus JCSC1435 2005.6.30

Kocuria rhizophila DC2201 2008.3.31

Brevibacillus brevis 47 Rhodococcus erythropolis PR4 Rhodococcus opacus B4 Gemmatimonas aurantiaca T-27 2009.3.31 Desulfovibrio magneticus RS-1 2009.7.31 Acetobacter pasteurianus 2009.10.20

Methanocella paludicola Kitasatospora setae 2010.1.4 2010.11.11 Deferribacter desulfuricans Salmonella typhimurium 2010.3.5 2010.11.26 Arthrospira platensis Sphingobium japonicum 2010.3.29

Anaerolinea thermophila 2011.1.24 Acidiphilium multivorum 2011.3.29 Microlunatus phosphorus 2011.6.1

DOGAN年表

oGa n~~~

DOGAN-Kun

NITE

Top Related