М.С.Гельфанд ( ИППИ РАН ) 3-й съезд ВОГиС, Москва, июнь 2004
DESCRIPTION
Сравнительная геномика и метаболическая реконструкция: что можно сказать об организме, зная только его геном. М.С.Гельфанд ( ИППИ РАН ) 3-й съезд ВОГиС, Москва, июнь 2004. красный : статьи синий : последовательности. Анализ индивидуальных генов. - PowerPoint PPT PresentationTRANSCRIPT
Сравнительная геномика и метаболическая
реконструкция: что можно сказать об организме, зная
только его геном
М.С.Гельфанд (ИППИ РАН)
3-й съезд ВОГиС, Москва, июнь 2004
красный: статьисиний: последовательности
100
1000
10000
100000
1000000
10000000
1982 1983 1984 1985 1986 1987 1988 1989 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000
год
Анализ индивидуальных генов
• Поиск родственных белков в банках последовательностей – перенос функции от гомологов
• Функциональные сайты (каталитические центры)
• Функциональные участки (трансмембранные сегменты, сигнальные пептиды и т.п.)
• Анализ на уровне индивидуальных генов даёт возможность охарактеризовать 50-75% генов в новом геноме
Но:• ~100 универсально отсутствующих генов (нет ни
одного известного гена для известной функции)• множество функций, для которых неизвестны
представители в больших таксонах• в каждом геноме ~5-10% консервативных генов с
неизвестной функцией• трудно предсказывать специфичность в
мультигенных семействах (транспортёры, факторы транскрипции)
• нельзя найти что-то принципиально новое
Полные геномы
2
149
4
18
30
55
84
8
19
422
1
107
4321
15
0
10
20
30
40
50
60
70
80
90
1995 1996 1997 1998 1999 2000 2001 2002
Сравнительная геномика и метаболическая реконструкция
• Метаболическая реконструкция
Идентификация пробелов
• Позиционный анализ
(гены и домены)
• Анализ филогенетического распределения
• Анализ регуляторных сигналов
Отнесение генов к функциональным и метаболическим системам Уточнение специфичности
Утилизация пектина
E. chrysanthemi
… и транспорт олигогалактуронатов
E. chrysanthemi
Y. pestis
K. pneumoniae
предсказание и подтверждение
Новые члены регулона KdgR у E. chrysanthemi
+ ppsA фосфоенолпируват-синтаза+ ydiA– chmX хемотаксис (акцептор метила)– dhfX периплазматическая эстераза – spiX изомераза (аналог KduI)– yjgK участвует в нижней части пути– tpfX– ydiV транспортер– sotA экспорт сахаров (токсичных интермедиатов?)– gntDBMNAC ABC-транспортер– yeeO транспортер
YpaA: транспортёр рибофлавина• 5 предсказанных ТМ-сегментов =>
потенциальный транспортёр
• регуляторный RFN-элемент => ко-регуляция с генами метаболизма рибофлавина => транспорт рибофлавина или предшественника
• S. pyogenes, E. faecalis, Listeria: есть ypaA, нет генов биосинтеза рибофлавина => транспорт рибофлавина
Предсказание: YpaA – рибофлавиновый транспортёр (Gelfand et al., 1999)
Проверка:
• YpaA переносит рибофлавин (генетический анализ, Кренева и др., 2000)
• ypaA регулируется рибофлавином (анализ экспрессии на микрочипах, Lee et al., 2001; прямой эксперимент, Winkler et al., 2002).
Новое семейство транспортёров аминокислот
S-box (rectangle frame)MetJ (circle frame)LYS-element (circles)Tyr-T-box (rectangles)
BC1434
FN 062 4
269.47
SON-3
CJ
CPE
LysT
MetT
TyrT
MleN
DF
CTCCB
OB
SO N-2VC-2
NM B
SON-1
VC-1
BHHP
C
TTE-nhaC
AC0744
FN0978
BL1111
CTC 00901
OB2874OB1118
NMB05 36
FN0352BC4121
EF-nhaC1
EF-nhaC2
PPE
LP-nha2
LP-nha1 L
L
M
GA
ELB
BS-yheL
BS-m leN
FN0650
VC2037
BC1709
SA 2292HI1107
VV21061FN207 7
BH3946
BC0373
FN14 22
BB0638
BB0637
F N1420
CTC02529SO1087
VCA0193
BT1270
C
CB
T C02520
CPE2317
FN1414
SA2117
Archaea
clostrid ia
Pasteure llaceae
malate/lactate
Метаболическая реконструкция
пути биосинтеза лизина
-aspartyl-phosphate
aspartate semialdehyde
homoserine
dihydrodipicolinate
tetrahydrodipicolinate
N-acetyl-2-amino-6-ketopimelateN-succinyl-2-amino-6-ketopimelate
N-acetyl-L,L-diaminopimelateN-succinyl-L,L-diaminopimelate
L,L-diaminopimelate
meso -diaminopimelate
Lysine transport
L-aspartate
lysC,dapG,yclMlysC,thrA,metL
asd
hom
thrA,metL
dapA
dapB
dapDdapD
ykuR
dapC(argD)
ddh
patA
dapE
dapF, dal
lysA
Идентификация пути ацетилированных интермедиатов в
B. subtilis и родственных бактериях - 0
dapD (yquQ):
• ортолог известного гена E. coli
Идентификация пути ацетилированных интермедиатов в
B. subtilis и родственных бактериях - 1
patA: • пиридоксаль-фосфат-
зависимая аминотрансфераза (по гомологии)
• ко-локализуется и ко-регулируется с генами биосинтеза лизина во многих грам-положительных бактериях
Идентификация пути ацетилированных интермедиатов в
B. subtilis и родственных бактериях - 2ykuR: • N-ацил-L-аминокислота
амидогидролаза (по гомологии)• ко-локализуется и ко-
регулируется с геном биосинтеза лизина dapD во многих грам-положительных бактериях
• в некоторых случаях принадлежит к большому лизиновому оперону, регулируемому LYS-элементом
Идентификация пути ацетилированных интермедиатов в
B. subtilis и родственных бактериях - 3dapX: • dapF отсутствует у некоторых
бактерий (Staphylococcus aureus, Oenococcus oeni, Leuconostoc mesenteroides)
• во всех этих геномах есть dapX, гомологичный аланиновой рацемазе и другим эпимеразам
• в S. aureus dapX принадлежит к большому лизиновому оперону
• в O. oeni оперон dapX-asd регулируется LYS-элемен dapX том
Метаболическая реконструкция
пути биосинтеза кобаламина
(витамина В12)
Прекоррин 3AO 2
Прекоррин 3B
Прекоррин 4
Прекоррин 5
Прекоррин 6x
Прекоррин 6y
Прекоррин 8x
Кобальт-прекоррин 3
Кобальт-прекоррин 4
Кобальт-прекоррин 5
Кобальт-прекоррин 6x
Кобальт-прекоррин 6y
Кобириновая кислота
Кобальт-прекоррин 8x
Гидробириновая кислота
a,c-диамид гидробириновой кислоты
a,c-диамид коб(II)ириновой кислоты
a,c-диамид коб(I)ириновой кислоты
Кобинамид
Кобаламин
аминопрпанол-2-фосф ат
Треонин-3-фосфат
Треонин
Аленозилкобинамид
-рибазол-5-фосфат
-рибазол
cysG
cbiP
cobU
cobS
cbiB
btu
FC
DE
cobT
cobD
cobC
cobNST
cobI
cobG
cobJ
cobM
cobF
cobK
cobH
cobL
cobB
cbiL
cbiHcbiG?
cbiF
cbiD?
cbiJ
cbiC
cbiET
cbiA
cobP
Co2+
Транспорт кобальтаcbiMNQO, hoxN, hupE, cbtAB, cbtC, cbtD, cbtE, cbtG, cnoABCD
идентификация новых ферментов, транспортёров кобаламина, промежуточных продуктов и кобальта
Предсказания: ферменты
• синтез жирных кислот: FadR
• синтез тиамина: ThiN
• биосинтез лизина – путь ацетилированных интермедиатов
• обратный путь синтеза цистеина из метионина и путь ре-утилизации метионина
• биосинтез кобаламина: ChlID, BluB, PduO, PduX, CobY, CobZ, CblXY, CblZ, BhiB, BtuS
• пути катаболизма различных сахаров и олигосахаридов
• синтез триптофана и фолата: семейство TrpG/PabA
• биосинтез биотина: BioZ, BioK
Предсказания: транспортёры
• аминокислоты – метионин
– тирозин
– триптофан
– лизин
– аргинин
– гистидин
• нуклеотиды
• сахара и олигосахариды– в том числе, важные для
патогенеза (стрептококки, растительные патогены)
• металлы – железо– цинк– кобальт– никель
• витамины и их предшественники– биотин– тиамин (В1)– рибофлавин (В2)– кобаламин (В12)
Предсказания: регуляторные сигналы
• MtaR (метиониновый репрессор стрептококков)
• BioR (биотиновый репрессор – бактерии и археи)
• ZUR и AdcR (цинковые репрессоры)
• регуляция катаболизма сахаров и олигосахаридов (несколько десятков регуляторов)
• регуляция синтеза ароматических аминокислот (стрептококки)
• регуляция систем ответа на перенаселение (quorum sensing – лактококки и лактобациллы)
• РНКовые переключатели (рибофлавин, тиамин)
• аттенюаторы аминокислотных оперонов
• регуляторные системы архей (тепловой шок, пурины, утилизация азота, синтез триптофана)
Подтверждённые предсказанияпредсказание геном(ы)
аргининовый транспортёр yqiXYZ: специфичность и регуляция
бактерии (Bacillus subtilis)
рибофлавиновый транспортёр YpaA: специфичность и регуляция
Грам-положительные бактерии (Bacillus subtilis)
ацил-КоА дегидрогеназа FadE кодируется геном yafH
гамма-протеобактерии (Escherichia coli)
рибофлавиновый РНК-переключатель бактерии (Bacillus subtilis, Escherichia coli)
тиаминовый РНК-переключатель бактерии и археи (Bacillus subtilis, Escherichia coli)
ThiN (= ThiD), биосинтез тиамина T. maritima, археи (Methanobacterium thermoautotrophicum)
метиониновый транспортёр MetD Bacillus subtilis, Escherichia coli
транспортёр олигогалактуронидов ogtABCD (togMNAB)
гамма-протеобактерии (Erwinia chrysanthemi)
Сравнительная геномика систем утилизации цинка
Две роли цинка в бактериях:
• Структурная в ДНК-полимеразах, праймазах, рибосомных белках
• Каталитическая в протеазах и других белках
Геномы и регуляторы
nZURFUR family
???
AdcR ?MarR family
pZURFUR family
Регуляторы и сигналыnZUR-nZUR-
AdcRpZUR
TTAACYRGTTAA
GATATGTTATAACATATCGAAATGTTATANTATAACATTTC
GTAATGTAATAACATTAC
TAAATCGTAATNATTACGATTTA
Выравнивание сигналов nZUR
GTAATGTAA TAACATTAC (alpha – most genera)GATATGTTA TAACATATC (alpha – Rhodobacter)GAAATGTTATANTATAACATTTC (gamma)
GaaATGTtA-----TAACATttC (consensus of consensi)
Транспортеры
• Ортологи транспортных систем AdcABC и YciC
• Паралоги компонентов систем AdcABC и YciC
• Потенциальные транспортеры с ранее не известной специфичностью
zinT: регуляция
zinT одиночный
домен: adcA-zinT
E. coli, S. typhi, K. pneumoniae Gamma-proteobacteria
Alpha-proteobacteria
B. subtilis, S. aureus
S. pneumoniae, S. mutans, S. pyogenes, L. lactis, E. faecalis
Bacillus group
Streptococcus group
zinT регулируется цинковыми репрессорами (nZUR-, nZUR-, pZUR)
adcA-zinT регулируется цинковыми репрессорами (pZUR, AdcR) (ex. L.l.)
A. tumefaciens, R. sphaeroides
ZinT: анализ белковой последовательности
E. coli, S. typhi, K. pneumoniae, A. tumefaciens, R. sphaeroides, B. subtilis
L. lactis
Y. pestis, V. cholerae, B. halodurans
TM Zn AdcA
S. aureus, E. faecalis, S. pneumoniae, S. mutans, S. pyogenes
ZinT
ZinT: резюме
• ZinT часто является доменом цинкового транспортёра
• zinT экспрессируется при недостатке цинка
• ZinT локализован на поверхности клетки (имеет трансмембранный якорь)
• ZinT имеет цинк-связывающий домен
вывод:• ZinT – новый тип цинк-связывающей
компоненты ABC транспортёра
Регуляция белков PHT (pneumococcal histidine triad) в стрептококках
S. pneumoniae S. equiS. agalactiae
lmb phtD phtE
phtBphtA
lmb phtD
S. pyogenes
phtY
lmb phtD
регуляция цинком показана экспериментально
Структурные свойства белков PHT
• Белки PHT содержат множественные копии мотива HxxHxH
• Белки PHT из S. pneumoniae – это паралоги с уровнем сходства 65-95%
• Белки PHT имеют N-концевые гидрофобные пептиды
• Локализация белков PHT из S. pneumoniae на поверхности бактериальной клетки была показана проточной цитометрией
Белки PHT:
• экспрессируются в условиях недостатка цинка
• локализуются на поверхности клеточной мембраны
• содержат цинк-связывающие мотивы
Гипотеза:• это новое семейство транспортёров
цинка
… неверно
• цинк-связывающие мотивы в транспортёрах:
EEEHEEHDHGEHEHSH
HSHEEHGHEEDDHDHSHEEHGHEEDDHHHHHDED
DEHGEGHEEEHGHEH
(гистидин-аспартат-глутамат)
• гистидиновые триады в белках PHT:
HGDHYHY 7 out of 21HGDHYHF 2 out of 21HGNHYHF 2 out of 21HYDHYHN 2 out of 21HMTHSHW 2 out of 21
(специфическое расположение гистидинов и ароматических аминокислот)
… продолжение анализа
• Ген phtD входит в оперон с геном lmb во всех стрептококках– Lmb: адгезин, участвующий в связывании
стрептококков с эпителиальными клетками
• PhtY в S. pyogenes: – phtY регулируется AdcR
– PhtY состоит из трех доменов:
PHT internalin H-rich
4 HIS TRIADS LRR IRHDYNHNHTYEDEEGHAHEHRDKDDHDHEHED
Белки PHТ: вторая попытка
• белки PHT продуцируются при недостатке цинка• белки PHT локализуются на поверхности клетки• белки PHT содержат цинк-связывающие мотивы• phtD образует потенциальный оперон с геном адгезина • PhtY содержит домен интерналина отвечающий за
инвазию
ГипотезаБелки PHT – это адгезины связанные с прикреплением к
клетке хозяина для дальнейшей инвазии
Цинк и паралоги белков рибосом
L36 L33 L31 S14E. coli, S.typhi – – – + –K. pneumoniae – – – – –Y. pestis,V. cholerae – – – + –B subtilis – – + – – + – +S. aureus – – – – – – +Listeria spp. – – – – – +E. faecalis – – – – – – + –S. pne., S. mutans – – – – – –S. pyo., L. lactis – – – – – – +
nZU
RpZU
RAdc
R
(в скобках – мотив «цинковая лента»)
L36 L33 L31 S14E. coli, S.typhi (–) – (–) + –K. pneumoniae (–) – (–) – –Y. pestis,V. cholerae (–) – (–) + –B subtilis (–) (–) + – (–) + (–) +S. aureus (–) (–) – – – (–) +Listeria spp. (–) (–) – – (–) +E. faecalis (–) (–) – – – (–) + –S. pne., S. mutans (–) (–) – – – (–)S. pyo., L. lactis (–) (–) – – – (–) +
nZU
RpZU
RAdc
R
Сводка наблюдений:
• Makarova-Ponomarev-Koonin, 2001:– L36, L33, L31, S14 – это единственные рибосомные белки,
дуплицированные более, чем в одном геноме
– L36, L33, L31, S14 – четыре из семи рибосомных белков, содержащих мотив цинковой ленты (четыре цистеина)
– Из двух (или более) копий L36, L33, L31, S1, обычно одна содержит мотив цинковой ленты, а другая – нет
• Среди генов, кодирующих паралоги рибосомных белков, как правило одни регулируется цинковым репрессором, а соответствующий белок никогда не имеет мотива цинковой ленты
Плохой сценарий
достаточно цинка
недостаточно цинка: весь цинк потреблен рибосомами, ферменты голодают
Хороший сценарий
достаточно цинка
недостаточно цинка: часть рибосом включает белки, не содержащие цинка – остается для ферментов
Регуляторный механизм
ribosomes
Zn-dependentenzymes
R
Sufficient Zn
Zn starvation
R
repressor
Предсказание … (Proc Natl Acad Sci U S A. 2003 Aug 19;100(17):9912-7.)
… и подтверждение (Mol Microbiol. 2004 Apr;52(1):273-83.)
Перспективы• Другие типы данных
– Экспрессия генов на олигонуклеотидных чипах
– Концентрации метаболитов
– Протеомика: концентрации белков
– Белок-белковые взаимодействия
– Белок-ДНКовые взаимодействия
• Автоматизация• Эукариоты• Моделирование метаболизма
– Потоковые алгоритмы
– Связь с результатами геномного анализа
• А.А.Миронов• А.Б.Рахманинова
• В.Ю.Макеев• М.А.Ройтберг• В.А.Любецкий• Eugene Koonin• Andrei Osterman• Pavel Pevzner• Nicole Hugovieux-Cotte-
Pattat
• П.Новичков• Д.Родионов• А.Витрещак• Е.Панина• Э.Пермина• О.Лайкова• А.Казаков• А.Герасимова• Е.Котельникова• Н.Садовская• Д.Равчеев• Г.Ковалёва