М.С.Гельфанд ( ИППИ РАН ) 3-й съезд ВОГиС, Москва, июнь 2004

45
Сравнительная геномика и метаболическая реконструкция: что можно сказать об организме, зная только его геном М.С.Гельфанд (ИППИ РАН) 3-й съезд ВОГиС, Москва, июнь 2004

Upload: hoai

Post on 12-Jan-2016

48 views

Category:

Documents


1 download

DESCRIPTION

Сравнительная геномика и метаболическая реконструкция: что можно сказать об организме, зная только его геном. М.С.Гельфанд ( ИППИ РАН ) 3-й съезд ВОГиС, Москва, июнь 2004. красный : статьи синий : последовательности. Анализ индивидуальных генов. - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: М.С.Гельфанд  ( ИППИ РАН ) 3-й съезд ВОГиС, Москва, июнь 2004

Сравнительная геномика и метаболическая

реконструкция: что можно сказать об организме, зная

только его геном

М.С.Гельфанд (ИППИ РАН)

3-й съезд ВОГиС, Москва, июнь 2004

Page 2: М.С.Гельфанд  ( ИППИ РАН ) 3-й съезд ВОГиС, Москва, июнь 2004

красный: статьисиний: последовательности

100

1000

10000

100000

1000000

10000000

1982 1983 1984 1985 1986 1987 1988 1989 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000

год

Page 3: М.С.Гельфанд  ( ИППИ РАН ) 3-й съезд ВОГиС, Москва, июнь 2004

Анализ индивидуальных генов

• Поиск родственных белков в банках последовательностей – перенос функции от гомологов

• Функциональные сайты (каталитические центры)

• Функциональные участки (трансмембранные сегменты, сигнальные пептиды и т.п.)

Page 4: М.С.Гельфанд  ( ИППИ РАН ) 3-й съезд ВОГиС, Москва, июнь 2004

• Анализ на уровне индивидуальных генов даёт возможность охарактеризовать 50-75% генов в новом геноме

Но:• ~100 универсально отсутствующих генов (нет ни

одного известного гена для известной функции)• множество функций, для которых неизвестны

представители в больших таксонах• в каждом геноме ~5-10% консервативных генов с

неизвестной функцией• трудно предсказывать специфичность в

мультигенных семействах (транспортёры, факторы транскрипции)

• нельзя найти что-то принципиально новое

Page 5: М.С.Гельфанд  ( ИППИ РАН ) 3-й съезд ВОГиС, Москва, июнь 2004

Полные геномы

2

149

4

18

30

55

84

8

19

422

1

107

4321

15

0

10

20

30

40

50

60

70

80

90

1995 1996 1997 1998 1999 2000 2001 2002

Page 6: М.С.Гельфанд  ( ИППИ РАН ) 3-й съезд ВОГиС, Москва, июнь 2004

Сравнительная геномика и метаболическая реконструкция

• Метаболическая реконструкция

Идентификация пробелов

• Позиционный анализ

(гены и домены)

• Анализ филогенетического распределения

• Анализ регуляторных сигналов

Отнесение генов к функциональным и метаболическим системам Уточнение специфичности

Page 7: М.С.Гельфанд  ( ИППИ РАН ) 3-й съезд ВОГиС, Москва, июнь 2004

Утилизация пектина

E. chrysanthemi

Page 8: М.С.Гельфанд  ( ИППИ РАН ) 3-й съезд ВОГиС, Москва, июнь 2004

… и транспорт олигогалактуронатов

E. chrysanthemi

Y. pestis

K. pneumoniae

Page 9: М.С.Гельфанд  ( ИППИ РАН ) 3-й съезд ВОГиС, Москва, июнь 2004

предсказание и подтверждение

Page 10: М.С.Гельфанд  ( ИППИ РАН ) 3-й съезд ВОГиС, Москва, июнь 2004

Новые члены регулона KdgR у E. chrysanthemi

+ ppsA фосфоенолпируват-синтаза+ ydiA– chmX хемотаксис (акцептор метила)– dhfX периплазматическая эстераза – spiX изомераза (аналог KduI)– yjgK участвует в нижней части пути– tpfX– ydiV транспортер– sotA экспорт сахаров (токсичных интермедиатов?)– gntDBMNAC ABC-транспортер– yeeO транспортер

Page 11: М.С.Гельфанд  ( ИППИ РАН ) 3-й съезд ВОГиС, Москва, июнь 2004

YpaA: транспортёр рибофлавина• 5 предсказанных ТМ-сегментов =>

потенциальный транспортёр

• регуляторный RFN-элемент => ко-регуляция с генами метаболизма рибофлавина => транспорт рибофлавина или предшественника

• S. pyogenes, E. faecalis, Listeria: есть ypaA, нет генов биосинтеза рибофлавина => транспорт рибофлавина

Предсказание: YpaA – рибофлавиновый транспортёр (Gelfand et al., 1999)

Проверка:

• YpaA переносит рибофлавин (генетический анализ, Кренева и др., 2000)

• ypaA регулируется рибофлавином (анализ экспрессии на микрочипах, Lee et al., 2001; прямой эксперимент, Winkler et al., 2002).

Page 12: М.С.Гельфанд  ( ИППИ РАН ) 3-й съезд ВОГиС, Москва, июнь 2004

Новое семейство транспортёров аминокислот

S-box (rectangle frame)MetJ (circle frame)LYS-element (circles)Tyr-T-box (rectangles)

BC1434

FN 062 4

269.47

SON-3

CJ

CPE

LysT

MetT

TyrT

MleN

DF

CTCCB

OB

SO N-2VC-2

NM B

SON-1

VC-1

BHHP

C

TTE-nhaC

AC0744

FN0978

BL1111

CTC 00901

OB2874OB1118

NMB05 36

FN0352BC4121

EF-nhaC1

EF-nhaC2

PPE

LP-nha2

LP-nha1 L

L

M

GA

ELB

BS-yheL

BS-m leN

FN0650

VC2037

BC1709

SA 2292HI1107

VV21061FN207 7

BH3946

BC0373

FN14 22

BB0638

BB0637

F N1420

CTC02529SO1087

VCA0193

BT1270

C

CB

T C02520

CPE2317

FN1414

SA2117

Archaea

clostrid ia

Pasteure llaceae

malate/lactate

Page 13: М.С.Гельфанд  ( ИППИ РАН ) 3-й съезд ВОГиС, Москва, июнь 2004

Метаболическая реконструкция

пути биосинтеза лизина

-aspartyl-phosphate

aspartate semialdehyde

homoserine

dihydrodipicolinate

tetrahydrodipicolinate

N-acetyl-2-amino-6-ketopimelateN-succinyl-2-amino-6-ketopimelate

N-acetyl-L,L-diaminopimelateN-succinyl-L,L-diaminopimelate

L,L-diaminopimelate

meso -diaminopimelate

Lysine transport

L-aspartate

lysC,dapG,yclMlysC,thrA,metL

asd

hom

thrA,metL

dapA

dapB

dapDdapD

ykuR

dapC(argD)

ddh

patA

dapE

dapF, dal

lysA

Page 14: М.С.Гельфанд  ( ИППИ РАН ) 3-й съезд ВОГиС, Москва, июнь 2004

Идентификация пути ацетилированных интермедиатов в

B. subtilis и родственных бактериях - 0

dapD (yquQ):

• ортолог известного гена E. coli

Page 15: М.С.Гельфанд  ( ИППИ РАН ) 3-й съезд ВОГиС, Москва, июнь 2004

Идентификация пути ацетилированных интермедиатов в

B. subtilis и родственных бактериях - 1

patA: • пиридоксаль-фосфат-

зависимая аминотрансфераза (по гомологии)

• ко-локализуется и ко-регулируется с генами биосинтеза лизина во многих грам-положительных бактериях

Page 16: М.С.Гельфанд  ( ИППИ РАН ) 3-й съезд ВОГиС, Москва, июнь 2004

Идентификация пути ацетилированных интермедиатов в

B. subtilis и родственных бактериях - 2ykuR: • N-ацил-L-аминокислота

амидогидролаза (по гомологии)• ко-локализуется и ко-

регулируется с геном биосинтеза лизина dapD во многих грам-положительных бактериях

• в некоторых случаях принадлежит к большому лизиновому оперону, регулируемому LYS-элементом

Page 17: М.С.Гельфанд  ( ИППИ РАН ) 3-й съезд ВОГиС, Москва, июнь 2004

Идентификация пути ацетилированных интермедиатов в

B. subtilis и родственных бактериях - 3dapX: • dapF отсутствует у некоторых

бактерий (Staphylococcus aureus, Oenococcus oeni, Leuconostoc mesenteroides)

• во всех этих геномах есть dapX, гомологичный аланиновой рацемазе и другим эпимеразам

• в S. aureus dapX принадлежит к большому лизиновому оперону

• в O. oeni оперон dapX-asd регулируется LYS-элемен dapX том

Page 18: М.С.Гельфанд  ( ИППИ РАН ) 3-й съезд ВОГиС, Москва, июнь 2004

Метаболическая реконструкция

пути биосинтеза кобаламина

(витамина В12)

Прекоррин 3AO 2

Прекоррин 3B

Прекоррин 4

Прекоррин 5

Прекоррин 6x

Прекоррин 6y

Прекоррин 8x

Кобальт-прекоррин 3

Кобальт-прекоррин 4

Кобальт-прекоррин 5

Кобальт-прекоррин 6x

Кобальт-прекоррин 6y

Кобириновая кислота

Кобальт-прекоррин 8x

Гидробириновая кислота

a,c-диамид гидробириновой кислоты

a,c-диамид коб(II)ириновой кислоты

a,c-диамид коб(I)ириновой кислоты

Кобинамид

Кобаламин

аминопрпанол-2-фосф ат

Треонин-3-фосфат

Треонин

Аленозилкобинамид

-рибазол-5-фосфат

-рибазол

cysG

cbiP

cobU

cobS

cbiB

btu

FC

DE

cobT

cobD

cobC

cobNST

cobI

cobG

cobJ

cobM

cobF

cobK

cobH

cobL

cobB

cbiL

cbiHcbiG?

cbiF

cbiD?

cbiJ

cbiC

cbiET

cbiA

cobP

Co2+

Транспорт кобальтаcbiMNQO, hoxN, hupE, cbtAB, cbtC, cbtD, cbtE, cbtG, cnoABCD

идентификация новых ферментов, транспортёров кобаламина, промежуточных продуктов и кобальта

Page 19: М.С.Гельфанд  ( ИППИ РАН ) 3-й съезд ВОГиС, Москва, июнь 2004

Предсказания: ферменты

• синтез жирных кислот: FadR

• синтез тиамина: ThiN

• биосинтез лизина – путь ацетилированных интермедиатов

• обратный путь синтеза цистеина из метионина и путь ре-утилизации метионина

• биосинтез кобаламина: ChlID, BluB, PduO, PduX, CobY, CobZ, CblXY, CblZ, BhiB, BtuS

• пути катаболизма различных сахаров и олигосахаридов

• синтез триптофана и фолата: семейство TrpG/PabA

• биосинтез биотина: BioZ, BioK

Page 20: М.С.Гельфанд  ( ИППИ РАН ) 3-й съезд ВОГиС, Москва, июнь 2004

Предсказания: транспортёры

• аминокислоты – метионин

– тирозин

– триптофан

– лизин

– аргинин

– гистидин

• нуклеотиды

• сахара и олигосахариды– в том числе, важные для

патогенеза (стрептококки, растительные патогены)

• металлы – железо– цинк– кобальт– никель

• витамины и их предшественники– биотин– тиамин (В1)– рибофлавин (В2)– кобаламин (В12)

Page 21: М.С.Гельфанд  ( ИППИ РАН ) 3-й съезд ВОГиС, Москва, июнь 2004

Предсказания: регуляторные сигналы

• MtaR (метиониновый репрессор стрептококков)

• BioR (биотиновый репрессор – бактерии и археи)

• ZUR и AdcR (цинковые репрессоры)

• регуляция катаболизма сахаров и олигосахаридов (несколько десятков регуляторов)

• регуляция синтеза ароматических аминокислот (стрептококки)

• регуляция систем ответа на перенаселение (quorum sensing – лактококки и лактобациллы)

• РНКовые переключатели (рибофлавин, тиамин)

• аттенюаторы аминокислотных оперонов

• регуляторные системы архей (тепловой шок, пурины, утилизация азота, синтез триптофана)

Page 22: М.С.Гельфанд  ( ИППИ РАН ) 3-й съезд ВОГиС, Москва, июнь 2004

Подтверждённые предсказанияпредсказание геном(ы)

аргининовый транспортёр yqiXYZ: специфичность и регуляция

бактерии (Bacillus subtilis)

рибофлавиновый транспортёр YpaA: специфичность и регуляция

Грам-положительные бактерии (Bacillus subtilis)

ацил-КоА дегидрогеназа FadE кодируется геном yafH

гамма-протеобактерии (Escherichia coli)

рибофлавиновый РНК-переключатель бактерии (Bacillus subtilis, Escherichia coli)

тиаминовый РНК-переключатель бактерии и археи (Bacillus subtilis, Escherichia coli)

ThiN (= ThiD), биосинтез тиамина T. maritima, археи (Methanobacterium thermoautotrophicum)

метиониновый транспортёр MetD Bacillus subtilis, Escherichia coli

транспортёр олигогалактуронидов ogtABCD (togMNAB)

гамма-протеобактерии (Erwinia chrysanthemi)

Page 23: М.С.Гельфанд  ( ИППИ РАН ) 3-й съезд ВОГиС, Москва, июнь 2004

Сравнительная геномика систем утилизации цинка

Две роли цинка в бактериях:

• Структурная в ДНК-полимеразах, праймазах, рибосомных белках

• Каталитическая в протеазах и других белках

Page 24: М.С.Гельфанд  ( ИППИ РАН ) 3-й съезд ВОГиС, Москва, июнь 2004

Геномы и регуляторы

nZURFUR family

???

AdcR ?MarR family

pZURFUR family

Page 25: М.С.Гельфанд  ( ИППИ РАН ) 3-й съезд ВОГиС, Москва, июнь 2004

Регуляторы и сигналыnZUR-nZUR-

AdcRpZUR

TTAACYRGTTAA

GATATGTTATAACATATCGAAATGTTATANTATAACATTTC

GTAATGTAATAACATTAC

TAAATCGTAATNATTACGATTTA

Page 26: М.С.Гельфанд  ( ИППИ РАН ) 3-й съезд ВОГиС, Москва, июнь 2004

Выравнивание сигналов nZUR

GTAATGTAA TAACATTAC (alpha – most genera)GATATGTTA TAACATATC (alpha – Rhodobacter)GAAATGTTATANTATAACATTTC (gamma)

GaaATGTtA-----TAACATttC (consensus of consensi)

Page 27: М.С.Гельфанд  ( ИППИ РАН ) 3-й съезд ВОГиС, Москва, июнь 2004

Транспортеры

• Ортологи транспортных систем AdcABC и YciC

• Паралоги компонентов систем AdcABC и YciC

• Потенциальные транспортеры с ранее не известной специфичностью

Page 28: М.С.Гельфанд  ( ИППИ РАН ) 3-й съезд ВОГиС, Москва, июнь 2004

zinT: регуляция

zinT одиночный

домен: adcA-zinT

E. coli, S. typhi, K. pneumoniae Gamma-proteobacteria

Alpha-proteobacteria

B. subtilis, S. aureus

S. pneumoniae, S. mutans, S. pyogenes, L. lactis, E. faecalis

Bacillus group

Streptococcus group

zinT регулируется цинковыми репрессорами (nZUR-, nZUR-, pZUR)

adcA-zinT регулируется цинковыми репрессорами (pZUR, AdcR) (ex. L.l.)

A. tumefaciens, R. sphaeroides

Page 29: М.С.Гельфанд  ( ИППИ РАН ) 3-й съезд ВОГиС, Москва, июнь 2004

ZinT: анализ белковой последовательности

E. coli, S. typhi, K. pneumoniae, A. tumefaciens, R. sphaeroides, B. subtilis

L. lactis

Y. pestis, V. cholerae, B. halodurans

TM Zn AdcA

S. aureus, E. faecalis, S. pneumoniae, S. mutans, S. pyogenes

ZinT

Page 30: М.С.Гельфанд  ( ИППИ РАН ) 3-й съезд ВОГиС, Москва, июнь 2004

ZinT: резюме

• ZinT часто является доменом цинкового транспортёра

• zinT экспрессируется при недостатке цинка

• ZinT локализован на поверхности клетки (имеет трансмембранный якорь)

• ZinT имеет цинк-связывающий домен

вывод:• ZinT – новый тип цинк-связывающей

компоненты ABC транспортёра

Page 31: М.С.Гельфанд  ( ИППИ РАН ) 3-й съезд ВОГиС, Москва, июнь 2004

Регуляция белков PHT (pneumococcal histidine triad) в стрептококках

S. pneumoniae S. equiS. agalactiae

lmb phtD phtE

phtBphtA

lmb phtD

S. pyogenes

phtY

lmb phtD

регуляция цинком показана экспериментально

Page 32: М.С.Гельфанд  ( ИППИ РАН ) 3-й съезд ВОГиС, Москва, июнь 2004

Структурные свойства белков PHT

• Белки PHT содержат множественные копии мотива HxxHxH

• Белки PHT из S. pneumoniae – это паралоги с уровнем сходства 65-95%

• Белки PHT имеют N-концевые гидрофобные пептиды

• Локализация белков PHT из S. pneumoniae на поверхности бактериальной клетки была показана проточной цитометрией

Page 33: М.С.Гельфанд  ( ИППИ РАН ) 3-й съезд ВОГиС, Москва, июнь 2004

Белки PHT:

• экспрессируются в условиях недостатка цинка

• локализуются на поверхности клеточной мембраны

• содержат цинк-связывающие мотивы

Гипотеза:• это новое семейство транспортёров

цинка

Page 34: М.С.Гельфанд  ( ИППИ РАН ) 3-й съезд ВОГиС, Москва, июнь 2004

… неверно

• цинк-связывающие мотивы в транспортёрах:

EEEHEEHDHGEHEHSH

HSHEEHGHEEDDHDHSHEEHGHEEDDHHHHHDED

DEHGEGHEEEHGHEH

(гистидин-аспартат-глутамат)

• гистидиновые триады в белках PHT:

HGDHYHY 7 out of 21HGDHYHF 2 out of 21HGNHYHF 2 out of 21HYDHYHN 2 out of 21HMTHSHW 2 out of 21

(специфическое расположение гистидинов и ароматических аминокислот)

Page 35: М.С.Гельфанд  ( ИППИ РАН ) 3-й съезд ВОГиС, Москва, июнь 2004

… продолжение анализа

• Ген phtD входит в оперон с геном lmb во всех стрептококках– Lmb: адгезин, участвующий в связывании

стрептококков с эпителиальными клетками

• PhtY в S. pyogenes: – phtY регулируется AdcR

– PhtY состоит из трех доменов:

PHT internalin H-rich

4 HIS TRIADS LRR IRHDYNHNHTYEDEEGHAHEHRDKDDHDHEHED

Page 36: М.С.Гельфанд  ( ИППИ РАН ) 3-й съезд ВОГиС, Москва, июнь 2004

Белки PHТ: вторая попытка

• белки PHT продуцируются при недостатке цинка• белки PHT локализуются на поверхности клетки• белки PHT содержат цинк-связывающие мотивы• phtD образует потенциальный оперон с геном адгезина • PhtY содержит домен интерналина отвечающий за

инвазию

ГипотезаБелки PHT – это адгезины связанные с прикреплением к

клетке хозяина для дальнейшей инвазии

Page 37: М.С.Гельфанд  ( ИППИ РАН ) 3-й съезд ВОГиС, Москва, июнь 2004

Цинк и паралоги белков рибосом

L36 L33 L31 S14E. coli, S.typhi – – – + –K. pneumoniae – – – – –Y. pestis,V. cholerae – – – + –B subtilis – – + – – + – +S. aureus – – – – – – +Listeria spp. – – – – – +E. faecalis – – – – – – + –S. pne., S. mutans – – – – – –S. pyo., L. lactis – – – – – – +

nZU

RpZU

RAdc

R

Page 38: М.С.Гельфанд  ( ИППИ РАН ) 3-й съезд ВОГиС, Москва, июнь 2004

(в скобках – мотив «цинковая лента»)

L36 L33 L31 S14E. coli, S.typhi (–) – (–) + –K. pneumoniae (–) – (–) – –Y. pestis,V. cholerae (–) – (–) + –B subtilis (–) (–) + – (–) + (–) +S. aureus (–) (–) – – – (–) +Listeria spp. (–) (–) – – (–) +E. faecalis (–) (–) – – – (–) + –S. pne., S. mutans (–) (–) – – – (–)S. pyo., L. lactis (–) (–) – – – (–) +

nZU

RpZU

RAdc

R

Page 39: М.С.Гельфанд  ( ИППИ РАН ) 3-й съезд ВОГиС, Москва, июнь 2004

Сводка наблюдений:

• Makarova-Ponomarev-Koonin, 2001:– L36, L33, L31, S14 – это единственные рибосомные белки,

дуплицированные более, чем в одном геноме

– L36, L33, L31, S14 – четыре из семи рибосомных белков, содержащих мотив цинковой ленты (четыре цистеина)

– Из двух (или более) копий L36, L33, L31, S1, обычно одна содержит мотив цинковой ленты, а другая – нет

• Среди генов, кодирующих паралоги рибосомных белков, как правило одни регулируется цинковым репрессором, а соответствующий белок никогда не имеет мотива цинковой ленты

Page 40: М.С.Гельфанд  ( ИППИ РАН ) 3-й съезд ВОГиС, Москва, июнь 2004

Плохой сценарий

достаточно цинка

недостаточно цинка: весь цинк потреблен рибосомами, ферменты голодают

Page 41: М.С.Гельфанд  ( ИППИ РАН ) 3-й съезд ВОГиС, Москва, июнь 2004

Хороший сценарий

достаточно цинка

недостаточно цинка: часть рибосом включает белки, не содержащие цинка – остается для ферментов

Page 42: М.С.Гельфанд  ( ИППИ РАН ) 3-й съезд ВОГиС, Москва, июнь 2004

Регуляторный механизм

ribosomes

Zn-dependentenzymes

R

Sufficient Zn

Zn starvation

R

repressor

Page 43: М.С.Гельфанд  ( ИППИ РАН ) 3-й съезд ВОГиС, Москва, июнь 2004

Предсказание … (Proc Natl Acad Sci U S A. 2003 Aug 19;100(17):9912-7.)

… и подтверждение (Mol Microbiol. 2004 Apr;52(1):273-83.)

Page 44: М.С.Гельфанд  ( ИППИ РАН ) 3-й съезд ВОГиС, Москва, июнь 2004

Перспективы• Другие типы данных

– Экспрессия генов на олигонуклеотидных чипах

– Концентрации метаболитов

– Протеомика: концентрации белков

– Белок-белковые взаимодействия

– Белок-ДНКовые взаимодействия

• Автоматизация• Эукариоты• Моделирование метаболизма

– Потоковые алгоритмы

– Связь с результатами геномного анализа

Page 45: М.С.Гельфанд  ( ИППИ РАН ) 3-й съезд ВОГиС, Москва, июнь 2004

• А.А.Миронов• А.Б.Рахманинова

• В.Ю.Макеев• М.А.Ройтберг• В.А.Любецкий• Eugene Koonin• Andrei Osterman• Pavel Pevzner• Nicole Hugovieux-Cotte-

Pattat

• П.Новичков• Д.Родионов• А.Витрещак• Е.Панина• Э.Пермина• О.Лайкова• А.Казаков• А.Герасимова• Е.Котельникова• Н.Садовская• Д.Равчеев• Г.Ковалёва