Быстрые пути эволюции белков. Эволюционный домен . БД ...

29
Быстрые пути эволюции белков. Эволюционный домен. БД PFAM.

Upload: karena

Post on 23-Jan-2016

84 views

Category:

Documents


0 download

DESCRIPTION

Быстрые пути эволюции белков. Эволюционный домен . БД PFAM. План. Белок – продукт гена Пути эволюции белков Мутации ДНК и их следствия для последовательностей белков Наблюдаемые явления в последовательностях белков локальные мутации повторы эволюционные домены - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: Быстрые пути эволюции белков.  Эволюционный домен .  БД  PFAM

Быстрые пути эволюции белков. Эволюционный домен.

БД PFAM.

Page 2: Быстрые пути эволюции белков.  Эволюционный домен .  БД  PFAM

План • Белок – продукт гена• Пути эволюции белков

– Мутации ДНК и их следствия для последовательностей белков– Наблюдаемые явления в последовательностях белков

• локальные мутации• повторы• эволюционные домены• мотивы и циклические перестановки

– ДНК-метилтрансферазы– [эндонуклеазы рестрикции]– RdRP

• БД Pfam• Другие ресурсы

Page 3: Быстрые пути эволюции белков.  Эволюционный домен .  БД  PFAM

«Продукт» гена

ГЕН

mRNA (зрелая)

Белок -предшественник

Зрелые rRNA, tRNA и др. RNA

Белок 2

Белок 3

РНК-предшественник

процессинг (модификация РНК)

ГЕН

пре-мРНК (предшественник)

Сплайсинг (у эукариот)

транскрипция

Зрелый белок 1(mature protein)

Альтернативный

сплайсинг mRNA (зрелая)

Посттрансляционная модификация

Белок -предшественник

mRNA (зрелая)

ГЕН

пре-мРНК (предшественник)

Белок -предшественник

Трансляция

Что определяет последовательность белка:• сигнал начала трансляции• сигналы сплайсинга (эукариоты)• стоп-кодон• (редкие сигналы: запланированный сдвиг рамки, ….)• кодирующая последовательность

Page 4: Быстрые пути эволюции белков.  Эволюционный домен .  БД  PFAM

Мутации ДНК и их следствия для последовательности белка

• Мутации соматические и мутации наследуемые

• Пресс отбора• Аллельные варианты (эукариоты)

Page 5: Быстрые пути эволюции белков.  Эволюционный домен .  БД  PFAM

Мутации ДНК и их следствия для последовательности белка

• Локальные мутации в сигналах– потеря стоп-кодона:

• удлинение на С-конце за счет “случайной” последовательности • слияние белков (прокариоты)

– потеря сайта инициации трансляции:• удлинение на N-конце за счет “случайной” последовательности • потеря части N-концевой последовательности

– потеря донорного сайта сплайсинга (эукариоты) :• вставки “случайной” последовательности за счет включения интрона • замена C-концевой последовательности на случайную (при сдвиге рамки из-за

вставки интрона в экзон)

– потеря акцепторного сайта сплайсинга (эукариоты) :• делеция части последовательности из-за потери экзона • делеция части последовательности с заменой последующей C-концевой

последовательности на случайную (при сдвиге рамки из-за потери экзона)

Примечание. Варианты усложняются при альтернативном сплайсинге

Page 6: Быстрые пути эволюции белков.  Эволюционный домен .  БД  PFAM

Мутации ДНК и их следствия для последовательности белка

• Локальные мутации в кодирующей последовательности– замена нуклеотида:

• последовательность белка без изменений• замена аминокислотного остатка

– мутация типа indel без сдвига рамки: • делеция/вставка аминокислотных остатков

– мутация типа indel со сдвигом рамки: • замена C-концевого участка на “случайную” последовательность• слияние белков (прокариоты)

– образование стоп-кодона: • потеря C-концевой последовательности

– двойная мутация типа indel с восстановлением рамки: • замена участка на “случайную” последовательность

– образование нового сайта сплайсинга, донорного или акцепторного (эукариоты):

• вставки “случайной” последовательности или делеции участков (много вариантов)

Page 7: Быстрые пути эволюции белков.  Эволюционный домен .  БД  PFAM

Нелокальные мутации ДНК, которые могут изменять последовательности

белков• Дупликация фрагмента ДНК

– образование паралога– образование повтора в белке

• Нерепликативная транспозиция – образование нового белка из частей старых– перестановка частей одного белка

• Инверсия фрагмента ДНК

Page 8: Быстрые пути эволюции белков.  Эволюционный домен .  БД  PFAM

Гомология нуклеотидных и аминокислотных последовательностей

• При перечисленных видах мутаций ДНК, кроме вставок нескольких нуклеотидов, прослеживается потомком какого нуклеотида генома предка является данный нуклеотид.

• При многих видах мутаций (но не всех!) то же верно и для аминокислотных остатков

• Поэтому можно говорить о гомологичности последовательностей и их “букв”

• Как правило, о гомологичности приходится судить по сходству последовательностей

Page 9: Быстрые пути эволюции белков.  Эволюционный домен .  БД  PFAM

Частоты мутаций

• Точечные: 10-11 --- 10-6 на сайт на поколение• Рекомбинация: ???

• при сравнении геномов бруцелл пара процентов замен ДНК ( 10000 замен на 1 млн. п.н.) и, очень грубо, несколько 1000 рекомбинаций (1000? на 1млн п.н.)

Page 10: Быстрые пути эволюции белков.  Эволюционный домен .  БД  PFAM

Примеры сравнений геномов

Page 11: Быстрые пути эволюции белков.  Эволюционный домен .  БД  PFAM

У далеких видов – E.coli и H.influenza – остаются общие гены и, иногда, порядок следования

нескольких генов, но не более того!

Page 12: Быстрые пути эволюции белков.  Эволюционный домен .  БД  PFAM

et al.

Сравнение двух штаммов

Page 13: Быстрые пути эволюции белков.  Эволюционный домен .  БД  PFAM

Вывод:

• Наследуемые рекомбинации бактериальных геномов происходят достаточно часто; хотя по числу их и меньше, чем замен.

Что же происходит с белками?

Page 14: Быстрые пути эволюции белков.  Эволюционный домен .  БД  PFAM

Наблюдаемые события в эволюции белков

• Замены, вставки, делеции остатков• Эволюционные домены:

– протяженные сходные последовательности в разных белках, окруженные негомологичными участками

– часто (но не всегда) участвующие в “премешивании доменов”

– часто (но не всегда) последовательность изолированного домена имеет стабильную пространственную структуру

– часто (но не всегда) домену можно приписать функцию

Page 15: Быстрые пути эволюции белков.  Эволюционный домен .  БД  PFAM

Белки, содержащие два эволюционных домена: гомеодомени OAR домен (N-концевые участки не показаны)

Page 16: Быстрые пути эволюции белков.  Эволюционный домен .  БД  PFAM

Гомеодомены активно перемешивались в эволюции.

• Об этом можно судить по 65(!) различным доменным архитектурам гомеобелков, представленным в банке Pfam

Гомеодомен

Парный домен и гомеодомен

Lim домены и гомеодомен

Гомеодомен, продолженный Лейциновой молниейPOU домен и гомеодомен

Два гомеодомена

PBX-домен и гомеодомен

Page 17: Быстрые пути эволюции белков.  Эволюционный домен .  БД  PFAM

Домены, найденные в последовательностях, часто, но далеко не всегда совпадают со структурными

доменами.

Page 18: Быстрые пути эволюции белков.  Эволюционный домен .  БД  PFAM

Накопленные данные показывают

что существуют “структурные единицы” наследуемой рекомбинации – эволюционные домены; они переставляются/вставляются/удаляются, как правило, целиком

Бывают исключения: пример - ДНК метилтрансферазы

Page 19: Быстрые пути эволюции белков.  Эволюционный домен .  БД  PFAM

Вывод:

• Домены – структурные единицы эволюции, структуры и функции белка

Page 20: Быстрые пути эволюции белков.  Эволюционный домен .  БД  PFAM

Ортологи — последовательности, возникшие из одного общего предшественника в процессе видообразования. Ортологи, как правило, имеют одну и ту же функцию

Паралоги — последовательности, возникшие из одного общего предшественника в результате дупликации одного гена в одном организме. Паралоги, как правило, имеют разные функции.

Page 21: Быстрые пути эволюции белков.  Эволюционный домен .  БД  PFAM

Словарик

Типы мотивов Типы подписей

Сайт(site) -

Мотив (motif) –

Повтор (repeat)–

Домен (domain) –

Семейство –

Суперсемейство -

Паттерн (pattern) –

Профиль–PSSM –

Профиль–HМM -

…..

CCHC- цинксвязывающий мотив

Подпись типа паттерн –

CX2CX4HX4C

Простой пример:

Page 22: Быстрые пути эволюции белков.  Эволюционный домен .  БД  PFAM

Ничто удачное не должно пропасть даром

• Точечные мутации медленный путь эволюции• Быстрый путь дупликация• Дуплицируются короткие фрагменты, домены, гены, кластеры

генов, хромосомы, геномы• Вторая копия может приобрести новые функции

Почему это интересно?

Page 23: Быстрые пути эволюции белков.  Эволюционный домен .  БД  PFAM

• 25 белков

• 9 белков

• 2 белка

• 12 белков

223 белка

243 белка

507 белков ЕС 2.5.1.15

ЕС 4.1.2.25

ЕС 2.7.6.3

Пример доменных перестроек: не только дупликации!

Page 24: Быстрые пути эволюции белков.  Эволюционный домен .  БД  PFAM

Пример 4

Page 25: Быстрые пути эволюции белков.  Эволюционный домен .  БД  PFAM

Pfam• http://pfam.sanger.ac.uk

• Большая коллекция семейств доменов Для каждого семейства есть множественное выравнивание и профиль-HMM .

• Состоит из 2-х частей:

PfamA – курируемая часть, покрывает 76% UniProt

PfamB – большое число маленьких семейств из автоматически сгенерированной базы доменов, не вошедших в PfamA (раньше – ProDom, теперь – ADDA) .

• Удобна для анализа доменной структуры белков.

Page 26: Быстрые пути эволюции белков.  Эволюционный домен .  БД  PFAM

Язык Pfam :

Семейство – коллекция гомологичных белков.

Домен – структурная единица, которую можно найти во множественном выравнивании.

Повтор – короткая единица, нестабильная сама по себе, но образует стабильные структуры, если есть много копий.

Мотив – короткая единица структуры вне глобулярных доменов.

Клан – группа родственных записей.

Page 27: Быстрые пути эволюции белков.  Эволюционный домен .  БД  PFAM

PfamProsite PrintsBlocks

Smart

(ProDom, PIRaln, ProClass, Systers, Picasso etc. not shown)

Сравните

Page 28: Быстрые пути эволюции белков.  Эволюционный домен .  БД  PFAM

Создание интегрированной базы данных

InterPro

PROSITE

PFAM

PRINTSInterPro

entries

IPR000001-

IPR011000

Интегрирование

родственных подписей

«вручную»

ProDom

SMARTTIGRFAMs

PIRSF

SUPERFAMILY

InterPro- an integrated resource of protein families, domains and functional sites.

Page 29: Быстрые пути эволюции белков.  Эволюционный домен .  БД  PFAM

Collagen alpha-1(III) chain (HUMAN)

… GPP GPA GFP GAP GQN GEP GGK GER GAP GEK GEG GPP GVA GPP GGS GPA GPP GPQ GVK GER GSP GGP GAA GFP …

Гипотеза: коллагены возникли врезультате тандемных дупликацийдевятки пар нуклеотидов (?)