Download - Понятие (множественного) выравнивания
Понятие(множественного)
выравниванияФББ МГУ, 2014г.
Аксянов Е.А.
Выравнивания – 2014 2
• Что такое выравнивание?
Выравнивания – 2014 3
Дано 4 последовательностиНайти общие мотивы
VLSGGTTMYPGIADRMQKEITALAPSTMKIKIIAPPERKYSVWIGGSILAVLSGGSTMFPGIVDRMNKELTALAPSTMKIKIIAPPERKYSVWIGGSILAVLSGGSTMFPGIADRMSKEISALAPSSMKIKVVAPPERKYSVWIGGSILAVLSGGSTMYPGLPSRLERELKQLYLERVLKGDVDKLSKFKIRIEDPPRRKHMVFLGGAVLA
VLSGGTTMYPGIADRMQKEITALAPSTMKIKIIAPPERKYSVWIGGSILAVLSGGSTMFPGIVDRMNKELTALAPSTMKIKIIAPPERKYSVWIGGSILAVLSGGSTMFPGIADRMSKEISALAPSSMKIKVVAPPERKYSVWIGGSILAVLSGGSTMYPGLPSRLERELKQLYLERVLKGDVDKLSKFKIRIEDPPRRKHMVFLGGAVLA
VLSGGTTMYPGIADRMQKEITALAPSTMKIKIIAPPERKYSVWIGGSILAVLSGGSTMFPGIVDRMNKELTALAPSTMKIKIIAPPERKYSVWIGGSILAVLSGGSTMFPGIADRMSKEISALAPSSMKIKVVAPPERKYSVWIGGSILAVLSGGSTMYPGLPSRLERELKQLYLERVLKGDVDKLSKFKIRIEDPPRRKHMVFLGGAVLA
VLSGGTTMYPGIADRMQKEITALAPSTMKIKIIAPPERKYSVWIGGSILAVLSGGSTMFPGIVDRMNKELTALAPSTMKIKIIAPPERKYSVWIGGSILAVLSGGSTMFPGIADRMSKEISALAPSSMKIKVVAPPERKYSVWIGGSILAVLSGGSTMYPGLPSRLERELKQLYLERVLKGDVDKLSKFKIRIEDPPRRKHMVFLGGAVLA
VLSGGTTMYPGIADRMQKEITALAPSTMKIKIIAPPERKYSVWIGGSILAVLSGGSTMFPGIVDRMNKELTALAPSTMKIKIIAPPERKYSVWIGGSILAVLSGGSTMFPGIADRMSKEISALAPSSMKIKVVAPPERKYSVWIGGSILAVLSGGSTMYPGLPSRLERELKQLYLERVLKGDVDKLSKFKIRIEDPPRRKHMVFLGGAVLA
VLSGGTTMYPGIADRMQKEITALAPSTMKIKIIAPPERKYSVWIGGSILAVLSGGSTMFPGIVDRMNKELTALAPSTMKIKIIAPPERKYSVWIGGSILAVLSGGSTMFPGIADRMSKEISALAPSSMKIKVVAPPERKYSVWIGGSILAVLSGGSTMYPGLPSRLERELKQLYLERVLKGDVDKLSKFKIRIEDPPRRKHMVFLGGAVLA
Выравнивания – 2014 4
Дано 4 последовательностиНайти общие мотивы
VLSGGTTMYPGIADRMQKEITAL APSTMKIKIIAPPERKYSVWIGGSILAVLSGGSTMFPGIVDRMNKELTAL APSTMKIKIIAPPERKYSVWIGGSILAVLSGGSTMFPGIADRMSKEISAL APSSMKIKVVAPPERKYSVWIGGSILAVLSGGSTMYPGLPSRLERELKQLYLERVLKGDVDKLSKFKIRIEDPPRRKHMVFLGGAVLA
VLSGGTTMYPGIADRMQKEITAL APSTMKIKIIAPPERKYSVWIGGSILAVLSGGSTMFPGIVDRMNKELTAL APSTMKIKIIAPPERKYSVWIGGSILAVLSGGSTMFPGIADRMSKEISAL APSSMKIKVVAPPERKYSVWIGGSILAVLSGGSTMYPGLPSRLERELKQLYLERVLKGDVDKLSKFKIRIEDPPRRKHMVFLGGAVLA
VLSGGTTMYPGIADRMQKEITAL APSTMKIKIIAPPERKYSVWIGGSILAVLSGGSTMFPGIVDRMNKELTAL APSTMKIKIIAPPERKYSVWIGGSILAVLSGGSTMFPGIADRMSKEISAL APSSMKIKVVAPPERKYSVWIGGSILAVLSGGSTMYPGLPSRLERELKQLYLERVLKGDVDKLSKFKIRIEDPPRRKHMVFLGGAVLA
VLSGGTTMYPGIADRMQKEITAL APSTMKIKIIAPPERKYSVWIGGSILAVLSGGSTMFPGIVDRMNKELTAL APSTMKIKIIAPPERKYSVWIGGSILAVLSGGSTMFPGIADRMSKEISAL APSSMKIKVVAPPERKYSVWIGGSILAVLSGGSTMYPGLPSRLERELKQLYLERVLKGDVDKLSKFKIRIEDPPRRKHMVFLGGAVLA
ВНИМАНИЕ: в белке разрывов нет, нарисованное тут пустое
место – это на самом деле пептидная связь!
Выравнивания – 2014 5
Выравнивание – это способ изобразить
предполагаемое сходство последовательностей
Выравнивания – 2014 6
• Что такое выравнивание?• В чем биологический смысл выравнивания и
отдельных его элементов?
Выравнивания – 2014 7
VLSGGTTMYPGIADRMQKEITAL-----------APSTMKIKIIAPPERKYSVWIGGSILAVLSGGSTMFPGIVDRMNKELTAL-----------APSTMKIKIIAPPERKYSVWIGGSILAVLSGGSTMFPGIADRMSKEISAL-----------APSSMKIKVVAPPERKYSVWIGGSILAVLSGGSTMYPGLPSRLERELKQLYLERVLKGDVDKLSKFKIRIEDPPRRKHMVFLGGAVLA
Может ли такое сходство быть результатом случайности?
LNAMVLVATLRYKKLRQPLNYILVNVSFGGFLLCIFSVFPVFVASCN LNAMVLVATLRYKKLRQPLNYILVNVSFGGFLLCIFSVFPVFVASCN
Биологический смысл выравнивания
Может ли такое сходство быть результатом случайности?
Возьмем из банка первуюпопавшуюся последовательность ...
Выравнивания – 2014 8
VLSGGTTMYPGIADRMQKEITAL-----------APSTMKIKIIAPPERKYSVWIGGSILAVLSGGSTMFPGIVDRMNKELTAL-----------APSTMKIKIIAPPERKYSVWIGGSILAVLSGGSTMFPGIADRMSKEISAL-----------APSSMKIKVVAPPERKYSVWIGGSILAVLSGGSTMYPGLPSRLERELKQLYLERVLKGDVDKLSKFKIRIEDPPRRKHMVFLGGAVLA
Может ли такое сходство быть результатом случайности?
Возьмем из банка вторуюпопавшуюся последовательность ...
CIIVVLQSKNSDIYMTVKEQSDIVHGIMSQCVLMKNVSRPCIIVVLQSKNSDIYMTVKEQSDIVHGIMSQCVLMKNVSRP
Биологический смысл выравнивания
Выравнивания – 2014 9
VLSGGTTMYPGIADRMQKEITAL-----------APSTMKIKIIAPPERKYSVWIGGSILAVLSGGSTMFPGIVDRMNKELTAL-----------APSTMKIKIIAPPERKYSVWIGGSILAVLSGGSTMFPGIADRMSKEISAL-----------APSSMKIKVVAPPERKYSVWIGGSILAVLSGGSTMYPGLPSRLERELKQLYLERVLKGDVDKLSKFKIRIEDPPRRKHMVFLGGAVLA
Может ли такое сходство быть результатом случайности?
НЕТ! Можно повторить этот опыт со многими последовательностями, и почти нигде мы не найдем таких мотивов.
Это ЖЖЖ неспроста!
Биологический смысл выравнивания
Выравнивания – 2014 10
VLSGGTTMYPGIADRMQKEITAL-----------APSTMKIKIIAPPERKYSVWIGGSILAVLSGGSTMFPGIVDRMNKELTAL-----------APSTMKIKIIAPPERKYSVWIGGSILAVLSGGSTMFPGIADRMSKEISAL-----------APSSMKIKVVAPPERKYSVWIGGSILAVLSGGSTMYPGLPSRLERELKQLYLERVLKGDVDKLSKFKIRIEDPPRRKHMVFLGGAVLA
Сходство последовательностей обычно свидетельствует об общности происхождения – гомологии. Все эти последовательности – гомологи, – то есть все они произошли от общего предка.
Можете предположить последовательность предка?
VLSGGSTM?PGI?DRM?KE??Alтут_ничего_не_было...
Биологический смысл выравнивания
Выравнивания – 2014 11
VLSGGTTMYPGIADRMQKEITAL-----------APSTMKIKIIAPPERKYSVWIGGSILAVLSGGSTMFPGIVDRMNKELTAL-----------APSTMKIKIIAPPERKYSVWIGGSILAVLSGGSTMFPGIADRMSKEISAL-----------APSSMKIKVVAPPERKYSVWIGGSILAVLSGGSTMYPGLPSRLERELKQLYLERVLKGDVDKLSKFKIRIEDPPRRKHMVFLGGAVLA
Вообще говоря, судить об общем предке по 4м последовательностям нельзя. Но если взять много гомологичных последовательностей, то наши суждения будут надежнее!
VLSGGSTM?PGI?DRM?KE??Alтут_ничего_не_было...
Биологический смысл выравнивания
Выравнивания – 2014 12
Биологический смысл выравнивания
VLSGGTTMYPGIADRMQKEITAL-----------APSTMKIKIIAPPERKYSVWIGGSILAVLSGGSTMFPGIVDRMNKELTAL-----------APSTMKIKIIAPPERKYSVWIGGSILAVLSGGSTMFPGIADRMSKEISAL-----------APSSMKIKVVAPPERKYSVWIGGSILAVLSGGSTMYPGLPSRLERELKQLYLERVLKGDVDKLSKFKIRIEDPPRRKHMVFLGGAVLA
Идентичные аминокислоты(тут замен, наверное, не было)
Похожие участки(в некоторых
позициях были замены)
Гэп (gap), то естьпептидная связь!(тут были вставки
или делеции)
Выравнивания – 2014 13
VLSGGTTMYPGIADRMQKEITAL-----------APSTMKIKIIAPPERKYSVWIGGSILAVLSGGSTMFPGIVDRMNKELTAL-----------APSTMKIKIIAPPERKYSVWIGGSILAVLSGGSTMFPGIADRMSKEISAL-----------APSSMKIKVVAPPERKYSVWIGGSILAVLSGGSTMYPGLPSRLERELKQLYLERVLKGDVDKLSKFKIRIEDPPRRKHMVFLGGAVLA
Если взять много гомологичных последовательностей, то наши суждения будут надежнее!
Консервативные участки – это те, которые не изменились (или мало изменились – зависит от определения) в ходе эволюции.
VLSGGSTM?PGI?DRM?KE??Alтут_ничего_не_было...
Биологический смысл выравнивания
Если взять много гомологичных последовательностей, то наши суждения будут надежнее!
Неконсервативные участки менялись быстрее.
Если взять много гомологичных последовательностей, то наши суждения будут надежнее!
Гэпы соотвествуют вставкам или делециям (инделям). Не всегда можно уверенно сказать, чему именно.
Выравнивания – 2014 14
Участки выравнивания,где много совпадений
соответствуют консервативным
(медленно эволюционирующим)
участкам последовательностей
Выравнивания – 2014 15
Совпадение (match) аминокислот может
означать, что в данной позиции сохранилась
предковая последовательность
Выравнивания – 2014 16
Несовпадение (mismatch) аминокислот может
означать, что в данной позиции произошли
замены
Выравнивания – 2014 17
Гэпы соответствуют вставкам или делециям (вместе они называются
инделями)
Выравнивания – 2014 18
• Что такое выравнивание?• В чем биологический смысл выравнивания и
отдельных его элементов?• Как изобразить выравнивание?
Выравнивания – 2014 19
Обычно выравнивание выглядит так
Раскраска – BLOSUM62
Выравнивания – 2014 20
Или так …
Раскраска – ClustalX
Выравнивания – 2014 21
Или так …
~1400 последовательностей, - почти в каждой позиции найдется какая-нибудь вставка хотя бы в одной
последовательности
Выравнивания – 2014 22
LOGO и консенсус
RqdIAxxlGlTrETVsRxLxБольшие буквы – почти консервативные позиции, Маленькие – менее консервативные позиции,х – неконсервативная позиция
(Эти обозначения в разных программах могут отличаться)
Выравнивания – 2014 23
Существуют разные способы изображения
выравнивания – различные раскраски,
консенсусные последовательности, LOGO
Выравнивания – 2014 24
• Что такое выравнивание?• В чем биологический смысл выравнивания и
отдельных его элементов?• Как изобразить выравнивание?• Что такое достоверное и недостоверное
выравнивание?
Выравнивания – 2014 25
Пример хорошего выравнивания
Выравнивания – 2014 26
Пример плохого выравнивания
Выравнивания – 2014 27
Некоторые участки выравниваются хорошо, другие - плохо
Выравнивания – 2014 28
Выравнивание - описание того, каким образом похожи друг на друга
гомологичные последовательности
Эти аминокислоты навернякапроизошли от одной предковой
Выравнивания – 2014 29
Выравнивание - описание того, каким образом похожи друг на друга
гомологичные последовательности
И эти тоже
Выравнивания – 2014 30
Выравнивание - описание того, каким образом похожи друг на друга
гомологичные последовательности
А эти – вряд ли. Почему?
Выравнивания – 2014 31
Выравнивание - описание того, каким образом похожи друг на друга
гомологичные последовательности
Ответ: участки выравнивания (не отдельные колонки), со значительным сходством свидетельствуют об общности
происхождения
Выравнивания – 2014 32
Выравнивание или его участок, на котором много гэпов и мало совпадений
не имеет никакого биологического смысла
Выравнивания – 2014 33
Участки с большим количеством совпадений и маленьким числом гэпов соответствуют гомологии
между участками последовательностей
Выравнивания – 2014 34
В таких участках консервативные колонки соответствуют гомологии
между буквами
Выравнивания – 2014 35
• Что такое выравнивание?• В чем биологический смысл выравнивания и
отдельных его элементов?• Как изобразить выравнивание?• Что такое достоверное и недостоверное
выравнивание?• Что свидетельствует о гомологии целых
последовательностей, отдельных участков и аминокислот?
Выравнивания – 2014 36
Гомология целых последовательностей, отдельных участков и аминокислот
БлокиБлок?Есть гомология
между буквами
КластерЕсть гомология
между участками
Выравнивания – 2014 37
Гомология целых последовательностей, отдельных участков и аминокислот
Тут гомологичны некоторые, но не все последовательности
Выравнивания – 2014 38
Гомология целых последовательностей, отдельных участков и аминокислот
1. Последовательности гомологичны целиком, т.к. есть относительно неплохое выравнивание по всей длине последовательностей.
2. Есть блоки без гэпов и высоким процентом консервативных позиций – там можно говорить о гомологии между отдельными аминокислотами. В том числе о гомологии между аминокислотам в неконсервативных позициях!
3. Есть короткие участки с гэпами между блоками. Можно говорить о гомологии между короткими фрагментами и длинными кластерами блоков.
4. Некоторые участки части последовательностей могут быть гомологичны, даже есть на данном участке выравнивания нет гомологии между всеми последовательностями.
Выравнивания – 2014 39
Три причины, по которым можно сделать вывод об общности происхождения участков из двух разных последовательностей:
1. Эти участки формируют консервативный блок в выравнивании.
2. Эти участки небольшого размера находятся между двумя консервативными блоками.
3. Это длинные участки, где наблюдается значительное сходство между этими двумя последовательностями
Выравнивания – 2014 40
Выравнивание - описание того, каким образом похожи друг на друга
гомологичные последовательности
Еще раз: совпадение отдельных букв может быть (и, скорее всего, является) случайностью. А вот совпадение или значительное сходство мотивов из 5-10 аминокислот (тем более, - протяженных доменов, длиной в десятки или сотни а.к.) не может объясняться случайными причинами.
Ищите в выравнивании длинных похожие участки. Выравнивание между ними имеет биологический смысл.
Выравнивание, где сходства между длинными участками нет, бессмысленно.
Выравнивания – 2014 41
Выравнивания. Термины• Выравнивание – сопоставление аминокислот из разных
последовательностей.• Колонка, последовательность.• Гомология – общность происхождения. Если
выравнивание построено правильно, то аминокислоты, расположенные в одной колонке, гомологичны.
• Консервативность – сильное сходство между последовательностями.
• Гэп – условное обозначение для всятавки или делеции. Никакого разрыва полипептидной цепи в последовательности, конечно, нет.
• Позиция в выравнивании (номер колонки), позиция в последовательности. Не путать!
Выравнивания – 2014 42
• Что такое выравнивание?• В чем биологический смысл выравнивания и
отдельных его элементов?• Как изобразить выравнивание?• Что такое достоверное и недостоверное
выравнивание?• Что свидетельствует о гомологии целых
последовательностей, отдельных участков и аминокислот?
• Означает ли отсутствие достоверного выравнивания отсутствие гомологии?
Выравнивания – 2014 43
Пример плохого выравнивания
Выравнивания – 2014 44
Пример плохого выравнивания
1 2 3 4
Правомерно ли говорить о гомологии аминокислот в колонке 2? 3? 4?
НЕТ! Эти участки совершенно несходны.
Вопросы:Программа Muscle сумела построить выравнивание. Гомологичны ли последовательности?
НЕТ! Программа всегда что-нибудь построит.
Выравнивания – 2014 45
Пример плохого выравнивания
1 2 3 4
Правомерно ли говорить о гомологии аминокислот в колонке 2? 3? 4?
НЕТ! Эти участки совершенно несходны.
Правомерно ли говорить о гомологии аминокислот в колонке 1?
НЕТ! Это – очевидная случайность (участок вокруг этой колонки неконсервативен).
Выравнивания – 2014 46
Пример плохого выравнивания
1 2 3 4
Ни одна из колонок выравнивания не несет информации о родстве последовательностей. Значит, они неродственны?
НЕТ! Эти последовательности гомологичны. Это следует из
1. Структурного сходства (хотя и слабого).2. Общности функций.3. Сходства доменной архитектуры (это – С-концевые
домены α-амилаз).
Выравнивания – 2014 47
Вот, кстати, их “структурное” выравнивание.Между последовательностями нет ничего общего.Тоже одна консервативная колонка.
Выравнивания – 2014 48
Гомология между последовательностями может быть настолько
слабой, что ее невозможно обнаружить при помощи
выравнивания.
Выравнивания – 2014 49
Похожие последовательности обычно гомологичны
(но бывают исключения!).Непохожие
последовательности обычно негомологичны
(но бывают исключения!).