Множественное выравнивание

24
Множественное выравнивание Множественное выравнивание

Upload: twyla

Post on 19-Mar-2016

91 views

Category:

Documents


3 download

DESCRIPTION

Множественное выравнивание. Обобщение парного выравнивания. Выравнивание 2-х последовательностей – двумерная матрица 3-х последовательностей – 3-х мерная. A T _ G C G _ A _ C G T _ A A T C A C _ A Задача : больше консервативных столбцов, лучше выравнивание. - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: Множественное выравнивание

Множественное выравниваниеМножественное выравнивание

Page 2: Множественное выравнивание

Обобщение парного выравниванияОбобщение парного выравнивания

• Выравнивание 2-х последовательностей – двумерная матрица

• 3-х последовательностей – 3-х мерная.

A T _ G C G _ A _ C G T _ A A T C A C _ A

• Задача: больше консервативных столбцов, лучше выравнивание

Page 3: Множественное выравнивание

Глобальное выравнивание 3-х Глобальное выравнивание 3-х последовательностейпоследовательностей

начало

конец

Page 4: Множественное выравнивание

2-D versus 2-D 2-D versus 2-D

В 3-D - 7

В 2-D, 3 пути прихода в узел

Page 5: Множественное выравнивание

3-D3-D архитектура архитектура(i-1,j-1,k-1)

(i,j-1,k-1)

(i,j-1,k)

(i-1,j-1,k) (i-1,j,k)

(i,j,k)

(i-1,j,k-1)

(i,j,k-1)

Page 6: Множественное выравнивание

АлгоритмАлгоритм

• si,j,k = max

(x, y, z) – запись в трехмерной матрице весов

si-1,j-1,k-1 + (vi, wj, uk)si-1,j-1,k + (vi, wj, _ )si-1,j,k-1 + (vi, _, uk)si,j-1,k-1 + (_, wj, uk)si-1,j,k + (vi, _ , _)si,j-1,k + (_, wj, _)si,j,k-1 + (_, _, uk)

Нет гэпов

Один гэп

Два гэпа

Page 7: Множественное выравнивание

Время работы алгоритмаВремя работы алгоритма

• Для 3-х последовательностей длины n, время работы - 7n^3; O(n^3)

• Для k последовательностей - (2k-1)(n^k); O(2kn^k)

Page 8: Множественное выравнивание

Множественное выравнивание Множественное выравнивание порождает парные выравниванияпорождает парные выравнивания

x: AC-GCGG-C y: AC-GC-GAG z: GCCGC-GAG

Порождает:

x: ACGCGG-C; x: AC-GCGG-C; y: AC-GCGAGy: ACGC-GAC; z: GCCGC-GAG; z: GCCGCGAG

Page 9: Множественное выравнивание

Обратная проблемаОбратная проблема

Имея 3 субъективных парных варнивания:

x: ACGCGG-C; x: AC-GCGG-C; y: AC-GCGAGy: ACGC-GAC; z: GCCGC-GAG; z: GCCGCGAG

Можем ли мы вычислить множественное

выравнивание, их порождающее?

Page 10: Множественное выравнивание

Хороший вариант

Плохой вариант

Ответ – не всегда.Ответ – не всегда.

Page 11: Множественное выравнивание

Выравнивание выравниванийВыравнивание выравниваний

x GGGCACTGCATy GGTTACGTC-- Alignment 1 z GGGAACTGCAG

w GGACGTACC-- Alignment 2v GGACCT-----

Page 12: Множественное выравнивание

ПрофилиПрофили

x GGGCACTGCATy GGTTACGTC-- Combined Alignment z GGGAACTGCAG

w GGACGTACC-- v GGACCT-----

GTCTGAGTCAGC GTCt/aGa/cA

Page 13: Множественное выравнивание

Множественное выравнивание – Множественное выравнивание – жадный алгоритмжадный алгоритм

u1= ACGTACGTACGT…

u2 = TTAATTAATTAA…

u3 = ACTACTACTACT…

uk = CCGGCCGGCCGG

u1= ACg/tTACg/tTACg/cT…

u2 = TTAATTAATTAA…

uk = CCGGCCGGCCGG…

kk-1

Page 14: Множественное выравнивание

ClustalWClustalW

• Прогрессивное выравнивание –жадный алгоритм с более «умным» способом выбора пар.

• Три шага1.) Построить парные выравнивания2.) Построить дерево-подсказку3.) Прогрессивное выравнивание по

дереву-подсказке

Прогрессивное выравниваниеПрогрессивное выравнивание

Page 15: Множественное выравнивание

ШагШаг 1: 1: Парные ВыравниванияПарные Выравнивания

• Выравнивания пар порождают матрицу identity

v1 v2 v3 v4

v1 -v2 .17 -v3 .87 .28 -v4 .59 .33 .62 -

(.17 значит идентичны на 17 % )

Page 16: Множественное выравнивание

ШагШаг 2: 2: Дерево-подсказкаДерево-подсказкаv1

v3

v4 v2

Далее вычислить:v1,3 = выравнивание (v1, v3)v1,3,4 = выравнивание ((v1,3),v4)v1,2,3,4 = выравнивание ((v1,3,4),v2)

v1 v2 v3 v4

v1 -v2 .17 -v3 .87 .28 -v4 .59 .33 .62 -

Page 17: Множественное выравнивание

ШагШаг 3: 3: Прогрессивное Прогрессивное выравниваниевыравнивание

• Выравниванием 2 наиболее близких последовательности.

• Следуя дереву - подсказке, довыравниваем следующую последовательность к имеющемуся выравниванию

FOS_RAT PEEMSVTS-LDLTGGLPEATTPESEEAFTLPLLNDPEPK-PSLEPVKNISNMELKAEPFDFOS_MOUSE PEEMSVAS-LDLTGGLPEASTPESEEAFTLPLLNDPEPK-PSLEPVKSISNVELKAEPFDFOS_CHICK SEELAAATALDLG----APSPAAAEEAFALPLMTEAPPAVPPKEPSG--SGLELKAEPFDFOSB_MOUSE PGPGPLAEVRDLPG-----STSAKEDGFGWLLPPPPPPP-----------------LPFQFOSB_HUMAN PGPGPLAEVRDLPG-----SAPAKEDGFSWLLPPPPPPP-----------------LPFQ . . : ** . :.. *:.* * . * **:

Точки и звезды отображают насколько консервативны столбцы.

Page 18: Множественное выравнивание

Множественные ВыравниванияМножественные Выравнивания: : ВзвешиваниеВзвешивание

Количество полных совпадений

Энтропия

Сумма по парам (SP-Score)

Page 19: Множественное выравнивание

LCS ScoreLCS Score

• Хорошо только для очень близких последовательностей

AAAAAAAATATC

Page 20: Множественное выравнивание

ЭнтропияЭнтропия• Определим вероятности букв в столбцах

• pA = 1, pT=pG=pC=0 (1-ый столбец)• pA = 0.75, pT = 0.25, pG=pC=0 (2-ый столбец)• pA = 0.50, pT = 0.25, pC=0.25 pG=0 (3-ий столбец)

• Энтропия столбца будет равна

CGTAX

XX pp,,,

log AAAAAAAATATC

Page 21: Множественное выравнивание

ЭнтропияЭнтропия: : ПримерПример

0

AAAA

entropy

2)241(4

41log

41

CGTA

entropy

Лучший вариант

Худший вариант

Page 22: Множественное выравнивание

ЭнтропияЭнтропия: : ПримерПримерЭнтропия столбца:

-( pAlogpA + pClogpC + pGlogpG + pTlogpT)

•Столбец 1 = -[1*log(1) + 0*log0 + 0*log0 +0*log0] = 0

•Столбец 2 = -[(1/4)*log(1/4) + (3/4)*log(3/4) + 0*log0 + 0*log0] = -[ (1/4)*(-2) + (3/4)*(-.415) ] = +0.811

•Столбец 3 = -[(1/4)*log(1/4)+(1/4)*log(1/4)+(1/4)*log(1/4) +(1/4)*log(1/4)] = 4* -[(1/4)*(-2)] = +2.0

•Энтропия выравнивания = 0 + 0.811 + 2.0 = +2.811

A A A

A C C

A C G

A C T

Page 23: Множественное выравнивание

Сумма по парам Сумма по парам (SP-Score)(SP-Score)

• Построим парное выравнивание по множественному

• Посчитаем веса всех этих парных выравниваний - s*(ai, aj)

• Просуммируем:s(a1,…,ak) = Σi,j s*(ai, aj)

Page 24: Множественное выравнивание

Проекции на плоскостиПроекции на плоскости

3-D выравнивание может быть спроецировано на 2-D плоскость чтобы получить порождаемое парное выравнивание.