Метилирование ДНК и атеросклероз › files › material ›...
TRANSCRIPT
Zaina et al. «DNA methylation map of human atherosclerosis»
1 / 16
Иерархическая кластеризация парных A- и N- образцов1
• Большинство образцов находятся в кластере,
соответствующем состоянию A/N, а не пациенту.
• Предположительно это означает, что для атеросклероза
специфичен определённый профиль метилирования ДНК.1См. рис. 4A в статье.
2 / 16
Такая разная иерархическая кластеризация
Иерархическая кластеризация парных A- и N- образцов с помощью
функции hclust из стандартной библиотеки языка R. Параметры ана-
логичны описанным в статье.
3 / 16
Сравнение A- и N- образцов
• В результате применения парного t-теста c поправкой
Бонферрони для множественного тестирования были
обнаружены 1895 различно метилированных CpG.
• Из них были выбраны 16 находящихся внутри генов,
связанных с сосудистой системой: PDGFA, PLAT, PRRX1,
PXDN и др.
• Наличие изменений в метилировании 15 цитозинов было
подтверждено с помощью пиросеквенирования и ещё 1 —
с помощью бисульфитного секвенирования.
• > 90% изменений соответствуют гиперметилированию в
атеросклерозе.
4 / 16
Дьявол в деталях: M или β?
• Данные Infinium HumanMethylation450 обычно
представляют в виде двух связанных величин:
β =Imethylated
Imethylated + Iunmethylated
∈ [0, 1] M = logβ
1− β∈ R
• При использовании t-теста уместнее использовать
M-значения, так как t-тест предполагает нормальность
данных.
• Несмотря на утверждения авторов, приведенные в статье
результаты, скорее, свидетельствуют об использовании β-,а не M-значений.
• Количество различий при использовании поправкиБонферрони с P < 0.05:
• М-значения — 1931,
• β-значения — 1835,
• среди них общих — 1567.
5 / 16
Дьявол в деталях: Бонферрони и др.
• Использовать поправку Бонферрони неудобно, потому что:
• поправка ограничивает вероятность ошибки хотя бы в
одном из тестов,
• получаемые результаты слишком консервативны.
• Более практичная альтернатива — метод
Бенджамини-Хохберга, который позволяет ограничить FDR
(false discovery rate)
• Количество различий при использовании методаБенджамини-Хохберга с FDR < 0.05:
• М-значения — 130993,
• β-значения — 130442,
• среди них общих — 126579.
6 / 16
Резюме сравнительного анализа данных Infinium HumanMethylation4502
Ген Контекст (A - N) 450K Пиро.-сек., % qRT-PCR
HOXA2 промотор +0.34 +11.7
HOXA6 промотор -0.28 +2.35
HOXA9 экзон -0.55 -34.4 +5.71
HOXA9 интрон -0.37, -0.46 -27.7, -33.2
HOXA11AS экзон +0.44, +0.35 +15.37, +12.20
HOXC4 экзон +0.60, +0.47 +27.40, +26.30
HOXC11 3’UTR +0.35 +9.10
HOXC11 3’UTR +0.34 +21.8
PDGFA интрон +0.30 +18.8 -6.29
PLAT экзон +0.30 +28.9 +4.68
PRRX1 интрон -0.28 -26.3 +1.51
PXDN экзон +0.37, +0.34 +23.1, +23.5 -1.73
MIR23b промотор +0.28 -2.29
2См. таблицу 4 в приложении к статье.7 / 16
Бисульфитное секвенирование ДНК
m
....C.CC.C.C......CC..C.C.... ----+
..........C.CC.........C..... | бисульфитная
m | конверсия
|
....U.UU.U.U......UU..C.U.... <---+
..........U.UU.........C..... ----+
|
..T.. .TT. ..C. | секвенирование
...T. T.TG .C.T |
T.TT. T..A |
TT.. T.T. <---+
8 / 16
Представление результатов бисульфитного секвенирования
m
....C.CC.C.C......CC..C.C....
..........C.CC.........C.....
m
..T.. .TT. ..C.
...T. T.TG .C.T
T.TT. T..T
TT.. T.T.
↑
Возможные представления результатов:
• пара (#C, #C + #T) = (2, 4),
• уровень метилирования #C/#C+#T = 2/4.
9 / 16
Источники ошибок в протоколе бисульфитного секвенирования
• Недостаточная или избыточная обработка ДНК
бисульфитом натрия приводит к переходам вида
цитозин → цитозин и 5-метилцитозин → урацил.
• Точечная мутация цитозин → тимин.
• Ошибки секвенирования и выравнивания, касающиеся
цитозина и тимина, влияют на получаемые значения
#C и #T .
10 / 16
Анализ данных бисульфитного секвенирования
• Цитозины в CpG контексте с #C + #T ≤ 5 были исключены
из рассмотрения.
• Оставшиеся цитозины были разбиты на две группы в
зависимости от значения#C
#T: слабо- (≤ 1) и сильно- (> 1)
метилированные.
• Результаты.
• В данных атеросклеротического поражения больше сильно
метилированных CpG.
• Средний уровень метилирования в А-образце больше чем в
N-образце, что согласуется с данными микрочипов.
11 / 16
Количество сильно метилированных CpG и средний уровнем метили-
рования в A- и N-образцах (см. рис.2E-G в статье)
Средний уровень метилирования в отрезках длины 10Mbp вдоль ге-
нома hg19 в A- и N- образцах (см. рис. 2F в статье)
Сравнение данных бисульфитного секвенирования
• DMR (differentially methylated region) — регион,
содержащий ≥ 5 последовательных по-разномуметилированных CpG.
• Для выявления разницы в метилировании использовался
тест Фишера на независимость3:
A N
#C 2 3
#T 4 5
H0 метилирование в A- и N- образцах не
отличается
H1 между образцами A и N есть разница в
метилировании
• Результат: в образце A наблюдается гиперметилирование
DMR по сравнению с образцом N.
3Коррекция на множественное тестирование при определении DMR не
проводилась.14 / 16
Сравнение данных бисульфитного секвенирования с другой стороны
• Использование теста Фишера для поиска различий в
метилировании предполагает независимость наличия
различий у соседних цитозинов.
• Можно:
• уйти от этого нереалистичного предположения и
• уточнить зависимость между цитозинами с помощью
расстояния между ними, то есть в предполагаемой модели
цитозины на расстоянии 3 и на расстоянии 1000
по-разному зависят от своих соседей.
• Пример:
m
....C.CC.C.C......CC..C.C.... A
....C.CC.C.C......CC..C.C.... N
m
....=.==.=.<......==..>.=.... Различия
15 / 16
Резюме сравнительного анализа данных бисульфитного секвенирования
Ген A N Различия
HOXA6 2/1726/32 Есть
HOXA9 5/1933/39 Есть
HOXA9 0/104/29 —
HOXA9 0/111/17 —
PDGFA 0/31/9 —
PLAT 9/179/28 —
PRRX1 11/2543/50 Есть
PXDN 5/104/22 —
PXDN 6/122/25 Есть
MIR23b 14/392/28 Есть
Значения #C и #C + #T для цитозинов в CpG контексте в генах, связан-
ных с сосудистой системой, FDR < 10−4
16 / 16