Функциональная аннотация
DESCRIPTION
Функциональная аннотация. М.Гельфанд «Сравнительная геномика и системная биология» БиБи, 4 курс + ШБ, 2 год + ПФУ весна 201 4. Цель аннотации. Что функция Когда Регуляция Экспрессии Время жизни Где Локализация Внутри/снаружи Органеллы и компартменты Как Механизм - PowerPoint PPT PresentationTRANSCRIPT
![Page 1: Функциональная аннотация](https://reader035.vdocuments.pub/reader035/viewer/2022062301/5681490e550346895db6456e/html5/thumbnails/1.jpg)
Функциональная аннотация
М.Гельфанд «Сравнительная геномика и
системная биология»
БиБи, 4 курс + ШБ, 2 год + ПФУвесна 2014
![Page 2: Функциональная аннотация](https://reader035.vdocuments.pub/reader035/viewer/2022062301/5681490e550346895db6456e/html5/thumbnails/2.jpg)
Цель аннотации• Что
– функция• Когда
– Регуляция• Экспрессии• Время жизни
• Где– Локализация
• Внутри/снаружи• Органеллы и компартменты
• Как– Механизм
• Специфичность, регуляция
![Page 3: Функциональная аннотация](https://reader035.vdocuments.pub/reader035/viewer/2022062301/5681490e550346895db6456e/html5/thumbnails/3.jpg)
Функции (условно)
• Ферменты– Метаболизм (катаболизм, анаболизм)– Биосинтез макромолекул
• Транспортеры• Регуляторы
– Рецепторы– Белки сигнальных каскадов– Факторы транскрипции и т.п.
• Структурные и «вспомогательные» белки– Цитоскелет, движение, деление– Межклеточные взаимодействия (рецепторы)– Шапероны. Большие комплексы
![Page 4: Функциональная аннотация](https://reader035.vdocuments.pub/reader035/viewer/2022062301/5681490e550346895db6456e/html5/thumbnails/4.jpg)
Gene Ontology
![Page 5: Функциональная аннотация](https://reader035.vdocuments.pub/reader035/viewer/2022062301/5681490e550346895db6456e/html5/thumbnails/5.jpg)
Три иерархии• Молекулярная функция• Биологический процесс• Компонент клетки
Пример: цитохром с– Транспорт электронов– Окислительное фосфорилирование– Внутренняя мембрана митохондрии
Геномные базы: • FlyBase (дрозофила)• SGD (Saccharomyces Genome Database)• MGD (Mouse Genome Database)
![Page 6: Функциональная аннотация](https://reader035.vdocuments.pub/reader035/viewer/2022062301/5681490e550346895db6456e/html5/thumbnails/6.jpg)
Молекулярная функция - примеры
• Широкие категории:– Каталитическая активность– Транспортная активность– Связывание
• Узкие категории:– Адениат-циклазная активность– Связывание Ca2+
Можно и по-другому (EC, TC) – это потом
![Page 7: Функциональная аннотация](https://reader035.vdocuments.pub/reader035/viewer/2022062301/5681490e550346895db6456e/html5/thumbnails/7.jpg)
Биологический процесс - примеры
• Широкие категории:– Cellular physiological processes– Перенос сигнала (signal transduction)
• Узкие категории:– Метаболизм пиримидинов– Транспорт альфа-глюкозидов– Асимметричное деление клеток
![Page 8: Функциональная аннотация](https://reader035.vdocuments.pub/reader035/viewer/2022062301/5681490e550346895db6456e/html5/thumbnails/8.jpg)
GO: процессы
![Page 9: Функциональная аннотация](https://reader035.vdocuments.pub/reader035/viewer/2022062301/5681490e550346895db6456e/html5/thumbnails/9.jpg)
Структура иерархии: сетьBiological process• Cellular process
– Cellular physiolgical process• Cell division
– Asymmetric cell division» Regulation of asymmetric cell division
– Regulation of cell division» Regulation of asymmetric cell division
• Regulation of cellular physiological process– Regulation of cell division
» Regulation of assymmetric cell division
• Physiological process– Cellular physiolocical process
• …
– Regulation of physiological process• …
![Page 10: Функциональная аннотация](https://reader035.vdocuments.pub/reader035/viewer/2022062301/5681490e550346895db6456e/html5/thumbnails/10.jpg)
УпражнениеНарисовать пути, ведущие к:(А-Д) GO:0045782 : positive regulation of cell budding
GO:0004612 : phosphoenolpyruvate carboxykinase (ATP) activity(Е-К) GO:0019568 : arabinose catabolism
GO:0003726 : double-stranded RNA adenosine deaminase activity(Л-Н) GO:0030660 : Golgi vesicle membrane
GO:0030570 : pectate lyase activity(О-П) GO:0019319 : hexose biosynthesis
GO:0047689 : aspartate racemase activity (Р-С) GO:0006068 : ethanol catabolism
GO:0004129 : cytochrome-c oxidase activity(Т-Я) GO:0030334 : regulation of cell migration
GO:0003705 : RNA polymerase II transcription factor activity, enhancer binding
используя AmiGO
http://www.geneontology.org AmiGo
http://www.godatabase.org/cgi-bin/amigo/go.cgi?search_constraint=terms&action=replace_tree&session_id=7922b1125244220
![Page 11: Функциональная аннотация](https://reader035.vdocuments.pub/reader035/viewer/2022062301/5681490e550346895db6456e/html5/thumbnails/11.jpg)
BL
AS
T h
om
e p
age
![Page 12: Функциональная аннотация](https://reader035.vdocuments.pub/reader035/viewer/2022062301/5681490e550346895db6456e/html5/thumbnails/12.jpg)
Параметры BLAST: wordsize
• Цистеиновые протеазы из люцернового долгоносика и коровьего клеща: 61% тождества, а BLASTN не находит. Для ДНК Wordsize=11(min 7), для белков =3.
![Page 13: Функциональная аннотация](https://reader035.vdocuments.pub/reader035/viewer/2022062301/5681490e550346895db6456e/html5/thumbnails/13.jpg)
Similarity ≠ homology• BLAST e-value is a measure of non-
randomness of sequence similarity• Possible causes of similarity:
– homology– domain homology– low complexity, coiled-coil, transmembrane
and other types of regions with non-standard amino acid composition
• Homology ≠ same function. Normally:– similar (general) function
(e.g. enzymatic activity)– maybe different specificity
![Page 14: Функциональная аннотация](https://reader035.vdocuments.pub/reader035/viewer/2022062301/5681490e550346895db6456e/html5/thumbnails/14.jpg)
Предсказание специфичности: дерево распадается на две ветви – все нормально
(A novel type of Ni /Co ABC transporters. Transmembrane component CbiM/NikM)
NikM
CbiMNi2+
Co2+
+ CbiN
+ NikL, NikK
+ NikN
+ NikL
![Page 15: Функциональная аннотация](https://reader035.vdocuments.pub/reader035/viewer/2022062301/5681490e550346895db6456e/html5/thumbnails/15.jpg)
Предсказание специфичности: все смешалось – нет предсказания ( The NiCoT transporters family)
![Page 16: Функциональная аннотация](https://reader035.vdocuments.pub/reader035/viewer/2022062301/5681490e550346895db6456e/html5/thumbnails/16.jpg)
Предсказание специфичности: смена специфичности – ошибки (The NikABCDE family of ABC transporters. Substrate-binding component NikA)
![Page 17: Функциональная аннотация](https://reader035.vdocuments.pub/reader035/viewer/2022062301/5681490e550346895db6456e/html5/thumbnails/17.jpg)
Noradrenaline transporter in an archaeon?
SOURCE Methanococcus jannaschii. ORGANISM Methanococcus jannaschii Archaea; Euryarchaeota; Methanococcales; Methanococcaceae; Methanococcus.
FEATURES Location/Qualifiers source 1..492 /organism="Methanococcus jannaschii" /db_xref="taxon:2190" Protein 1..492
/product="sodium-dependent noradrenaline transporter" CDS 1..492 /gene="MJ1319" /note="similar to EGAD:HI0736 percent identity: 38.5;
identified by sequence similarity; putative" /coded_by="U67572:71..1549" /transl_table=11
Now corrected: Hypothetical sodium-dependent transporter MJ1319.
![Page 18: Функциональная аннотация](https://reader035.vdocuments.pub/reader035/viewer/2022062301/5681490e550346895db6456e/html5/thumbnails/18.jpg)
Lesson(s)
1. Avoid overprediction (homology does not necessarily mean same cellular role or specificity)
![Page 19: Функциональная аннотация](https://reader035.vdocuments.pub/reader035/viewer/2022062301/5681490e550346895db6456e/html5/thumbnails/19.jpg)
Similarity to hypothetical proteins: somebody else’s errors…
The only correct annotation!
![Page 20: Функциональная аннотация](https://reader035.vdocuments.pub/reader035/viewer/2022062301/5681490e550346895db6456e/html5/thumbnails/20.jpg)
Genes with curious functional assignments
• C75604: Probable head morphogenesis protein, Deinococcus radiodurans
• O05360: Automembrane protein H, Yersinia enterocolitica
• Q8TID9: Benzodiazepine (valium) receptor TspO, Methanosarcina acetivorans
• NP_069403: DR-beta chain MHC class II, Archaeoglobus fulgidus
![Page 21: Функциональная аннотация](https://reader035.vdocuments.pub/reader035/viewer/2022062301/5681490e550346895db6456e/html5/thumbnails/21.jpg)
Errors in experimental papers
SwissProt:
DEFINITION Hypothetical 43.6 kDa protein.ACCESSION P48012
...
KEYWORDS Hypothetical protein.
SOURCE Debaryomyces occidentalis
ORGANISM Debaryomyces occidentalis
Eukaryota; Fungi; Ascomycota; Saccharomycotina; Saccharomycetes;
Saccharomycetales; Saccharomycetaceae; Debaryomyces.
[CAUTION] Was originally (Ref.1) thought to be 3-isopropylmalate dehydrogenase (LEU2).
PIR:DEFINITION 3-isopropylmalate dehydrogenase (EC 1.1.1.85)
- yeast(Schwanniomyces occidentalis).
ACCESSION S55845
KEYWORDS oxidoreductase.
![Page 22: Функциональная аннотация](https://reader035.vdocuments.pub/reader035/viewer/2022062301/5681490e550346895db6456e/html5/thumbnails/22.jpg)
SwissProt entry DSDX_ECOLI
-!- CAUTION: An ORF called dsdC was originally (Ref.3) assigned to the wrong DNA strand and thought to be a D-serine deaminase activator, it was then resequenced by Ref.2 and still thought to be "dsdC", but this time to function as a D-serine permease. It is Ref.1 that showed that dsdC is another gene and that this sequence should be called dsdX. It should also be noted that the C-terminal part of dsdX (from 338 onward) was also sequenced (Ref.6 and Ref.7) and was thought to be a separate ORF (don't worry, we also had difficulties understanding what happened!).
![Page 23: Функциональная аннотация](https://reader035.vdocuments.pub/reader035/viewer/2022062301/5681490e550346895db6456e/html5/thumbnails/23.jpg)
Lesson(s)
1. Avoid overprediction (homology does not necessarily mean same cellular role or specificity)
2. Check carefully the source(s) of annotations in the list of homologs
![Page 24: Функциональная аннотация](https://reader035.vdocuments.pub/reader035/viewer/2022062301/5681490e550346895db6456e/html5/thumbnails/24.jpg)
mastermind protein of Drosophila
![Page 25: Функциональная аннотация](https://reader035.vdocuments.pub/reader035/viewer/2022062301/5681490e550346895db6456e/html5/thumbnails/25.jpg)
Filtering of low-complexity
segments
• often insufficient
• may lose non-trivial information
![Page 26: Функциональная аннотация](https://reader035.vdocuments.pub/reader035/viewer/2022062301/5681490e550346895db6456e/html5/thumbnails/26.jpg)
Lesson(s)
1. Avoid overprediction (homology does not necessarily mean same cellular role or specificity)
2. Check the source(s) of annotations in the list of homologs
3. Beware of similarity in low-complexity regions, non-globular domains, transmembrane segments
![Page 27: Функциональная аннотация](https://reader035.vdocuments.pub/reader035/viewer/2022062301/5681490e550346895db6456e/html5/thumbnails/27.jpg)
Homology of domains
I64228: “DNA polymerase homolog”(in fact, 5’-3- exonuclease) Klenow fragment
Bacterial DNA polymerases
![Page 28: Функциональная аннотация](https://reader035.vdocuments.pub/reader035/viewer/2022062301/5681490e550346895db6456e/html5/thumbnails/28.jpg)
BL
AS
T d
om
ain
s p
age
![Page 29: Функциональная аннотация](https://reader035.vdocuments.pub/reader035/viewer/2022062301/5681490e550346895db6456e/html5/thumbnails/29.jpg)
InterPro domains
![Page 30: Функциональная аннотация](https://reader035.vdocuments.pub/reader035/viewer/2022062301/5681490e550346895db6456e/html5/thumbnails/30.jpg)
Lesson(s)
1. Avoid overprediction (homology does not necessarily mean same cellular role or specificity)
2. Check the source(s) of annotations in the list of homologs
3. Beware of similarity in low-complexity regions, non-globular domains, transmembrane segments
4. Do not extend domain homology to annotation of the whole protein
![Page 31: Функциональная аннотация](https://reader035.vdocuments.pub/reader035/viewer/2022062301/5681490e550346895db6456e/html5/thumbnails/31.jpg)
PROSITE• Множественное выравнивание консервативные
позиции паттерны• Вырожденные паттерны• P-loop ATPases:
• [GA]x(4)GK[ST] • Очень малая избирательность
![Page 32: Функциональная аннотация](https://reader035.vdocuments.pub/reader035/viewer/2022062301/5681490e550346895db6456e/html5/thumbnails/32.jpg)
caspases/paracaspases/metacaspases
![Page 33: Функциональная аннотация](https://reader035.vdocuments.pub/reader035/viewer/2022062301/5681490e550346895db6456e/html5/thumbnails/33.jpg)
Профили. PSI-BLAST
• Значимость (E=0.005), 1 лишний на 200 поисков
• Ручная прочистка при итерациях
• Автоматически – до схождения
• Асимметрия
![Page 34: Функциональная аннотация](https://reader035.vdocuments.pub/reader035/viewer/2022062301/5681490e550346895db6456e/html5/thumbnails/34.jpg)
Lesson(s)
1. Avoid overprediction (homology does not necessarily mean same cellular role or specificity)
2. Check the source(s) of annotations in the list of homologs
3. Beware of similarity in low-complexity regions, non-globular domains, transmembrane segments
4. Do not extend domain homology to annotation of the whole protein
5. Правильный паттерн должен сохраняться у (близких) ортологов; должны сохраняться основные каталитические остатки
![Page 35: Функциональная аннотация](https://reader035.vdocuments.pub/reader035/viewer/2022062301/5681490e550346895db6456e/html5/thumbnails/35.jpg)
Анализ белка в отсутствие гомологов• Сигнальные пептиды. SignalP (нейронная сеть)• Трансмембранные сегменты. Две дюжины
серверов (TMHMM, PHDhtm, HMMTOP)– Гидрофобные/гидрофильные– Сигнал на границе– Топология (положительные внутри)– Использование выравниваний– Бета-белки. Порины
• Локализация. PSORT, TargetP• Coiled coil. COILS, Parcoil/Multicoil• Вторичная и пространственная структура.
Threading• Сравнительная геномика и негеномные данные