jekaterina kokatjuhha fachbereich mathematik und informatik institut für informatik studiengang...
Post on 06-Apr-2015
108 Views
Preview:
TRANSCRIPT
Jekaterina Kokatjuhha
Fachbereich Mathematik und InformatikInstitut für InformatikStudiengang Bioinformatik
Bachelorarbeit
Identifizierung von Genexpressions-Netzwerken in unterschiedlichen immunologischen
Zuständen
Freie Universität Berlin
Jekaterina Kokatjuhha2
Freie Universität Berlin
Co-Expression von Genen
Gene mit gleichen Funktionen unter Kontrolle eines Transkriptionsfaktors(TF) -> Co-Regulation
Korrelationsanalyse nach Pearson
Bestimmung der co-exprimierten Gene erfolgt durch den Vergleich biologischer Zustände (aktiv und inaktiv)
Aktiver biologischer Zustand: erhöhte Expression eines TFs und der von ihm gesteuerten Gene.
Erkennung von Co-Expressionsnetzwerken -> Aufdeckung regulatorischen Mechanismen und biologischen Zusammenhängen
Einleitung
Material und Methoden
Ergebnisse
Diskussion
Jekaterina Kokatjuhha3
Freie Universität Berlin
Verwendete Software
Oracle VM VirtualBox (4.2.12) mit Linux als Betriebssystem HPS-System Soroban der Freien Universität Berlin Ruby (1.9.3p374) on Rails (3.2.9) R (3.0.1) und Bioconductor (2.12) Genesis (1.7.6)
Einleitung
Material und Methoden
Ergebnisse
Diskussion
Jekaterina Kokatjuhha4
Freie Universität Berlin
Klinische Proben
32 Human Genome U133 Plus 2.0 Arrays
Zelltypen: - ,- (CD4, CD8), B (CD19)-Zellen, NK-Zellen (CD56) , Granulozyten (CD15), mit LPS, TNF und IFNa2α 90 Minuten stimulierte sowie unstimulierte Monozyten (CD14) und Kontrolle (Ctl 90)
Einleitung
Material und Methoden
Ergebnisse
Diskussion
Jekaterina Kokatjuhha5
Freie Universität Berlin
Qualitätsanalyse
Einleitung
Material und Methoden
ErgebnisseQualitätsanalyseWeb-ApplikationKorrelationsanalyse
Diskussion
Jekaterina Kokatjuhha6
Freie Universität Berlin
Qualitätsanalyse
Einleitung
Material und Methoden
ErgebnisseQualitätsanalyseWeb-ApplikationKorrelationsanalyse
Diskussion
CD14 IFN Datensatz
Jekaterina Kokatjuhha7
Freie Universität Berlin
Qualitätsanalyse
Einleitung
Material und Methoden
ErgebnisseQualitätsanalyseWeb-ApplikationKorrelationsanalyse
Diskussion
Jekaterina Kokatjuhha8
Freie Universität Berlin
Qualitätsanalyse
Einleitung
Material und Methoden
ErgebnisseQualitätsanalyseWeb-ApplikationKorrelationsanalyse
Diskussion
Jekaterina Kokatjuhha9
Freie Universität Berlin
Qualitätsanalyse
Einleitung
Material und Methoden
ErgebnisseQualitätsanalyseWeb-ApplikationKorrelationsanalyse
Diskussion
Jekaterina Kokatjuhha10
Freie Universität Berlin
Qualitätsanalyse
Einleitung
Material und Methoden
ErgebnisseQualitätsanalyseWeb-ApplikationKorrelationsanalyse
Diskussion
Jekaterina Kokatjuhha11
Freie Universität Berlin
Web-Applikation/Qualitätsanalyse
Einleitung
Material und Methoden
ErgebnisseQualitätsanalyseWeb-ApplikationKorrelationsanalyse
Diskussion
Jekaterina Kokatjuhha12
Freie Universität Berlin
Web-Applikation/Qualitätsanalyse
Einleitung
Material und Methoden
ErgebnisseQualitätsanalyseWeb-ApplikationKorrelationsanalyse
Diskussion
Jekaterina Kokatjuhha13
Freie Universität Berlin
Web-Applikation/Qualitätsanalyse
Einleitung
Material und Methoden
ErgebnisseQualitätsanalyseWeb-ApplikationKorrelationsanalyse
Diskussion
Jekaterina Kokatjuhha14
Freie Universität Berlin
Web-Applikation/Qualitätsanalyse
Einleitung
Material und Methoden
ErgebnisseQualitätsanalyseWeb-ApplikationKorrelationsanalyse
Diskussion
Jekaterina Kokatjuhha15
Freie Universität Berlin
Web-Applikation/Normalisierung
Einleitung
Material und Methoden
ErgebnisseQualitätsanalyseWeb-ApplikationKorrelationsanalyse
Diskussion
Jekaterina Kokatjuhha16
Freie Universität Berlin
Web-Applikation/Korrelationsanalyse
Einleitung
Material und Methoden
ErgebnisseQualitätsanalyseWeb-ApplikationKorrelationsanalyse
Diskussion
Jekaterina Kokatjuhha17
Freie Universität Berlin
Web-Applikation/Korrelationsanalyse
Einleitung
Material und Methoden
ErgebnisseQualitätsanalyseWeb-ApplikationKorrelationsanalyse
Diskussion
Jekaterina Kokatjuhha18
Freie Universität Berlin
Korrelationsanalyse
Untersuchter Datensatz: CD14, CD14_Ctl und mit IFN-α2a stimulierte CD14
1808 Korrelationspaare mit Korrelationskoeffizient >=0,99 für co-regulierte Gene bzw. <=-0,99 für entgegengesetzt regulierte Gene
869 Gene gehören zu diesem Netzwerk
Hierarchisches Clustering der Korrelationsmatrix zwischen allen beteiligten Genen und der Intensitätsmatrix
CD14 IFNa2a Datensatz
ND_51_CD14
ND_52_CD14
ND_53_CD14
ND_5_CD14_IFNa2a_90
ND_6_CD14_IFNa2a_90
ND_7_CD14_IFNa2a_90
ND_8_CD14_IFNa2a_90
ND_5_CD14_Ctl_90
ND_6_CD14_Ctl_90
ND_7_CD14_Ctl_90
ND_8_CD14_Ctl_90
Einleitung
Material und Methoden
ErgebnisseQualitätsanalyseWeb-ApplikationKorrelationsanalyse
Diskussion
Jekaterina Kokatjuhha19
Freie Universität Berlin
Korrelationsanalyse
Einleitung
Material und Methoden
ErgebnisseQualitätsanalyseWeb-ApplikationKorrelationsanalyse
Diskussion
869 Gene
Jekaterina Kokatjuhha20
Freie Universität Berlin
Korrelationsanalyse Filterungsmethode
Entfernung...
aller Korrelationen, die Probesets ohne Genzuweisung enthalten
Einleitung
Material und Methoden
ErgebnisseQualitätsanalyseWeb-ApplikationKorrelationsanalyse
Diskussion
von „Ausreißer“ Korrelationen durch Ermittlung von Standardabweichung (SD), Mittelwert (M) getrennt für die Kontrolle („CD14_Ctl“) und IFN-α2a und Ausschluss der Gene, deren SD/M Ratio >60% für die Kontrollen und >100% für IFN-α2a Stimulationen liegt
von Genen mit ähnlicher Expression in den Kontrollzuständen („CD14_Ctl“) und nach IFN-α2a Stimulation durch Ausschluss der Gene, deren SD/M Ratio über beide Zustände <60% liegt
Jekaterina Kokatjuhha21
Freie Universität Berlin
Korrelationsanalyse Filterungsmethode
Entfernung aller Gene mit einer ähnlichen Expression in den CD14 Monozyten und nach IFN-α2a Stimulation durch die Ermittlung der maximalen Expressionswerte über beide Zustände und Ausschluss der Gene, deren Signalwert <31 ist
Einbeziehen von weiteren Stimulationen mit anderen Aktivatoren(TNF, LPS) in die Korrelationsberechnung und Filterung nach Korrelationskoeffizient >0,5 bzw. <-0,5
Einleitung
Material und Methoden
ErgebnisseQualitätsanalyseWeb-ApplikationKorrelationsanalyse
Diskussion
Jekaterina Kokatjuhha22
Freie Universität Berlin
Korrelationsanalyse
Minderung von 1808 auf 543 Korrelationen
Spezifizierung von 869 auf 151 beteiligte Gene
Stärkere Reduktionen durch die Entfernung von Genen mit stark streuender Expression innerhalb einer Gruppe und durch Hinzunahme von anderen Stimulationszuständen
Einbeziehen von mehreren Funktionszuständen -> Steigerung der Spezifität der Co-Expressionen.
Einleitung
Material und Methoden
ErgebnisseQualitätsanalyseWeb-ApplikationKorrelationsanalyse
Diskussion
Jekaterina Kokatjuhha23
Freie Universität Berlin
Korrelationsanalyse
Einleitung
Material und Methoden
ErgebnisseQualitätsanalyseWeb-ApplikationKorrelationsanalyse
Diskussion
151 Gene
869 Gene
Jekaterina Kokatjuhha24
Freie Universität Berlin
Korrelationsanalyse
CD14 TNF Datensatz und CD14 IFN Datensatz niedriger Überlappungsgrad IFN induzierte Netzwerke haben eine hohe Spezifität für IFN
Überlappungsgrad von 52% zw. CD14 IFN und CD14 LPS LPS löst molekulare Reaktionen aus, die auch IFN induzieren
Einleitung
Material und Methoden
ErgebnisseQualitätsanalyseWeb-ApplikationKorrelationsanalyse
Diskussion
IFN TNF LPS cell types
IFN cell types
TNF cell types
LPS cell types
cell types
CD14 IFN TNF LPS
CD14 LPS
CD14 TNF
CD14 IFN
CD14 IFN LPS
CD14 IFN TNF
CD15 IFN
CD4 IFN
CD8 IFN
CD56 IFN
CD19 IFN
CD4 CD8 CD19 CD56 IFN
0%
20%
40%
60%
80%
100%
120%
Verteilung von Korrelationswerten
Jekaterina Kokatjuhha25
Freie Universität Berlin
Korrelationsanalyse 151 Gene des IFN-induzierten Co-Expressionsnetzwerken Annotationsdatenbanken: KEGG Signalwege, Gene Ontology
biologische Prozesse
KEGG Signalwege:Cytokine-cytokine receptor interactionChemokine signaling pathway
GeneOntology:Cytokine-mediated signaling pathwaytype I interferone-mediated signaling pathwayresponse to virusinterferone-gamma-mediated signaling pathwayimmune response
Einleitung
Material und Methoden
ErgebnisseQualitätsanalyseWeb-ApplikationKorrelationsanalyse
Diskussion
Jekaterina Kokatjuhha26
Freie Universität Berlin
Diskussion
gezielte Auswahl der funktionellen Zuständen
Filterungsmethoden auf CD14 LPS Datensatz (713) und CD14 TNF Datensatz (2059)
Schnittmenge aller 3 Datensätzen -> 16 Gene
molekulare Interaktionen im Reagenzglas molekulare Reaktion bei jeder Immunaktivierung
Bezug zu den Signalwegmodellen
Referenzsignaturen im Sinne von Co-Regulationsnetzwerken
Einleitung
Material und Methoden
ErgebnisseQualitätsanalyseWeb-ApplikationKorrelationsanalyse
Diskussion
Jekaterina Kokatjuhha27
Freie Universität Berlin
Jekaterina Kokatjuhha28
Freie Universität Berlin
Quellenverzeichniss
Adelmeyer M, Warmuth E,. Finanzmathematik für Einsteiger: Von Anleihen über Aktien zu Optionen (2005) vieweg - 2.Auflage Alberts B, et al.. Molekularbiologie der Zelle (2004) Wiley-VCH - 4.Auflage Allocco DJ, Kohane IS, Butte AJ. Quantifying the relationship between co-expression, co-regulation and gene function (2004) BMC Bioinformatics http://
www.biomedcentral.com/1471-2105/5/18 Berrar DP, Dublitzky W, Granzow M. A Practical Approach to Microarray Data Analysis (2002) Kluwer Carmona-Saez P, Chagoyen M, Tirado F, Carazo JM, Pascual-Montano A. GENECODIS: A web-based tool for finding significant concurrent annotations in
gene lists (2007) Genome Biology 8(1):R3 Creighton CJ, Nagaraja AK, Hanash SM, Matzuk MM, Gunaratne PH. A bioinformatics tool for linking gene expression profiling results with public databases
of microRNA target predictions (2008) RNA Society Crowley J, Ankerst DP. Handbook of Statistics in Clinical Oncology (2006) Chapman & Hall/CRC - 2.Auflage De Rinaldis E, Lahm A. DNA Microarrays Current Applications (2007) Horizon - 1.Auflage) Drặghici S. Statistics and Data Analysis for Microarrays Using R and Bioconductor (2012) CRC PressTaylor & Francis Group - 2.Auflage Emmert-Streib F, Dehmer M. Analysis of Microarray Data (2008) Wiley-VCH Janeway CA, Travers P, Walport M, Shlomchik M. Immunologie (2002) Spektrum - 5.Auflage Hanahan D, Weinberg Ra. Hallmarks of cancer: the next generation (2011) Cell Zeitschrift
Hartung J, Elpelt B, Klösener K.-H. Statistik: Lehr- und Handbuch der angewandten Statistik (2005) Oldenbourg - 14.Auflage Hofmann WK. Gene Expression Profiling by Microarrays: Clinical Implications (2006) Camridge University Press - 1.Auflage Hübner J. Komplementäre Onkologie: supportive Maßnahmen und evidenzbasirte Empfehlungne (2008) Schattauer Knudsen S. Cancer Diagnostics with DNA Microarrays (2006) Wiley-Liss Murphy K, Travers P, Walport M. Janeway Immunologie (2009) Spektrum - 7.Auflage Müller-Esterl W. Biochemie (2004) Spektrum - 1.Auflage Nogales-Cadenas R, Carmona-Saez P, Vazquez M, Vicente C, Yang X, Tirado F, Carazo JM, Pascual-Montano A. GeneCodis: interpreting gene lists through
enrichment analysis and integration of diverse biological information (2009) Nucleic Acids Research. doi: 10.1093/nar/gkp416 Schendera CFG. Datenmanagement und Datenanalyse mit dem SAS-System (2004) Oldenburd
Shamith AS, Forster S, Auchettl K, Hertzog PJ. INTERFEROME: the database of interferon regulated genes (2009) Nucleic Acids Research Shoofs T, Müller-Tidow C. DNA methylation as a pathogenic event and as a therapeutic target in AML (2011) Cancel Treat Rev Siegenthaler W, Blum HE. Klinische Pathophysiologie (2006) Georg Thieme - 9.Auflage Sturn A, Quackenbush J, Trajanoski Z. Genesis: cluster analysis of microarray data (2002) Bioinformatics 18(1):207-8. Tabas-Madrid D, Nogales-Cadenas R, Pascual-Montano A. GeneCodis3: a non-redundant and modular enrichment analysis tool for functional genomics
(2012) Nucleic Acids Research. doi: 10.1093/nar/gks402 Wagener C, Müller O. Molekulare Onkologie: Entstehung, Progression, klinische Aspekte (2011) Thieme - 3.Auflage Weinberg JJM, Buchholz R. TNF-alpha Inhibitors (2006) Birkhäuser http://genecodis.cnb.csic.es/ abgerufen 10.08.2013 ArrayAnalysis http://www.arrayanalysis.org/, abgerufen 23.07.2013
top related