Vorlesung Einführung in die Bioinformatik - Expressionsdatenanalyse U. Scholz & M. Lange Folie #7-1
Methoden & Tools für die Methoden & Tools für die ExpressionsdatenanalyseExpressionsdatenanalyse
Vorlesung Einführung in die Bioinformatik - U. Scholz & M. Lange Folie #7-2Expressionsdatenanalyse
Vorgehensmodell Vorgehensmodell ExpressionsdatenverarbeitungExpressionsdatenverarbeitung
Bildanalyse
Normalisierung/Filterung
Datenauswertung
Vorlesung Einführung in die Bioinformatik - U. Scholz & M. Lange Folie #7-3Expressionsdatenanalyse
BildanalyseBildanalyse
Bilddatei einlesen Spot-Raster berechnen Abbildung Spot-Intensitäten auf numerische Werte
- Bestimmung der Spot-Grenzen- Berechnung der Spot-Intensität- Ermittlung der Bild-Hindergrundintensitäten und Korrektur
Spotintensität Qualitätskontrolle Ausgabe Textdatei
Ziel: Numerische Darstellung Arrays
Vorlesung Einführung in die Bioinformatik - U. Scholz & M. Lange Folie #7-4Expressionsdatenanalyse
NormalisierungNormalisierung
Mathematisch:Skalierung des Wertebereichs auf einen bestimmten Bereich, üblicherweise zwischen 0 und 1 (bzw. 100 Prozent)
Mess-Ergebnisse mit unterschiedlicher Grundlage vergleichbar z.B.:(50 Studenten mit der Note 1 vs. 10% mit Note 1)
Aber: Bioinformatik:- Background Correction- Normalization- Quantification / Summarization
Ziel: Vergleichbarkeit von Arrays
Vorlesung Einführung in die Bioinformatik - U. Scholz & M. Lange Folie #7-5Expressionsdatenanalyse
Normalisierung: DurchschnittNormalisierung: Durchschnitt
Forderung:Verhältnis der Durchschnittsintensitäten (AVG) der Hybridisierungen ist gleich
Mathematisch:AVGHyb1 = AVGHyb2
Beispiel:- Hyb1: (1,2,5,1,6)- Hyb2: (100,200,500,100,600)
- AVGHyb1 = 3 AVGHyb2 = 300
- AVGHyb1 / AVGHyb2 = 0,01
- Hyb2norm = Hyb2 * 0,01
- Hyb2norm = (1,2,5,1,6)
Vorlesung Einführung in die Bioinformatik - U. Scholz & M. Lange Folie #7-6Expressionsdatenanalyse
Normalisierung: QuantilNormalisierung: Quantil
Normalisierung über ein Set von Hybridisierungen.
Annahme: Die meisten Gene sind in allen Experimenten gleich stark expremiert→ Die Chips haben gleiche Intensitätsverteilung
Normalisiere so, dass die Quantilen jedes Chips gleich sind.
Vorlesung Einführung in die Bioinformatik - U. Scholz & M. Lange Folie #7-7Expressionsdatenanalyse
Normalisierung: Quantil - BeispielNormalisierung: Quantil - Beispiel
Hyb1 Hyb2
G1 1 10
G2 2 30
G3 5 5
G4 3 20
Hyb1 Hyb2 AVG
5 30 17,5
3 20 11,5
2 10 6
1 5 3
Hyb1 Hyb2
G1 3 6
G2 6 17,5
G3 17,5 3
G4 11,5 11,5
1. 2.
3.
4 Quantile
Vorlesung Einführung in die Bioinformatik - U. Scholz & M. Lange Folie #7-8Expressionsdatenanalyse
TM4 - TM4 - http://www.tm4.org/http://www.tm4.org/
Vorlesung Einführung in die Bioinformatik - U. Scholz & M. Lange Folie #7-9Expressionsdatenanalyse
TM4 - Überblick ITM4 - Überblick I
Software von TIGR (The Institute of Genomic Ressearch):
“Microarrays have emerged as the premier tool for studying gene expression on a genomic scale.
Advances in the precision of array printers and scanners as well as improved laboratory protocols allow for assays of tremendous complexity and scope.
Scientist seeking to harness the potential of this technique are often challenged by the prodigious quantities of data produced.
Well-designed, user-friendly software is the key to tracking, integrating, qualifying, and ultimately deriving scientific insight from the experimental results.
In support of our ongoing work in microarray analysis of gene expression, we developed a suite of software that allow users in the laboratory to capture, manage, and analyze effectively data from DNA microarray experiments.”
Vorlesung Einführung in die Bioinformatik - U. Scholz & M. Lange Folie #7-10Expressionsdatenanalyse
TM4 - Überblick IITM4 - Überblick II
4 Hauptkomponenten: TIGR Spotfinder: Bildanalyse Microarray Data Analysis System (MIDAS): Normalisierung,
Filterung Multi Experiment Viewer (MeV): Interpretation der Ergebnisse Microarray Data Manager (MADAM):
Zusatzmodule: MIAME-compliant MySQL database Automated Microarray Pipeline ExpressConverter SlideMap …
Vorlesung Einführung in die Bioinformatik - U. Scholz & M. Lange Folie #7-11Expressionsdatenanalyse
TIGR – Spotfinder ITIGR – Spotfinder I
Vorlesung Einführung in die Bioinformatik - U. Scholz & M. Lange Folie #7-12Expressionsdatenanalyse
TIGR – Spotfinder IITIGR – Spotfinder II
Vorlesung Einführung in die Bioinformatik - U. Scholz & M. Lange Folie #7-13Expressionsdatenanalyse
TIGR – Spotfinder: Interne TIGR – Spotfinder: Interne DokumentationDokumentation
Ausschnitt aus:
ftp://occams.dfci.harvard.edu/pub/bio/training/TIGRSpotfinder.ppt
Vorlesung Einführung in die Bioinformatik - U. Scholz & M. Lange Folie #7-14Expressionsdatenanalyse
MIDAS: Microarray Data Analysis MIDAS: Microarray Data Analysis System ISystem I
Vorlesung Einführung in die Bioinformatik - U. Scholz & M. Lange Folie #7-15Expressionsdatenanalyse
MIDAS: Microarray Data Analysis MIDAS: Microarray Data Analysis System IISystem II
Vorlesung Einführung in die Bioinformatik - U. Scholz & M. Lange Folie #7-16Expressionsdatenanalyse
MIDAS:MIDAS: Interne DokumentationInterne Dokumentation
Ausschnitt aus:
http://www.tm4.org/documentation/MIDAS2_19.ppt
Vorlesung Einführung in die Bioinformatik - U. Scholz & M. Lange Folie #7-17Expressionsdatenanalyse
MeV: MultiExperiment Viewer IMeV: MultiExperiment Viewer I
Vorlesung Einführung in die Bioinformatik - U. Scholz & M. Lange Folie #7-18Expressionsdatenanalyse
MeV: MultiExperiment Viewer IIMeV: MultiExperiment Viewer II
Vorlesung Einführung in die Bioinformatik - U. Scholz & M. Lange Folie #7-19Expressionsdatenanalyse
MeV:MeV: Interne DokumentationInterne Dokumentation
Ausschnitt aus:
http://www.tm4.org/documentation/mev_advanced.ppt
Vorlesung Einführung in die Bioinformatik - U. Scholz & M. Lange Folie #7-20Expressionsdatenanalyse
MeV:MeV: Implementierte Clustering Implementierte Clustering MethodenMethoden
1. HCL: Hierarchical clustering2. ST: Support Trees 3. SOTA: Self Organizing Tree Algorithm 4. RN: Relevance Networks5. KMC: K-Means/K-Medians Clustering6. KMS: K-Means / K-Medians Support7. CAST: Clustering Affinity Search Technique8. QTC: QT CLUST9. SOM: Self Organizing Maps10. GSH: Gene Shaving11. FOM: Figures of Merit12. PTM: Template Matching13. TTEST: T-tests14. SAM: Significance Analysis of Microarrays15. ANOVA: Analysis of Variance16. TFA: Two-factor ANOVA17. SVM: Support Vector Machines18. KNNC: K-Nearest-Neighbor Classification19. DAM: Discriminant Analysis Module20. COA: Correspondence Analysis21. PCA: Principal Components Analysis22. TRN: Expression Terrain Maps23. EASE: Expression Analysis Systematic Explorer
Vorlesung Einführung in die Bioinformatik - U. Scholz & M. Lange Folie #7-21Expressionsdatenanalyse
MADAM: MicroArray DAta ManagerMADAM: MicroArray DAta Manager
Vorlesung Einführung in die Bioinformatik - U. Scholz & M. Lange Folie #7-22Expressionsdatenanalyse
MADAM: Interne DokumentationMADAM: Interne Dokumentation
Ausschnitt aus: ftp://occams.dfci.harvard.edu/pub/bio/training/madam_4_0.ppt
Vorlesung Einführung in die Bioinformatik - U. Scholz & M. Lange Folie #7-23Expressionsdatenanalyse
Expression Profiler Expression Profiler http://www.ebi.ac.uk/expressionprofiler/http://www.ebi.ac.uk/expressionprofiler/
Vorlesung Einführung in die Bioinformatik - U. Scholz & M. Lange Folie #7-24Expressionsdatenanalyse
Expression Profiler: Expression Profiler: Eingabemöglichkeiten Eingabemöglichkeiten
Vorlesung Einführung in die Bioinformatik - U. Scholz & M. Lange Folie #7-25Expressionsdatenanalyse
Auswahl eines Arrays aus Auswahl eines Arrays aus ArrayExpressArrayExpress
Vorlesung Einführung in die Bioinformatik - U. Scholz & M. Lange Folie #7-26Expressionsdatenanalyse
Auswahl eines Arrays aus Auswahl eines Arrays aus ArrayExpressArrayExpress
Vorlesung Einführung in die Bioinformatik - U. Scholz & M. Lange Folie #7-27Expressionsdatenanalyse
Expression Profiler - mögliche Expression Profiler - mögliche SichtenSichten
Vorlesung Einführung in die Bioinformatik - U. Scholz & M. Lange Folie #7-28Expressionsdatenanalyse
Expression Profiler: Ergebnisse als Text-Expression Profiler: Ergebnisse als Text-DateiDatei
Vorlesung Einführung in die Bioinformatik - U. Scholz & M. Lange Folie #7-29Expressionsdatenanalyse
Expression Profiler: Ergebnisse Expression Profiler: Ergebnisse grafisch Igrafisch I
Vorlesung Einführung in die Bioinformatik - U. Scholz & M. Lange Folie #7-30Expressionsdatenanalyse
Expression Profiler: Ergebnisse Expression Profiler: Ergebnisse grafisch IIgrafisch II
Vorlesung Einführung in die Bioinformatik - U. Scholz & M. Lange Folie #7-31Expressionsdatenanalyse
Expression Profiler: Ergebnisse Expression Profiler: Ergebnisse grafisch IIIgrafisch III
Vorlesung Einführung in die Bioinformatik - U. Scholz & M. Lange Folie #7-32Expressionsdatenanalyse
Expression Profiler: Ergebnisse Expression Profiler: Ergebnisse grafisch IVgrafisch IV