statistik fur informatiker, ss 2018¨ · worum geht es in der statistik? die welt ist voller...
TRANSCRIPT
![Page 1: Statistik fur Informatiker, SS 2018¨ · Worum geht es in der Statistik? Die Welt ist voller Variabilitat.¨ Wie geht man mit variablen Daten um? Idee der Statistik: Variabilitat](https://reader033.vdocuments.pub/reader033/viewer/2022041502/5e228e243f38553b793dfc6c/html5/thumbnails/1.jpg)
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von Mittelwerten
Statistik fur Informatiker, SS 2018
2. Ideen aus der Statistik
2.1 Deskriptive Statistik
Timo Schluter und Matthias Birkner
http://www.staff.uni-mainz.de/birkner/StatInfo18/
11.6.2018
1/94
![Page 2: Statistik fur Informatiker, SS 2018¨ · Worum geht es in der Statistik? Die Welt ist voller Variabilitat.¨ Wie geht man mit variablen Daten um? Idee der Statistik: Variabilitat](https://reader033.vdocuments.pub/reader033/viewer/2022041502/5e228e243f38553b793dfc6c/html5/thumbnails/2.jpg)
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von Mittelwerten
Inhalt1 Ansatz der Statistik2 Graphische Darstellungen
Histogramme und DichtepolygoneStripchartsBoxplotsGeschummelt: Graphische Tricksereien
3 Statistische KenngroßenMedian und andere Quartile, (empirische) QuantileMittelwert und Standardabweichung
4 Beispiele zum Sinn und Unsinn von MittelwertenBeispiel: Wahlerische BachstelzenBeispiel: Spiderman & SpiderwomanBeispiel: Kupfertoleranz beim Roten Straußgras
2/94
![Page 3: Statistik fur Informatiker, SS 2018¨ · Worum geht es in der Statistik? Die Welt ist voller Variabilitat.¨ Wie geht man mit variablen Daten um? Idee der Statistik: Variabilitat](https://reader033.vdocuments.pub/reader033/viewer/2022041502/5e228e243f38553b793dfc6c/html5/thumbnails/3.jpg)
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von Mittelwerten
Viele Menschen stehen ”Statistik“ kritisch gegenuber:
It is easy to lie with statistics.
It is hard to tell the truth without it.
Andrejs Dunkels (1939–1998)
3/94
![Page 4: Statistik fur Informatiker, SS 2018¨ · Worum geht es in der Statistik? Die Welt ist voller Variabilitat.¨ Wie geht man mit variablen Daten um? Idee der Statistik: Variabilitat](https://reader033.vdocuments.pub/reader033/viewer/2022041502/5e228e243f38553b793dfc6c/html5/thumbnails/4.jpg)
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von Mittelwerten
Viele Menschen stehen ”Statistik“ kritisch gegenuber:
It is easy to lie with statistics.It is hard to tell the truth without it.
Andrejs Dunkels (1939–1998)
3/94
![Page 5: Statistik fur Informatiker, SS 2018¨ · Worum geht es in der Statistik? Die Welt ist voller Variabilitat.¨ Wie geht man mit variablen Daten um? Idee der Statistik: Variabilitat](https://reader033.vdocuments.pub/reader033/viewer/2022041502/5e228e243f38553b793dfc6c/html5/thumbnails/5.jpg)
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von Mittelwerten
Worum geht es in der Statistik?
Die Welt ist voller Variabilitat.
Wie geht man mit variablen Daten um?
Idee der Statistik:Variabilitat (Erscheinung der Natur) durch Zufall
(mathematische Abstraktion) modellierenDie Daten werden als Realisierungen von Zufallsvariablenaufgefasst, die in einem stochastischen Modell spezifiert
werden.Man versucht dann, anhand der Daten Ruckschlusse aufParameter des Modells zu ziehen, und so systematische
Effekte von Zufalligem zu trennen.
4/94
![Page 6: Statistik fur Informatiker, SS 2018¨ · Worum geht es in der Statistik? Die Welt ist voller Variabilitat.¨ Wie geht man mit variablen Daten um? Idee der Statistik: Variabilitat](https://reader033.vdocuments.pub/reader033/viewer/2022041502/5e228e243f38553b793dfc6c/html5/thumbnails/6.jpg)
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von Mittelwerten
Worum geht es in der Statistik?
Die Welt ist voller Variabilitat.
Wie geht man mit variablen Daten um?
Idee der Statistik:Variabilitat (Erscheinung der Natur) durch Zufall
(mathematische Abstraktion) modellierenDie Daten werden als Realisierungen von Zufallsvariablenaufgefasst, die in einem stochastischen Modell spezifiert
werden.Man versucht dann, anhand der Daten Ruckschlusse aufParameter des Modells zu ziehen, und so systematische
Effekte von Zufalligem zu trennen.
4/94
![Page 7: Statistik fur Informatiker, SS 2018¨ · Worum geht es in der Statistik? Die Welt ist voller Variabilitat.¨ Wie geht man mit variablen Daten um? Idee der Statistik: Variabilitat](https://reader033.vdocuments.pub/reader033/viewer/2022041502/5e228e243f38553b793dfc6c/html5/thumbnails/7.jpg)
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von Mittelwerten
Worum geht es in der Statistik?
Die Welt ist voller Variabilitat.
Wie geht man mit variablen Daten um?
Idee der Statistik:Variabilitat (Erscheinung der Natur) durch Zufall
(mathematische Abstraktion) modellieren
Die Daten werden als Realisierungen von Zufallsvariablenaufgefasst, die in einem stochastischen Modell spezifiert
werden.Man versucht dann, anhand der Daten Ruckschlusse aufParameter des Modells zu ziehen, und so systematische
Effekte von Zufalligem zu trennen.
4/94
![Page 8: Statistik fur Informatiker, SS 2018¨ · Worum geht es in der Statistik? Die Welt ist voller Variabilitat.¨ Wie geht man mit variablen Daten um? Idee der Statistik: Variabilitat](https://reader033.vdocuments.pub/reader033/viewer/2022041502/5e228e243f38553b793dfc6c/html5/thumbnails/8.jpg)
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von Mittelwerten
Worum geht es in der Statistik?
Die Welt ist voller Variabilitat.
Wie geht man mit variablen Daten um?
Idee der Statistik:Variabilitat (Erscheinung der Natur) durch Zufall
(mathematische Abstraktion) modellierenDie Daten werden als Realisierungen von Zufallsvariablenaufgefasst, die in einem stochastischen Modell spezifiert
werden.
Man versucht dann, anhand der Daten Ruckschlusse aufParameter des Modells zu ziehen, und so systematische
Effekte von Zufalligem zu trennen.
4/94
![Page 9: Statistik fur Informatiker, SS 2018¨ · Worum geht es in der Statistik? Die Welt ist voller Variabilitat.¨ Wie geht man mit variablen Daten um? Idee der Statistik: Variabilitat](https://reader033.vdocuments.pub/reader033/viewer/2022041502/5e228e243f38553b793dfc6c/html5/thumbnails/9.jpg)
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von Mittelwerten
Worum geht es in der Statistik?
Die Welt ist voller Variabilitat.
Wie geht man mit variablen Daten um?
Idee der Statistik:Variabilitat (Erscheinung der Natur) durch Zufall
(mathematische Abstraktion) modellierenDie Daten werden als Realisierungen von Zufallsvariablenaufgefasst, die in einem stochastischen Modell spezifiert
werden.Man versucht dann, anhand der Daten Ruckschlusse aufParameter des Modells zu ziehen, und so systematische
Effekte von Zufalligem zu trennen.4/94
![Page 10: Statistik fur Informatiker, SS 2018¨ · Worum geht es in der Statistik? Die Welt ist voller Variabilitat.¨ Wie geht man mit variablen Daten um? Idee der Statistik: Variabilitat](https://reader033.vdocuments.pub/reader033/viewer/2022041502/5e228e243f38553b793dfc6c/html5/thumbnails/10.jpg)
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von Mittelwerten
Deskriptive (d.h. beschreibende) Statistik
Wie geht man mit variablen Daten um?
”0. Antwort“: Man verschafft sich einenersten Eindruck mittels graphischerDarstellungen und statistischerKenngroßen
5/94
![Page 11: Statistik fur Informatiker, SS 2018¨ · Worum geht es in der Statistik? Die Welt ist voller Variabilitat.¨ Wie geht man mit variablen Daten um? Idee der Statistik: Variabilitat](https://reader033.vdocuments.pub/reader033/viewer/2022041502/5e228e243f38553b793dfc6c/html5/thumbnails/11.jpg)
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von Mittelwerten
Deskriptive (d.h. beschreibende) Statistik
Wie geht man mit variablen Daten um?
”0. Antwort“: Man verschafft sich einenersten Eindruck mittels graphischerDarstellungen und statistischerKenngroßen
5/94
![Page 12: Statistik fur Informatiker, SS 2018¨ · Worum geht es in der Statistik? Die Welt ist voller Variabilitat.¨ Wie geht man mit variablen Daten um? Idee der Statistik: Variabilitat](https://reader033.vdocuments.pub/reader033/viewer/2022041502/5e228e243f38553b793dfc6c/html5/thumbnails/12.jpg)
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien
Inhalt1 Ansatz der Statistik2 Graphische Darstellungen
Histogramme und DichtepolygoneStripchartsBoxplotsGeschummelt: Graphische Tricksereien
3 Statistische KenngroßenMedian und andere Quartile, (empirische) QuantileMittelwert und Standardabweichung
4 Beispiele zum Sinn und Unsinn von MittelwertenBeispiel: Wahlerische BachstelzenBeispiel: Spiderman & SpiderwomanBeispiel: Kupfertoleranz beim Roten Straußgras
6/94
![Page 13: Statistik fur Informatiker, SS 2018¨ · Worum geht es in der Statistik? Die Welt ist voller Variabilitat.¨ Wie geht man mit variablen Daten um? Idee der Statistik: Variabilitat](https://reader033.vdocuments.pub/reader033/viewer/2022041502/5e228e243f38553b793dfc6c/html5/thumbnails/13.jpg)
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien
Ein Beispiel
Bei einer biologischen Expeditionwurden in der Nordsee Springkrebse(Galathea intermedia) gefangenund untersucht.
Die Daten: Helgolander Tiefe Rinne, Fang vom 6.9.
Carapaxlange (mm):Nichteiertragende Weibchen (n = 215)
2,9 3,0 2,9 2,5 2,7 2,9 2,9 3,03,0 2,9 3,4 2,8 2,9 2,8 2,8 2,42,8 2,5 2,7 3,0 2,9 3,2 3,1 3,02,7 2,5 3,0 2,8 2,8 2,8 2,7 3,02,6 3,0 2,9 2,8 2,9 2,9 2,3 2,72,6 2,7 2,5 . . . . .
7/94
![Page 14: Statistik fur Informatiker, SS 2018¨ · Worum geht es in der Statistik? Die Welt ist voller Variabilitat.¨ Wie geht man mit variablen Daten um? Idee der Statistik: Variabilitat](https://reader033.vdocuments.pub/reader033/viewer/2022041502/5e228e243f38553b793dfc6c/html5/thumbnails/14.jpg)
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien
Ein Beispiel
Bei einer biologischen Expeditionwurden in der Nordsee Springkrebse(Galathea intermedia) gefangenund untersucht.
Die Daten: Helgolander Tiefe Rinne, Fang vom 6.9.
Carapaxlange (mm):Nichteiertragende Weibchen (n = 215)
2,9 3,0 2,9 2,5 2,7 2,9 2,9 3,03,0 2,9 3,4 2,8 2,9 2,8 2,8 2,42,8 2,5 2,7 3,0 2,9 3,2 3,1 3,02,7 2,5 3,0 2,8 2,8 2,8 2,7 3,02,6 3,0 2,9 2,8 2,9 2,9 2,3 2,72,6 2,7 2,5 . . . . . 7/94
![Page 15: Statistik fur Informatiker, SS 2018¨ · Worum geht es in der Statistik? Die Welt ist voller Variabilitat.¨ Wie geht man mit variablen Daten um? Idee der Statistik: Variabilitat](https://reader033.vdocuments.pub/reader033/viewer/2022041502/5e228e243f38553b793dfc6c/html5/thumbnails/15.jpg)
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien
0 50 100 150 200
2.0
2.5
3.0
Stichprobe vom 6. September, n=215
Index
Car
apax
lang
e[m
m]
8/94
![Page 16: Statistik fur Informatiker, SS 2018¨ · Worum geht es in der Statistik? Die Welt ist voller Variabilitat.¨ Wie geht man mit variablen Daten um? Idee der Statistik: Variabilitat](https://reader033.vdocuments.pub/reader033/viewer/2022041502/5e228e243f38553b793dfc6c/html5/thumbnails/16.jpg)
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien
Inhalt1 Ansatz der Statistik2 Graphische Darstellungen
Histogramme und DichtepolygoneStripchartsBoxplotsGeschummelt: Graphische Tricksereien
3 Statistische KenngroßenMedian und andere Quartile, (empirische) QuantileMittelwert und Standardabweichung
4 Beispiele zum Sinn und Unsinn von MittelwertenBeispiel: Wahlerische BachstelzenBeispiel: Spiderman & SpiderwomanBeispiel: Kupfertoleranz beim Roten Straußgras
9/94
![Page 17: Statistik fur Informatiker, SS 2018¨ · Worum geht es in der Statistik? Die Welt ist voller Variabilitat.¨ Wie geht man mit variablen Daten um? Idee der Statistik: Variabilitat](https://reader033.vdocuments.pub/reader033/viewer/2022041502/5e228e243f38553b793dfc6c/html5/thumbnails/17.jpg)
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien
Eine Moglichkeit der graphischenDarstellung:
das Histogramm
10/94
![Page 18: Statistik fur Informatiker, SS 2018¨ · Worum geht es in der Statistik? Die Welt ist voller Variabilitat.¨ Wie geht man mit variablen Daten um? Idee der Statistik: Variabilitat](https://reader033.vdocuments.pub/reader033/viewer/2022041502/5e228e243f38553b793dfc6c/html5/thumbnails/18.jpg)
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien
Histogramm der Carapaxlangen in der Stichprobe
Stichprobe vom 6. September, n=215
Carapaxlange [mm]
Anz
ahl
1.5 2.0 2.5 3.0 3.5
010
2030
4050
6070
Wieviele hatten Carapaxlange zwischen 2,0 und 2,2 mm ?
11/94
![Page 19: Statistik fur Informatiker, SS 2018¨ · Worum geht es in der Statistik? Die Welt ist voller Variabilitat.¨ Wie geht man mit variablen Daten um? Idee der Statistik: Variabilitat](https://reader033.vdocuments.pub/reader033/viewer/2022041502/5e228e243f38553b793dfc6c/html5/thumbnails/19.jpg)
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien
Histogramm der Carapaxlangen in der Stichprobe
Stichprobe vom 6. September, n=215
Carapaxlange [mm]
Anz
ahl
1.5 2.0 2.5 3.0 3.5
010
2030
4050
6070
Wieviele hatten Carapaxlange zwischen 2,0 und 2,2 mm ?11/94
![Page 20: Statistik fur Informatiker, SS 2018¨ · Worum geht es in der Statistik? Die Welt ist voller Variabilitat.¨ Wie geht man mit variablen Daten um? Idee der Statistik: Variabilitat](https://reader033.vdocuments.pub/reader033/viewer/2022041502/5e228e243f38553b793dfc6c/html5/thumbnails/20.jpg)
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien
Histogramm der Carapaxlangen in der Stichprobe
Stichprobe vom 6. September, n=215
Carapaxlange [mm]
Anz
ahl
1.5 2.0 2.5 3.0 3.5
010
2030
4050
6070
22
Wieviele hatten Carapaxlange zwischen 2,0 und 2,2 mm ?22
12/94
![Page 21: Statistik fur Informatiker, SS 2018¨ · Worum geht es in der Statistik? Die Welt ist voller Variabilitat.¨ Wie geht man mit variablen Daten um? Idee der Statistik: Variabilitat](https://reader033.vdocuments.pub/reader033/viewer/2022041502/5e228e243f38553b793dfc6c/html5/thumbnails/21.jpg)
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien
Analoge Daten zwei Monate spater(Stichprobe vom 3.11. der Große n = 57)
Stichprobe vom 3. November, n=57
Carapaxlange [mm]
Anz
ahl
1.5 2.0 2.5 3.0 3.5
05
1015
2025
13/94
![Page 22: Statistik fur Informatiker, SS 2018¨ · Worum geht es in der Statistik? Die Welt ist voller Variabilitat.¨ Wie geht man mit variablen Daten um? Idee der Statistik: Variabilitat](https://reader033.vdocuments.pub/reader033/viewer/2022041502/5e228e243f38553b793dfc6c/html5/thumbnails/22.jpg)
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien
Vergleich der beiden VerteilungenBeide Stichproben
Carapaxlange [mm]
Anz
ahl
1.5 2.0 2.5 3.0 3.5
010
2030
4050
6070
Problem: ungleiche Stichprobenumfange:6.Sept: n = 2153.Nov : n = 57
Idee: stauche vertikale Achse so, dass Gesamtflache = 1.
14/94
![Page 23: Statistik fur Informatiker, SS 2018¨ · Worum geht es in der Statistik? Die Welt ist voller Variabilitat.¨ Wie geht man mit variablen Daten um? Idee der Statistik: Variabilitat](https://reader033.vdocuments.pub/reader033/viewer/2022041502/5e228e243f38553b793dfc6c/html5/thumbnails/23.jpg)
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien
Vergleich der beiden VerteilungenBeide Stichproben
Carapaxlange [mm]
Anz
ahl
1.5 2.0 2.5 3.0 3.5
010
2030
4050
6070
Problem: ungleiche Stichprobenumfange:6.Sept: n = 2153.Nov : n = 57
Idee: stauche vertikale Achse so, dass Gesamtflache = 1.
14/94
![Page 24: Statistik fur Informatiker, SS 2018¨ · Worum geht es in der Statistik? Die Welt ist voller Variabilitat.¨ Wie geht man mit variablen Daten um? Idee der Statistik: Variabilitat](https://reader033.vdocuments.pub/reader033/viewer/2022041502/5e228e243f38553b793dfc6c/html5/thumbnails/24.jpg)
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien
Vergleich der beiden VerteilungenBeide Stichproben
Carapaxlange [mm]
Anz
ahl
1.5 2.0 2.5 3.0 3.5
010
2030
4050
6070
Problem: ungleiche Stichprobenumfange:6.Sept: n = 2153.Nov : n = 57
Idee: stauche vertikale Achse so, dass Gesamtflache = 1.14/94
![Page 25: Statistik fur Informatiker, SS 2018¨ · Worum geht es in der Statistik? Die Welt ist voller Variabilitat.¨ Wie geht man mit variablen Daten um? Idee der Statistik: Variabilitat](https://reader033.vdocuments.pub/reader033/viewer/2022041502/5e228e243f38553b793dfc6c/html5/thumbnails/25.jpg)
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien
Stichprobe vom 6. September, n=215
Carapaxlange [mm]
Dic
hte
1.5 2.0 2.5 3.0 3.5
0.0
0.5
1.0
1.5
Die Gesamtflache der Balken ist nun = 1.
Die neue vertikale Koordinate ist jetzt eine Dichte (engl.density).
15/94
![Page 26: Statistik fur Informatiker, SS 2018¨ · Worum geht es in der Statistik? Die Welt ist voller Variabilitat.¨ Wie geht man mit variablen Daten um? Idee der Statistik: Variabilitat](https://reader033.vdocuments.pub/reader033/viewer/2022041502/5e228e243f38553b793dfc6c/html5/thumbnails/26.jpg)
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien
Stichprobe vom 6. September, n=215
Carapaxlange [mm]
Dic
hte
1.5 2.0 2.5 3.0 3.5
0.0
0.5
1.0
1.5
Die Gesamtflache der Balken ist nun = 1.
Die neue vertikale Koordinate ist jetzt eine Dichte (engl.density).
15/94
![Page 27: Statistik fur Informatiker, SS 2018¨ · Worum geht es in der Statistik? Die Welt ist voller Variabilitat.¨ Wie geht man mit variablen Daten um? Idee der Statistik: Variabilitat](https://reader033.vdocuments.pub/reader033/viewer/2022041502/5e228e243f38553b793dfc6c/html5/thumbnails/27.jpg)
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien
Stichprobe vom 6. September, n=215
Carapaxlange [mm]
Dic
hte
1.5 2.0 2.5 3.0 3.5
0.0
0.5
1.0
1.5
Gesamtflache = 1. Dichte = Anteil am Ganzen pro mm.
Welcher Anteil hatte Lange zwischen 2,8 und 3,0 mm ?Etwa (3,0 − 2,8) ⋅ 0,5 = 0,1, d.h. ca. 10%
16/94
![Page 28: Statistik fur Informatiker, SS 2018¨ · Worum geht es in der Statistik? Die Welt ist voller Variabilitat.¨ Wie geht man mit variablen Daten um? Idee der Statistik: Variabilitat](https://reader033.vdocuments.pub/reader033/viewer/2022041502/5e228e243f38553b793dfc6c/html5/thumbnails/28.jpg)
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien
Stichprobe vom 6. September, n=215
Carapaxlange [mm]
Dic
hte
1.5 2.0 2.5 3.0 3.5
0.0
0.5
1.0
1.5
Gesamtflache = 1. Dichte = Anteil am Ganzen pro mm.
Welcher Anteil hatte Lange zwischen 2,8 und 3,0 mm ?
Etwa (3,0 − 2,8) ⋅ 0,5 = 0,1, d.h. ca. 10%
16/94
![Page 29: Statistik fur Informatiker, SS 2018¨ · Worum geht es in der Statistik? Die Welt ist voller Variabilitat.¨ Wie geht man mit variablen Daten um? Idee der Statistik: Variabilitat](https://reader033.vdocuments.pub/reader033/viewer/2022041502/5e228e243f38553b793dfc6c/html5/thumbnails/29.jpg)
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien
Stichprobe vom 6. September, n=215
Carapaxlange [mm]
Dic
hte
1.5 2.0 2.5 3.0 3.5
0.0
0.5
1.0
1.5
Gesamtflache = 1. Dichte = Anteil am Ganzen pro mm.
Welcher Anteil hatte Lange zwischen 2,8 und 3,0 mm ?Etwa (3,0 − 2,8) ⋅ 0,5 = 0,1, d.h. ca. 10%
16/94
![Page 30: Statistik fur Informatiker, SS 2018¨ · Worum geht es in der Statistik? Die Welt ist voller Variabilitat.¨ Wie geht man mit variablen Daten um? Idee der Statistik: Variabilitat](https://reader033.vdocuments.pub/reader033/viewer/2022041502/5e228e243f38553b793dfc6c/html5/thumbnails/30.jpg)
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien
Die beiden Histogramme sind jetztvergleichbar
(sie haben dieselbe Gesamtflache).
17/94
![Page 31: Statistik fur Informatiker, SS 2018¨ · Worum geht es in der Statistik? Die Welt ist voller Variabilitat.¨ Wie geht man mit variablen Daten um? Idee der Statistik: Variabilitat](https://reader033.vdocuments.pub/reader033/viewer/2022041502/5e228e243f38553b793dfc6c/html5/thumbnails/31.jpg)
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien
Die beiden Histogramme sind jetztvergleichbar
(sie haben dieselbe Gesamtflache).
17/94
![Page 32: Statistik fur Informatiker, SS 2018¨ · Worum geht es in der Statistik? Die Welt ist voller Variabilitat.¨ Wie geht man mit variablen Daten um? Idee der Statistik: Variabilitat](https://reader033.vdocuments.pub/reader033/viewer/2022041502/5e228e243f38553b793dfc6c/html5/thumbnails/32.jpg)
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien
Versuche, die Histogramme zusammen zuzeigen:
Beide Stichproben
Carapaxlange [mm]
Dic
hte
1.5 2.0 2.5 3.0 3.5
0.0
0.5
1.0
1.5
2.0
2.5
18/94
![Page 33: Statistik fur Informatiker, SS 2018¨ · Worum geht es in der Statistik? Die Welt ist voller Variabilitat.¨ Wie geht man mit variablen Daten um? Idee der Statistik: Variabilitat](https://reader033.vdocuments.pub/reader033/viewer/2022041502/5e228e243f38553b793dfc6c/html5/thumbnails/33.jpg)
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien
Versuche, die Histogramme zusammen zuzeigen:
Beide Stichproben
Carapaxlange [mm]
Dic
hte
1.5 2.0 2.5 3.0 3.5
0.0
0.5
1.0
1.5
2.0
2.5
19/94
![Page 34: Statistik fur Informatiker, SS 2018¨ · Worum geht es in der Statistik? Die Welt ist voller Variabilitat.¨ Wie geht man mit variablen Daten um? Idee der Statistik: Variabilitat](https://reader033.vdocuments.pub/reader033/viewer/2022041502/5e228e243f38553b793dfc6c/html5/thumbnails/34.jpg)
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien
Versuche, die Histogramme zusammen zuzeigen:
1.5 1.7 1.9 2.1 2.3 2.5 2.7 2.9 3.1 3.3 3.5 3.7
Beide Stichproben0.
00.
51.
01.
52.
0
20/94
![Page 35: Statistik fur Informatiker, SS 2018¨ · Worum geht es in der Statistik? Die Welt ist voller Variabilitat.¨ Wie geht man mit variablen Daten um? Idee der Statistik: Variabilitat](https://reader033.vdocuments.pub/reader033/viewer/2022041502/5e228e243f38553b793dfc6c/html5/thumbnails/35.jpg)
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien
Versuche, die Histogramme zusammen zuzeigen:
Beide Stichproben
1.3 1.5 1.7 1.9 2.1 2.3 2.5 2.7 2.9 3.1 3.3 3.5 3.7 3.90
0.2
0.4
0.6
0.8
1
1.2
1.4
1.6
1.8
2
Sept
Nov
21/94
![Page 36: Statistik fur Informatiker, SS 2018¨ · Worum geht es in der Statistik? Die Welt ist voller Variabilitat.¨ Wie geht man mit variablen Daten um? Idee der Statistik: Variabilitat](https://reader033.vdocuments.pub/reader033/viewer/2022041502/5e228e243f38553b793dfc6c/html5/thumbnails/36.jpg)
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien
Vorschlag
Total abgefahrene 3D-Plots konnen in der Werbung nutzlich sein
,
fur die Wissenschaft sind einfache und klare2D-Darstellungen meistens angemessener.
22/94
![Page 37: Statistik fur Informatiker, SS 2018¨ · Worum geht es in der Statistik? Die Welt ist voller Variabilitat.¨ Wie geht man mit variablen Daten um? Idee der Statistik: Variabilitat](https://reader033.vdocuments.pub/reader033/viewer/2022041502/5e228e243f38553b793dfc6c/html5/thumbnails/37.jpg)
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien
Vorschlag
Total abgefahrene 3D-Plots konnen in der Werbung nutzlich sein,
fur die Wissenschaft sind einfache und klare2D-Darstellungen meistens angemessener.
22/94
![Page 38: Statistik fur Informatiker, SS 2018¨ · Worum geht es in der Statistik? Die Welt ist voller Variabilitat.¨ Wie geht man mit variablen Daten um? Idee der Statistik: Variabilitat](https://reader033.vdocuments.pub/reader033/viewer/2022041502/5e228e243f38553b793dfc6c/html5/thumbnails/38.jpg)
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien
Problem
Histogramme kann man nicht ohneweiteres
in demselben Graphendarstellen,
weil sie einanderuberdecken wurden.
23/94
![Page 39: Statistik fur Informatiker, SS 2018¨ · Worum geht es in der Statistik? Die Welt ist voller Variabilitat.¨ Wie geht man mit variablen Daten um? Idee der Statistik: Variabilitat](https://reader033.vdocuments.pub/reader033/viewer/2022041502/5e228e243f38553b793dfc6c/html5/thumbnails/39.jpg)
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien
Problem
Histogramme kann man nicht ohneweiteres
in demselben Graphendarstellen,
weil sie einanderuberdecken wurden.
23/94
![Page 40: Statistik fur Informatiker, SS 2018¨ · Worum geht es in der Statistik? Die Welt ist voller Variabilitat.¨ Wie geht man mit variablen Daten um? Idee der Statistik: Variabilitat](https://reader033.vdocuments.pub/reader033/viewer/2022041502/5e228e243f38553b793dfc6c/html5/thumbnails/40.jpg)
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien
Einfache und klare Losung: Dichtepolygone
Stichprobe vom 6. September, n=215
Carapaxlange [mm]
Dic
hte
1.5 2.0 2.5 3.0 3.5
0.0
0.5
1.0
1.5
24/94
![Page 41: Statistik fur Informatiker, SS 2018¨ · Worum geht es in der Statistik? Die Welt ist voller Variabilitat.¨ Wie geht man mit variablen Daten um? Idee der Statistik: Variabilitat](https://reader033.vdocuments.pub/reader033/viewer/2022041502/5e228e243f38553b793dfc6c/html5/thumbnails/41.jpg)
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien
Einfache und klare Losung: Dichtepolygone
Stichprobe vom 6. September, n=215
Carapaxlange [mm]
Dic
hte
1.5 2.0 2.5 3.0 3.5
0.0
0.5
1.0
1.5
25/94
![Page 42: Statistik fur Informatiker, SS 2018¨ · Worum geht es in der Statistik? Die Welt ist voller Variabilitat.¨ Wie geht man mit variablen Daten um? Idee der Statistik: Variabilitat](https://reader033.vdocuments.pub/reader033/viewer/2022041502/5e228e243f38553b793dfc6c/html5/thumbnails/42.jpg)
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien
Einfache und klare Losung: Dichtepolygone
Stichprobe vom 3. November, n=57
Carapaxlange [mm]
Anz
ahl
1.5 2.0 2.5 3.0 3.5
0.0
0.5
1.0
1.5
2.0
26/94
![Page 43: Statistik fur Informatiker, SS 2018¨ · Worum geht es in der Statistik? Die Welt ist voller Variabilitat.¨ Wie geht man mit variablen Daten um? Idee der Statistik: Variabilitat](https://reader033.vdocuments.pub/reader033/viewer/2022041502/5e228e243f38553b793dfc6c/html5/thumbnails/43.jpg)
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien
Zwei (oder mehr) Dichtepolygone in einem Plot
1.5 2.0 2.5 3.0 3.5 4.0
0.0
0.5
1.0
1.5
2.0
2.5
Beide Stichproben
Carapaxlange [mm]
Dic
hte
SeptNov
Man sieht sofort:Die Verteilung in der Stichprobe vom November ist gegenuberder vom September nach links verschoben (und sie ist auchstarker um den haufigsten Wert konzentriert).
27/94
![Page 44: Statistik fur Informatiker, SS 2018¨ · Worum geht es in der Statistik? Die Welt ist voller Variabilitat.¨ Wie geht man mit variablen Daten um? Idee der Statistik: Variabilitat](https://reader033.vdocuments.pub/reader033/viewer/2022041502/5e228e243f38553b793dfc6c/html5/thumbnails/44.jpg)
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien
Zwei (oder mehr) Dichtepolygone in einem Plot
1.5 2.0 2.5 3.0 3.5 4.0
0.0
0.5
1.0
1.5
2.0
2.5
Beide Stichproben
Carapaxlange [mm]
Dic
hte
SeptNov
Man sieht sofort:Die Verteilung in der Stichprobe vom November ist gegenuberder vom September nach links verschoben (und sie ist auchstarker um den haufigsten Wert konzentriert).
27/94
![Page 45: Statistik fur Informatiker, SS 2018¨ · Worum geht es in der Statistik? Die Welt ist voller Variabilitat.¨ Wie geht man mit variablen Daten um? Idee der Statistik: Variabilitat](https://reader033.vdocuments.pub/reader033/viewer/2022041502/5e228e243f38553b793dfc6c/html5/thumbnails/45.jpg)
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien
Anzahl vs. DichteA
nzah
l
0 1 2 3 4 5 6 7
02
46
8
Anz
ahl
0 1 2 3 4 5 6 7
04
8
Dic
hte
0 1 2 3 4 5 6 7
0.0
0.2
0.4
Also:
Bei HistogrammenmitungleichmaßigerUnterteilungimmer Dichtenverwenden!
28/94
![Page 46: Statistik fur Informatiker, SS 2018¨ · Worum geht es in der Statistik? Die Welt ist voller Variabilitat.¨ Wie geht man mit variablen Daten um? Idee der Statistik: Variabilitat](https://reader033.vdocuments.pub/reader033/viewer/2022041502/5e228e243f38553b793dfc6c/html5/thumbnails/46.jpg)
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien
Anzahl vs. DichteA
nzah
l
0 1 2 3 4 5 6 7
02
46
8
Anz
ahl
0 1 2 3 4 5 6 7
04
8
Dic
hte
0 1 2 3 4 5 6 7
0.0
0.2
0.4
Also:
Bei HistogrammenmitungleichmaßigerUnterteilungimmer Dichtenverwenden!
28/94
![Page 47: Statistik fur Informatiker, SS 2018¨ · Worum geht es in der Statistik? Die Welt ist voller Variabilitat.¨ Wie geht man mit variablen Daten um? Idee der Statistik: Variabilitat](https://reader033.vdocuments.pub/reader033/viewer/2022041502/5e228e243f38553b793dfc6c/html5/thumbnails/47.jpg)
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien
Anzahl vs. DichteA
nzah
l
0 1 2 3 4 5 6 7
02
46
8
Anz
ahl
0 1 2 3 4 5 6 7
04
8
Dic
hte
0 1 2 3 4 5 6 7
0.0
0.2
0.4
Also:
Bei HistogrammenmitungleichmaßigerUnterteilungimmer Dichtenverwenden!
28/94
![Page 48: Statistik fur Informatiker, SS 2018¨ · Worum geht es in der Statistik? Die Welt ist voller Variabilitat.¨ Wie geht man mit variablen Daten um? Idee der Statistik: Variabilitat](https://reader033.vdocuments.pub/reader033/viewer/2022041502/5e228e243f38553b793dfc6c/html5/thumbnails/48.jpg)
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien
Anzahl vs. DichteA
nzah
l
0 1 2 3 4 5 6 7
02
46
8
Anz
ahl
0 1 2 3 4 5 6 7
04
8
Dic
hte
0 1 2 3 4 5 6 7
0.0
0.2
0.4
Also:
Bei HistogrammenmitungleichmaßigerUnterteilungimmer Dichtenverwenden!
28/94
![Page 49: Statistik fur Informatiker, SS 2018¨ · Worum geht es in der Statistik? Die Welt ist voller Variabilitat.¨ Wie geht man mit variablen Daten um? Idee der Statistik: Variabilitat](https://reader033.vdocuments.pub/reader033/viewer/2022041502/5e228e243f38553b793dfc6c/html5/thumbnails/49.jpg)
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien
Inhalt1 Ansatz der Statistik2 Graphische Darstellungen
Histogramme und DichtepolygoneStripchartsBoxplotsGeschummelt: Graphische Tricksereien
3 Statistische KenngroßenMedian und andere Quartile, (empirische) QuantileMittelwert und Standardabweichung
4 Beispiele zum Sinn und Unsinn von MittelwertenBeispiel: Wahlerische BachstelzenBeispiel: Spiderman & SpiderwomanBeispiel: Kupfertoleranz beim Roten Straußgras
29/94
![Page 50: Statistik fur Informatiker, SS 2018¨ · Worum geht es in der Statistik? Die Welt ist voller Variabilitat.¨ Wie geht man mit variablen Daten um? Idee der Statistik: Variabilitat](https://reader033.vdocuments.pub/reader033/viewer/2022041502/5e228e243f38553b793dfc6c/html5/thumbnails/50.jpg)
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien
Stripchart, einfach
Carapaxlangen in den beiden Stichproben
1.5 2.0 2.5 3.0 3.5
Sep
tN
ov
30/94
![Page 51: Statistik fur Informatiker, SS 2018¨ · Worum geht es in der Statistik? Die Welt ist voller Variabilitat.¨ Wie geht man mit variablen Daten um? Idee der Statistik: Variabilitat](https://reader033.vdocuments.pub/reader033/viewer/2022041502/5e228e243f38553b793dfc6c/html5/thumbnails/51.jpg)
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien
Stripchart, mit “jitter”
Carapaxlangen in den beiden Stichproben
1.5 2.0 2.5 3.0 3.5
Sep
tN
ov
31/94
![Page 52: Statistik fur Informatiker, SS 2018¨ · Worum geht es in der Statistik? Die Welt ist voller Variabilitat.¨ Wie geht man mit variablen Daten um? Idee der Statistik: Variabilitat](https://reader033.vdocuments.pub/reader033/viewer/2022041502/5e228e243f38553b793dfc6c/html5/thumbnails/52.jpg)
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien
Stripchart, mit “stacking”
Carapaxlangen in den beiden Stichproben
1.5 2.0 2.5 3.0 3.5
Sep
tN
ov
32/94
![Page 53: Statistik fur Informatiker, SS 2018¨ · Worum geht es in der Statistik? Die Welt ist voller Variabilitat.¨ Wie geht man mit variablen Daten um? Idee der Statistik: Variabilitat](https://reader033.vdocuments.pub/reader033/viewer/2022041502/5e228e243f38553b793dfc6c/html5/thumbnails/53.jpg)
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien
Histogramme/Dichtepolygone undStripcharts
gebenein ausfuhrliches Bildeines Datensatzes.
Manchmal zu ausfuhrlich.
33/94
![Page 54: Statistik fur Informatiker, SS 2018¨ · Worum geht es in der Statistik? Die Welt ist voller Variabilitat.¨ Wie geht man mit variablen Daten um? Idee der Statistik: Variabilitat](https://reader033.vdocuments.pub/reader033/viewer/2022041502/5e228e243f38553b793dfc6c/html5/thumbnails/54.jpg)
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien
Histogramme/Dichtepolygone undStripcharts
gebenein ausfuhrliches Bildeines Datensatzes.
Manchmal zu ausfuhrlich.
33/94
![Page 55: Statistik fur Informatiker, SS 2018¨ · Worum geht es in der Statistik? Die Welt ist voller Variabilitat.¨ Wie geht man mit variablen Daten um? Idee der Statistik: Variabilitat](https://reader033.vdocuments.pub/reader033/viewer/2022041502/5e228e243f38553b793dfc6c/html5/thumbnails/55.jpg)
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien
Inhalt1 Ansatz der Statistik2 Graphische Darstellungen
Histogramme und DichtepolygoneStripchartsBoxplotsGeschummelt: Graphische Tricksereien
3 Statistische KenngroßenMedian und andere Quartile, (empirische) QuantileMittelwert und Standardabweichung
4 Beispiele zum Sinn und Unsinn von MittelwertenBeispiel: Wahlerische BachstelzenBeispiel: Spiderman & SpiderwomanBeispiel: Kupfertoleranz beim Roten Straußgras
34/94
![Page 56: Statistik fur Informatiker, SS 2018¨ · Worum geht es in der Statistik? Die Welt ist voller Variabilitat.¨ Wie geht man mit variablen Daten um? Idee der Statistik: Variabilitat](https://reader033.vdocuments.pub/reader033/viewer/2022041502/5e228e243f38553b793dfc6c/html5/thumbnails/56.jpg)
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien
Zu viel Information erschwert den Uberblick
Baum Baum Baum Baum Baum Baum Baum Baum Baum Baum Baum Baum Baum
Wald?
35/94
![Page 57: Statistik fur Informatiker, SS 2018¨ · Worum geht es in der Statistik? Die Welt ist voller Variabilitat.¨ Wie geht man mit variablen Daten um? Idee der Statistik: Variabilitat](https://reader033.vdocuments.pub/reader033/viewer/2022041502/5e228e243f38553b793dfc6c/html5/thumbnails/57.jpg)
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien
Zu viel Information erschwert den Uberblick
Baum Baum Baum Baum Baum Baum Baum Baum Baum Baum Baum Baum Baum
Wald?
35/94
![Page 58: Statistik fur Informatiker, SS 2018¨ · Worum geht es in der Statistik? Die Welt ist voller Variabilitat.¨ Wie geht man mit variablen Daten um? Idee der Statistik: Variabilitat](https://reader033.vdocuments.pub/reader033/viewer/2022041502/5e228e243f38553b793dfc6c/html5/thumbnails/58.jpg)
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien
Boxplot, einfache Ausfuhrung
0 2 4 6
x
0 2 4 6
36/94
![Page 59: Statistik fur Informatiker, SS 2018¨ · Worum geht es in der Statistik? Die Welt ist voller Variabilitat.¨ Wie geht man mit variablen Daten um? Idee der Statistik: Variabilitat](https://reader033.vdocuments.pub/reader033/viewer/2022041502/5e228e243f38553b793dfc6c/html5/thumbnails/59.jpg)
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien
Boxplot, einfache Ausfuhrung
0 2 4 6
x
0 2 4 6
25% 25% 25% 25%
36/94
![Page 60: Statistik fur Informatiker, SS 2018¨ · Worum geht es in der Statistik? Die Welt ist voller Variabilitat.¨ Wie geht man mit variablen Daten um? Idee der Statistik: Variabilitat](https://reader033.vdocuments.pub/reader033/viewer/2022041502/5e228e243f38553b793dfc6c/html5/thumbnails/60.jpg)
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien
Boxplot, einfache Ausfuhrung
0 2 4 6
x
0 2 4 6
25% 25% 25% 25%
Min Max1. Quartil 3. QuartilMedian
36/94
![Page 61: Statistik fur Informatiker, SS 2018¨ · Worum geht es in der Statistik? Die Welt ist voller Variabilitat.¨ Wie geht man mit variablen Daten um? Idee der Statistik: Variabilitat](https://reader033.vdocuments.pub/reader033/viewer/2022041502/5e228e243f38553b793dfc6c/html5/thumbnails/61.jpg)
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien
Boxplot, Standard-Ausfuhrung
0 2 4 6
x
0 2 4 6
37/94
![Page 62: Statistik fur Informatiker, SS 2018¨ · Worum geht es in der Statistik? Die Welt ist voller Variabilitat.¨ Wie geht man mit variablen Daten um? Idee der Statistik: Variabilitat](https://reader033.vdocuments.pub/reader033/viewer/2022041502/5e228e243f38553b793dfc6c/html5/thumbnails/62.jpg)
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien
Boxplot, Standard-Ausfuhrung
0 2 4 6
x
0 2 4 6
Interquartilbereich (IQR)
1.5 × IQR 1.5 × IQR
37/94
![Page 63: Statistik fur Informatiker, SS 2018¨ · Worum geht es in der Statistik? Die Welt ist voller Variabilitat.¨ Wie geht man mit variablen Daten um? Idee der Statistik: Variabilitat](https://reader033.vdocuments.pub/reader033/viewer/2022041502/5e228e243f38553b793dfc6c/html5/thumbnails/63.jpg)
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien
Boxplot, Profi-Ausfuhrung
0 2 4 6
x
0 2 4 6
38/94
![Page 64: Statistik fur Informatiker, SS 2018¨ · Worum geht es in der Statistik? Die Welt ist voller Variabilitat.¨ Wie geht man mit variablen Daten um? Idee der Statistik: Variabilitat](https://reader033.vdocuments.pub/reader033/viewer/2022041502/5e228e243f38553b793dfc6c/html5/thumbnails/64.jpg)
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien
Boxplot, Profi-Ausfuhrung
0 2 4 6
x
0 2 4 6
95%-Konfidenzintervall fur den Median
38/94
![Page 65: Statistik fur Informatiker, SS 2018¨ · Worum geht es in der Statistik? Die Welt ist voller Variabilitat.¨ Wie geht man mit variablen Daten um? Idee der Statistik: Variabilitat](https://reader033.vdocuments.pub/reader033/viewer/2022041502/5e228e243f38553b793dfc6c/html5/thumbnails/65.jpg)
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien
Beispiel:Vergleich von mehreren Gruppen
39/94
![Page 66: Statistik fur Informatiker, SS 2018¨ · Worum geht es in der Statistik? Die Welt ist voller Variabilitat.¨ Wie geht man mit variablen Daten um? Idee der Statistik: Variabilitat](https://reader033.vdocuments.pub/reader033/viewer/2022041502/5e228e243f38553b793dfc6c/html5/thumbnails/66.jpg)
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien
Dic
hte
8 10 12 14
0.00
Dic
hte
8 10 12 14
0.00
Dic
hte
8 10 12 14
0.0
Dic
hte
8 10 12 14
0.0
40/94
![Page 67: Statistik fur Informatiker, SS 2018¨ · Worum geht es in der Statistik? Die Welt ist voller Variabilitat.¨ Wie geht man mit variablen Daten um? Idee der Statistik: Variabilitat](https://reader033.vdocuments.pub/reader033/viewer/2022041502/5e228e243f38553b793dfc6c/html5/thumbnails/67.jpg)
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien
12
34
8 10 12 14
40/94
![Page 68: Statistik fur Informatiker, SS 2018¨ · Worum geht es in der Statistik? Die Welt ist voller Variabilitat.¨ Wie geht man mit variablen Daten um? Idee der Statistik: Variabilitat](https://reader033.vdocuments.pub/reader033/viewer/2022041502/5e228e243f38553b793dfc6c/html5/thumbnails/68.jpg)
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien
Inhalt1 Ansatz der Statistik2 Graphische Darstellungen
Histogramme und DichtepolygoneStripchartsBoxplotsGeschummelt: Graphische Tricksereien
3 Statistische KenngroßenMedian und andere Quartile, (empirische) QuantileMittelwert und Standardabweichung
4 Beispiele zum Sinn und Unsinn von MittelwertenBeispiel: Wahlerische BachstelzenBeispiel: Spiderman & SpiderwomanBeispiel: Kupfertoleranz beim Roten Straußgras
41/94
![Page 69: Statistik fur Informatiker, SS 2018¨ · Worum geht es in der Statistik? Die Welt ist voller Variabilitat.¨ Wie geht man mit variablen Daten um? Idee der Statistik: Variabilitat](https://reader033.vdocuments.pub/reader033/viewer/2022041502/5e228e243f38553b793dfc6c/html5/thumbnails/69.jpg)
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien
Graphische Tricksereien
im Bereich der deskriptiven Statistik / der Kommunikationvon numerischen Beobachtungen oder Resultaten:
(Graphische) Tricksereien / ”Aufhubschen“ vonBeobachtungen, z.B.
Irrefuhrende Wahl des NullpunktsStillschweigende nicht-lineare Transformationen derAchsenoptische Tauschung durch unpassende2d/3d-Grafiken...
konnen den Betrachter (manchmal absichtlich) in die Irrefuhren.
42/94
![Page 70: Statistik fur Informatiker, SS 2018¨ · Worum geht es in der Statistik? Die Welt ist voller Variabilitat.¨ Wie geht man mit variablen Daten um? Idee der Statistik: Variabilitat](https://reader033.vdocuments.pub/reader033/viewer/2022041502/5e228e243f38553b793dfc6c/html5/thumbnails/70.jpg)
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien
Beunruhigend große Fluktuationen beimDornfelder?
Hektarertrage Dornfelder, 1994–2013 (in hl)
1995 2000 2005 2010
110
120
130
140
150
160
170
Jahr
Hek
tare
rtra
g
Daten: Statistisches Landesamt RLP
43/94
![Page 71: Statistik fur Informatiker, SS 2018¨ · Worum geht es in der Statistik? Die Welt ist voller Variabilitat.¨ Wie geht man mit variablen Daten um? Idee der Statistik: Variabilitat](https://reader033.vdocuments.pub/reader033/viewer/2022041502/5e228e243f38553b793dfc6c/html5/thumbnails/71.jpg)
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien
Beunruhigend große Fluktuationen beimDornfelder?
Hektarertrage Dornfelder, 1994–2013 (in hl)
1995 2000 2005 2010
050
100
150
Jahr
Hek
tare
rtra
g
Daten: Statistisches Landesamt RLP
44/94
![Page 72: Statistik fur Informatiker, SS 2018¨ · Worum geht es in der Statistik? Die Welt ist voller Variabilitat.¨ Wie geht man mit variablen Daten um? Idee der Statistik: Variabilitat](https://reader033.vdocuments.pub/reader033/viewer/2022041502/5e228e243f38553b793dfc6c/html5/thumbnails/72.jpg)
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien
Rotwein in RLP: nur ein Tropfchen?
Bestockte Weinflachen in RLP 2013
Rotwein: 8881 ha Weißwein: 14686 ha
Daten: Statistisches Landesamt RLP; Bilder (c) Benutzer Andre Karwath
45/94
![Page 73: Statistik fur Informatiker, SS 2018¨ · Worum geht es in der Statistik? Die Welt ist voller Variabilitat.¨ Wie geht man mit variablen Daten um? Idee der Statistik: Variabilitat](https://reader033.vdocuments.pub/reader033/viewer/2022041502/5e228e243f38553b793dfc6c/html5/thumbnails/73.jpg)
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien
Rotwein in RLP: nur ein Tropfchen?Bestockte Weinflachen in RLP 2013
020
0040
0060
0080
0010
000
1200
014
000
Rotwein: 8881 ha Weißwein: 14686 ha
Daten: Statistisches Landesamt RLP46/94
![Page 74: Statistik fur Informatiker, SS 2018¨ · Worum geht es in der Statistik? Die Welt ist voller Variabilitat.¨ Wie geht man mit variablen Daten um? Idee der Statistik: Variabilitat](https://reader033.vdocuments.pub/reader033/viewer/2022041502/5e228e243f38553b793dfc6c/html5/thumbnails/74.jpg)
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien
Fazit
1 Histogramme erlauben einen detailierten Blick auf dieDaten
2 Dichtepolygone erlauben Vergleiche zwischen vielenVerteilungen
3 Boxplot konnen große Datenmengen vereinfachtzusammenfassen
4 Bei kleinen Datenmengen eher Stripchartsangemessen
5 Vorsicht mit Tricks wie 3D oder halbtransparentenFarben
47/94
![Page 75: Statistik fur Informatiker, SS 2018¨ · Worum geht es in der Statistik? Die Welt ist voller Variabilitat.¨ Wie geht man mit variablen Daten um? Idee der Statistik: Variabilitat](https://reader033.vdocuments.pub/reader033/viewer/2022041502/5e228e243f38553b793dfc6c/html5/thumbnails/75.jpg)
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien
Fazit
1 Histogramme erlauben einen detailierten Blick auf dieDaten
2 Dichtepolygone erlauben Vergleiche zwischen vielenVerteilungen
3 Boxplot konnen große Datenmengen vereinfachtzusammenfassen
4 Bei kleinen Datenmengen eher Stripchartsangemessen
5 Vorsicht mit Tricks wie 3D oder halbtransparentenFarben
47/94
![Page 76: Statistik fur Informatiker, SS 2018¨ · Worum geht es in der Statistik? Die Welt ist voller Variabilitat.¨ Wie geht man mit variablen Daten um? Idee der Statistik: Variabilitat](https://reader033.vdocuments.pub/reader033/viewer/2022041502/5e228e243f38553b793dfc6c/html5/thumbnails/76.jpg)
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien
Fazit
1 Histogramme erlauben einen detailierten Blick auf dieDaten
2 Dichtepolygone erlauben Vergleiche zwischen vielenVerteilungen
3 Boxplot konnen große Datenmengen vereinfachtzusammenfassen
4 Bei kleinen Datenmengen eher Stripchartsangemessen
5 Vorsicht mit Tricks wie 3D oder halbtransparentenFarben
47/94
![Page 77: Statistik fur Informatiker, SS 2018¨ · Worum geht es in der Statistik? Die Welt ist voller Variabilitat.¨ Wie geht man mit variablen Daten um? Idee der Statistik: Variabilitat](https://reader033.vdocuments.pub/reader033/viewer/2022041502/5e228e243f38553b793dfc6c/html5/thumbnails/77.jpg)
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien
Fazit
1 Histogramme erlauben einen detailierten Blick auf dieDaten
2 Dichtepolygone erlauben Vergleiche zwischen vielenVerteilungen
3 Boxplot konnen große Datenmengen vereinfachtzusammenfassen
4 Bei kleinen Datenmengen eher Stripchartsangemessen
5 Vorsicht mit Tricks wie 3D oder halbtransparentenFarben
47/94
![Page 78: Statistik fur Informatiker, SS 2018¨ · Worum geht es in der Statistik? Die Welt ist voller Variabilitat.¨ Wie geht man mit variablen Daten um? Idee der Statistik: Variabilitat](https://reader033.vdocuments.pub/reader033/viewer/2022041502/5e228e243f38553b793dfc6c/html5/thumbnails/78.jpg)
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien
Fazit
1 Histogramme erlauben einen detailierten Blick auf dieDaten
2 Dichtepolygone erlauben Vergleiche zwischen vielenVerteilungen
3 Boxplot konnen große Datenmengen vereinfachtzusammenfassen
4 Bei kleinen Datenmengen eher Stripchartsangemessen
5 Vorsicht mit Tricks wie 3D oder halbtransparentenFarben
47/94
![Page 79: Statistik fur Informatiker, SS 2018¨ · Worum geht es in der Statistik? Die Welt ist voller Variabilitat.¨ Wie geht man mit variablen Daten um? Idee der Statistik: Variabilitat](https://reader033.vdocuments.pub/reader033/viewer/2022041502/5e228e243f38553b793dfc6c/html5/thumbnails/79.jpg)
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenMedian und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung
Inhalt1 Ansatz der Statistik2 Graphische Darstellungen
Histogramme und DichtepolygoneStripchartsBoxplotsGeschummelt: Graphische Tricksereien
3 Statistische KenngroßenMedian und andere Quartile, (empirische) QuantileMittelwert und Standardabweichung
4 Beispiele zum Sinn und Unsinn von MittelwertenBeispiel: Wahlerische BachstelzenBeispiel: Spiderman & SpiderwomanBeispiel: Kupfertoleranz beim Roten Straußgras
48/94
![Page 80: Statistik fur Informatiker, SS 2018¨ · Worum geht es in der Statistik? Die Welt ist voller Variabilitat.¨ Wie geht man mit variablen Daten um? Idee der Statistik: Variabilitat](https://reader033.vdocuments.pub/reader033/viewer/2022041502/5e228e243f38553b793dfc6c/html5/thumbnails/80.jpg)
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenMedian und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung
Es ist oft moglich,das Wesentliche
an einer Stichprobe
mit ein paar Zahlenzusammenzufassen.
49/94
![Page 81: Statistik fur Informatiker, SS 2018¨ · Worum geht es in der Statistik? Die Welt ist voller Variabilitat.¨ Wie geht man mit variablen Daten um? Idee der Statistik: Variabilitat](https://reader033.vdocuments.pub/reader033/viewer/2022041502/5e228e243f38553b793dfc6c/html5/thumbnails/81.jpg)
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenMedian und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung
Wesentlich:
1. Wie groß?
Lageparameter
2. Wie variabel?
Streuungsparameter
50/94
![Page 82: Statistik fur Informatiker, SS 2018¨ · Worum geht es in der Statistik? Die Welt ist voller Variabilitat.¨ Wie geht man mit variablen Daten um? Idee der Statistik: Variabilitat](https://reader033.vdocuments.pub/reader033/viewer/2022041502/5e228e243f38553b793dfc6c/html5/thumbnails/82.jpg)
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenMedian und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung
Wesentlich:
1. Wie groß?
Lageparameter
2. Wie variabel?
Streuungsparameter
50/94
![Page 83: Statistik fur Informatiker, SS 2018¨ · Worum geht es in der Statistik? Die Welt ist voller Variabilitat.¨ Wie geht man mit variablen Daten um? Idee der Statistik: Variabilitat](https://reader033.vdocuments.pub/reader033/viewer/2022041502/5e228e243f38553b793dfc6c/html5/thumbnails/83.jpg)
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenMedian und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung
Wesentlich:
1. Wie groß?
Lageparameter
2. Wie variabel?
Streuungsparameter
50/94
![Page 84: Statistik fur Informatiker, SS 2018¨ · Worum geht es in der Statistik? Die Welt ist voller Variabilitat.¨ Wie geht man mit variablen Daten um? Idee der Statistik: Variabilitat](https://reader033.vdocuments.pub/reader033/viewer/2022041502/5e228e243f38553b793dfc6c/html5/thumbnails/84.jpg)
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenMedian und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung
Inhalt1 Ansatz der Statistik2 Graphische Darstellungen
Histogramme und DichtepolygoneStripchartsBoxplotsGeschummelt: Graphische Tricksereien
3 Statistische KenngroßenMedian und andere Quartile, (empirische) QuantileMittelwert und Standardabweichung
4 Beispiele zum Sinn und Unsinn von MittelwertenBeispiel: Wahlerische BachstelzenBeispiel: Spiderman & SpiderwomanBeispiel: Kupfertoleranz beim Roten Straußgras
51/94
![Page 85: Statistik fur Informatiker, SS 2018¨ · Worum geht es in der Statistik? Die Welt ist voller Variabilitat.¨ Wie geht man mit variablen Daten um? Idee der Statistik: Variabilitat](https://reader033.vdocuments.pub/reader033/viewer/2022041502/5e228e243f38553b793dfc6c/html5/thumbnails/85.jpg)
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenMedian und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung
Eine Moglichkeitkennen wir schonaus dem Boxplot:
52/94
![Page 86: Statistik fur Informatiker, SS 2018¨ · Worum geht es in der Statistik? Die Welt ist voller Variabilitat.¨ Wie geht man mit variablen Daten um? Idee der Statistik: Variabilitat](https://reader033.vdocuments.pub/reader033/viewer/2022041502/5e228e243f38553b793dfc6c/html5/thumbnails/86.jpg)
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenMedian und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung
Lageparameter
Der Median
Streuungsparameter
Der Quartilabstand (Q3 −Q1)
53/94
![Page 87: Statistik fur Informatiker, SS 2018¨ · Worum geht es in der Statistik? Die Welt ist voller Variabilitat.¨ Wie geht man mit variablen Daten um? Idee der Statistik: Variabilitat](https://reader033.vdocuments.pub/reader033/viewer/2022041502/5e228e243f38553b793dfc6c/html5/thumbnails/87.jpg)
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenMedian und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung
Lageparameter
Der Median
Streuungsparameter
Der Quartilabstand (Q3 −Q1)
53/94
![Page 88: Statistik fur Informatiker, SS 2018¨ · Worum geht es in der Statistik? Die Welt ist voller Variabilitat.¨ Wie geht man mit variablen Daten um? Idee der Statistik: Variabilitat](https://reader033.vdocuments.pub/reader033/viewer/2022041502/5e228e243f38553b793dfc6c/html5/thumbnails/88.jpg)
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenMedian und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung
Lageparameter
Der Median
Streuungsparameter
Der Quartilabstand (Q3 −Q1)
53/94
![Page 89: Statistik fur Informatiker, SS 2018¨ · Worum geht es in der Statistik? Die Welt ist voller Variabilitat.¨ Wie geht man mit variablen Daten um? Idee der Statistik: Variabilitat](https://reader033.vdocuments.pub/reader033/viewer/2022041502/5e228e243f38553b793dfc6c/html5/thumbnails/89.jpg)
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenMedian und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung
Der Median1:die Halfte der Beobachtungen sind
kleiner,die Halfte sind großer.
Der Median istdas 50%-Quantil
der Daten.
1”saloppe“ Definition (wir sehen gleich die prazise Definition)
54/94
![Page 90: Statistik fur Informatiker, SS 2018¨ · Worum geht es in der Statistik? Die Welt ist voller Variabilitat.¨ Wie geht man mit variablen Daten um? Idee der Statistik: Variabilitat](https://reader033.vdocuments.pub/reader033/viewer/2022041502/5e228e243f38553b793dfc6c/html5/thumbnails/90.jpg)
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenMedian und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung
Der Median1:die Halfte der Beobachtungen sind
kleiner,die Halfte sind großer.
Der Median istdas 50%-Quantil
der Daten.
1”saloppe“ Definition (wir sehen gleich die prazise Definition)
54/94
![Page 91: Statistik fur Informatiker, SS 2018¨ · Worum geht es in der Statistik? Die Welt ist voller Variabilitat.¨ Wie geht man mit variablen Daten um? Idee der Statistik: Variabilitat](https://reader033.vdocuments.pub/reader033/viewer/2022041502/5e228e243f38553b793dfc6c/html5/thumbnails/91.jpg)
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenMedian und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung
Die Quartile
Das erste Quartil2, Q1:
ein Viertel der Beobachtungensind kleiner,
drei Viertel sind großer.
Q1 ist das25%-Quantilder Daten.
2”saloppe“ Definition (wir sehen gleich die prazise Definition)
55/94
![Page 92: Statistik fur Informatiker, SS 2018¨ · Worum geht es in der Statistik? Die Welt ist voller Variabilitat.¨ Wie geht man mit variablen Daten um? Idee der Statistik: Variabilitat](https://reader033.vdocuments.pub/reader033/viewer/2022041502/5e228e243f38553b793dfc6c/html5/thumbnails/92.jpg)
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenMedian und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung
Die Quartile
Das erste Quartil2, Q1:ein Viertel der Beobachtungen
sind kleiner,drei Viertel sind großer.
Q1 ist das25%-Quantilder Daten.
2”saloppe“ Definition (wir sehen gleich die prazise Definition)
55/94
![Page 93: Statistik fur Informatiker, SS 2018¨ · Worum geht es in der Statistik? Die Welt ist voller Variabilitat.¨ Wie geht man mit variablen Daten um? Idee der Statistik: Variabilitat](https://reader033.vdocuments.pub/reader033/viewer/2022041502/5e228e243f38553b793dfc6c/html5/thumbnails/93.jpg)
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenMedian und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung
Die Quartile
Das erste Quartil2, Q1:ein Viertel der Beobachtungen
sind kleiner,drei Viertel sind großer.
Q1 ist das25%-Quantilder Daten.
2”saloppe“ Definition (wir sehen gleich die prazise Definition)
55/94
![Page 94: Statistik fur Informatiker, SS 2018¨ · Worum geht es in der Statistik? Die Welt ist voller Variabilitat.¨ Wie geht man mit variablen Daten um? Idee der Statistik: Variabilitat](https://reader033.vdocuments.pub/reader033/viewer/2022041502/5e228e243f38553b793dfc6c/html5/thumbnails/94.jpg)
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenMedian und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung
Die Quartile
Das dritte Quartil3, Q3:
drei Viertel der Beobachtungensind kleiner,
ein Viertel sind großer.
Q3 ist das75%-Quantilder Daten.
3”saloppe“ Definition (wir sehen gleich die prazise Definition)
56/94
![Page 95: Statistik fur Informatiker, SS 2018¨ · Worum geht es in der Statistik? Die Welt ist voller Variabilitat.¨ Wie geht man mit variablen Daten um? Idee der Statistik: Variabilitat](https://reader033.vdocuments.pub/reader033/viewer/2022041502/5e228e243f38553b793dfc6c/html5/thumbnails/95.jpg)
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenMedian und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung
Die Quartile
Das dritte Quartil3, Q3:drei Viertel der Beobachtungen
sind kleiner,ein Viertel sind großer.
Q3 ist das75%-Quantilder Daten.
3”saloppe“ Definition (wir sehen gleich die prazise Definition)
56/94
![Page 96: Statistik fur Informatiker, SS 2018¨ · Worum geht es in der Statistik? Die Welt ist voller Variabilitat.¨ Wie geht man mit variablen Daten um? Idee der Statistik: Variabilitat](https://reader033.vdocuments.pub/reader033/viewer/2022041502/5e228e243f38553b793dfc6c/html5/thumbnails/96.jpg)
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenMedian und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung
Die Quartile
Das dritte Quartil3, Q3:drei Viertel der Beobachtungen
sind kleiner,ein Viertel sind großer.
Q3 ist das75%-Quantilder Daten.
3”saloppe“ Definition (wir sehen gleich die prazise Definition)
56/94
![Page 97: Statistik fur Informatiker, SS 2018¨ · Worum geht es in der Statistik? Die Welt ist voller Variabilitat.¨ Wie geht man mit variablen Daten um? Idee der Statistik: Variabilitat](https://reader033.vdocuments.pub/reader033/viewer/2022041502/5e228e243f38553b793dfc6c/html5/thumbnails/97.jpg)
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenMedian und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung
(Empirische) Quantile, allgemein
Seien n (reelle) Beobachtungswerte x1,x2, . . . ,xn
gegeben, α ∈ (0,1).q ist (ein) α-Quantil der n Beobachtungswerte, wenn gilt1n∣1 ≤ i ≤ n ∶ xi ≤ q∣ ≥ α und
1n∣1 ≤ i ≤ n ∶ xi ≥ q∣ ≥ 1 − α.
Bem.: Im Allgemeinen ist ein α-Quantil nicht eindeutig:Seien x(1) ≤ x(2) ≤ ⋯ ≤ x(n) die der Große nach sortiertenWerte.Wenn α = k
n mit 1 ≤ k < n, so ist jeder Wert q ∈ [x(k),x(k+1)]ein α-Quantil,denn ∣i ∶ xi ≤ x(k)∣ ≥ k , ∣i ∶ xi ≥ x(k)∣ ≥ n − k + 1.Wenn nα /∈ 1, . . . ,n − 1, so ist das α-Quantil der Wertx(k) mit k = ⌈αn⌉.
57/94
![Page 98: Statistik fur Informatiker, SS 2018¨ · Worum geht es in der Statistik? Die Welt ist voller Variabilitat.¨ Wie geht man mit variablen Daten um? Idee der Statistik: Variabilitat](https://reader033.vdocuments.pub/reader033/viewer/2022041502/5e228e243f38553b793dfc6c/html5/thumbnails/98.jpg)
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenMedian und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung
(Empirische) Quantile, allgemein
Seien n (reelle) Beobachtungswerte x1,x2, . . . ,xn
gegeben, α ∈ (0,1).q ist (ein) α-Quantil der n Beobachtungswerte, wenn gilt1n∣1 ≤ i ≤ n ∶ xi ≤ q∣ ≥ α und
1n∣1 ≤ i ≤ n ∶ xi ≥ q∣ ≥ 1 − α.
Bem.: Im Allgemeinen ist ein α-Quantil nicht eindeutig:Seien x(1) ≤ x(2) ≤ ⋯ ≤ x(n) die der Große nach sortiertenWerte.Wenn α = k
n mit 1 ≤ k < n, so ist jeder Wert q ∈ [x(k),x(k+1)]ein α-Quantil,denn ∣i ∶ xi ≤ x(k)∣ ≥ k , ∣i ∶ xi ≥ x(k)∣ ≥ n − k + 1.Wenn nα /∈ 1, . . . ,n − 1, so ist das α-Quantil der Wertx(k) mit k = ⌈αn⌉.
57/94
![Page 99: Statistik fur Informatiker, SS 2018¨ · Worum geht es in der Statistik? Die Welt ist voller Variabilitat.¨ Wie geht man mit variablen Daten um? Idee der Statistik: Variabilitat](https://reader033.vdocuments.pub/reader033/viewer/2022041502/5e228e243f38553b793dfc6c/html5/thumbnails/99.jpg)
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenMedian und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung
(Empirische) Quantile, allgemein II
n (reelle) Beobachtungswerte x1,x2, . . . ,xn gegeben,α ∈ (0,1).(ein) α-Quantil q der n Beobachtungswerte erfullt1n∣1 ≤ i ≤ n ∶ xi ≤ q∣ ≥ α und
1n∣1 ≤ i ≤ n ∶ xi ≥ q∣ ≥ 1 − α.
Bem.:Die Definition passt zu unserer fruheren Definition furVerteilungen, wenn man die empirische Verteilung1n ∑
ni=1 δxi betrachtet.
In der Literatur (und auch in Statistik-Software) sindverschiedene Interpolationen ublich, um ”das“α-Quantil stetig in α zu machen.(In R siehe etwa help(quantile), es sind 9 Variantenimplementiert.)Die Uneindeutigkeit des α-Quantils ist fur halbwegsgroße n in der Praxis oft wenig von Belang.
58/94
![Page 100: Statistik fur Informatiker, SS 2018¨ · Worum geht es in der Statistik? Die Welt ist voller Variabilitat.¨ Wie geht man mit variablen Daten um? Idee der Statistik: Variabilitat](https://reader033.vdocuments.pub/reader033/viewer/2022041502/5e228e243f38553b793dfc6c/html5/thumbnails/100.jpg)
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenMedian und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung
(Empirische) Quantile, allgemein II
n (reelle) Beobachtungswerte x1,x2, . . . ,xn gegeben,α ∈ (0,1).(ein) α-Quantil q der n Beobachtungswerte erfullt1n∣1 ≤ i ≤ n ∶ xi ≤ q∣ ≥ α und
1n∣1 ≤ i ≤ n ∶ xi ≥ q∣ ≥ 1 − α.
Bem.:Die Definition passt zu unserer fruheren Definition furVerteilungen, wenn man die empirische Verteilung1n ∑
ni=1 δxi betrachtet.
In der Literatur (und auch in Statistik-Software) sindverschiedene Interpolationen ublich, um ”das“α-Quantil stetig in α zu machen.(In R siehe etwa help(quantile), es sind 9 Variantenimplementiert.)Die Uneindeutigkeit des α-Quantils ist fur halbwegsgroße n in der Praxis oft wenig von Belang.
58/94
![Page 101: Statistik fur Informatiker, SS 2018¨ · Worum geht es in der Statistik? Die Welt ist voller Variabilitat.¨ Wie geht man mit variablen Daten um? Idee der Statistik: Variabilitat](https://reader033.vdocuments.pub/reader033/viewer/2022041502/5e228e243f38553b793dfc6c/html5/thumbnails/101.jpg)
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenMedian und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung
Inhalt1 Ansatz der Statistik2 Graphische Darstellungen
Histogramme und DichtepolygoneStripchartsBoxplotsGeschummelt: Graphische Tricksereien
3 Statistische KenngroßenMedian und andere Quartile, (empirische) QuantileMittelwert und Standardabweichung
4 Beispiele zum Sinn und Unsinn von MittelwertenBeispiel: Wahlerische BachstelzenBeispiel: Spiderman & SpiderwomanBeispiel: Kupfertoleranz beim Roten Straußgras
59/94
![Page 102: Statistik fur Informatiker, SS 2018¨ · Worum geht es in der Statistik? Die Welt ist voller Variabilitat.¨ Wie geht man mit variablen Daten um? Idee der Statistik: Variabilitat](https://reader033.vdocuments.pub/reader033/viewer/2022041502/5e228e243f38553b793dfc6c/html5/thumbnails/102.jpg)
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenMedian und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung
n (reelle) Beobachtungswerte x1,x2, . . . ,xn
Am haufigsten werden benutzt:
Lageparameter
Der Mittelwert x ∶= 1n
n
∑i=1
xi
StreuungsparameterDie Standardabweichung s (bzw. σ)
wobei
σ2 = 1n
n
∑i=1
(xi − x)2 die (empirische) Varianz
s2 = 1n − 1
n
∑i=1
(xi − x)2 die korrigierte Stichproben-Varianz
( = nn−1σ
2)
60/94
![Page 103: Statistik fur Informatiker, SS 2018¨ · Worum geht es in der Statistik? Die Welt ist voller Variabilitat.¨ Wie geht man mit variablen Daten um? Idee der Statistik: Variabilitat](https://reader033.vdocuments.pub/reader033/viewer/2022041502/5e228e243f38553b793dfc6c/html5/thumbnails/103.jpg)
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenMedian und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung
n (reelle) Beobachtungswerte x1,x2, . . . ,xn
Am haufigsten werden benutzt:
Lageparameter
Der Mittelwert x ∶= 1n
n
∑i=1
xi
StreuungsparameterDie Standardabweichung s (bzw. σ)
wobei
σ2 = 1n
n
∑i=1
(xi − x)2 die (empirische) Varianz
s2 = 1n − 1
n
∑i=1
(xi − x)2 die korrigierte Stichproben-Varianz
( = nn−1σ
2)
60/94
![Page 104: Statistik fur Informatiker, SS 2018¨ · Worum geht es in der Statistik? Die Welt ist voller Variabilitat.¨ Wie geht man mit variablen Daten um? Idee der Statistik: Variabilitat](https://reader033.vdocuments.pub/reader033/viewer/2022041502/5e228e243f38553b793dfc6c/html5/thumbnails/104.jpg)
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenMedian und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung
n (reelle) Beobachtungswerte x1,x2, . . . ,xn
Am haufigsten werden benutzt:
Lageparameter
Der Mittelwert x ∶= 1n
n
∑i=1
xi
StreuungsparameterDie Standardabweichung s (bzw. σ)
wobei
σ2 = 1n
n
∑i=1
(xi − x)2 die (empirische) Varianz
s2 = 1n − 1
n
∑i=1
(xi − x)2 die korrigierte Stichproben-Varianz
( = nn−1σ
2)60/94
![Page 105: Statistik fur Informatiker, SS 2018¨ · Worum geht es in der Statistik? Die Welt ist voller Variabilitat.¨ Wie geht man mit variablen Daten um? Idee der Statistik: Variabilitat](https://reader033.vdocuments.pub/reader033/viewer/2022041502/5e228e243f38553b793dfc6c/html5/thumbnails/105.jpg)
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenMedian und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung
Erinnerung: Geometrische Bedeutungdes Mittelwerts
Der Schwerpunkt
61/94
![Page 106: Statistik fur Informatiker, SS 2018¨ · Worum geht es in der Statistik? Die Welt ist voller Variabilitat.¨ Wie geht man mit variablen Daten um? Idee der Statistik: Variabilitat](https://reader033.vdocuments.pub/reader033/viewer/2022041502/5e228e243f38553b793dfc6c/html5/thumbnails/106.jpg)
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenMedian und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung
Wir stellen uns die Beobachtungen alsgleich schwere Gewichte auf einer
Waage vor:
0 1 2 3
x
62/94
![Page 107: Statistik fur Informatiker, SS 2018¨ · Worum geht es in der Statistik? Die Welt ist voller Variabilitat.¨ Wie geht man mit variablen Daten um? Idee der Statistik: Variabilitat](https://reader033.vdocuments.pub/reader033/viewer/2022041502/5e228e243f38553b793dfc6c/html5/thumbnails/107.jpg)
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenMedian und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung
Wo muß der Drehpunkt sein, damit dieWaage im Gleichgewicht ist?
0 1 2 3
x
62/94
![Page 108: Statistik fur Informatiker, SS 2018¨ · Worum geht es in der Statistik? Die Welt ist voller Variabilitat.¨ Wie geht man mit variablen Daten um? Idee der Statistik: Variabilitat](https://reader033.vdocuments.pub/reader033/viewer/2022041502/5e228e243f38553b793dfc6c/html5/thumbnails/108.jpg)
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenMedian und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung
m = 1,5 ?
63/94
![Page 109: Statistik fur Informatiker, SS 2018¨ · Worum geht es in der Statistik? Die Welt ist voller Variabilitat.¨ Wie geht man mit variablen Daten um? Idee der Statistik: Variabilitat](https://reader033.vdocuments.pub/reader033/viewer/2022041502/5e228e243f38553b793dfc6c/html5/thumbnails/109.jpg)
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenMedian und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung
m = 1,5 ?
zu klein
63/94
![Page 110: Statistik fur Informatiker, SS 2018¨ · Worum geht es in der Statistik? Die Welt ist voller Variabilitat.¨ Wie geht man mit variablen Daten um? Idee der Statistik: Variabilitat](https://reader033.vdocuments.pub/reader033/viewer/2022041502/5e228e243f38553b793dfc6c/html5/thumbnails/110.jpg)
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenMedian und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung
m = 2 ?
63/94
![Page 111: Statistik fur Informatiker, SS 2018¨ · Worum geht es in der Statistik? Die Welt ist voller Variabilitat.¨ Wie geht man mit variablen Daten um? Idee der Statistik: Variabilitat](https://reader033.vdocuments.pub/reader033/viewer/2022041502/5e228e243f38553b793dfc6c/html5/thumbnails/111.jpg)
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenMedian und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung
m = 2 ?
zu groß
63/94
![Page 112: Statistik fur Informatiker, SS 2018¨ · Worum geht es in der Statistik? Die Welt ist voller Variabilitat.¨ Wie geht man mit variablen Daten um? Idee der Statistik: Variabilitat](https://reader033.vdocuments.pub/reader033/viewer/2022041502/5e228e243f38553b793dfc6c/html5/thumbnails/112.jpg)
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenMedian und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung
m = 1,8 ?
63/94
![Page 113: Statistik fur Informatiker, SS 2018¨ · Worum geht es in der Statistik? Die Welt ist voller Variabilitat.¨ Wie geht man mit variablen Daten um? Idee der Statistik: Variabilitat](https://reader033.vdocuments.pub/reader033/viewer/2022041502/5e228e243f38553b793dfc6c/html5/thumbnails/113.jpg)
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenMedian und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung
m = 1,8 ?
richtig
63/94
![Page 114: Statistik fur Informatiker, SS 2018¨ · Worum geht es in der Statistik? Die Welt ist voller Variabilitat.¨ Wie geht man mit variablen Daten um? Idee der Statistik: Variabilitat](https://reader033.vdocuments.pub/reader033/viewer/2022041502/5e228e243f38553b793dfc6c/html5/thumbnails/114.jpg)
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenMedian und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung
Oft kann man ”mit dem bloßen Auge“anhand eines Histogramms den
Mittelwert gut einschatzen.
Beispiel: Galathea intermedia
”Rundlichkeit“:=
Abdominalbreite / Carapaxlange
64/94
![Page 115: Statistik fur Informatiker, SS 2018¨ · Worum geht es in der Statistik? Die Welt ist voller Variabilitat.¨ Wie geht man mit variablen Daten um? Idee der Statistik: Variabilitat](https://reader033.vdocuments.pub/reader033/viewer/2022041502/5e228e243f38553b793dfc6c/html5/thumbnails/115.jpg)
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenMedian und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung
65/94
![Page 116: Statistik fur Informatiker, SS 2018¨ · Worum geht es in der Statistik? Die Welt ist voller Variabilitat.¨ Wie geht man mit variablen Daten um? Idee der Statistik: Variabilitat](https://reader033.vdocuments.pub/reader033/viewer/2022041502/5e228e243f38553b793dfc6c/html5/thumbnails/116.jpg)
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenMedian und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung
65/94
![Page 117: Statistik fur Informatiker, SS 2018¨ · Worum geht es in der Statistik? Die Welt ist voller Variabilitat.¨ Wie geht man mit variablen Daten um? Idee der Statistik: Variabilitat](https://reader033.vdocuments.pub/reader033/viewer/2022041502/5e228e243f38553b793dfc6c/html5/thumbnails/117.jpg)
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenMedian und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung
65/94
![Page 118: Statistik fur Informatiker, SS 2018¨ · Worum geht es in der Statistik? Die Welt ist voller Variabilitat.¨ Wie geht man mit variablen Daten um? Idee der Statistik: Variabilitat](https://reader033.vdocuments.pub/reader033/viewer/2022041502/5e228e243f38553b793dfc6c/html5/thumbnails/118.jpg)
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenMedian und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung
65/94
![Page 119: Statistik fur Informatiker, SS 2018¨ · Worum geht es in der Statistik? Die Welt ist voller Variabilitat.¨ Wie geht man mit variablen Daten um? Idee der Statistik: Variabilitat](https://reader033.vdocuments.pub/reader033/viewer/2022041502/5e228e243f38553b793dfc6c/html5/thumbnails/119.jpg)
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenMedian und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung
65/94
![Page 120: Statistik fur Informatiker, SS 2018¨ · Worum geht es in der Statistik? Die Welt ist voller Variabilitat.¨ Wie geht man mit variablen Daten um? Idee der Statistik: Variabilitat](https://reader033.vdocuments.pub/reader033/viewer/2022041502/5e228e243f38553b793dfc6c/html5/thumbnails/120.jpg)
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenMedian und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung
65/94
![Page 121: Statistik fur Informatiker, SS 2018¨ · Worum geht es in der Statistik? Die Welt ist voller Variabilitat.¨ Wie geht man mit variablen Daten um? Idee der Statistik: Variabilitat](https://reader033.vdocuments.pub/reader033/viewer/2022041502/5e228e243f38553b793dfc6c/html5/thumbnails/121.jpg)
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenMedian und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung
65/94
![Page 122: Statistik fur Informatiker, SS 2018¨ · Worum geht es in der Statistik? Die Welt ist voller Variabilitat.¨ Wie geht man mit variablen Daten um? Idee der Statistik: Variabilitat](https://reader033.vdocuments.pub/reader033/viewer/2022041502/5e228e243f38553b793dfc6c/html5/thumbnails/122.jpg)
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenMedian und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung
65/94
![Page 123: Statistik fur Informatiker, SS 2018¨ · Worum geht es in der Statistik? Die Welt ist voller Variabilitat.¨ Wie geht man mit variablen Daten um? Idee der Statistik: Variabilitat](https://reader033.vdocuments.pub/reader033/viewer/2022041502/5e228e243f38553b793dfc6c/html5/thumbnails/123.jpg)
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenMedian und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung
Beispiel:
3.11.88
66/94
![Page 124: Statistik fur Informatiker, SS 2018¨ · Worum geht es in der Statistik? Die Welt ist voller Variabilitat.¨ Wie geht man mit variablen Daten um? Idee der Statistik: Variabilitat](https://reader033.vdocuments.pub/reader033/viewer/2022041502/5e228e243f38553b793dfc6c/html5/thumbnails/124.jpg)
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenMedian und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung
67/94
![Page 125: Statistik fur Informatiker, SS 2018¨ · Worum geht es in der Statistik? Die Welt ist voller Variabilitat.¨ Wie geht man mit variablen Daten um? Idee der Statistik: Variabilitat](https://reader033.vdocuments.pub/reader033/viewer/2022041502/5e228e243f38553b793dfc6c/html5/thumbnails/125.jpg)
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenMedian und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung
67/94
![Page 126: Statistik fur Informatiker, SS 2018¨ · Worum geht es in der Statistik? Die Welt ist voller Variabilitat.¨ Wie geht man mit variablen Daten um? Idee der Statistik: Variabilitat](https://reader033.vdocuments.pub/reader033/viewer/2022041502/5e228e243f38553b793dfc6c/html5/thumbnails/126.jpg)
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenMedian und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung
67/94
![Page 127: Statistik fur Informatiker, SS 2018¨ · Worum geht es in der Statistik? Die Welt ist voller Variabilitat.¨ Wie geht man mit variablen Daten um? Idee der Statistik: Variabilitat](https://reader033.vdocuments.pub/reader033/viewer/2022041502/5e228e243f38553b793dfc6c/html5/thumbnails/127.jpg)
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenMedian und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung
67/94
![Page 128: Statistik fur Informatiker, SS 2018¨ · Worum geht es in der Statistik? Die Welt ist voller Variabilitat.¨ Wie geht man mit variablen Daten um? Idee der Statistik: Variabilitat](https://reader033.vdocuments.pub/reader033/viewer/2022041502/5e228e243f38553b793dfc6c/html5/thumbnails/128.jpg)
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenMedian und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung
67/94
![Page 129: Statistik fur Informatiker, SS 2018¨ · Worum geht es in der Statistik? Die Welt ist voller Variabilitat.¨ Wie geht man mit variablen Daten um? Idee der Statistik: Variabilitat](https://reader033.vdocuments.pub/reader033/viewer/2022041502/5e228e243f38553b793dfc6c/html5/thumbnails/129.jpg)
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenMedian und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung
67/94
![Page 130: Statistik fur Informatiker, SS 2018¨ · Worum geht es in der Statistik? Die Welt ist voller Variabilitat.¨ Wie geht man mit variablen Daten um? Idee der Statistik: Variabilitat](https://reader033.vdocuments.pub/reader033/viewer/2022041502/5e228e243f38553b793dfc6c/html5/thumbnails/130.jpg)
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenMedian und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung
67/94
![Page 131: Statistik fur Informatiker, SS 2018¨ · Worum geht es in der Statistik? Die Welt ist voller Variabilitat.¨ Wie geht man mit variablen Daten um? Idee der Statistik: Variabilitat](https://reader033.vdocuments.pub/reader033/viewer/2022041502/5e228e243f38553b793dfc6c/html5/thumbnails/131.jpg)
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenMedian und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung
Die Standardabweichung (auch: Streuung)
Wie weit weichteine typische Beobachtung
vomMittelwert
ab ?
68/94
![Page 132: Statistik fur Informatiker, SS 2018¨ · Worum geht es in der Statistik? Die Welt ist voller Variabilitat.¨ Wie geht man mit variablen Daten um? Idee der Statistik: Variabilitat](https://reader033.vdocuments.pub/reader033/viewer/2022041502/5e228e243f38553b793dfc6c/html5/thumbnails/132.jpg)
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenMedian und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung
Die Standardabweichung (auch: Streuung)
Wie weit weichteine typische Beobachtung
vomMittelwert
ab ?
68/94
![Page 133: Statistik fur Informatiker, SS 2018¨ · Worum geht es in der Statistik? Die Welt ist voller Variabilitat.¨ Wie geht man mit variablen Daten um? Idee der Statistik: Variabilitat](https://reader033.vdocuments.pub/reader033/viewer/2022041502/5e228e243f38553b793dfc6c/html5/thumbnails/133.jpg)
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenMedian und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung
Mit n oder n − 1 berechnen?
Die Standardabweichung σ eines Zufallsexperiments mitn gleichwahrscheinlichen Ausgangen x1, . . . ,xn (z.B.Wurfelwurf) ist definiert durch (vgl. Def. 1.76)
σ =¿ÁÁÀ1
n
n
∑i=1
(xi − x)2.
Wenn es sich bei x1, . . . ,xn um Beobachtungswerte ineiner Stichprobe handelt, verwendet man eher
s =¿ÁÁÀ 1
n − 1
n
∑i=1
(xi − x)2.
69/94
![Page 134: Statistik fur Informatiker, SS 2018¨ · Worum geht es in der Statistik? Die Welt ist voller Variabilitat.¨ Wie geht man mit variablen Daten um? Idee der Statistik: Variabilitat](https://reader033.vdocuments.pub/reader033/viewer/2022041502/5e228e243f38553b793dfc6c/html5/thumbnails/134.jpg)
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenMedian und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung
Mit n oder n − 1 berechnen?
Die Standardabweichung σ eines Zufallsexperiments mitn gleichwahrscheinlichen Ausgangen x1, . . . ,xn (z.B.Wurfelwurf) ist definiert durch (vgl. Def. 1.76)
σ =¿ÁÁÀ1
n
n
∑i=1
(xi − x)2.
Wenn es sich bei x1, . . . ,xn um Beobachtungswerte ineiner Stichprobe handelt, verwendet man eher
s =¿ÁÁÀ 1
n − 1
n
∑i=1
(xi − x)2.
69/94
![Page 135: Statistik fur Informatiker, SS 2018¨ · Worum geht es in der Statistik? Die Welt ist voller Variabilitat.¨ Wie geht man mit variablen Daten um? Idee der Statistik: Variabilitat](https://reader033.vdocuments.pub/reader033/viewer/2022041502/5e228e243f38553b793dfc6c/html5/thumbnails/135.jpg)
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenMedian und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung
s als Schatzer fur σ
Wir werden sehen:Wenn X1, . . . ,Xn u.i.v. Zufallsvariablen mit VarianzVar[X1] = σ2,
X ∶= 1n
n
∑i=1
Xi ,
so hat die Zufallsvariable
S2 ∶= 1n − 1
n
∑i=1
(Xi −X)2
die EigenschaftE[S2] = σ2.
70/94
![Page 136: Statistik fur Informatiker, SS 2018¨ · Worum geht es in der Statistik? Die Welt ist voller Variabilitat.¨ Wie geht man mit variablen Daten um? Idee der Statistik: Variabilitat](https://reader033.vdocuments.pub/reader033/viewer/2022041502/5e228e243f38553b793dfc6c/html5/thumbnails/136.jpg)
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenMedian und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung
Faustregel fur die Standardabweichung
Bei ungefahr glockenformigen (also eingipfligen undsymmetrischen) Verteilungen liegen ca. 2/3 der Verteilungzwischen x − σ und x + σ.
0.0
0.2
0.4
0.6
0.8
1.0
prob
abili
ty d
ensi
ty
x −− σσ x x ++ σσ
Oft kann man so die Standardabweichung ”mit bloßemAuge“ abschatzen.
71/94
![Page 137: Statistik fur Informatiker, SS 2018¨ · Worum geht es in der Statistik? Die Welt ist voller Variabilitat.¨ Wie geht man mit variablen Daten um? Idee der Statistik: Variabilitat](https://reader033.vdocuments.pub/reader033/viewer/2022041502/5e228e243f38553b793dfc6c/html5/thumbnails/137.jpg)
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenMedian und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung
Faustregel fur die Standardabweichung
Bei ungefahr glockenformigen (also eingipfligen undsymmetrischen) Verteilungen liegen ca. 2/3 der Verteilungzwischen x − σ und x + σ.
0.0
0.2
0.4
0.6
0.8
1.0
prob
abili
ty d
ensi
ty
x −− σσ x x ++ σσ
Oft kann man so die Standardabweichung ”mit bloßemAuge“ abschatzen.
71/94
![Page 138: Statistik fur Informatiker, SS 2018¨ · Worum geht es in der Statistik? Die Welt ist voller Variabilitat.¨ Wie geht man mit variablen Daten um? Idee der Statistik: Variabilitat](https://reader033.vdocuments.pub/reader033/viewer/2022041502/5e228e243f38553b793dfc6c/html5/thumbnails/138.jpg)
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenMedian und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung
Standardabweichung der Carapaxlangennichteiertragender Weibchen vom 6.9.88
Nichteiertragende Weibchen
Carapaxlänge [mm]
Dic
hte
2.0 2.5 3.0
0.0
0.5
1.0
1.5 x == 2.53
Hier liegt der Anteil zwischen x − σ und x + σ bei 72%.
72/94
![Page 139: Statistik fur Informatiker, SS 2018¨ · Worum geht es in der Statistik? Die Welt ist voller Variabilitat.¨ Wie geht man mit variablen Daten um? Idee der Statistik: Variabilitat](https://reader033.vdocuments.pub/reader033/viewer/2022041502/5e228e243f38553b793dfc6c/html5/thumbnails/139.jpg)
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenMedian und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung
Standardabweichung der Carapaxlangennichteiertragender Weibchen vom 6.9.88
Nichteiertragende Weibchen
Carapaxlänge [mm]
Dic
hte
2.0 2.5 3.0
0.0
0.5
1.0
1.5 x == 2.53x == 2.53σσ == 0.28
σσ2 == 0.077
Hier liegt der Anteil zwischen x − σ und x + σ bei 72%.
72/94
![Page 140: Statistik fur Informatiker, SS 2018¨ · Worum geht es in der Statistik? Die Welt ist voller Variabilitat.¨ Wie geht man mit variablen Daten um? Idee der Statistik: Variabilitat](https://reader033.vdocuments.pub/reader033/viewer/2022041502/5e228e243f38553b793dfc6c/html5/thumbnails/140.jpg)
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenMedian und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung
Standardabweichung der Carapaxlangennichteiertragender Weibchen vom 6.9.88
Nichteiertragende Weibchen
Carapaxlänge [mm]
Dic
hte
2.0 2.5 3.0
0.0
0.5
1.0
1.5 x == 2.53x == 2.53σσ == 0.28
σσ2 == 0.077
Hier liegt der Anteil zwischen x − σ und x + σ bei 72%.72/94
![Page 141: Statistik fur Informatiker, SS 2018¨ · Worum geht es in der Statistik? Die Welt ist voller Variabilitat.¨ Wie geht man mit variablen Daten um? Idee der Statistik: Variabilitat](https://reader033.vdocuments.pub/reader033/viewer/2022041502/5e228e243f38553b793dfc6c/html5/thumbnails/141.jpg)
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenMedian und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung
Ubrigens: Einschlagige R-Befehle
Mittelwert (mean), Standardabweichung (sd), Median,und Quantilemean(x)sd(x)median(x)quantile(x, 0.25, type=1)quantile(x, 0.75, type=1)summary(x)
Boxplot, Histogrammboxplot(x)hist(x) (fur Dichtehistogramm: hist(x, prob=T))
Ein Dichtepolygon gewinnt man z.B. viah <- hist(x)plot(h$mids, h$density, type=’l’)
73/94
![Page 142: Statistik fur Informatiker, SS 2018¨ · Worum geht es in der Statistik? Die Welt ist voller Variabilitat.¨ Wie geht man mit variablen Daten um? Idee der Statistik: Variabilitat](https://reader033.vdocuments.pub/reader033/viewer/2022041502/5e228e243f38553b793dfc6c/html5/thumbnails/142.jpg)
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenBeispiel: Wahlerische Bachstelzen Beispiel: Spiderman & Spiderwoman Beispiel: Kupfertoleranz beim Roten Straußgras
Inhalt1 Ansatz der Statistik2 Graphische Darstellungen
Histogramme und DichtepolygoneStripchartsBoxplotsGeschummelt: Graphische Tricksereien
3 Statistische KenngroßenMedian und andere Quartile, (empirische) QuantileMittelwert und Standardabweichung
4 Beispiele zum Sinn und Unsinn von MittelwertenBeispiel: Wahlerische BachstelzenBeispiel: Spiderman & SpiderwomanBeispiel: Kupfertoleranz beim Roten Straußgras
74/94
![Page 143: Statistik fur Informatiker, SS 2018¨ · Worum geht es in der Statistik? Die Welt ist voller Variabilitat.¨ Wie geht man mit variablen Daten um? Idee der Statistik: Variabilitat](https://reader033.vdocuments.pub/reader033/viewer/2022041502/5e228e243f38553b793dfc6c/html5/thumbnails/143.jpg)
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenBeispiel: Wahlerische Bachstelzen Beispiel: Spiderman & Spiderwoman Beispiel: Kupfertoleranz beim Roten Straußgras
Mittelwert und Standardabweichung. . .charakterisieren die Daten gut, falls deren Verteilung(zumindest in etwa) glockenformig ist
und mussen andernfalls mit Vorsicht interpretiertwerden.
Wir betrachten dazu einige Lehrbuch-Beispiele aus derBiologie, siehe z.B.
M. Begon, C. R. Townsend, and J. L. Harper.Ecology: From Individuals to Ecosystems.Blackell Publishing, 4 edition, 2008.
(Wir verwenden an die Originalpublikationen angelehntesimulierte Daten, nehmen Sie also nicht alle Datenpunktewortlich.)
75/94
![Page 144: Statistik fur Informatiker, SS 2018¨ · Worum geht es in der Statistik? Die Welt ist voller Variabilitat.¨ Wie geht man mit variablen Daten um? Idee der Statistik: Variabilitat](https://reader033.vdocuments.pub/reader033/viewer/2022041502/5e228e243f38553b793dfc6c/html5/thumbnails/144.jpg)
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenBeispiel: Wahlerische Bachstelzen Beispiel: Spiderman & Spiderwoman Beispiel: Kupfertoleranz beim Roten Straußgras
Mittelwert und Standardabweichung. . .charakterisieren die Daten gut, falls deren Verteilung(zumindest in etwa) glockenformig istund mussen andernfalls mit Vorsicht interpretiertwerden.
Wir betrachten dazu einige Lehrbuch-Beispiele aus derBiologie, siehe z.B.
M. Begon, C. R. Townsend, and J. L. Harper.Ecology: From Individuals to Ecosystems.Blackell Publishing, 4 edition, 2008.
(Wir verwenden an die Originalpublikationen angelehntesimulierte Daten, nehmen Sie also nicht alle Datenpunktewortlich.)
75/94
![Page 145: Statistik fur Informatiker, SS 2018¨ · Worum geht es in der Statistik? Die Welt ist voller Variabilitat.¨ Wie geht man mit variablen Daten um? Idee der Statistik: Variabilitat](https://reader033.vdocuments.pub/reader033/viewer/2022041502/5e228e243f38553b793dfc6c/html5/thumbnails/145.jpg)
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenBeispiel: Wahlerische Bachstelzen Beispiel: Spiderman & Spiderwoman Beispiel: Kupfertoleranz beim Roten Straußgras
Mittelwert und Standardabweichung. . .charakterisieren die Daten gut, falls deren Verteilung(zumindest in etwa) glockenformig istund mussen andernfalls mit Vorsicht interpretiertwerden.
Wir betrachten dazu einige Lehrbuch-Beispiele aus derBiologie, siehe z.B.
M. Begon, C. R. Townsend, and J. L. Harper.Ecology: From Individuals to Ecosystems.Blackell Publishing, 4 edition, 2008.
(Wir verwenden an die Originalpublikationen angelehntesimulierte Daten, nehmen Sie also nicht alle Datenpunktewortlich.)
75/94
![Page 146: Statistik fur Informatiker, SS 2018¨ · Worum geht es in der Statistik? Die Welt ist voller Variabilitat.¨ Wie geht man mit variablen Daten um? Idee der Statistik: Variabilitat](https://reader033.vdocuments.pub/reader033/viewer/2022041502/5e228e243f38553b793dfc6c/html5/thumbnails/146.jpg)
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenBeispiel: Wahlerische Bachstelzen Beispiel: Spiderman & Spiderwoman Beispiel: Kupfertoleranz beim Roten Straußgras
Inhalt1 Ansatz der Statistik2 Graphische Darstellungen
Histogramme und DichtepolygoneStripchartsBoxplotsGeschummelt: Graphische Tricksereien
3 Statistische KenngroßenMedian und andere Quartile, (empirische) QuantileMittelwert und Standardabweichung
4 Beispiele zum Sinn und Unsinn von MittelwertenBeispiel: Wahlerische BachstelzenBeispiel: Spiderman & SpiderwomanBeispiel: Kupfertoleranz beim Roten Straußgras
76/94
![Page 147: Statistik fur Informatiker, SS 2018¨ · Worum geht es in der Statistik? Die Welt ist voller Variabilitat.¨ Wie geht man mit variablen Daten um? Idee der Statistik: Variabilitat](https://reader033.vdocuments.pub/reader033/viewer/2022041502/5e228e243f38553b793dfc6c/html5/thumbnails/147.jpg)
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenBeispiel: Wahlerische Bachstelzen Beispiel: Spiderman & Spiderwoman Beispiel: Kupfertoleranz beim Roten Straußgras
Bachstelzen fressen DungfliegenRauber Beute
Bachstelze (White Wagtail) Gelbe DungfliegeMotacilla alba alba Scatophaga stercoraria
image (c) by Artur Mikołajewski image (c) by Viatour Luc
77/94
![Page 148: Statistik fur Informatiker, SS 2018¨ · Worum geht es in der Statistik? Die Welt ist voller Variabilitat.¨ Wie geht man mit variablen Daten um? Idee der Statistik: Variabilitat](https://reader033.vdocuments.pub/reader033/viewer/2022041502/5e228e243f38553b793dfc6c/html5/thumbnails/148.jpg)
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenBeispiel: Wahlerische Bachstelzen Beispiel: Spiderman & Spiderwoman Beispiel: Kupfertoleranz beim Roten Straußgras
Vermutung
Die Fliegen sind unterschiedlich großEffizienz fur die Bachstelze = Energiegewinn / Zeitzum Fangen und fressenLaborexperimente lassen vermuten, dass dieEffizienz bei 7mm großen Fliegen maximal ist.
N.B. Davies.Prey selection and social behaviour in wagtails (Aves:Motacillidae).J. Anim. Ecol., 46:37–57, 1977.
78/94
![Page 149: Statistik fur Informatiker, SS 2018¨ · Worum geht es in der Statistik? Die Welt ist voller Variabilitat.¨ Wie geht man mit variablen Daten um? Idee der Statistik: Variabilitat](https://reader033.vdocuments.pub/reader033/viewer/2022041502/5e228e243f38553b793dfc6c/html5/thumbnails/149.jpg)
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenBeispiel: Wahlerische Bachstelzen Beispiel: Spiderman & Spiderwoman Beispiel: Kupfertoleranz beim Roten Straußgras
available dung flies
length [mm]
num
ber
4 5 6 7 8 9 10 11
050
100
150
79/94
![Page 150: Statistik fur Informatiker, SS 2018¨ · Worum geht es in der Statistik? Die Welt ist voller Variabilitat.¨ Wie geht man mit variablen Daten um? Idee der Statistik: Variabilitat](https://reader033.vdocuments.pub/reader033/viewer/2022041502/5e228e243f38553b793dfc6c/html5/thumbnails/150.jpg)
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenBeispiel: Wahlerische Bachstelzen Beispiel: Spiderman & Spiderwoman Beispiel: Kupfertoleranz beim Roten Straußgras
available dung flies
length [mm]
num
ber
4 5 6 7 8 9 10 11
050
100
150 mean= 7.99
79/94
![Page 151: Statistik fur Informatiker, SS 2018¨ · Worum geht es in der Statistik? Die Welt ist voller Variabilitat.¨ Wie geht man mit variablen Daten um? Idee der Statistik: Variabilitat](https://reader033.vdocuments.pub/reader033/viewer/2022041502/5e228e243f38553b793dfc6c/html5/thumbnails/151.jpg)
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenBeispiel: Wahlerische Bachstelzen Beispiel: Spiderman & Spiderwoman Beispiel: Kupfertoleranz beim Roten Straußgras
available dung flies
length [mm]
num
ber
4 5 6 7 8 9 10 11
050
100
150 mean= 7.99
sd= 0.96
79/94
![Page 152: Statistik fur Informatiker, SS 2018¨ · Worum geht es in der Statistik? Die Welt ist voller Variabilitat.¨ Wie geht man mit variablen Daten um? Idee der Statistik: Variabilitat](https://reader033.vdocuments.pub/reader033/viewer/2022041502/5e228e243f38553b793dfc6c/html5/thumbnails/152.jpg)
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenBeispiel: Wahlerische Bachstelzen Beispiel: Spiderman & Spiderwoman Beispiel: Kupfertoleranz beim Roten Straußgras
captured dung flies
length [mm]
num
ber
4 5 6 7 8 9 10 11
010
2030
4050
60
79/94
![Page 153: Statistik fur Informatiker, SS 2018¨ · Worum geht es in der Statistik? Die Welt ist voller Variabilitat.¨ Wie geht man mit variablen Daten um? Idee der Statistik: Variabilitat](https://reader033.vdocuments.pub/reader033/viewer/2022041502/5e228e243f38553b793dfc6c/html5/thumbnails/153.jpg)
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenBeispiel: Wahlerische Bachstelzen Beispiel: Spiderman & Spiderwoman Beispiel: Kupfertoleranz beim Roten Straußgras
captured dung flies
length [mm]
num
ber
4 5 6 7 8 9 10 11
010
2030
4050
60 mean= 6.79
79/94
![Page 154: Statistik fur Informatiker, SS 2018¨ · Worum geht es in der Statistik? Die Welt ist voller Variabilitat.¨ Wie geht man mit variablen Daten um? Idee der Statistik: Variabilitat](https://reader033.vdocuments.pub/reader033/viewer/2022041502/5e228e243f38553b793dfc6c/html5/thumbnails/154.jpg)
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenBeispiel: Wahlerische Bachstelzen Beispiel: Spiderman & Spiderwoman Beispiel: Kupfertoleranz beim Roten Straußgras
captured dung flies
length [mm]
num
ber
4 5 6 7 8 9 10 11
010
2030
4050
60 mean= 6.79
sd= 0.69
79/94
![Page 155: Statistik fur Informatiker, SS 2018¨ · Worum geht es in der Statistik? Die Welt ist voller Variabilitat.¨ Wie geht man mit variablen Daten um? Idee der Statistik: Variabilitat](https://reader033.vdocuments.pub/reader033/viewer/2022041502/5e228e243f38553b793dfc6c/html5/thumbnails/155.jpg)
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenBeispiel: Wahlerische Bachstelzen Beispiel: Spiderman & Spiderwoman Beispiel: Kupfertoleranz beim Roten Straußgras
4 5 6 7 8 9 10 11
0.0
0.1
0.2
0.3
0.4
0.5
dung flies: available, captured
length [mm]
frac
tion
per
mm
availablecaptured
79/94
![Page 156: Statistik fur Informatiker, SS 2018¨ · Worum geht es in der Statistik? Die Welt ist voller Variabilitat.¨ Wie geht man mit variablen Daten um? Idee der Statistik: Variabilitat](https://reader033.vdocuments.pub/reader033/viewer/2022041502/5e228e243f38553b793dfc6c/html5/thumbnails/156.jpg)
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenBeispiel: Wahlerische Bachstelzen Beispiel: Spiderman & Spiderwoman Beispiel: Kupfertoleranz beim Roten Straußgras
Vergleich der Großenverteilungencaptured available
Mittelwert
6.29 < 7.99Standardabweichung 0.69 < 0.96
4 5 6 7 8 9 10 11
0.0
0.1
0.2
0.3
0.4
0.5
dung flies: available, captured
length [mm]
frac
tion
per
mm
availablecaptured
80/94
![Page 157: Statistik fur Informatiker, SS 2018¨ · Worum geht es in der Statistik? Die Welt ist voller Variabilitat.¨ Wie geht man mit variablen Daten um? Idee der Statistik: Variabilitat](https://reader033.vdocuments.pub/reader033/viewer/2022041502/5e228e243f38553b793dfc6c/html5/thumbnails/157.jpg)
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenBeispiel: Wahlerische Bachstelzen Beispiel: Spiderman & Spiderwoman Beispiel: Kupfertoleranz beim Roten Straußgras
Vergleich der Großenverteilungencaptured available
Mittelwert
6.29
<
7.99Standardabweichung 0.69 < 0.96
4 5 6 7 8 9 10 11
0.0
0.1
0.2
0.3
0.4
0.5
dung flies: available, captured
length [mm]
frac
tion
per
mm
availablecaptured
80/94
![Page 158: Statistik fur Informatiker, SS 2018¨ · Worum geht es in der Statistik? Die Welt ist voller Variabilitat.¨ Wie geht man mit variablen Daten um? Idee der Statistik: Variabilitat](https://reader033.vdocuments.pub/reader033/viewer/2022041502/5e228e243f38553b793dfc6c/html5/thumbnails/158.jpg)
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenBeispiel: Wahlerische Bachstelzen Beispiel: Spiderman & Spiderwoman Beispiel: Kupfertoleranz beim Roten Straußgras
Vergleich der Großenverteilungencaptured available
Mittelwert 6.29 < 7.99
Standardabweichung 0.69 < 0.96
4 5 6 7 8 9 10 11
0.0
0.1
0.2
0.3
0.4
0.5
dung flies: available, captured
length [mm]
frac
tion
per
mm
availablecaptured
80/94
![Page 159: Statistik fur Informatiker, SS 2018¨ · Worum geht es in der Statistik? Die Welt ist voller Variabilitat.¨ Wie geht man mit variablen Daten um? Idee der Statistik: Variabilitat](https://reader033.vdocuments.pub/reader033/viewer/2022041502/5e228e243f38553b793dfc6c/html5/thumbnails/159.jpg)
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenBeispiel: Wahlerische Bachstelzen Beispiel: Spiderman & Spiderwoman Beispiel: Kupfertoleranz beim Roten Straußgras
Vergleich der Großenverteilungencaptured available
Mittelwert 6.29 < 7.99Standardabweichung
0.69 < 0.96
4 5 6 7 8 9 10 11
0.0
0.1
0.2
0.3
0.4
0.5
dung flies: available, captured
length [mm]
frac
tion
per
mm
availablecaptured
80/94
![Page 160: Statistik fur Informatiker, SS 2018¨ · Worum geht es in der Statistik? Die Welt ist voller Variabilitat.¨ Wie geht man mit variablen Daten um? Idee der Statistik: Variabilitat](https://reader033.vdocuments.pub/reader033/viewer/2022041502/5e228e243f38553b793dfc6c/html5/thumbnails/160.jpg)
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenBeispiel: Wahlerische Bachstelzen Beispiel: Spiderman & Spiderwoman Beispiel: Kupfertoleranz beim Roten Straußgras
Vergleich der Großenverteilungencaptured available
Mittelwert 6.29 < 7.99Standardabweichung
0.69
<
0.96
4 5 6 7 8 9 10 11
0.0
0.1
0.2
0.3
0.4
0.5
dung flies: available, captured
length [mm]
frac
tion
per
mm
availablecaptured
80/94
![Page 161: Statistik fur Informatiker, SS 2018¨ · Worum geht es in der Statistik? Die Welt ist voller Variabilitat.¨ Wie geht man mit variablen Daten um? Idee der Statistik: Variabilitat](https://reader033.vdocuments.pub/reader033/viewer/2022041502/5e228e243f38553b793dfc6c/html5/thumbnails/161.jpg)
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenBeispiel: Wahlerische Bachstelzen Beispiel: Spiderman & Spiderwoman Beispiel: Kupfertoleranz beim Roten Straußgras
Vergleich der Großenverteilungencaptured available
Mittelwert 6.29 < 7.99Standardabweichung 0.69 < 0.96
4 5 6 7 8 9 10 11
0.0
0.1
0.2
0.3
0.4
0.5
dung flies: available, captured
length [mm]
frac
tion
per
mm
availablecaptured
80/94
![Page 162: Statistik fur Informatiker, SS 2018¨ · Worum geht es in der Statistik? Die Welt ist voller Variabilitat.¨ Wie geht man mit variablen Daten um? Idee der Statistik: Variabilitat](https://reader033.vdocuments.pub/reader033/viewer/2022041502/5e228e243f38553b793dfc6c/html5/thumbnails/162.jpg)
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenBeispiel: Wahlerische Bachstelzen Beispiel: Spiderman & Spiderwoman Beispiel: Kupfertoleranz beim Roten Straußgras
Interpretation
Die Bachstelzen bevorzugen Dungfliegen, die etwa 7mmgroß sind.
Hier waren die Verteilungen glockenformig und esgenugten 4 Werte (die beiden Mittelwerte und die beidenStandardabweichungen), um die Daten adaquat zubeschreiben.
81/94
![Page 163: Statistik fur Informatiker, SS 2018¨ · Worum geht es in der Statistik? Die Welt ist voller Variabilitat.¨ Wie geht man mit variablen Daten um? Idee der Statistik: Variabilitat](https://reader033.vdocuments.pub/reader033/viewer/2022041502/5e228e243f38553b793dfc6c/html5/thumbnails/163.jpg)
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenBeispiel: Wahlerische Bachstelzen Beispiel: Spiderman & Spiderwoman Beispiel: Kupfertoleranz beim Roten Straußgras
Interpretation
Die Bachstelzen bevorzugen Dungfliegen, die etwa 7mmgroß sind.
Hier waren die Verteilungen glockenformig und esgenugten 4 Werte (die beiden Mittelwerte und die beidenStandardabweichungen), um die Daten adaquat zubeschreiben.
81/94
![Page 164: Statistik fur Informatiker, SS 2018¨ · Worum geht es in der Statistik? Die Welt ist voller Variabilitat.¨ Wie geht man mit variablen Daten um? Idee der Statistik: Variabilitat](https://reader033.vdocuments.pub/reader033/viewer/2022041502/5e228e243f38553b793dfc6c/html5/thumbnails/164.jpg)
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenBeispiel: Wahlerische Bachstelzen Beispiel: Spiderman & Spiderwoman Beispiel: Kupfertoleranz beim Roten Straußgras
Inhalt1 Ansatz der Statistik2 Graphische Darstellungen
Histogramme und DichtepolygoneStripchartsBoxplotsGeschummelt: Graphische Tricksereien
3 Statistische KenngroßenMedian und andere Quartile, (empirische) QuantileMittelwert und Standardabweichung
4 Beispiele zum Sinn und Unsinn von MittelwertenBeispiel: Wahlerische BachstelzenBeispiel: Spiderman & SpiderwomanBeispiel: Kupfertoleranz beim Roten Straußgras
82/94
![Page 165: Statistik fur Informatiker, SS 2018¨ · Worum geht es in der Statistik? Die Welt ist voller Variabilitat.¨ Wie geht man mit variablen Daten um? Idee der Statistik: Variabilitat](https://reader033.vdocuments.pub/reader033/viewer/2022041502/5e228e243f38553b793dfc6c/html5/thumbnails/165.jpg)
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenBeispiel: Wahlerische Bachstelzen Beispiel: Spiderman & Spiderwoman Beispiel: Kupfertoleranz beim Roten Straußgras
Nephila madagascariensisimage (c) by Bernard Gagnon
83/94
![Page 166: Statistik fur Informatiker, SS 2018¨ · Worum geht es in der Statistik? Die Welt ist voller Variabilitat.¨ Wie geht man mit variablen Daten um? Idee der Statistik: Variabilitat](https://reader033.vdocuments.pub/reader033/viewer/2022041502/5e228e243f38553b793dfc6c/html5/thumbnails/166.jpg)
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenBeispiel: Wahlerische Bachstelzen Beispiel: Spiderman & Spiderwoman Beispiel: Kupfertoleranz beim Roten Straußgras
Simulierte Daten:Eine Stichprobe von 70 SpinnenMittlere Große: 21,06 mmStandardabweichung der Große: 12,94 mm
84/94
![Page 167: Statistik fur Informatiker, SS 2018¨ · Worum geht es in der Statistik? Die Welt ist voller Variabilitat.¨ Wie geht man mit variablen Daten um? Idee der Statistik: Variabilitat](https://reader033.vdocuments.pub/reader033/viewer/2022041502/5e228e243f38553b793dfc6c/html5/thumbnails/167.jpg)
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenBeispiel: Wahlerische Bachstelzen Beispiel: Spiderman & Spiderwoman Beispiel: Kupfertoleranz beim Roten Straußgras
?????
size [mm]
Fre
quen
cy
0 10 20 30 40 50
01
23
45
6
85/94
![Page 168: Statistik fur Informatiker, SS 2018¨ · Worum geht es in der Statistik? Die Welt ist voller Variabilitat.¨ Wie geht man mit variablen Daten um? Idee der Statistik: Variabilitat](https://reader033.vdocuments.pub/reader033/viewer/2022041502/5e228e243f38553b793dfc6c/html5/thumbnails/168.jpg)
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenBeispiel: Wahlerische Bachstelzen Beispiel: Spiderman & Spiderwoman Beispiel: Kupfertoleranz beim Roten Straußgras
Nephila madagascariensis (n=70)
size [mm]
Fre
quen
cy
0 10 20 30 40 50
02
46
810
1214
85/94
![Page 169: Statistik fur Informatiker, SS 2018¨ · Worum geht es in der Statistik? Die Welt ist voller Variabilitat.¨ Wie geht man mit variablen Daten um? Idee der Statistik: Variabilitat](https://reader033.vdocuments.pub/reader033/viewer/2022041502/5e228e243f38553b793dfc6c/html5/thumbnails/169.jpg)
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenBeispiel: Wahlerische Bachstelzen Beispiel: Spiderman & Spiderwoman Beispiel: Kupfertoleranz beim Roten Straußgras
Nephila madagascariensis (n=70)
size [mm]
Fre
quen
cy
0 10 20 30 40 50
02
46
810
1214
mean= 21.06
85/94
![Page 170: Statistik fur Informatiker, SS 2018¨ · Worum geht es in der Statistik? Die Welt ist voller Variabilitat.¨ Wie geht man mit variablen Daten um? Idee der Statistik: Variabilitat](https://reader033.vdocuments.pub/reader033/viewer/2022041502/5e228e243f38553b793dfc6c/html5/thumbnails/170.jpg)
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenBeispiel: Wahlerische Bachstelzen Beispiel: Spiderman & Spiderwoman Beispiel: Kupfertoleranz beim Roten Straußgras
Nephila madagascariensis (n=70)
size [mm]
Fre
quen
cy
0 10 20 30 40 50
02
46
810
1214
males females
85/94
![Page 171: Statistik fur Informatiker, SS 2018¨ · Worum geht es in der Statistik? Die Welt ist voller Variabilitat.¨ Wie geht man mit variablen Daten um? Idee der Statistik: Variabilitat](https://reader033.vdocuments.pub/reader033/viewer/2022041502/5e228e243f38553b793dfc6c/html5/thumbnails/171.jpg)
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenBeispiel: Wahlerische Bachstelzen Beispiel: Spiderman & Spiderwoman Beispiel: Kupfertoleranz beim Roten Straußgras
Nephila madagascariensis (n=70)
size [mm]
Fre
quen
cy
0 10 20 30 40 50
02
46
810
1214
males females
85/94
![Page 172: Statistik fur Informatiker, SS 2018¨ · Worum geht es in der Statistik? Die Welt ist voller Variabilitat.¨ Wie geht man mit variablen Daten um? Idee der Statistik: Variabilitat](https://reader033.vdocuments.pub/reader033/viewer/2022041502/5e228e243f38553b793dfc6c/html5/thumbnails/172.jpg)
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenBeispiel: Wahlerische Bachstelzen Beispiel: Spiderman & Spiderwoman Beispiel: Kupfertoleranz beim Roten Straußgras
Nephila madagascariensisimage (c) by Arthur Chapman 86/94
![Page 173: Statistik fur Informatiker, SS 2018¨ · Worum geht es in der Statistik? Die Welt ist voller Variabilitat.¨ Wie geht man mit variablen Daten um? Idee der Statistik: Variabilitat](https://reader033.vdocuments.pub/reader033/viewer/2022041502/5e228e243f38553b793dfc6c/html5/thumbnails/173.jpg)
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenBeispiel: Wahlerische Bachstelzen Beispiel: Spiderman & Spiderwoman Beispiel: Kupfertoleranz beim Roten Straußgras
Fazit des Spinnenbeispiels
Wenn die Daten aus verschiedenen Gruppenzusammengesetzt sind, die sich bezuglich des Merkmalsdeutlich unterscheiden, kann es sinnvoll sein,Kenngroßen wie den Mittelwert fur jede Gruppe einzelnzu berechnen.
87/94
![Page 174: Statistik fur Informatiker, SS 2018¨ · Worum geht es in der Statistik? Die Welt ist voller Variabilitat.¨ Wie geht man mit variablen Daten um? Idee der Statistik: Variabilitat](https://reader033.vdocuments.pub/reader033/viewer/2022041502/5e228e243f38553b793dfc6c/html5/thumbnails/174.jpg)
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenBeispiel: Wahlerische Bachstelzen Beispiel: Spiderman & Spiderwoman Beispiel: Kupfertoleranz beim Roten Straußgras
Inhalt1 Ansatz der Statistik2 Graphische Darstellungen
Histogramme und DichtepolygoneStripchartsBoxplotsGeschummelt: Graphische Tricksereien
3 Statistische KenngroßenMedian und andere Quartile, (empirische) QuantileMittelwert und Standardabweichung
4 Beispiele zum Sinn und Unsinn von MittelwertenBeispiel: Wahlerische BachstelzenBeispiel: Spiderman & SpiderwomanBeispiel: Kupfertoleranz beim Roten Straußgras
88/94
![Page 175: Statistik fur Informatiker, SS 2018¨ · Worum geht es in der Statistik? Die Welt ist voller Variabilitat.¨ Wie geht man mit variablen Daten um? Idee der Statistik: Variabilitat](https://reader033.vdocuments.pub/reader033/viewer/2022041502/5e228e243f38553b793dfc6c/html5/thumbnails/175.jpg)
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenBeispiel: Wahlerische Bachstelzen Beispiel: Spiderman & Spiderwoman Beispiel: Kupfertoleranz beim Roten Straußgras
Kupfertolerantes Rotes Straußgras
Rotes Straußgras KupferAgrostis tenuis Cuprum
image (c) Kristian Peters Hendrick met de Bles
89/94
![Page 176: Statistik fur Informatiker, SS 2018¨ · Worum geht es in der Statistik? Die Welt ist voller Variabilitat.¨ Wie geht man mit variablen Daten um? Idee der Statistik: Variabilitat](https://reader033.vdocuments.pub/reader033/viewer/2022041502/5e228e243f38553b793dfc6c/html5/thumbnails/176.jpg)
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenBeispiel: Wahlerische Bachstelzen Beispiel: Spiderman & Spiderwoman Beispiel: Kupfertoleranz beim Roten Straußgras
Anpassung an Kupfer?
Pflanzen, denen das Kupfer schadet, haben kurzereWurzeln.
Die Wurzellangen von Pflanzen aus der Umgebungvon Kupferminen wird gemessen.Samen von unbelasteten Wiesen werden beiKupferminen eingesat.Die Wurzellangen dieser “Wiesenpflanzen” werdengemessen.
A.D. Bradshaw.Population Differentiation in agrostis tenius Sibth. III. populationsin varied environments.New Phytologist, 59(1):92 – 103, 1960.
T. McNeilly and A.D Bradshaw.Evolutionary Processes in Populations of Copper TolerantAgrostis tenuis Sibth.Evolution, 22:108–118, 1968.
90/94
![Page 177: Statistik fur Informatiker, SS 2018¨ · Worum geht es in der Statistik? Die Welt ist voller Variabilitat.¨ Wie geht man mit variablen Daten um? Idee der Statistik: Variabilitat](https://reader033.vdocuments.pub/reader033/viewer/2022041502/5e228e243f38553b793dfc6c/html5/thumbnails/177.jpg)
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenBeispiel: Wahlerische Bachstelzen Beispiel: Spiderman & Spiderwoman Beispiel: Kupfertoleranz beim Roten Straußgras
Anpassung an Kupfer?
Pflanzen, denen das Kupfer schadet, haben kurzereWurzeln.Die Wurzellangen von Pflanzen aus der Umgebungvon Kupferminen wird gemessen.
Samen von unbelasteten Wiesen werden beiKupferminen eingesat.Die Wurzellangen dieser “Wiesenpflanzen” werdengemessen.
A.D. Bradshaw.Population Differentiation in agrostis tenius Sibth. III. populationsin varied environments.New Phytologist, 59(1):92 – 103, 1960.
T. McNeilly and A.D Bradshaw.Evolutionary Processes in Populations of Copper TolerantAgrostis tenuis Sibth.Evolution, 22:108–118, 1968.
90/94
![Page 178: Statistik fur Informatiker, SS 2018¨ · Worum geht es in der Statistik? Die Welt ist voller Variabilitat.¨ Wie geht man mit variablen Daten um? Idee der Statistik: Variabilitat](https://reader033.vdocuments.pub/reader033/viewer/2022041502/5e228e243f38553b793dfc6c/html5/thumbnails/178.jpg)
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenBeispiel: Wahlerische Bachstelzen Beispiel: Spiderman & Spiderwoman Beispiel: Kupfertoleranz beim Roten Straußgras
Anpassung an Kupfer?
Pflanzen, denen das Kupfer schadet, haben kurzereWurzeln.Die Wurzellangen von Pflanzen aus der Umgebungvon Kupferminen wird gemessen.Samen von unbelasteten Wiesen werden beiKupferminen eingesat.
Die Wurzellangen dieser “Wiesenpflanzen” werdengemessen.
A.D. Bradshaw.Population Differentiation in agrostis tenius Sibth. III. populationsin varied environments.New Phytologist, 59(1):92 – 103, 1960.
T. McNeilly and A.D Bradshaw.Evolutionary Processes in Populations of Copper TolerantAgrostis tenuis Sibth.Evolution, 22:108–118, 1968.
90/94
![Page 179: Statistik fur Informatiker, SS 2018¨ · Worum geht es in der Statistik? Die Welt ist voller Variabilitat.¨ Wie geht man mit variablen Daten um? Idee der Statistik: Variabilitat](https://reader033.vdocuments.pub/reader033/viewer/2022041502/5e228e243f38553b793dfc6c/html5/thumbnails/179.jpg)
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenBeispiel: Wahlerische Bachstelzen Beispiel: Spiderman & Spiderwoman Beispiel: Kupfertoleranz beim Roten Straußgras
Anpassung an Kupfer?
Pflanzen, denen das Kupfer schadet, haben kurzereWurzeln.Die Wurzellangen von Pflanzen aus der Umgebungvon Kupferminen wird gemessen.Samen von unbelasteten Wiesen werden beiKupferminen eingesat.Die Wurzellangen dieser “Wiesenpflanzen” werdengemessen.
A.D. Bradshaw.Population Differentiation in agrostis tenius Sibth. III. populationsin varied environments.New Phytologist, 59(1):92 – 103, 1960.
T. McNeilly and A.D Bradshaw.Evolutionary Processes in Populations of Copper TolerantAgrostis tenuis Sibth.Evolution, 22:108–118, 1968.
90/94
![Page 180: Statistik fur Informatiker, SS 2018¨ · Worum geht es in der Statistik? Die Welt ist voller Variabilitat.¨ Wie geht man mit variablen Daten um? Idee der Statistik: Variabilitat](https://reader033.vdocuments.pub/reader033/viewer/2022041502/5e228e243f38553b793dfc6c/html5/thumbnails/180.jpg)
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenBeispiel: Wahlerische Bachstelzen Beispiel: Spiderman & Spiderwoman Beispiel: Kupfertoleranz beim Roten Straußgras
Browntop Bent (n=50)
root length (cm)
dens
ity p
er c
m
0 50 100 150 200
020
4060
8010
0 Copper Mine Grass
2/3 der Wurzellangen innerhalb [m-sd,m+sd]???? Nein!
91/94
![Page 181: Statistik fur Informatiker, SS 2018¨ · Worum geht es in der Statistik? Die Welt ist voller Variabilitat.¨ Wie geht man mit variablen Daten um? Idee der Statistik: Variabilitat](https://reader033.vdocuments.pub/reader033/viewer/2022041502/5e228e243f38553b793dfc6c/html5/thumbnails/181.jpg)
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenBeispiel: Wahlerische Bachstelzen Beispiel: Spiderman & Spiderwoman Beispiel: Kupfertoleranz beim Roten Straußgras
Browntop Bent (n=50)
root length (cm)
dens
ity p
er c
m
0 50 100 150 200
010
2030
40
Grass seeds from a meadow
2/3 der Wurzellangen innerhalb [m-sd,m+sd]???? Nein!
91/94
![Page 182: Statistik fur Informatiker, SS 2018¨ · Worum geht es in der Statistik? Die Welt ist voller Variabilitat.¨ Wie geht man mit variablen Daten um? Idee der Statistik: Variabilitat](https://reader033.vdocuments.pub/reader033/viewer/2022041502/5e228e243f38553b793dfc6c/html5/thumbnails/182.jpg)
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenBeispiel: Wahlerische Bachstelzen Beispiel: Spiderman & Spiderwoman Beispiel: Kupfertoleranz beim Roten Straußgras
Browntop Bent (n=50)
root length (cm)
dens
ity p
er c
m
0 50 100 150 200
010
2030
40
Grass seeds from a meadow
copper tolerant ?
2/3 der Wurzellangen innerhalb [m-sd,m+sd]???? Nein!
91/94
![Page 183: Statistik fur Informatiker, SS 2018¨ · Worum geht es in der Statistik? Die Welt ist voller Variabilitat.¨ Wie geht man mit variablen Daten um? Idee der Statistik: Variabilitat](https://reader033.vdocuments.pub/reader033/viewer/2022041502/5e228e243f38553b793dfc6c/html5/thumbnails/183.jpg)
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenBeispiel: Wahlerische Bachstelzen Beispiel: Spiderman & Spiderwoman Beispiel: Kupfertoleranz beim Roten Straußgras
0 50 100 150 200
0.00
0.01
0.02
0.03
0.04
0.05
0.06
0.07
Browntop Bent (n=50)
root length (cm)
dens
ity p
er c
m
meadow plants
copper mine plants
2/3 der Wurzellangen innerhalb [m-sd,m+sd]???? Nein!
91/94
![Page 184: Statistik fur Informatiker, SS 2018¨ · Worum geht es in der Statistik? Die Welt ist voller Variabilitat.¨ Wie geht man mit variablen Daten um? Idee der Statistik: Variabilitat](https://reader033.vdocuments.pub/reader033/viewer/2022041502/5e228e243f38553b793dfc6c/html5/thumbnails/184.jpg)
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenBeispiel: Wahlerische Bachstelzen Beispiel: Spiderman & Spiderwoman Beispiel: Kupfertoleranz beim Roten Straußgras
Browntop Bent (n=50)
root length (cm)
dens
ity p
er c
m
0 50 100 150 200
020
4060
8010
0 copper mine plants
m m+sm−s
2/3 der Wurzellangen innerhalb [m-sd,m+sd]???? Nein!
91/94
![Page 185: Statistik fur Informatiker, SS 2018¨ · Worum geht es in der Statistik? Die Welt ist voller Variabilitat.¨ Wie geht man mit variablen Daten um? Idee der Statistik: Variabilitat](https://reader033.vdocuments.pub/reader033/viewer/2022041502/5e228e243f38553b793dfc6c/html5/thumbnails/185.jpg)
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenBeispiel: Wahlerische Bachstelzen Beispiel: Spiderman & Spiderwoman Beispiel: Kupfertoleranz beim Roten Straußgras
Browntop Bent (n=50)
root length (cm)
dens
ity p
er c
m
0 50 100 150 200
010
2030
40
meadow plants
m m+sm−s
2/3 der Wurzellangen innerhalb [m-sd,m+sd]???? Nein!
91/94
![Page 186: Statistik fur Informatiker, SS 2018¨ · Worum geht es in der Statistik? Die Welt ist voller Variabilitat.¨ Wie geht man mit variablen Daten um? Idee der Statistik: Variabilitat](https://reader033.vdocuments.pub/reader033/viewer/2022041502/5e228e243f38553b793dfc6c/html5/thumbnails/186.jpg)
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenBeispiel: Wahlerische Bachstelzen Beispiel: Spiderman & Spiderwoman Beispiel: Kupfertoleranz beim Roten Straußgras
Fazit des Straußgras-Beispiels
Manche Verteilungen konnen nur mit mehr alszwei Variablen angemessen beschrieben
werden.
z.B. mit den funf Werten der Boxplots:min, Q1, median, Q3, max
92/94
![Page 187: Statistik fur Informatiker, SS 2018¨ · Worum geht es in der Statistik? Die Welt ist voller Variabilitat.¨ Wie geht man mit variablen Daten um? Idee der Statistik: Variabilitat](https://reader033.vdocuments.pub/reader033/viewer/2022041502/5e228e243f38553b793dfc6c/html5/thumbnails/187.jpg)
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenBeispiel: Wahlerische Bachstelzen Beispiel: Spiderman & Spiderwoman Beispiel: Kupfertoleranz beim Roten Straußgras
Fazit des Straußgras-Beispiels
Manche Verteilungen konnen nur mit mehr alszwei Variablen angemessen beschrieben
werden.
z.B. mit den funf Werten der Boxplots:min, Q1, median, Q3, max
92/94
![Page 188: Statistik fur Informatiker, SS 2018¨ · Worum geht es in der Statistik? Die Welt ist voller Variabilitat.¨ Wie geht man mit variablen Daten um? Idee der Statistik: Variabilitat](https://reader033.vdocuments.pub/reader033/viewer/2022041502/5e228e243f38553b793dfc6c/html5/thumbnails/188.jpg)
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenBeispiel: Wahlerische Bachstelzen Beispiel: Spiderman & Spiderwoman Beispiel: Kupfertoleranz beim Roten Straußgras
0 50 100 150 200
Browntop Bent n=50+50
root length (cm)
copper mine plants
meadow plants
93/94
![Page 189: Statistik fur Informatiker, SS 2018¨ · Worum geht es in der Statistik? Die Welt ist voller Variabilitat.¨ Wie geht man mit variablen Daten um? Idee der Statistik: Variabilitat](https://reader033.vdocuments.pub/reader033/viewer/2022041502/5e228e243f38553b793dfc6c/html5/thumbnails/189.jpg)
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenBeispiel: Wahlerische Bachstelzen Beispiel: Spiderman & Spiderwoman Beispiel: Kupfertoleranz beim Roten Straußgras
Schlussfolgerung
Viele Datenverteilungen sind annaherndglockenformig und konnen durch den Mittelwert
und die Standardabweichung hinreichendbeschrieben werden.
Es gibt aber auch Ausnahmen. Also:Besser ist es, die Daten auch graphisch zu
untersuchen,und sich nicht allein auf numerische
Kenngroßen zu verlassen.
94/94
![Page 190: Statistik fur Informatiker, SS 2018¨ · Worum geht es in der Statistik? Die Welt ist voller Variabilitat.¨ Wie geht man mit variablen Daten um? Idee der Statistik: Variabilitat](https://reader033.vdocuments.pub/reader033/viewer/2022041502/5e228e243f38553b793dfc6c/html5/thumbnails/190.jpg)
Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenBeispiel: Wahlerische Bachstelzen Beispiel: Spiderman & Spiderwoman Beispiel: Kupfertoleranz beim Roten Straußgras
Schlussfolgerung
Viele Datenverteilungen sind annaherndglockenformig und konnen durch den Mittelwert
und die Standardabweichung hinreichendbeschrieben werden.
Es gibt aber auch Ausnahmen. Also:Besser ist es, die Daten auch graphisch zu
untersuchen,und sich nicht allein auf numerische
Kenngroßen zu verlassen.
94/94