mathe-lernzettel - hausaufgaben · pdf filemathe-lernzettel - auslastungsmodell: in einer...
TRANSCRIPT
Mathe-Lernzettel
Schwerpunkt 3 : Stochastik
Einführung in die Stochastik:
- wichtige Begriffe:
- Baumdiagramm:
Relative Häufigkeit h(E) ; Darstellung eines Ergebnisses
𝑎𝑏𝑠𝑜𝑙𝑢𝑡𝑒 𝐻ä𝑢𝑓𝑖𝑔𝑘𝑒𝑖𝑡
𝐴𝑛𝑧𝑎 𝑙 𝑑𝑒𝑟 𝐷𝑢𝑟𝑐 𝑓ü𝑟𝑢𝑛𝑔𝑒𝑛
Absolute Häufigkeit H(E)
Wahrscheinlichkeit P(E) ; dient einer Prognose
Empirisches Gesetz der großen Zahlen
Je häufiger ich einen Versuche durchführe, desto mehr nähert sich die rel. Häufigkeit der Wahrscheinlichkeit an.
Zufallsversuch Man kann den Ausgang nicht vorhersagen. Die Ergebnismenge lässt sich jedoch angeben
Ergebnis a1,a2, ...
Ergebnismenge z.B.: S = {1,2,3,4,5,6}
Ereignis z.B.: E = {2,4}; Zusammenfassung von Ergebnissen
Laplace-Versuch Jedes Ergebnis hat die gleiche Wahrscheinlichkeit (z.B. Münze)
Laplace-Regel für Ergebnisse 1
𝐴𝑛𝑧𝑎𝑙 𝑑𝑒𝑟 𝑚ö𝑔𝑙𝑖𝑐𝑒𝑛 𝐸𝑟𝑔𝑒𝑏𝑛𝑖𝑠𝑠𝑒
Laplace-Regel für Ereignisse 𝐴𝑛𝑧𝑎𝑙 𝑑𝑒𝑟 𝑔ü𝑛𝑠𝑡𝑖𝑔𝑒𝑛 𝐸𝑟𝑔𝑒𝑏𝑛𝑖𝑠𝑠𝑒
𝐴𝑛𝑧𝑎𝑙 𝑑𝑒𝑟 𝑚ö𝑔𝑙𝑖𝑐𝑒𝑛 𝐸𝑟𝑔𝑒𝑏𝑛𝑖𝑠𝑠𝑒
Unmögliches Ereignis z.B. , dass eine Reiszwecke auf der Spitze landet
Sicheres Ereignis P(E) = 1 (100%)
Gegenereignis 𝐸 Elementare Summenregel E = {1,2}; P(E) = P({1,2}) = P({1})+P({2})
Komplementärregel P(E)+P(E ) = 1; P(E ) = 1-P(E)
Pfadmultiplikation Entlang eines Pfades multiplizieren
Pfadaddition Die Pfadendwahrscheinlichkeiten (vgl. Pfadmultiplikation) werden addiert
Ziehen mit Zurücklegen n=Anzahl der ges. Kugeln, k=Anzahl der Versuchsdurchführungen nk Möglichkeiten
Ziehen ohne Zurücklegen Bei n Elementen gibt es 𝑛 !
𝑛−𝑘 ! Möglichkeiten für k-faches Ziehen
Mit GTR: (nPr)
Ziehen mit einem Griff Die Reihenfolge ist egal! Wählt man k Elemente aus n Elementen aus, so gibt es
𝑛𝑘 =
𝑛 !
𝑛−𝑘 ! 𝑘! "n über k" Möglichkeiten mit GTR: (nCr)
f c
𝐵 𝐴 𝑎
𝑐
𝐴𝐶
𝐵𝐷
𝐵𝐶
𝐴𝐷
a b d e
Pfadaddition: 𝐴𝐶 + 𝐴𝐷
Pfadmultiplikation: 𝑐 ∙𝑎
𝑐= 𝑎
100%
𝑏
𝑐
𝑑
𝑓
𝑒
𝑓
Mathe-Lernzettel
- Vierfeldertafel:
Merkmal A Merkmal B gesamt
Merkmal C a = g-d = c-b d = g-a = f-e g = a+d = 100%-h
Merkmal D b = h-e = c-a e = h-b = f-d h = b+e = 100%-g
gesamt c = 100%-f = a+b f = 100%-c = d+e 100%
- Bayes'sche Regel:
Sei B ein Ereignis, das uns interessiert und A eine Bedingung, unter der wir den Vorgang betrachten,
dann gilt:
Die Wahrscheinlichkeit PA(B) für B unter der Bedingung A berechnet sich wie folgt:
𝑃𝐴 𝐵 =𝑃(𝐴 ∩ 𝐵)
𝑃(𝐴)
Bedingte Wahrscheinlichkeiten berechnen sich als Quotient:
Der Zähler des Bruches lässt sich aus einem inneren Feld der Mehrfeldertafel ablesen. Der Nenner
des Bruches steht als Zeilen- oder Spaltensumme am Rand (umgekehrte Pfadmultiplikation):
Bernoulli-Kette:
Bernoulli-Ketten sind besondere n-stufige Zufallsversuche mit folgenden Eigenschaften:
Auf jeder Stufe unterscheidet man nur zwei Ergebnisse, die man als Erfolg bzw. Misserfolg bezeichnet.
Die Wahrscheinlichkeit für einen Erfolg (Erfolgswahrscheinlichkeit p) bzw. einen Misserfolg (Misserfolgswahrscheinlichkeit q=1-p) bleiben während des Zufallsversuchs unverändert.
p: Erfolgswahrscheinlichkeit
q = q-1: Misserfolgswahrscheinlichkeit
n: Anzahl der Stufen
k: Anzahl der Erfolge
X: "Anzahl der Erfolge" hier wird angegeben, was als Erfolg gelten soll
Es gilt: 𝑃 𝑋 = 𝑘 = 𝑛𝑘 ∙ 𝑝𝑘 ∙ 𝑞𝑛−𝑘
Ereignis Beschreibung mit Zufallsgröße
Berechnung Berechnung mit GTR (STAT-Menü)
Genau k Erfolge 𝑋 = 𝑘 𝑃 𝑋 = 𝑘 = 𝑛𝑘 ∙ 𝑝𝑘 ∙ 𝑞𝑛−𝑘 Bpd
höchstens k Erfolge 𝑋 ≤ 𝑘 𝑃 𝑋 ≤ 𝑘 =
𝑛𝑡 ∙ 𝑝𝑡 ∙ 𝑞𝑛−𝑡
𝑘
𝑡=0
Bcd
weniger als k Erfolge 𝑋 < 𝑘 𝑃 𝑋 ≤ (𝑘 − 1) Bcd
mehr als k Erfolge 𝑋 > 𝑘 1 − 𝑃 𝑋 ≤ 𝑘 1-Bcd
mindestens k Erfolge 𝑋 ≥ 𝑘 1 − 𝑃 𝑋 ≤ (𝑘 − 1) 1-Bcd
mindestens a und höchstens b Erfolge
𝑎 ≤ 𝑋 ≤ 𝑏 𝑃 𝑋 ≤ 𝑏 − 𝑃(𝑋 ≤ 𝑎 − 1 )
Mathe-Lernzettel
- Auslastungsmodell:
In einer Reifenhandlung arbeiten 10 Monteure, die eine Maschine zum auswuchten der Radfelgen
durchschnittlich für 24 Minuten pro Stunde benötigen.
a) Mit welcher Wahrscheinlichkeit genügen 4 [5;6] Maschinen?
240,4
60p X: Anzahl der Monteure, die eine Maschine zum beliebigen Zeitpunkt benötigen
n = 10
Bei 4 Maschinen:
633,0
4,014,010
4,014,04
104,014,0
3
104,014,0
2
104,014,0
1
104,014,0
0
10
)4()3()2()1()0()4(
104
0
64738290100
mm
m m
XPXPXPXPXPXP
Mit einer Wahrscheinlichkeit von 63,3% genügen 4 Maschinen.
Bei 5 Maschinen:
834,0
4,014,010
)5()4()3()2()1()0()5(
5
0
10
m
mm
m
XPXPXPXPXPXPXP
Mit einer Wahrscheinlichkeit von 83,4% genügen 5 Maschinen.
Bei 6 Maschinen:
945,0
4,014,010
)6()5()4()3()2()1()0()6(
6
0
10
m
mm
m
XPXPXPXPXPXPXPXP
Mit einer Wahrscheinlichkeit von 94,5% genügen 6 Maschinen.
b) Wie viele Maschinen müssen zur Verfügung stehen, damit diese mit einer Wahrscheinlichkeit von
mindestens 95% ausreichen?
988,04,014,010
)7(7
0
10
m
mm
mxP
7 Maschinen müssen zur Verfügung stehen, damit diese zu 95% ausreichen, da die
Wahrscheinlichkeit dann größer als 95% ist.
Zwischenschritt siehe
4 Maschinen
Mathe-Lernzettel
Erwartungswert einer Zufallsgröße:
- Allgemein:
Eine Zufallsgröße X nehme die Werte a1, a2, ...,am mit den Wahrscheinlichkeiten
P(X=a1), P(X=a2),...,P(X=am) an. Dann wird der zu erwartende Mittelwert E(X) der Verteilung als
Erwartungswert der Zufallsgröße X bezeichnet. Es gilt:
𝐸 𝑋 = 𝑎1 ∙ 𝑃 𝑋 = 𝑎1 + 𝑎2 ∙ 𝑃 = 𝑎2 + ⋯+ 𝑎𝑚 ∙ 𝑃 𝑋 = 𝑎𝑚 = 𝑎𝑖 ∙ 𝑃(𝑋 = 𝑎𝑖)
𝑚
𝑖=1
Der Erwartungswert wird auch mit μ bezeichnet.
- Bei einer Binomialverteilung gilt:
𝜇 = 𝐸 𝑋 = 𝑛 ∙ 𝑝
- Beispiel 1:
Ein Würfel mit einer zweiten Sechs statt der Eins wird mehrmals geworfen:
𝐸 𝑋 = 2 ∙1
6+ 3 ∙
1
6+ 4 ∙
1
6+ 5 ∙
1
6+ 6 ∙
2
6= 4, 3
- Beispiel 2:
20% Gewinnlose, 80% Nieten Eine Person möchte solange ein Los kaufen, bis sie einen Gewinn gezogen hat. Maximal 5 Lose werden gezogen. Welche Ausgabe wird im Mittel gemacht, wenn ein Los 2€ kostet? X: „Anzahl der gezogenen Lose“
a P (X = a) a P (X = a)
1 0,2 0,2
2 0,8 0,2 0,32
3 0,8 0,8 0,2 0,384
4 0,8 0,8 0,8 0,2 0,4096
5 0,8 0,8 0,8 0,8 0,2+ 0,8∙0,8∙0,8∙0,8∙0,8 = 0,8 0,8 0,8 0,8 (0,2+0,8) =0,8 0,8 0,8 0,8 (1)
2,048
Summe : 3,3616 Überlegungen zu a=5: Die erste Möglichkeit beim Ziehen des 5. Loses wäre, dass man ein Gewinn zieht. Also: 0,8 0,8 0,8 0,8 0,2 (vier Nieten und ein Gewinn). Der Erwartungswert für diese Möglichkeit beträgt 0,4096. Die zweite Möglichkeit wäre noch eine 5. Niete zu ziehen. Also: 0,8∙0,8∙0,8∙0,8∙0,8. Der Erwartungswert beträgt also 1,6384. 𝐸 𝑋 = 1 ∙ 𝑃 𝑋 = 1 + 2 ∙ 𝑃 𝑋 = 2 + 3 ∙ 𝑃 𝑋 = 3 + 4 ∙ 𝑃 𝑋 = 4 + 5 ∙ 𝑃 𝑋 = 5 = 1 ∙ 0,2 + 2 ∙ 0,8 ∙ 0,2 + 3 ∙ 0,8 ∙ 0,8 ∙ 0,2 + ⋯ = 3,3616 Der Erwartungswert für das Ziehen von einem Gewinn, innerhalb der 5 Versuche, beträgt 3,3616. Die Person müsste im Mittel 6,72 € ausgeben (3,3616 2).
Mathe-Lernzettel
Maß für die Streuung:
- Allgemein:
Bei einem Zufallsversuch kann das Ergebnis vom Erwartungswert abweichen. Je häufiger und je weiter die
Ergebnisse von μ (E(X)) abweichen, desto stärker streuen die Werte.
Def.: Als Varianz V(X) der Zufallsgröße X bezeichnet man die zu erwartende mittlere quadratische Abweichung
vom Erwartungswert μ der Zufallsgröße X, also:
𝑉 𝑋 = (𝑎1 − 𝜇)² ∙ 𝑃 𝑋 = 𝑎1 + ⋯+ (𝑎𝑚 − 𝜇)² ∙ 𝑃 𝑋 = 𝑎𝑚 = (𝑎𝑖 − 𝜇)² ∙ 𝑃(𝑋 = 𝑎𝑖)
𝑚
𝑖=1
Die Quadratwurzel aus der Varianz einer Zufallsgröße heißt Standardabweichung σ:
𝜎 = 𝑉(𝑋)
- Bei einer Binomialverteilung gilt:
𝑉 𝑋 = 𝑛 ∙ 𝑝 ∙ 𝑞 = 𝑛 ∙ 𝑝 ∙ 1 − 𝑝 = 𝜇 ∙ (1 − 𝑝)
𝜎 = 𝑛 ∙ 𝑝 ∙ 𝑞
- Beispiel:
Bekanntlich lässt sich ein Ziehen ohne Zurücklegen für große n auch näherungsweise als ein Ziehen mit
Zurücklegen interpretieren. In einer Lostrommel befinden sich insgesamt 100 Lose in der Trommel,
darunter 20 Gewinnlose. Felix kauft 10 Lose und betrachtet die Zufallsgröße X: "Anzahl der Gewinnlose"
Nehmen Sie eine näherungsweise Berechnung an, dass mit Zurücklegen gezogen wird. Ermitteln Sie für
diesen Fall den Erwartungswert, die Standardabweichung und die Wahrscheinlichkeit P(X=μ).
Gegeben: X = „Anzahl der Gewinnlose“, n = 10, p = 2,05
1
100
20
Gesucht: , , )( xP
Bei Binomialverteilungen mit der Stufenzahl n und der Erfolgswahrscheinlichkeit p gilt:
pn )1( ppn bzw. )1( p
Da es sich hierbei um einen Zufallsversuch handelt, bei dem wir zwischen Erfolg und Misserfolg
unterscheiden können und die Wahrscheinlichkeit für den Erfolg immer gleich bleibt, können wir
Gebrauch der oben genannten Formeln machen.
Erwartungswert: 22,010
Standardabweichung: 265,16,1)2,01(2
𝑃 𝑋 = 𝜇 = 𝑛𝜇 ∙ 𝑝
𝜇 ∙ (1 − 𝑝)𝑛−𝜇
⇔ 𝑃 𝑋 = 2 = 102 ∙ 0,22 ∙ (1 − 0,2)10−2
⇔ 𝑃 𝑋 = 2 ≈ 0,301
Wenn wir davon ausgehen, dass mit Zurücklegen gezogen wird, betrachten wir das Ergebnis, dass Felix
bei 2 von 10 seiner gekauften Lose Glück hat und ein Gewinnlos zieht.
Die Wahrscheinlichkeit hierfür liegt bei 30,1%.
Bedingt durch die Standardabweichung von ca. 1,27 kann es jedoch sein, dass Felix nur ein Los zieht oder
dass sich glücklicherweise 3 Gewinnlose unter seinen 10 gekauften Losen befinden.
Mathe-Lernzettel
Wie viele Lose muss Felix zusätzlich kaufen, damit er mit mehr als 99% mindestens ein Gewinnlos
bekommt?
Gesucht: 𝑛
𝑃 𝑋 ≥ 1 > 0,99
⇔ 1 − 𝑃 𝑋 ≤ 0 > 0,99 Es kann keine negative Anzahl an Gewinnlosen geben, deshalb gilt:
⇔ 1 − 𝑃 𝑋 = 0 > 0,99 | − 1 | ∙ (−1)
⇔ 𝑃 𝑋 = 0 < 0,01
𝑃 𝑋 = 0 = 𝑛0 ∙ 𝑝0 ∙ (1 − 𝑝)𝑛−0 = 1 ∙ 1 ∙
4
5 𝑛
𝑃 𝑋 = 0 = 4
5 𝑛
⇔ 4
5 𝑛
< 0,01 |ln(… )
⇔ 𝑛 ∙ ln(4
5) < ln(0,01)
⇔ 𝑛 >ln(0,01)
ln 4
5
⇔ 𝑛 ≥ 21
Felix muss zusätzlich noch 11 Lose kaufen, um mit mehr als 99% ein Gewinnlos zu bekommen.
Hypothesen:
Bei dem Testen von Hypothesen gilt es abzuwägen, ab welcher Anzahl der Erfolge X man die eine oder andere Hypothese verwirft oder glaubt. Hierfür werden die Wahrscheinlichkeiten für die Erfolge X bei den unterschiedlichen Wahrscheinlichkeiten verglichen, und so eine möglichst niedrige Fehlerwahrscheinlichkeit gefunden. Da es sich um Zufallsexperimente handelt, ist eine eindeutige Bestimmung jedoch nie möglich. Man unterscheidet zwischen Annahmebereich und Verwerfungsbereich einer Hypothese: Liegt das Ergebnis eines Zufallsversuchs im Verwerfungsbereich, dann hält man die Hypothese für falsch; liegt es im Annahmebereich, dann hat man dazu keinen Anlass. Daher können beim Hypothesentest zweierlei Fehler unterlaufen: Fehler 1. Art (α): Eine wahre Hypothese wird verworfen. Fehler 2. Art (β): Eine falsche Hypothese wird nicht verworfen (geglaubt).
- Beispiel 1:
Arzneimittel gegen Bluthochdruck helfen bei etwa 60% der Patienten. Ein neues Medikament verspricht
sogar bei 80% der Fälle zu helfen. Um dies zu testen, werden 20 Patienten mit der neuen Arznei
behandelt.
Angenommen die Behauptung ist richtig, d.h. die Heilungschance p beträgt p=0,8, dann erwarten wir im
Versuch mit n=20 Patienten ungefähr μ=n∙p=16 Heilungen.
Wenn mehr als 16 Heilungen eintreten, spricht das eher für die Behauptung des Herstellers. Zufällig kann
es aber auch zu weniger als 16 Heilungen kommen, obwohl p=0,8. Mit welcher Wahrscheinlichkeit ist dies
der Fall? Berechnen Sie dazu die Zufallsgröße X: "Anzahl der geheilten Patienten" die Wahrscheinlichkeit
P0,8(X≤15), P0,8(X≤14),..., P0,8(X≤12).
Mathe-Lernzettel
Gegeben: n = 20 (Patienten), p = 0,8 (neues Medikament), μ=16 (Heilungen)
Es liegt eine Binomialverteilung vor, da es nur 2 Ergebnisse gibt, eine gleichbleibende Wahrscheinlichkeit
vorliegt und damit eine Bernoulli-Kette zugrunde liegt.
Durch das STAT-Menü des Taschenrechner ergibt sich:
𝑃0,8 𝑋 ≤ 16 = 0,5886
𝑃0,8 𝑋 ≤ 15 = 0,3704
𝑃0,8 𝑋 ≤ 14 = 0,1958
𝑃0,8 𝑋 ≤ 13 = 0,0867
𝑃0,8 𝑋 ≤ 12 = 0,0321
Die Wahrscheinlichkeit, dass trotz der höheren Wahrscheinlichkeit von p=0,8 weniger/gleich 16 Patienten geheilt werden, ist mit einer Wahrscheinlichkeit von 58,86 % sehr hoch, verwirft man die Hypothese bei einer Heilung von weniger als 17 Patienten, kann man leicht einen Fehler begehen. Glaubt man die Hypothese schon bei 13 Heilungen, ist die Wahrscheinlichkeit die wahre Hypothese zu verwerfen mit 3,2% sehr niedrig. Angenommen, die Heilungschance des neuen Medikaments beträgt auch nur 60% wie bei den bekannten Arzneimitteln, dann erwarten wir ungefähr μ=20∙0,6=12 Heilungen. Wenn weniger als 12 Heilungen eintreten, spricht dies eher gegen die Behauptung des Herstellers (p=0,8). Zufällig kann es aber auch zu mehr als 12 Heilungen kommen:
𝑃0,6 𝑋 ≥ 13 = 1 − 𝑃0,6 𝑋 ≤ 12 = 1 − 0,5841 = 0,4159
𝑃0,6 𝑋 ≥ 14 = 1 − 𝑃0,6 𝑋 ≤ 13 = 1 − 0,75 = 0,25
𝑃0,6 𝑋 ≥ 15 = 1 − 𝑃0,6 𝑋 ≤ 14 = 1 − 0,8744 = 0,1256
𝑃0,6 𝑋 ≥ 16 = 1 − 𝑃0,6 𝑋 ≤ 15 = 1 − 0,949 = 0,051
𝑃0,6 𝑋 ≥ 17 = 1 − 𝑃0,6 𝑋 ≤ 16 = 1 − 0,984 = 0,016
Aus dem ersten Teil geht also hervor, dass die Wahrscheinlichkeit, die wahre Hypothese zu verwerfen sinkt, wenn man die Hypothese schon bei möglichst wenig Heilungen glaubt. Andersrum steigt jedoch die Wahrscheinlichkeit eine falsche Hypothese zu glauben. Man muss nun eine Entscheidungsregel aufstellen, wie zum Beispiel: Man glaubt den Angaben des neuen Medikaments, also p=0,8, wenn mindestens 15 Personen geheilt werden. Anderenfalls geht man davon aus, dass es nicht besser ist als die bisher verwendeten Medikamente mit der Wahrscheinlichkeit von 60%. Dabei können folgende Fehler passieren: Fehler 1. Art: Das neue Medikament ist besser als die bisherigen (p=0,8). Zufällig kann es aber vorkommen, dass
weniger als 15 Patienten geheilt werden und man würde den Angaben nicht glauben, obwohl sie
stimmen. Zu solch einem Fehler käme es in (𝑃0,8 𝑋 ≤ 14 = 0,1958 ) 19,6% der Fälle.
Fehler 2. Art: Das neue Medikament ist genauso gut wie die bisherigen (p=0,6). Zufällig kann es aber vorkommen, dass
mehr als 15 Patienten geheilt werden und man würde den Angaben glauben, obwohl sie nicht stimmen.
Zu solch einem Fehler käme es in (𝑃0,6 𝑋 ≥ 15 = 0,126 ) 12,6% der Fälle.
Mathe-Lernzettel
- Beispiel 2:
Nun betrachten wir 50 Patienten an denen das Medikament getestet wird.
Bestimmen Sie den kritischen Wert zur Hypothese p=0,8 so, dass α ≤ 0,05 ist.
Hinweis: Als kritischen Wert wählt man den Mittelwert zwischen zwei benachbarten ganzen Zahlen. Dadurch werden Missverständnisse vermieden, in denen unklar bliebe, ob die Entscheidungsregel z.B. für x > k oder x ≥ k (bzw. x ≤ k oder x < k ) gilt, mit k ∈ ℕ .
Die Hypothese p=0,8 wird sicherlich nur dann verworfen, wenn deutlich weniger Patienten geheilt
werden als erwartet, d.h. weniger als μ=50∙0,8=40.
Der kritische Wert zur Hypothese p=0,8 ist so zu bestimmen, dass die Wahrscheinlichkeit für den
Verwerfungsbereich V höchstens 5% beträgt, also 𝑃0,8 𝑉 ≤ 0,05.
Betrachten wir nun verschiedene Bereiche für n=50 und p=0,8:
𝑃0,8 𝑋 ≤ 36 = 0,111
𝑃0,8 𝑋 ≤ 35 = 0,061 > 0,05
𝑃0,8 𝑋 ≤ 34 = 0,031 < 0,05
Der kritische Wert liegt also zwischen 34 und 35. Die Entscheidungsregel lautet somit:
Verwirf die Hypothese p=0,8, falls weniger als 35 Heilungen erfolgen.
Die Wahrscheinlichkeit einen Fehler 2. Art zu begehen, also p=0,8 zu glauben, obwohl nur zufällig mehr
als 35 Heilungen bei p=0,6 erfolgten, kann nun einfach berechnet werden durch:
𝛽 = 𝑃0,6 𝑋 ≥ 35 = 0,096.
Gauß'sche Glockenfunktion / Normalverteilung:
Gauß entdeckte, dass sich z. B. die Wahrscheinlichkeiten zufälliger Messfehler durch glockenförmige
Wahrscheinlichkeitsdichten der Form 𝜑𝜇 ; 𝜎 𝑥 =1
𝜎 2𝜋∙ 𝑒−
(𝑥−𝜇 )²
2𝜎 ² beschreiben lassen. Dabei sind 𝜇 und 𝜎
konstante Parameter. Für 𝜇 = 0 und 𝜎 = 1 vereinfacht sich die Funktionsgleichung zu 𝜑 𝑥 =1
2𝜋∙ 𝑒−
𝑥 ²
2 .
Man spricht dann von der Standard-Glockenfunktion.
Diese e-Funktion lässt sich folgendermaßen beschreiben:
um μ auf der x-Achse verschoben
2σ² verändert den Graphen (die abfallende und die absteigende Seite
um 1
𝜎∙ 2𝜋 wird die Funktion entlang der y-Achse gestaucht
Maximalstelle liegt bei x=μ
Gegeben sind Binomialverteilungen mit einer Erfolgswahrscheinlichkeit p=0,3 und
(1) n=50 (2) n=100 (3) n=200 (4) n=300
Um die dazugehörigen Glockenkurven zeichnen zu lassen, benötigt man jeweils den Erwartungswert und
die Standardabweichung:
(1) 𝜇 = 15 (2) 𝜇 = 30 (3) 𝜇 = 60 (4) 𝜇 = 90
𝜎 = 3,240 𝜎 = 4,583 𝜎 = 6,481 𝜎 = 7,987
Mathe-Lernzettel
Es ergeben sich folgende Graphen
Mit zunehmenden n werden die Glockenkurven flacher und breiter, die Standardabweichung vom Erwartungswert nimmt zu
- Sigma-Umgebung:
Die symmetrischen Intervalle 𝜇 − 𝜎 ; 𝜇 + 𝜎 , 𝜇 − 2𝜎 ; 𝜇 + 2𝜎 und 𝜇 − 3𝜎 ; 𝜇 + 3𝜎 nennt man
auch Sigma-Umgebung mit dem Radius 1σ, 2σ und 3σ um den Erwartungswert 𝜇 und schreibt kurz 1σ-,
2σ- und 3σ-Umgebung.
Beispiel für (1) und der 1σ-Umgebung:
𝜇 − 𝜎 ; 𝜇 + 𝜎 = 15 − 3,24 ; 15 + 3,24 = 11,76 ; 18,24 ≈ 11,8 ; 18,2
(1) (2) (3) (4)
1σ-Umgebung 11,8 ; 18,2 25,5 ; 34,5 53,6 ; 66,4 82,1 ; 97,9
2σ-Umgebung 8,6 ; 21,4 29,9 ; 39,1 47,1 ; 72,9 74,2 ; 105,8
3σ-Umgebung 5,3 ; 24,7 16,3 ; 43,7 40,6 ; 79,4 66,2 ; 113,8
Mit Hilfe der Intervallgrenzen ist es nun möglich, den Flächeninhalt zwischen der Glockenkurve und der x-
Achse zu berechnen:
(1) (2) (3) (4)
1 -Umgebung 0,6827 0,6827 0,6827 0,6827
2 -Umgebung 0,9545 0,9545 0,9545 0,9545
3 -Umgebung 0,9973 0,9973 0,9973 0,9973
Es fällt auf, dass sich die Flächeninhalte zwischen der x-Achse und den jeweils 4 verschiedenen
Glockenkurven für die gleiche Sigma-Umgebung gleich groß sind.
Dies kann man nun nutzen, indem man mit dieser Sigma-Umgebung Sicherheitswahrscheinlichkeiten
angeben kann.
Ist σ>3, so gilt:
𝑃 𝜇 − 1,64𝜎 ≤ 𝑋 ≤ 𝜇 + 1,64𝜎 = 90%
𝑃 𝜇 − 1,96𝜎 ≤ 𝑋 ≤ 𝜇 + 1,96𝜎 = 95%
𝑃 𝜇 − 2,58𝜎 ≤ 𝑋 ≤ 𝜇 + 2,58𝜎 = 99%
Mathe-Lernzettel
- Vertrauens-/Konfidenzintervalle für nicht bekannte Wahrscheinlichkeiten:
Die zuvor angegebenen Vertrauensintervalle gelten nur, wenn eine Binomialverteilung vorliegt und wenn
𝜎 > 3 ist.
Radius des Intervalls Vertrauensintervall
90% -Sicherheit: 1,64 ∙ 𝜎 [𝜇 − 1,64𝜎 ; 𝜇 + 1,64𝜎]
95% -Sicherheit: 1,96 ∙ 𝜎 [𝜇 − 1,96𝜎 ; 𝜇 + 1,96𝜎]
99% -Sicherheit: 2,58 ∙ 𝜎 [𝜇 − 2,58𝜎 ; 𝜇 + 2,58𝜎]
Man rundet immer zum Erwartungswert hin. Also beim unteren Sicherheitsintervall rundet man auf, beim
oberen ab.
Dieses Intervall gibt jedoch nur absolute Werte an und man benötigt die Wahrscheinlichkeit p.
Falls man aber gleich Wahrscheinlichkeiten als Ergebnis haben möchte, so gibt es hierfür folgende Formel:
90% -Sicherheit: 1,64 ∙ 𝜎 [ − 1,64 (1−)
𝑛 ; + 1,64
(1−)
𝑛]
95% -Sicherheit: 1,96 ∙ 𝜎 [ − 1,96 (1−)
𝑛 ; + 1,96
(1−)
𝑛]
99% -Sicherheit: 2,58 ∙ 𝜎 [ − 2,58 (1−)
𝑛 ; + 2,58
(1−)
𝑛]
Wobei h der relativen Häufigkeit ( =𝑟
𝑛) entspricht, r dem Stichprobenergebnis und n dem
Stichprobenumfang.
Die Formel erhält man, indem man das obere Intervall durch n teilt:
𝜇 − 1,64𝜎
⇔ 𝑛 ∙ 𝑝 − 1,64 𝑛 ∙ 𝑝 ∙ (1 − 𝑝) |:𝑛
⇔ 𝑝 − 1,64 𝑛∙𝑝∙(1−𝑝)
𝑛²
⇔ − 1,64 ∙(1−)
𝑛 p wird hier durch h ersetzt
Mit dem Taschenrechner kann solch ein Vertrauensintervall im STAT-Menü berechnet werden:
𝐹4 [𝐼𝑁𝑇𝑅] ⟶ 𝐹1 [𝑍] ⟶ 𝐹3 [1 − 𝑝]
Es erscheint folgende Tabelle:
C-Level (Sicherheitswahrscheinlichkeit) z.B. 0,95
X (Anzahl des interessierenden Ereignisses) (r)
n (Stichprobenumfang) (n)
Save Res List 1
Das Ergebnis wird in folgender Tabelle angezeigt:
Left (untere Grenze des Intervalls) ...
Right (obere Grenze des Intervalls) ...
Mathe-Lernzettel
- Flächeninhalt und Integral einer Normalverteilung:
Zunächst kann man sich klar machen, dass die gesamte Fläche unter einer Glockenkurve 1 ergeben muss
(also 100%). Somit gilt:
𝜑𝜇 ,𝜎
+∞
−∞
𝑥 𝑑𝑥 = 1
Den Inhalt der Fläche (siehe Bild) unterhalb eines Graphen von f über dem Intervall ] −∞;𝑎]
interpretiert man als die Wahrscheinlichkeit P (X ≤ a).
Das Integral dieser Funktion wird allg. beschrieben durch:
𝜑 𝑥 = 1
𝜎∙ 2𝜋∙ 𝑒−
(𝑥−𝜇 )²
2∙𝜎²𝜇+𝑘𝜎
−∞𝑑𝑥
Durch die sog. Standardisierungsformel:
𝑧 =𝑥 − 𝜇
𝜎
erhalten wir die Standardnormalverteilung
𝜑 𝑧 =1
2𝜋∙ 𝑒−
𝑧²
2 Dies wurde durch Substitution und Transformation erreicht, ist aber nicht abirelevant!
deren Stammfunktion Φ können wir nicht berechnen und wird daher in Tabellen in der Formelsammlung
angegeben. Um ein Integral zu bestimmen muss man also nur z ausrechnen und dann in einer Tabelle
Φ z heraussuchen:
Gegeben ist die Glockenkurve: 𝜑4;2 𝑧 =1
2∙ 2𝜋∙ 𝑒−
(𝑧−4)²
2∙2²
Gesucht ist das Integral im Intervall [2;6] :
𝜑4;2 𝑧 𝑑𝑧6
2= Φ
6−4
2 − Φ
2−4
2 = Φ 1 − Φ −1 ≈ 0,683
Mit dem Taschenrechner kann das Integral einer Normalverteilung im STAT-Menü berechnet werden:
𝐹5 [𝐷𝐼𝑆𝑇] ⟶ 𝐹1 [𝑁𝑂𝑅𝑀] ⟶ 𝐹2 [𝑁𝑐𝑑]
Es erscheint folgende Tabelle:
Das Ergebnis wird in folgender Tabelle angezeigt (man kann sich das Ergebnis auch zeichnen lassen):
p 0,683
Z: Low -1
Z: Up 1
Lower 2
Upper 6
𝜎 2
𝜇 4
Mathe-Lernzettel
Beispielaufgaben:
In einem Zoo, in dem innerhalb von 5 Jahren 436 Meerschweinchen geboren wurden, waren 218 Tiere mit
einem Alter von 14 Tagen schwerer als 144,1M g .
Ermitteln Sie unter Annahme einer Binomialverteilung für die unbekannte Wahrscheinlichkeit p, dass im hannoverschen Zoo ein zweiwöchiges „Meerie“ schwerer als 144,1M g ist, zur
Sicherheitswahrscheinlichkeit von 95% das Vertrauensintervall (siehe Tabelle in der Anlage; zur Kontrolle: [0,453;0,547]).
Begründen Sie, dass das Produkt der unbekannten Wahrscheinlichkeit p mit der
Gegenwahrscheinlichkeit 1 p durch 1 0,25p p abgeschätzt werden kann und leiten Sie damit
die folgende Abschätzung für die Intervalllänge d in Abhängigkeit vom Stichprobenumfang n zur
Sicherheitswahrscheinlichkeit 95% her: 1
1,96dn
.
Berechnen Sie auf der Grundlage dieser Abschätzung den minimalen Stichprobenumfang für die Untersuchung zweiwöchiger Meerschweinchen, so dass die Grenzen des Vertrauensintervalls um höchstens 0,01 von der Mitte des Vertrauensintervalls abweichen.
In einer Normkurve nach einem Meerschweinchenverband wird das Körpergewicht Y als normalverteilt
angenommen und für den Erwartungswert für zweiwöchige Meerschweinchen 1 142g sowie für
die Standardabweichung der Wert 6,80g angegeben. Es soll geprüft werden, ob die Daten des
Zoos (siehe oben) zu dieser Normkurve passen.
Ermitteln Sie dazu aus der Normkurve die Wahrscheinlichkeit, dass ein 14 Tage altes Meerschweinchen mehr als 144,1M g wiegt.
Begründen Sie mit Hilfe der berechneten Wahrscheinlichkeit, dass die Gesamtheit der zweiwöchigen Meerschweinchen dieses Zoos bei einer Sicherheitswahrscheinlichkeit von 95% nicht durch die Normkurve beschrieben werden kann.
Bestimmen Sie einen Erwartungswert 2 für eine andere Normkurve, bei der bei gleicher
Standardabweichung 6,80g die Wahrscheinlichkeit P Y M mit der unteren Grenze 0,453 des
in b) ermittelten Vertrauensintervalls übereinstimmt.
Umgebungen des Erwartungswertes bei Binomialverteilungen und die zugehörigen Wahrscheinlichkeiten
Radius der Umgebung 1 1,64 1,96 2 2,58 3
Wahrscheinlichkeit 68 % 90 % 95 % 95,5 % 99 % 99,7 %
Mathe-Lernzettel
Lösungen:
Ermitteln Sie unter Annahme einer Binomialverteilung für die unbekannte Wahrscheinlichkeit p, dass im
hannoverschen Zoo ein zweiwöchiges „Meerie“ schwerer als M=144,1g ist, zur Sicherheitswahrscheinlichkeit
von 95% das Vertrauensintervall
Da wir p nicht kennen, müssen wir folgendes Vertrauensintervall betrachten:
[ − 1,96 (1−)
𝑛 ; + 1,96
(1−)
𝑛]
Der Stichprobenumfang n beträgt n = 436, das Strichprobenergebnis r beträgt r = 218.
Daraus ergibt sich =𝑟
𝑛=
218
436= 0,5.
Für das Vertrauensintervall gilt demnach:
[0,5 − 1,96 0,5 1−0,5
436 ; 0,5 + 1,96
0,5(1−0,5)
436]
= [0,453 ; 0,547]
Begründen Sie, dass das Produkt der unbekannten Wahrscheinlichkeit p mit der Gegenwahrscheinlichkeit 1-p durch 𝑝 ∙ (1 − 𝑝) ≈ 0,25 abgeschätzt werden kann und leiten Sie damit die folgende Abschätzung für die Intervalllänge d in Abhängigkeit vom Stichprobenumfang n zur Sicherheitswahrscheinlichkeit 95% her:
𝑑 ≈ 1,96 ∙ 1
𝑛 .
Gegeben ist 𝑝 ∙ 1 − 𝑝 ⇔ 𝑝 − 𝑝² und das Intervall [0,453 ; 0,547]. Stellt man dies als Funktion da mit 𝑓 𝑝 = 𝑝 − 𝑝² so ergibt sich eine nach unten geöffnete Parabel mit dem Maximum (0,5|0,25). Setzt man für p die linke bzw. rechte Intervallgrenze ein, so erhält man den Randwert 0,2478. Also schwanken die Werte für 0,453 bis 0,547 zwischen 0,2478 und 0,25. Um die Intervalllänge zu bestimmen hilft folgende Skizze:
Daraus folgt:
𝑑 = 2 ∙1,96𝜎
𝑛= 2 ∙ 1,96 ∙
𝑛𝑝 (1−𝑝)
𝑛= 2 ∙ 1,96 ∙
𝑝∙(1−𝑝)
𝑛
mit der Näherungsformel oben gilt weiter:
𝑑 ≈ 2 ∙ 1,96 ∙ 0,25
𝑛= 1,96 ∙
4 ∙ 0,25
𝑛= 1,96 ∙
1
𝑛 𝑞. 𝑒. 𝑑
𝑋
𝑋
𝑛
𝜇𝑚𝑖𝑛 𝜇𝑚𝑎𝑥
𝑝𝑚𝑎𝑥 𝑝𝑚𝑖𝑛
1,96𝜎 1,96𝜎
1,96𝜎
𝑛
1,96𝜎
𝑛
:𝑛
Da unsere Intervallgrenzen mit der
Wahrscheinlichkeit p angegeben sind
und nicht in absoluten Zahlen, müssen
wir auch hier wieder durch n teilen
(siehe oben -> Vertrauensintervalle)
Mathe-Lernzettel
Berechnen Sie auf der Grundlage dieser Abschätzung den minimalen Stichprobenumfang für die Untersuchung zweiwöchiger Meerschweinchen, so dass die Grenzen des Vertrauensintervalls um höchstens 0,01 von der Mitte des Vertrauensintervalls abweichen. Es muss also gelten: 𝑑 = 0,02, da d angibt, wie weit die Grenzen des Vertrauensintervall voneinander
entfernt sind. Aus 2) entnehmen wir: 𝑑 ≈ 1,96 ∙ 1
𝑛
Durch Umformen erhält man: 1,962
𝑑2 ≈ 𝑛
Einsetzen von d = 0,02: 1,962
0,022≈ 𝑛
Also ist 𝑛 ≈ 9604 und man braucht mindestens 9604 Meerschweinchen, die gewogen werden, um die oben
angegebene Vorrausetzung zu erfüllen.
Es soll aus der Normkurve zum Körpergewicht Y für zweiwöchige Meerschweinchen mit 𝜇 = 142𝑔 und
𝜎 = 6,80𝑔 die Wahrscheinlichkeit ermittelt werden, dass ein zwei Wochen altes Meerschwein mehr als
M=144,1g wiegt.
Gesucht ist 𝑃 𝑌 > 144,1 = 1 − 𝑃(𝑌 ≤ 144,1).
Der Flächeninhalt unter der Glockenkurve gibt die Wahrscheinlichkeit für das entsprechende Intervall an.
𝑃 𝑌 > 144,1 = 1 − 𝑓 𝑥 𝑑𝑥
144,1
0
= 1 − 1
2𝜋 ∙ 6,8𝑒−
(𝑥−142)2
2∙6,82 𝑑𝑥
144,1
0
≈ 0,379
(Kann mit dem GTR im STAT-Menü berechnet werden (siehe oben)).
Die Wahrscheinlichkeit, dass ein zweiwöchiges Meerschweinchen mehr als 144,1 g wiegt, beträgt somit ca.
37,9%.
Begründen Sie mit Hilfe der berechneten Wahrscheinlichkeit, dass die Gesamtheit der zweiwöchigen Meerschweinchen dieses Zoos bei einer Sicherheitswahrscheinlichkeit von 95% nicht durch die Normkurve beschrieben werden kann.
Da die berechnete Wahrscheinlichkeit von p = 0,379 nicht im in Aufgabe 1 berechneten Sicherheitsintervall
[0,453; 0,547] liegt, kann man sagen, dass die Gesamtheit der zweiwöchigen Meerschweinchen bei einer
Sicherheitswahrscheinlichkeit von 95% nicht mit Hilfe der Normkurve beschrieben werden kann.
Bestimmen Sie einen Erwartungswert 𝜇2 für eine andere Normkurve, bei der bei gleicher Standardabweichung 𝜎 = 6,8𝑔 die Wahrscheinlichkeit 𝑃(𝑌 > 𝑀) mit der unteren Grenze 0,453 des ermittelten Vertrauensintervalls übereinstimmt.
Der zu bestimmende Erwartungswert µ für eine andere Normkurve mit σ = 6,8g, für den gilt
𝑃 𝑌 > 𝑀 = 0,453, kann durch Ausprobieren bestimmt werden. Dies geschieht mit Hilfe des GTR erneut im
STAT-Menü, erneut über die Gegenwahrscheinlichkeit 𝑃 𝑌 ≤ 𝑀 = 0,547:
Für µ = 143,2 ist p = 0,552
Für µ = 143,3 ist p = 0,547 gesuchter Wert!
Für µ = 143,4 ist p = 0,541
Somit beträgt der gesuchte Erwartungswert 143,3g.