statystyka matematyczna. wykład iii. estymacja przedziałowa
TRANSCRIPT
Rozkłady zmiennych losowychEstymacja przedziałowa
Statystyka matematyczna. Wykład III.
Estymacja przedziałowa
Edward Kozłowski
e-mail:[email protected]
Edward Kozłowski Estymacja przedziałowa
Rozkłady zmiennych losowychEstymacja przedziałowa
Spis treści
1 Rozkłady zmiennych losowychRozkład χ2
Rozkład t-StudentaRozkład Fischera
2 Estymacja przedziałowaPrzedziały ufności dla nieznanej wartości przeciętnej µPrzedziały ufności dla nieznanej wariancji σ2 i odchyleniastandardowego σ
Edward Kozłowski Estymacja przedziałowa
Rozkłady zmiennych losowychEstymacja przedziałowa
Rozkład χ2
Definicja 1.
Niech zmiwenne losowe Ui, i = 1, 2, ..., n mają rozkład normalnyN (0; 1), wtedy zmienna losowa
Xn =n∑i=1
U2i
ma rozkład χ2 o n stopniach swobody oraz oznaczamy jako Xn ∼ χ2 (n).
Funkcja gęstości
f (x, n) =
{1√
2nΓ(n2 )xn2−1e−
x2 , dla x > 0
0, dla x ¬ 0
gdzie gamma-funkcja Γ (·) jest dana wzorem
Γ (m) =
∞∫0
sm−1e−sds.
Edward Kozłowski Estymacja przedziałowa
Rozkłady zmiennych losowychEstymacja przedziałowa
Własności:
Wartoś oczekiwana zmiennej losowej Xn o rozkładzie χ2 (n) iwariancja wynoszą
EXn = n
V ar (Xn) = 2n
Zmienna losowa jest asymptotycznie zbieżna (według rozkładu)
Xn − n√2n
F−→ U dla n −→∞
gdzie zmienna losowa U ∼ N (0; 1). Zatem dla dośc dużego n mamyXn ∼ N
(n;√
2n). Powyższą aproksymację możemy stosowac dla
n 30.
Edward Kozłowski Estymacja przedziałowa
Rozkłady zmiennych losowychEstymacja przedziałowa
Zastosowanie:Niech X1, ..., Xn oznacza n−elementowa próba której elementy sąpodporządkowane rozkładowi normalnemu N (µ, σ). Niech
S2 =1n
n∑i=1
(Xi − X
)2,
X =1n
n∑i=1
Xi.
Zmienna losowa
Yn =nS2
σ2
ma rozkład χ2 (n− 1) i nie zależy od X!!!
Edward Kozłowski Estymacja przedziałowa
Rozkłady zmiennych losowychEstymacja przedziałowa
Rozkład t-Studenta
Definicja 2.
Niech U oraz Xn będą niezależnymi zmiennymi losowymi o rozkładachU ∼ N (0; 1) oraz Xn ∼ χ2 (n) odpowiednio. Zmienna losowa
Tn =U√Xnn
ma rozkład t-Stunenta o n stopniach swobody, oznaczamy jakoTn ∼ t (n).
Funkcja gęstości jest dana wzorem
f (t, n) =Γ(n+1
2
)√nπΓ
(n2
) (1 +t2
n
)−n+12
Edward Kozłowski Estymacja przedziałowa
Rozkłady zmiennych losowychEstymacja przedziałowa
Własności:Dla n 2 wartoś oczekiwana i wariancja zmiennej losowej Tn orozkładzie t (n) wynoszą
ETn = 0
V ar (Tn) =n
n− 2Dla n = 1 rozkład t-Studenta jest rozkładem Cauchy’ego, gdziefunkcja gęstości wynosi
f (t) =1π
11 + t2
Wartoś oczekiwana i wariancja w tym przypadku nie istnieją!!
lima−→+∞
1π
a∫0
t
1 + t2dt = +∞
Zmienna losowa Tn jest asymptotycznie zbieżna (według rozkładu)do rozkładu normalnego N (0; 1), tzn.
TnF−→ U dla n −→∞
gdzie zmienna losowa U ∼ N (0; 1). Powyższą aproksymacjęmożemy stosowac dla n 30.
Edward Kozłowski Estymacja przedziałowa
Rozkłady zmiennych losowychEstymacja przedziałowa
Zastosowanie:Niech n−elementowa próba X1, ..., Xn jest podporządkowana rozkładowinormalnemu N (µ, σ) oraz X i S2 oznaczają estymatory średniej iwariancji odpowiednio. Zmienna losowa postaci
Tn =X − µS
√n− 1
ma rozkład t-Studenta o n− 1 stopniach swobody (Tn ∼ t (n− 1)).
Edward Kozłowski Estymacja przedziałowa
Rozkłady zmiennych losowychEstymacja przedziałowa
Rozkład Fischera
Definicja 3.
Niech zmienne Xn oraz Xm mają rozkłady χ2 o n i m stopniachswobody odpowiednio( Xn ∼ χ2 (n), Xm ∼ χ2 (m)). Zmienna losowa
Vn,m =XnnXmm
ma rozkład Fischera o n i m stopniach swobody (oznaczamy jakoVn,m ∼ F (n,m)).
Funkcja gęstości jest dana wzorem
f (x, n,m) =
Γ(n+m2 )
Γ(n2 )Γ(m2 )nn2m
m2 x
n2 −1
(m+nx)n+m2
, dla x > 0,
0, dla x ¬ 0.
Edward Kozłowski Estymacja przedziałowa
Rozkłady zmiennych losowychEstymacja przedziałowa
Własności:
Wartość oczekiwana zmiennej losowej Vn,m
EVn,m =m
m− 2
dla m > 2.
Wariancja zmiennej losowej Vn,m
V ar (Vn,m) =2m2 (m+ n− 2)
n (m− 2)2 (m− 4)
dla m > 4.
Edward Kozłowski Estymacja przedziałowa
Rozkłady zmiennych losowychEstymacja przedziałowa
Zastosowanie:Niech n−elementowa próba X1, ..., Xn jest podporządkowana rozkładowinormalnemu N (µX , σ), natomiast m−elementowa próba Y1, ..., Ym jestpodporządkowana rozkładowi normalnemu N (µY , σ). Zmienne losoweX1, ..., Xn, Y1, ..., Ym są niezależne. Niech X i Y oznaczają estymatoryśrednich zmiennych losowych X i Y odpowiednio. Zmienna losowa
Vn,m =
1n−1
n∑i=1
(Xi − X
)21
m−1
n∑i=1
(Yi − Y
)2ma rozkład F (n− 1,m− 1).
Edward Kozłowski Estymacja przedziałowa
Rozkłady zmiennych losowychEstymacja przedziałowa
Przedziały ufności dla nieznanej wartości przeciętnej µPrzedziały ufności dla nieznanej wariancjiσ2 i odchylenia standardowegoσ
Estymacja przedziałowa
Metoda przedziałowa polega na określeniu przedziałów ufności dlanieznanych parametrów rozkładu.
Definicja 4.
Dla ustalonego poziomu ufności 1− α (poziomu istotności 0 < α < 1)przedziałem ufności parametru Θ nazywamy przedział (Θ1,Θ2) gdziekońce tego przedziału Θ1 = Θ1 (X1, ..., Xn) i Θ2 = Θ2 (X1, ..., Xn) sąfunkcjami próby losowej oraz spełniają warunek
P (Θ1 (X1, ..., Xn) < Θ < Θ2 (X1, ..., Xn)) = 1− α.
Widzimy że końce przedziału ufności są zmiennymi losowymi. Nieznanawartość parametru Θ może należeć do przedziału (Θ1,Θ2) lub tez nie!Dla różnych próbek losowych x1, ..., xn znajdujemy różne przedziałyufności.Stosunek przedziałów ufności które zawierają nieznany parametr Θ dowszystkich przedziałów skonstruowanych w oparciu o próby x1, ..., xnwynosi 1− α.
Edward Kozłowski Estymacja przedziałowa
Rozkłady zmiennych losowychEstymacja przedziałowa
Przedziały ufności dla nieznanej wartości przeciętnej µPrzedziały ufności dla nieznanej wariancjiσ2 i odchylenia standardowegoσ
Przykład 1.Dla poziomu ufności 1− α w oparciu o próbę losową X1, ..., Xn znaleźćprzedział ufności dla nieznanej wartości µ populacji, w której cecha Xma rozkład normalny N (µ, σ) oraz prametr σ jest znany.Z twierdzenia Lindeberga - Levy’ego zmienna losowa
X =X1 +X2 + ...+Xn
n
dąży do rozkładu N(µ, σ√
n
), natomiast statystyka
U =X − µσ
√n
ma rozkład normalny N (0, 1). Zadanie polega na wyznaczeniu kwantyliu1 i u2 tak aby spełniona była równość
P (u1 < U < u2) = F (u2)− F (u1) = 1− α.
Edward Kozłowski Estymacja przedziałowa
Rozkłady zmiennych losowychEstymacja przedziałowa
Przedziały ufności dla nieznanej wartości przeciętnej µPrzedziały ufności dla nieznanej wariancjiσ2 i odchylenia standardowegoσ
Przyjmuąc u2 = F−1 (1− α2) oraz u1 = F−1 (α1), gdzie α = α1 + α2,mamy
F (u2)− F (u1) = 1− α2 − α1 = 1− α
Rozwiązując nierówność
u1 <X − µσ
√n < u2
otrzymujemyX − u2
σ√n< µ < X − u1
σ√n.
Edward Kozłowski Estymacja przedziałowa
Rozkłady zmiennych losowychEstymacja przedziałowa
Przedziały ufności dla nieznanej wartości przeciętnej µPrzedziały ufności dla nieznanej wariancjiσ2 i odchylenia standardowegoσ
Uwaga.Wybierając dowolne α1, α2 tak aby była spełniona równośćα = α1 + α2 otrzymujemy różne przedziały ufności.Jeżeli α1 = α2 = α
2 , to dla rozkładu normalnego N (0, 1)mamy F−1
(1− α
2
)= −F−1
(α2
), stąd −u1 = u2. Zatem przedział
ufności jest postaci
X − u σ√n< µ < X + u
σ√n,
gdzie u = F−1(1− α
2
).
W przypadku, gdy α1 = α, to mamy
P (u < U) = 1− α.Rozwiązując nierówność
u <X − µσ
√n
otrzymujemy lewostronny przedział ufności
µ < X − u σ√n,
gdzie u = F−1 (α).Edward Kozłowski Estymacja przedziałowa
Rozkłady zmiennych losowychEstymacja przedziałowa
Przedziały ufności dla nieznanej wartości przeciętnej µPrzedziały ufności dla nieznanej wariancjiσ2 i odchylenia standardowegoσ
Uwaga cd.
W przypadku, gdy α2 = α, to
P (U < u) = 1− α.
Rozwiązując nierówność
X − µσ
√n < u
otrzymujemy prawostronny przedział ufności
X − u σ√n< µ,
gdzie u = F−1 (1− α).
Edward Kozłowski Estymacja przedziałowa
Rozkłady zmiennych losowychEstymacja przedziałowa
Przedziały ufności dla nieznanej wartości przeciętnej µPrzedziały ufności dla nieznanej wariancjiσ2 i odchylenia standardowegoσ
Przedziały ufności dla nieznanej wartości przeciętnej
* Cecha X ma rozkład normalny N (µ, σ), gdzie prametr µ jestnieznany, natomiast znane jest ochylenie standardowe σ. Dlapoziomu ufności 1− α w oparciu o próbę X1, ..., Xn przedział ufności dlanieznanej wartości µ populacji wynosi (patrz przykład 1)
X − u σ√n< µ < X + u
σ√n,
gdzie u = F−1(1− α
2
).
Edward Kozłowski Estymacja przedziałowa
Rozkłady zmiennych losowychEstymacja przedziałowa
Przedziały ufności dla nieznanej wartości przeciętnej µPrzedziały ufności dla nieznanej wariancjiσ2 i odchylenia standardowegoσ
* Cecha X ma rozkład normalny N (µ, σ), gdzie prametry µ i σ sąnieznane oraz n < 100. Statystyka
Tn =X − µS
√n− 1
ma rozklad t-Studenta o n− 1 stopniach swobody, gdzie
X =1n
n∑i=1
Xi
S =
√√√√ 1n
n∑i=1
(Xi − X
)2Z tablic rozkładu t-Studenta na poziomie ufności 1− α odczytujemykwantyle rzędu 1− α
2 oraz α2 . Ponieważ rozkład t-Studenta jest
rozkładem symetrycznym, to
t∗ = t−1(α
2, n− 1
)= −t−1
(1− α
2, n− 1
),
gdzie t(x, n) oznacza dystrybuantę rozkladu t-Studenta o n stopniachswobody.
Edward Kozłowski Estymacja przedziałowa
Rozkłady zmiennych losowychEstymacja przedziałowa
Przedziały ufności dla nieznanej wartości przeciętnej µPrzedziały ufności dla nieznanej wariancjiσ2 i odchylenia standardowegoσ
Dla poziomu ufności 1− α w oparciu o próbę X1, ..., Xn przedziałufności dla nieznanej wartości µ populacji wyznaczamy z równości
P
(−t∗ < X − µ
S
√n− 1 < t∗
)= 1− α.
Ostatecznie otrzymujemy
X − S t∗√n− 1
< µ < X + St∗√n− 1
.
Edward Kozłowski Estymacja przedziałowa
Rozkłady zmiennych losowychEstymacja przedziałowa
Przedziały ufności dla nieznanej wartości przeciętnej µPrzedziały ufności dla nieznanej wariancjiσ2 i odchylenia standardowegoσ
* Cecha X ma dowolny rozkład o nieznanych wartości średniej µ iodchyleniu standardowym σ (σ <∞). Dla dużych populacji n 100 ztwierdzenia Lindeberga - Levy’ego statystyka
U =X − µS1
√n
ma rozkład asymptotycznie zbieżny do N (0, 1), gdzie
S21 = 1
n−1
n∑i=1
(Xi − X
)2jest nieobciążonym estymatorem odchylenia
standardowego σ.Dla poziomu ufności 1− α w oparciu o próbę X1, ..., Xn przedziałufności dla nieznanej wartości µ populacji wynosi
X − u S1√n< µ < X + u
S1√n,
gdzie u = F−1(1− α
2
).
Edward Kozłowski Estymacja przedziałowa
Rozkłady zmiennych losowychEstymacja przedziałowa
Przedziały ufności dla nieznanej wartości przeciętnej µPrzedziały ufności dla nieznanej wariancjiσ2 i odchylenia standardowegoσ
Przedziały ufności dla nieznanej wariancji i odchyleniastandardowego
* Cecha X ma rozkład normalny N (µ, σ), gdzie prametry µ i σ sąnieznane. Dla próby o liczebności n ¬ 50 statystyka
χ2 =nS2
σ2
ma rozkład χ2 (chi-kwadrat) o n− 1 stopniach swobody. Z tablicrozkładu χ2 na poziomie ufności 1− α odczytujemy kwantyle rzędu1− α
2 oraz α2 i oznaczamy je jako χ2
(α2 , n− 1
), χ2
(1− α
2 , n− 1). Dla
poziomu istotności α w oparciu o próbę X1, ..., Xn przedział ufności dlanieznanej wariancji w populacji wyznaczamy z równości
P
(χ2(α
2, n− 1
)<nS2
σ2 < χ2(
1− α
2, n− 1
))= 1− α.
Edward Kozłowski Estymacja przedziałowa
Rozkłady zmiennych losowychEstymacja przedziałowa
Przedziały ufności dla nieznanej wartości przeciętnej µPrzedziały ufności dla nieznanej wariancjiσ2 i odchylenia standardowegoσ
Ostatecznie, przedział ufności dla wariancji σ2 wynosi
nS2
χ2(1− α
2 , n− 1) < σ2 <
nS2
χ2(α2 , n− 1
) ,natomiast dla odchylenia standardowego σ
S√n√
χ2(1− α
2 , n− 1) < σ <
S√n√
χ2(α2 , n− 1
) .
Edward Kozłowski Estymacja przedziałowa
Rozkłady zmiennych losowychEstymacja przedziałowa
Przedziały ufności dla nieznanej wartości przeciętnej µPrzedziały ufności dla nieznanej wariancjiσ2 i odchylenia standardowegoσ
* Cecha X ma rozkład normalny N (µ, σ), gdzie prametry µ i σ sąnieznane. Dla próby o liczbności n 50 statystyka
√2χ2 =
√2nS2
σ2 =S
σ
√2n
dąży do rozkładu normalnego N(√
2n− 3, 1). Zatem dla poziomu
istotności α w oparciu o próbę X1, ..., Xn przedział ufności dla nieznanejwariancji w populacji wyznaczamy z równości
P
(−u < S
σ
√2n−
√2n− 3 < u
)= 1− α,
gdzie u jest kwantylem rzędu 1− α2 dla rozkładu normalnego N (0, 1).
Ostatecznie przedział ufności dla odchylenia standardowego σ wynosi
S√
2n√2n− 3 + u
< σ <S√
2n√2n− 3− u
.
Edward Kozłowski Estymacja przedziałowa