statystyka matematyczna. wykład iii. estymacja przedziałowa

Rozkłady zmiennych losowychEstymacja przedziałowa

Statystyka matematyczna. Wykład III.

Estymacja przedziałowa

Edward Kozłowski

e-mail:[email protected]

Edward Kozłowski Estymacja przedziałowa


Spis treści

1 Rozkłady zmiennych losowychRozkład χ2

Rozkład t-StudentaRozkład Fischera

2 Estymacja przedziałowaPrzedziały ufności dla nieznanej wartości przeciętnej µPrzedziały ufności dla nieznanej wariancji σ2 i odchyleniastandardowego σ



Rozkład χ2

Definicja 1.

Niech zmiwenne losowe Ui, i = 1, 2, ..., n mają rozkład normalnyN (0; 1), wtedy zmienna losowa

Xn =n∑i=1

U2i

ma rozkład χ2 o n stopniach swobody oraz oznaczamy jako Xn ∼ χ2 (n).

Funkcja gęstości

f (x, n) =

{1√

2nΓ(n2 )xn2−1e−

x2 , dla x > 0

0, dla x ¬ 0

gdzie gamma-funkcja Γ (·) jest dana wzorem

Γ (m) =

∞∫0

sm−1e−sds.



Własności:

Wartoś oczekiwana zmiennej losowej Xn o rozkładzie χ2 (n) iwariancja wynoszą

EXn = n

V ar (Xn) = 2n

Zmienna losowa jest asymptotycznie zbieżna (według rozkładu)

Xn − n√2n

F−→ U dla n −→∞

gdzie zmienna losowa U ∼ N (0; 1). Zatem dla dośc dużego n mamyXn ∼ N

(n;√

2n). Powyższą aproksymację możemy stosowac dla

n 30.



Zastosowanie:Niech X1, ..., Xn oznacza n−elementowa próba której elementy sąpodporządkowane rozkładowi normalnemu N (µ, σ). Niech

S2 =1n

n∑i=1

(Xi − X

)2,

X =1n

n∑i=1

Xi.

Zmienna losowa

Yn =nS2

σ2

ma rozkład χ2 (n− 1) i nie zależy od X!!!



Rozkład t-Studenta

Definicja 2.

Niech U oraz Xn będą niezależnymi zmiennymi losowymi o rozkładachU ∼ N (0; 1) oraz Xn ∼ χ2 (n) odpowiednio. Zmienna losowa

Tn =U√Xnn

ma rozkład t-Stunenta o n stopniach swobody, oznaczamy jakoTn ∼ t (n).

Funkcja gęstości jest dana wzorem

f (t, n) =Γ(n+1

2

)√nπΓ

(n2

) (1 +t2

n

)−n+12



Własności:Dla n 2 wartoś oczekiwana i wariancja zmiennej losowej Tn orozkładzie t (n) wynoszą

ETn = 0

V ar (Tn) =n

n− 2Dla n = 1 rozkład t-Studenta jest rozkładem Cauchy’ego, gdziefunkcja gęstości wynosi

f (t) =1π

11 + t2

Wartoś oczekiwana i wariancja w tym przypadku nie istnieją!!

lima−→+∞

1π

a∫0

t

1 + t2dt = +∞

Zmienna losowa Tn jest asymptotycznie zbieżna (według rozkładu)do rozkładu normalnego N (0; 1), tzn.

TnF−→ U dla n −→∞

gdzie zmienna losowa U ∼ N (0; 1). Powyższą aproksymacjęmożemy stosowac dla n 30.



Zastosowanie:Niech n−elementowa próba X1, ..., Xn jest podporządkowana rozkładowinormalnemu N (µ, σ) oraz X i S2 oznaczają estymatory średniej iwariancji odpowiednio. Zmienna losowa postaci

Tn =X − µS

√n− 1

ma rozkład t-Studenta o n− 1 stopniach swobody (Tn ∼ t (n− 1)).



Rozkład Fischera

Definicja 3.

Niech zmienne Xn oraz Xm mają rozkłady χ2 o n i m stopniachswobody odpowiednio( Xn ∼ χ2 (n), Xm ∼ χ2 (m)). Zmienna losowa

Vn,m =XnnXmm

ma rozkład Fischera o n i m stopniach swobody (oznaczamy jakoVn,m ∼ F (n,m)).

Funkcja gęstości jest dana wzorem

f (x, n,m) =

Γ(n+m2 )

Γ(n2 )Γ(m2 )nn2m

m2 x

n2 −1

(m+nx)n+m2

, dla x > 0,

0, dla x ¬ 0.



Własności:

Wartość oczekiwana zmiennej losowej Vn,m

EVn,m =m

m− 2

dla m > 2.

Wariancja zmiennej losowej Vn,m

V ar (Vn,m) =2m2 (m+ n− 2)

n (m− 2)2 (m− 4)

dla m > 4.



Zastosowanie:Niech n−elementowa próba X1, ..., Xn jest podporządkowana rozkładowinormalnemu N (µX , σ), natomiast m−elementowa próba Y1, ..., Ym jestpodporządkowana rozkładowi normalnemu N (µY , σ). Zmienne losoweX1, ..., Xn, Y1, ..., Ym są niezależne. Niech X i Y oznaczają estymatoryśrednich zmiennych losowych X i Y odpowiednio. Zmienna losowa

Vn,m =

1n−1

n∑i=1

(Xi − X

)21

m−1

n∑i=1

(Yi − Y

)2ma rozkład F (n− 1,m− 1).



Przedziały ufności dla nieznanej wartości przeciętnej µPrzedziały ufności dla nieznanej wariancjiσ2 i odchylenia standardowegoσ

Estymacja przedziałowa

Metoda przedziałowa polega na określeniu przedziałów ufności dlanieznanych parametrów rozkładu.

Definicja 4.

Dla ustalonego poziomu ufności 1− α (poziomu istotności 0 < α < 1)przedziałem ufności parametru Θ nazywamy przedział (Θ1,Θ2) gdziekońce tego przedziału Θ1 = Θ1 (X1, ..., Xn) i Θ2 = Θ2 (X1, ..., Xn) sąfunkcjami próby losowej oraz spełniają warunek

P (Θ1 (X1, ..., Xn) < Θ < Θ2 (X1, ..., Xn)) = 1− α.

Widzimy że końce przedziału ufności są zmiennymi losowymi. Nieznanawartość parametru Θ może należeć do przedziału (Θ1,Θ2) lub tez nie!Dla różnych próbek losowych x1, ..., xn znajdujemy różne przedziałyufności.Stosunek przedziałów ufności które zawierają nieznany parametr Θ dowszystkich przedziałów skonstruowanych w oparciu o próby x1, ..., xnwynosi 1− α.




Przykład 1.Dla poziomu ufności 1− α w oparciu o próbę losową X1, ..., Xn znaleźćprzedział ufności dla nieznanej wartości µ populacji, w której cecha Xma rozkład normalny N (µ, σ) oraz prametr σ jest znany.Z twierdzenia Lindeberga - Levy’ego zmienna losowa

X =X1 +X2 + ...+Xn

n

dąży do rozkładu N(µ, σ√

n

), natomiast statystyka

U =X − µσ

√n

ma rozkład normalny N (0, 1). Zadanie polega na wyznaczeniu kwantyliu1 i u2 tak aby spełniona była równość

P (u1 < U < u2) = F (u2)− F (u1) = 1− α.




Przyjmuąc u2 = F−1 (1− α2) oraz u1 = F−1 (α1), gdzie α = α1 + α2,mamy

F (u2)− F (u1) = 1− α2 − α1 = 1− α

Rozwiązując nierówność

u1 <X − µσ

√n < u2

otrzymujemyX − u2

σ√n< µ < X − u1

σ√n.




Uwaga.Wybierając dowolne α1, α2 tak aby była spełniona równośćα = α1 + α2 otrzymujemy różne przedziały ufności.Jeżeli α1 = α2 = α

2 , to dla rozkładu normalnego N (0, 1)mamy F−1

(1− α

2

)= −F−1

(α2

), stąd −u1 = u2. Zatem przedział

ufności jest postaci

X − u σ√n< µ < X + u

σ√n,

gdzie u = F−1(1− α

2

).

W przypadku, gdy α1 = α, to mamy

P (u < U) = 1− α.Rozwiązując nierówność

u <X − µσ

√n

otrzymujemy lewostronny przedział ufności

µ < X − u σ√n,

gdzie u = F−1 (α).Edward Kozłowski Estymacja przedziałowa



Uwaga cd.

W przypadku, gdy α2 = α, to

P (U < u) = 1− α.

Rozwiązując nierówność

X − µσ

√n < u

otrzymujemy prawostronny przedział ufności

X − u σ√n< µ,

gdzie u = F−1 (1− α).




Przedziały ufności dla nieznanej wartości przeciętnej

* Cecha X ma rozkład normalny N (µ, σ), gdzie prametr µ jestnieznany, natomiast znane jest ochylenie standardowe σ. Dlapoziomu ufności 1− α w oparciu o próbę X1, ..., Xn przedział ufności dlanieznanej wartości µ populacji wynosi (patrz przykład 1)

X − u σ√n< µ < X + u

σ√n,


2

).




* Cecha X ma rozkład normalny N (µ, σ), gdzie prametry µ i σ sąnieznane oraz n < 100. Statystyka

Tn =X − µS

√n− 1

ma rozklad t-Studenta o n− 1 stopniach swobody, gdzie

X =1n

n∑i=1

Xi

S =

√√√√ 1n

n∑i=1

(Xi − X

)2Z tablic rozkładu t-Studenta na poziomie ufności 1− α odczytujemykwantyle rzędu 1− α

2 oraz α2 . Ponieważ rozkład t-Studenta jest

rozkładem symetrycznym, to

t∗ = t−1(α

2, n− 1

)= −t−1

(1− α

2, n− 1

),

gdzie t(x, n) oznacza dystrybuantę rozkladu t-Studenta o n stopniachswobody.




Dla poziomu ufności 1− α w oparciu o próbę X1, ..., Xn przedziałufności dla nieznanej wartości µ populacji wyznaczamy z równości

P

(−t∗ < X − µ

S

√n− 1 < t∗

)= 1− α.

Ostatecznie otrzymujemy

X − S t∗√n− 1

< µ < X + St∗√n− 1

.




* Cecha X ma dowolny rozkład o nieznanych wartości średniej µ iodchyleniu standardowym σ (σ <∞). Dla dużych populacji n 100 ztwierdzenia Lindeberga - Levy’ego statystyka

U =X − µS1

√n

ma rozkład asymptotycznie zbieżny do N (0, 1), gdzie

S21 = 1

n−1

n∑i=1

(Xi − X

)2jest nieobciążonym estymatorem odchylenia

standardowego σ.Dla poziomu ufności 1− α w oparciu o próbę X1, ..., Xn przedziałufności dla nieznanej wartości µ populacji wynosi

X − u S1√n< µ < X + u

S1√n,


2

).




Przedziały ufności dla nieznanej wariancji i odchyleniastandardowego

* Cecha X ma rozkład normalny N (µ, σ), gdzie prametry µ i σ sąnieznane. Dla próby o liczebności n ¬ 50 statystyka

χ2 =nS2

σ2

ma rozkład χ2 (chi-kwadrat) o n− 1 stopniach swobody. Z tablicrozkładu χ2 na poziomie ufności 1− α odczytujemy kwantyle rzędu1− α

2 oraz α2 i oznaczamy je jako χ2

(α2 , n− 1

), χ2

(1− α

2 , n− 1). Dla

poziomu istotności α w oparciu o próbę X1, ..., Xn przedział ufności dlanieznanej wariancji w populacji wyznaczamy z równości

P

(χ2(α

2, n− 1

)<nS2

σ2 < χ2(

1− α

2, n− 1

))= 1− α.




Ostatecznie, przedział ufności dla wariancji σ2 wynosi

nS2

χ2(1− α

2 , n− 1) < σ2 <

nS2

χ2(α2 , n− 1

) ,natomiast dla odchylenia standardowego σ

S√n√

χ2(1− α

2 , n− 1) < σ <

S√n√

χ2(α2 , n− 1

) .




* Cecha X ma rozkład normalny N (µ, σ), gdzie prametry µ i σ sąnieznane. Dla próby o liczbności n 50 statystyka

√2χ2 =

√2nS2

σ2 =S

σ

√2n

dąży do rozkładu normalnego N(√

2n− 3, 1). Zatem dla poziomu

istotności α w oparciu o próbę X1, ..., Xn przedział ufności dla nieznanejwariancji w populacji wyznaczamy z równości

P

(−u < S

σ

√2n−

√2n− 3 < u

)= 1− α,

gdzie u jest kwantylem rzędu 1− α2 dla rozkładu normalnego N (0, 1).

Ostatecznie przedział ufności dla odchylenia standardowego σ wynosi

S√

2n√2n− 3 + u

< σ <S√

2n√2n− 3− u

.


statystyka matematyczna. wykład iii. estymacja przedziałowa

Documents