podstawy statystyki
DESCRIPTION
Podstawy statystyki. Dr Janusz Górczyński. Literatura. J. Jóźwiak, J.Podgórski, Statystyka od podstaw , PWE, Warszawa 1997 K. Zając, Zarys metod statystycznych , PWE, Warszawa, 1994 J. Górczyński, Podstawy statystyki , Wyd. II. WSZiM Sochaczew, 2000 - PowerPoint PPT PresentationTRANSCRIPT
![Page 1: Podstawy statystyki](https://reader036.vdocuments.pub/reader036/viewer/2022081503/5681433c550346895dafaffe/html5/thumbnails/1.jpg)
Podstawy statystyki
Dr Janusz Górczyński
![Page 2: Podstawy statystyki](https://reader036.vdocuments.pub/reader036/viewer/2022081503/5681433c550346895dafaffe/html5/thumbnails/2.jpg)
2
Literatura J. Jóźwiak, J.Podgórski, Statystyka
od podstaw, PWE, Warszawa 1997 K. Zając, Zarys metod
statystycznych, PWE, Warszawa, 1994
J. Górczyński, Podstawy statystyki, Wyd. II. WSZiM Sochaczew, 2000
J. Górczyński, Wybrane wzory i tablice statystyczne, Wyd. II. WSZiM Sochaczew, 2000
![Page 3: Podstawy statystyki](https://reader036.vdocuments.pub/reader036/viewer/2022081503/5681433c550346895dafaffe/html5/thumbnails/3.jpg)
3
Czym zajmuje się statystyka? Odpowiadając na to pytanie
rozważmy taką sytuację: interesuje nas poznanie takiej cechy jak np. zużycie paliwa na 100 km przez samochody pewnej firmy (i modelu).
Szukając odpowiedzi na to pytanie można by ograniczyć się do spytania znajomego właściciela takiego pojazdu o to, ile jego pojazd zużywa paliwa.
![Page 4: Podstawy statystyki](https://reader036.vdocuments.pub/reader036/viewer/2022081503/5681433c550346895dafaffe/html5/thumbnails/4.jpg)
4
Czym zajmuje się statystyka ? (2)
Powiedzmy, że odpowiedź brzmi: 6,8 l/100 km.
Natychmiast pojawiają się wątpliwości co do sposobu traktowania tej odpowiedzi.
Czy to oznacza, że WSZYSTKIE samochody mają takie zużycie?
Czy to oznacza, że ŚREDNIE zużycie jest takie?
![Page 5: Podstawy statystyki](https://reader036.vdocuments.pub/reader036/viewer/2022081503/5681433c550346895dafaffe/html5/thumbnails/5.jpg)
5
Czym zajmuje się statystyka ? (3)
Czy nasz znajomy jest DOBRYM reprezentantem ogółu właścicieli tego modelu?
A może jeździ zbyt ostro? A może zbyt delikatnie? A może trzeba uzyskać odpowiedzi
od większej liczby kierowców? Jeżeli tak, to od ilu? I jak ich
wybrać?
![Page 6: Podstawy statystyki](https://reader036.vdocuments.pub/reader036/viewer/2022081503/5681433c550346895dafaffe/html5/thumbnails/6.jpg)
6
Czym zajmuje się statystyka ? (4)
Powiedzmy, że uzyskaliśmy odpowiedzi od 9 użytkowników badanego modelu.
Niech to będą takie dane:6,2 6,7 6,5 6,9 7,2 7,2 7,1 7,3 7,2
Co TERAZ możemy powiedzieć o zużycia paliwa?
Najmniejsze zużycie to 6,2 l/100 km, a największe to 7,3 l/100 km.
![Page 7: Podstawy statystyki](https://reader036.vdocuments.pub/reader036/viewer/2022081503/5681433c550346895dafaffe/html5/thumbnails/7.jpg)
7
Czym zajmuje się statystyka ? (5)
A jak można teraz określić PRZECIĘTNE zużycie paliwa?
Jedna z możliwości to ŚREDNIA ARYTMETYCZNA, w tym przykładzie równa 6,92 l/100 km.
Pytanie kolejne: czy ta średnia odnosi się tylko do tych 9 pomiarów, czy też może być odniesiona do ogółu użytkowników badanego modelu?
![Page 8: Podstawy statystyki](https://reader036.vdocuments.pub/reader036/viewer/2022081503/5681433c550346895dafaffe/html5/thumbnails/8.jpg)
8
Czym zajmuje się statystyka ? (6) Odpowiedzi na te i wiele innych pytań
udziela STATYSTYKA, która zajmuje się badaniem zjawisk masowych.
Analiza zjawisk masowych pozwala na poznanie natury zjawiska (cechy) i praw nim rządzących.
Zastosowanie statystyki do naszego przykładu pozwoli na uogólnienie wniosków na wszystkich użytkowników badanego modelu samochodu.
![Page 9: Podstawy statystyki](https://reader036.vdocuments.pub/reader036/viewer/2022081503/5681433c550346895dafaffe/html5/thumbnails/9.jpg)
9
Badanie statystyczne Celem badania statystycznego
będzie najczęściej poznanie rozkładu danej cechy i oszacowanie charakterystyk tego rozkładu.
Jeżeli zmienna losowa X jest modelem probalistycznym dla pewnej cechy w populacji generalnej, to rozkład często-ści występowania tej cechy jest opisany rozkładem prawdopodobieństwa zmiennej modelowej.
![Page 10: Podstawy statystyki](https://reader036.vdocuments.pub/reader036/viewer/2022081503/5681433c550346895dafaffe/html5/thumbnails/10.jpg)
10
Statystyka a rachunek prawdopodobieństwa Statystyka korzysta z rachunku
prawdopodobieństwa – działu matematyki zajmującego się badaniem zdarzeń przypadkowych (losowych).
Tym samym będziemy korzystać z elementarnych pojęć rachunku prawdopodobieństwa.
![Page 11: Podstawy statystyki](https://reader036.vdocuments.pub/reader036/viewer/2022081503/5681433c550346895dafaffe/html5/thumbnails/11.jpg)
11
Elelementy prawdopodobieństwa (1) Zdarzenie losowe – takie, którego
wyniku nie jesteśmy w stanie przewidzieć.
Przykładowo: wynik rzutu monetą, suma oczek przy rzucie dwoma kostkami sześciennymi.
Zdarzenie elementarne – każda możliwa sytuacja w danym zagadnieniu (eksperymencie).
![Page 12: Podstawy statystyki](https://reader036.vdocuments.pub/reader036/viewer/2022081503/5681433c550346895dafaffe/html5/thumbnails/12.jpg)
12
Elelementy prawdopodobieństwa (2)
Przykładem zdarzenia elementarnego przy rzucie dwoma kostkami do gry jest para liczb odpowiadających liczbie oczek na każdej z kostek (1,1), (1,2)...(6,6).
Zbiór wszystkich możliwych zdarzeń elementarnych oznaczamy symbolem .
Zbiór może być skończony lub nie (może zawierać nieskończenie wiele zdarzeń elementarnych).
![Page 13: Podstawy statystyki](https://reader036.vdocuments.pub/reader036/viewer/2022081503/5681433c550346895dafaffe/html5/thumbnails/13.jpg)
13
Elementy prawdopodobieństwa (3)
Zdarzenie losowe – jest to dowolny pod-zbiór zbioru zdarzeń elementarnych .
Rozpatrzmy rzut 3 monetami. Zdarzeniem losowym (powiedzmy) A może być wyrzucenie 2 reszek.
Prawdopodobieństwo zajścia zdarzenia losowego – jest to szansa zajścia tego zdarzenia.
Prawdopodobieństwo jest liczbą z przedziału domkniętego <0; 1>
![Page 14: Podstawy statystyki](https://reader036.vdocuments.pub/reader036/viewer/2022081503/5681433c550346895dafaffe/html5/thumbnails/14.jpg)
14
Obliczanie prawdopodobieństw (1) Przy obliczaniu prawdopodobieństwa zajścia
dowolnego zdarzenia losowego A można korzystać z tzw. klasycznej definicji Laplace’a:
n
kAP )(
gdzie k jest liczbą zdarzeń elementarnych tworzących zdarzenie A, a n liczbą wszyst-kich zdarzeń elementarnych w zbiorze .
![Page 15: Podstawy statystyki](https://reader036.vdocuments.pub/reader036/viewer/2022081503/5681433c550346895dafaffe/html5/thumbnails/15.jpg)
15
Obliczanie prawdopodobieństw (2) Z podanego wzoru można
oczywiście korzystać tylko wtedy, gdy zbiory zdarzeń elementarnych i zdarzeń tworzących zdarzenie losowe A są skończone (policzalne).
Z podanego wzoru wynika, że P(A) może być równe 0 (dla k=0).
Z podanego wzoru wynika, że P(A) może być równe 1 (dla k=n).
![Page 16: Podstawy statystyki](https://reader036.vdocuments.pub/reader036/viewer/2022081503/5681433c550346895dafaffe/html5/thumbnails/16.jpg)
16
Obliczanie prawdopodobieństw (3) O zdarzeniu losowym A, którego
P(A)=0 mówimy, że jest to zdarzenie niemożliwe.
O zdarzeniu losowym A, którego P(A)=1 mówimy, że jest to zdarzenie pewne.
Zdarzenie A’ nazywamy zdarzeniem przeciwnym do zdarzenia A.
Suma zdarzeń A i A’ tworzy zdarzenie pewne.
![Page 17: Podstawy statystyki](https://reader036.vdocuments.pub/reader036/viewer/2022081503/5681433c550346895dafaffe/html5/thumbnails/17.jpg)
17
Obliczanie prawdopodobieństw (4)
Dla prawdopodobieństw zdarzeń A i A’ zachodzi relacja:
P(A)+P(A’)=1 a stąd P(A’)=1-P(A) Relację powyższą wykorzystuje się
przy obliczaniu prawdopodobieństwa zajścia A - jeżeli łatwiej jest obliczyć P(A’).
![Page 18: Podstawy statystyki](https://reader036.vdocuments.pub/reader036/viewer/2022081503/5681433c550346895dafaffe/html5/thumbnails/18.jpg)
18
Obliczanie prawdopodobieństw (5) Przy obliczaniu prawdopodobieństw
wykorzystuje się dwa klasyczne wzory: P(AB)=P(A)+P(B)-P(AB) (1) P(AB)=P(A)P(B/A) (2) Jeżeli zdarzenia A i B się wykluczają, to
wzór 1 przyjmuje postać: P(AB)=P(A)+P(B) (3) Jeżeli A i B są niezależne, to wzór 2
przyjmuje postać: P(AB)=P(A)P(B) (4)
![Page 19: Podstawy statystyki](https://reader036.vdocuments.pub/reader036/viewer/2022081503/5681433c550346895dafaffe/html5/thumbnails/19.jpg)
Przykłady obliczeńprawdopodobieństw
![Page 20: Podstawy statystyki](https://reader036.vdocuments.pub/reader036/viewer/2022081503/5681433c550346895dafaffe/html5/thumbnails/20.jpg)
20
Przykład 1
Z talii 52 kart pobieramy losowo 1 kartę. Jakie jest p-stwo, że jest to as lub kier?
Korzystamy z wzoru na p-stwo sumy dwu zdarzeń. Niech A oznacza wylosowanie asa, a B wylosowanie kiera.
Zgodnie ze wzorem P(AB)=P(A)+P(B)-P(AB) mamy:
52
16
52
1134
52
1
52
13
52
4)(
BAP
![Page 21: Podstawy statystyki](https://reader036.vdocuments.pub/reader036/viewer/2022081503/5681433c550346895dafaffe/html5/thumbnails/21.jpg)
21
Przykład 2
Z urny o składzie 4 kule białe, 6 zielonych i 10 niebieskich losujemy 1 kulę. Jakie jest p-stwo, że jest to kula biała lub zielona?
Korzystamy z wzoru na p-stwo sumy dwóch zdarzeń. Niech A oznacza wylosowanie kuli białej, a B zielonej.
Zgodnie ze wzorem P(AB)=P(A)+P(B)-P(AB) mamy:
20
10
20
0
20
6
20
4)( BAP
![Page 22: Podstawy statystyki](https://reader036.vdocuments.pub/reader036/viewer/2022081503/5681433c550346895dafaffe/html5/thumbnails/22.jpg)
22
Przykład 3
Z urny o składzie 4 kule białe, 6 niebieskich i 10 zielonych losujemy dwie kule. Jakie jest p-stwo, że są to kule białe?
Korzystamy z wzoru na p-stwo iloczynu dwóch zdarzeń. Niech A oznacza wylosowanie pierwszej kuli białej, a B drugiej kuli białej.
Zgodnie ze wzorem P(AB)=P(A)P(B/A) mamy:
380
12
19
3
20
4)( BAP
![Page 23: Podstawy statystyki](https://reader036.vdocuments.pub/reader036/viewer/2022081503/5681433c550346895dafaffe/html5/thumbnails/23.jpg)
23
Przykład 3 inaczej
Przykład 3 może być także rozwiązany z użyciem symbolu Newtona od określenia liczebności zbioru i ilości zdarzeń elementarnych składających się na zdarzenie losowe.
190
6
1219201234
)!220(!2!20
)!24(!2!4
)(202
42
BAP
![Page 24: Podstawy statystyki](https://reader036.vdocuments.pub/reader036/viewer/2022081503/5681433c550346895dafaffe/html5/thumbnails/24.jpg)
24
Zmiene losowe - definicja
Zmienne losowe oznaczać będziemy dużymi litera-mi alfabetu (np. X, Y, Z), a ich wartości odpowiednio małymi literami (np. x, y, z).
Ze względu na możliwy zbiór wartości rozróżniać będziemy dwa podstawowe typy zmiennych losowych: skokowe i ciągłe.
Zmienną losową X nazywamy funkcję o wartościach rzeczywistych określoną na zbiorze zdarzeń elemen-tarnych
![Page 25: Podstawy statystyki](https://reader036.vdocuments.pub/reader036/viewer/2022081503/5681433c550346895dafaffe/html5/thumbnails/25.jpg)
25
Zmienna losowa skokowa
Zmienna losowa X typu skokowego przyjmuje skończoną lub przeliczalną liczbę wartości z pewnego przedziału.
Zmienne tego typu nazywane są także zmiennymi dyskretnymi.
Przykładem zmiennej tego typu może być np. liczba błędów na stronie pewnej książki.
![Page 26: Podstawy statystyki](https://reader036.vdocuments.pub/reader036/viewer/2022081503/5681433c550346895dafaffe/html5/thumbnails/26.jpg)
26
Zmienne losowe ciągłe
Zmienna losowa typu ciągłego przyjmuje nieskończenie wiele wartości z pewnego przedziału liczbowego.
Przykładem tego typu zmiennej może być np. zawartość tłuszczu w mleku krów, czy zawartość białka w pewnym produkcie.
![Page 27: Podstawy statystyki](https://reader036.vdocuments.pub/reader036/viewer/2022081503/5681433c550346895dafaffe/html5/thumbnails/27.jpg)
27
Rozkład zmiennej losowej skokowej
Przyporządkowanie każdej wartości zmiennej losowej typu skokowego prawdopodobieństwa jej realizacji nazy-wamy funkcją rozkładu prawdopodobieństwa (w skrócie f.r.p.). Funkcja ta może być podana w formie tabelki, wzoru lub wykresu.
Dla f.r.p. spełnione są warunki:
P X x p p
p
i i i
ii
( ) ,
0 1
1
![Page 28: Podstawy statystyki](https://reader036.vdocuments.pub/reader036/viewer/2022081503/5681433c550346895dafaffe/html5/thumbnails/28.jpg)
28
Funkcję f(x) spełniającą dwa warunki
nazywamy funkcją gęstości prawdopodobieństwa (f.g.p.) pewnej zmiennej losowej X (ciągłej).
Rozkład zmiennej losowej ciągłej
1 0
. ( )
x Rf x
2 1
. ( )f x dx
![Page 29: Podstawy statystyki](https://reader036.vdocuments.pub/reader036/viewer/2022081503/5681433c550346895dafaffe/html5/thumbnails/29.jpg)
29
Funkcja dystrybuanty
Dystrybuantą zmiennej losowej X nazywamy funkcję F(x) spełniającą warunek:
F x P X x
P x x
f x dx
ix
x x
xi
i
( ) ( )
( )
( )
![Page 30: Podstawy statystyki](https://reader036.vdocuments.pub/reader036/viewer/2022081503/5681433c550346895dafaffe/html5/thumbnails/30.jpg)
30
Własności dystrybuantyFunkcja dystrybuanty spełnia trzy warunki (lub
inaczej ma następujące własności):
1.
2. jest niemalejąca
3. jest co najmniej prawostronnie ciągła
W szczególności
F x( ) ; 0 1
F F( ) ( ) 0 1
![Page 31: Podstawy statystyki](https://reader036.vdocuments.pub/reader036/viewer/2022081503/5681433c550346895dafaffe/html5/thumbnails/31.jpg)
31
Momentem zwykłym rzędu k zmiennej losowej X
nazywamy wartość oczekiwaną k-tej potęgi tej zmiennej:
Parametryrozkładu zmiennych losowych
m EX
x p
x f x dxk
k
ik
ii
k
( )
![Page 32: Podstawy statystyki](https://reader036.vdocuments.pub/reader036/viewer/2022081503/5681433c550346895dafaffe/html5/thumbnails/32.jpg)
32
Parametryrozkładu zmiennych losowych
Momentem centralnym rzędu k zmiennej losowej X nazywamy wartość oczekiwaną funkcji g x X EX k( ) [ ]
kk
ik
ii
kE X EX
x EX p
x EX f x dx
[ ]
( )
( ) ( )
![Page 33: Podstawy statystyki](https://reader036.vdocuments.pub/reader036/viewer/2022081503/5681433c550346895dafaffe/html5/thumbnails/33.jpg)
33
Wybrane momenty
Moment zwykły rzędu pierwszego nazywamy wartością oczekiwaną zmiennej losowej X (wartością średnią):
Moment centralny rzędu drugiego nazywamy wariancją zmiennej losowej X
Pierwiastek kwadratowy z wariancji nazywamy odchyleniem standardowym
m EX1
D X E X EX22
2 [ ]
DX D X 2
![Page 34: Podstawy statystyki](https://reader036.vdocuments.pub/reader036/viewer/2022081503/5681433c550346895dafaffe/html5/thumbnails/34.jpg)
34
Związki między momentami
Dla trzech pierwszych momentów zachodzą związki:
Ze związków tych korzystamy przy praktycznym
wyznaczaniu momentów centralnych.
1 1 0 E X m( )
22
2 12 E X EX m m( )
33
3 1 2 133 2 E X EX m m m m( )
![Page 35: Podstawy statystyki](https://reader036.vdocuments.pub/reader036/viewer/2022081503/5681433c550346895dafaffe/html5/thumbnails/35.jpg)
35
Dodatkowe charakterystyki pozycyjne
P X Me i P X Me( ) ( ) 1
2
1
2
5,0)( MeF
Medianą zmiennej losowej X nazywamy wartość Me
spełniającą nierówności:
Dla zmiennej ciągłej spełniony jest warunek:
Mediana jest taką wartością zmiennej losowej X, która dzieli pole pod funkcją gęstości na dwie części o identycznej powierzchni.
![Page 36: Podstawy statystyki](https://reader036.vdocuments.pub/reader036/viewer/2022081503/5681433c550346895dafaffe/html5/thumbnails/36.jpg)
36
Dodatkowe charakterystyki pozycyjne
P X K p i P X K p
dla pp p( ) ( )
( , )
1
0 1
F K pp( )
Kwantylem rzędu p zmiennej losowej X nazywamy wartość Kp spełniającą nierówności:
Z powyższej definicji wynika, że dla zmiennej ciągłej prawdziwa jest zależność:
![Page 37: Podstawy statystyki](https://reader036.vdocuments.pub/reader036/viewer/2022081503/5681433c550346895dafaffe/html5/thumbnails/37.jpg)
37
Dodatkowe charakterystyki pozycyjne
Kwantyle rzędu p = 0.25, p = 0.50 oraz p = 0.75 nazywane są odpowiednio kwartylami i oznaczane symbolami
Q1 - kwartyl pierwszy
Q2 - kwartyl drugi
Q3 - kwartyl trzeci
Z definicji kwantylu wynika, że kwartyle dzielą zbiór wartości zmiennej losowej X na ćwiartki (po 25% zbioru elementów).
![Page 38: Podstawy statystyki](https://reader036.vdocuments.pub/reader036/viewer/2022081503/5681433c550346895dafaffe/html5/thumbnails/38.jpg)
38
Dodatkowe charakterystyki pozycyjne
W przypadku zmiennej losowej ciągłej wartości x
odpowiada maksimum lokalne funkcji gęstości.
Dominantą Do (modą Mo) zmiennej losowej X
nazywamy taką wartość x tej zmiennej, której odpo-
wiada największe prawdopodobieństwo realizacji
(w przypadku zmiennej losowej skokowej).
![Page 39: Podstawy statystyki](https://reader036.vdocuments.pub/reader036/viewer/2022081503/5681433c550346895dafaffe/html5/thumbnails/39.jpg)
39
Obliczanie dodatkowych charakterystyk
Funkcja rozkładu p-stwa pewnej zmiennej losowej X dana jest tabelką:
xi -3 -2 -1 0 1 3
pi 0,1 0,2 0,2 0,1 0,2 0,2
Obliczmy Me, k0,75 oraz Do (Mo) tej zmiennej losowej.
![Page 40: Podstawy statystyki](https://reader036.vdocuments.pub/reader036/viewer/2022081503/5681433c550346895dafaffe/html5/thumbnails/40.jpg)
40
Charakterystyki ....Medianą tej zmiennej losowej jest dowolna liczba z zakresu od –1 do 0, co wynika z poniższych nierówności:
7,0)1(5,0)1( XPiXP
5,0)0(6,0)0( XPiXP
Kwantylem rzędu 0,75 jest liczba 1, co wynika z nierówności:
4,0)1(8,0)1( XPiXP
Dominanta nie istnieje, nie ma bowiem takiej wartości zmiennej, której odpowiada max. p-stwa.
![Page 41: Podstawy statystyki](https://reader036.vdocuments.pub/reader036/viewer/2022081503/5681433c550346895dafaffe/html5/thumbnails/41.jpg)
41
Asymetria rozkładu zmiennej losowej
Zmienna losowa X ma rozkład symetryczny, jeżeli istnieje taka wartość a, że każdemu punktowi odpowiada
punkt taki, że spełnione są warunki:
W przypadku ciągłej zmiennej losowej opisanej funkcją gęstości f(x) musi być spełniony warunek:
dla każdego x
x ai
x aj
P X x P X x i a x x ai j i j( ) ( )
f a x f a x( ) ( )
![Page 42: Podstawy statystyki](https://reader036.vdocuments.pub/reader036/viewer/2022081503/5681433c550346895dafaffe/html5/thumbnails/42.jpg)
42
Asymetria rozkładu zmiennej losowej
Punkt a nosi nazwę środka symetrii, a prosta x = a jest osią symetrii.
![Page 43: Podstawy statystyki](https://reader036.vdocuments.pub/reader036/viewer/2022081503/5681433c550346895dafaffe/html5/thumbnails/43.jpg)
43
Asymetria rozkładu
Asymetria prawostronna (M oznacza średnią, a M0 dominantę)
M Mo 0
![Page 44: Podstawy statystyki](https://reader036.vdocuments.pub/reader036/viewer/2022081503/5681433c550346895dafaffe/html5/thumbnails/44.jpg)
44
Asymetria rozkładu
Asymetria lewostronna (M oznacza średnią, a M0 dominantę)
M Mo 0
![Page 45: Podstawy statystyki](https://reader036.vdocuments.pub/reader036/viewer/2022081503/5681433c550346895dafaffe/html5/thumbnails/45.jpg)
45
Miary asymetrii
Miarą asymetrii może być różnica między wartością średnią (M) a dominantą (Mo), która mierzy nie tylko stopień asymetrii, ale także jej kierunek. Jest to jednak miara mianowana, a więc zależna od jednostek cechy.
Lepszą miarą asymetrii jest współczynnik asymetrii (skośność) zdefiniowany jako
gdzie DX jest odchyleniem standardowym.
33D X
![Page 46: Podstawy statystyki](https://reader036.vdocuments.pub/reader036/viewer/2022081503/5681433c550346895dafaffe/html5/thumbnails/46.jpg)
46
Miary asymetrii (c.d)
Jeżeli > 0, to asymetria rozkładu jest dodatnia (prawostronna).
Jeżeli < 0, to asymetria rozkłau jest ujemna (lewostronna).
W rozkładzie symetrycznym = 0 (co wynika z faktu, że w rozkładach symetrycznych wszystkie momenty centralne rzędu nieparzystego są równe zero)
![Page 47: Podstawy statystyki](https://reader036.vdocuments.pub/reader036/viewer/2022081503/5681433c550346895dafaffe/html5/thumbnails/47.jpg)
47
Kurtoza
Miarą kształtu rozkładu zmiennej losowej jest kurtoza definiowana jest jako różnica stosunku momentu centralnego rzędu czwartego do kwadratu momentu centralnego rzędu drugiego a liczbą 3:
322
4
kurtoza
Dodatnia wartość kurtozy wskazuje na wysmukły kształt rozkładu zmiennej losowej, ujemna z kolei na kształt spłaszczony. Kurtoza jest więc miarą koncentracji wartości zmiennej losowej wokół jej wartości średniej.
![Page 48: Podstawy statystyki](https://reader036.vdocuments.pub/reader036/viewer/2022081503/5681433c550346895dafaffe/html5/thumbnails/48.jpg)
48
Podstawowe rozkłady zmiennych losowych
1. Rozkład zero-jedynkowy.
Funkcja rozkładu prawdopodobieństwa dana jest tabelką:
xi0 1
pi q p
Oczywiście p + q = 1
Parametrami rozkładu tej zmiennej są:
EX p D X pq DX pq , ,2
![Page 49: Podstawy statystyki](https://reader036.vdocuments.pub/reader036/viewer/2022081503/5681433c550346895dafaffe/html5/thumbnails/49.jpg)
49
Podstawowe rozkłady zmiennych losowych
2. Rozkład dwumianowy (Bernoulliego)
Rozkład ten otrzymujemy w wyniku n-krotnego powtarzania eksperymentu, w którym realizuje się zmienna zero-jedynkowa. Zmienna losowa przyjmuje n + 1 wartości, a jej
f.r.p. dana jest wzorem:
Parametry rozkładu są odpowiednio równe:
P X kn
kp qk n k( )
EX np D X npq DX npq , ,2
![Page 50: Podstawy statystyki](https://reader036.vdocuments.pub/reader036/viewer/2022081503/5681433c550346895dafaffe/html5/thumbnails/50.jpg)
50
Wykresy f.r.p dla trzech p-stw sukcesu
![Page 51: Podstawy statystyki](https://reader036.vdocuments.pub/reader036/viewer/2022081503/5681433c550346895dafaffe/html5/thumbnails/51.jpg)
51
Podstawowe rozkłady zmiennych losowych
3. Rozkład Poissona
Zmienna losowa X przyjmująca wartości k = 0, 1, 2, ..., n ma rozkład Poissona, jeżeli jej f.r.p dana jest wzorem:
Parametrami rozkładu tej zmiennej są odpowiednio:
Rozkład Poissona może być wykorzystany jako przybliżenie rozkładu dwumianowego (Bernoulliego) w tych sytuacjach, gdy n jest duże, p małe i iloczyn np = = const.
P X kk
ek
( )!
EX D X DX , ,2
![Page 52: Podstawy statystyki](https://reader036.vdocuments.pub/reader036/viewer/2022081503/5681433c550346895dafaffe/html5/thumbnails/52.jpg)
52
Wykresy f.r.p dla trzech wartości
Mean12,55
Poisson Distribution
prob
abil
ity
0 3 6 9 12 15 180
0,1
0,2
0,3
0,4
![Page 53: Podstawy statystyki](https://reader036.vdocuments.pub/reader036/viewer/2022081503/5681433c550346895dafaffe/html5/thumbnails/53.jpg)
53
Podstawowe rozkłady zmiennych losowych
4. Rozkład normalnyFunkcja gęstości rozkładu normalnego dana jest wzorem
W rozkładzie normalnym przyjmuje się nastepujące oznaczenia parametrów:
Jeżeli pewna zmienna losowa będzie miała rozkład normalny z wartością średnią m i odchyleniem standardowym , to zapiszemy to jako
XmWykresem funkcji gęstości rozkładu normalnego jest tzw.
krzywa Gaussa.
f x ex m
( )( )
1
2
2
22
EX m D X DX , 2 2
![Page 54: Podstawy statystyki](https://reader036.vdocuments.pub/reader036/viewer/2022081503/5681433c550346895dafaffe/html5/thumbnails/54.jpg)
54
Funkcja gęstości rozkładu normalnego z parametrami m i
![Page 55: Podstawy statystyki](https://reader036.vdocuments.pub/reader036/viewer/2022081503/5681433c550346895dafaffe/html5/thumbnails/55.jpg)
55
Funkcja dystrybuanty rozkładu normalnego
![Page 56: Podstawy statystyki](https://reader036.vdocuments.pub/reader036/viewer/2022081503/5681433c550346895dafaffe/html5/thumbnails/56.jpg)
56
Wpływ parametrów rozkładu normalnego na kształt i położenie funkcji gęstości
![Page 57: Podstawy statystyki](https://reader036.vdocuments.pub/reader036/viewer/2022081503/5681433c550346895dafaffe/html5/thumbnails/57.jpg)
57
Funkcja gęstości - interpretacja prawdopodobieństwa
![Page 58: Podstawy statystyki](https://reader036.vdocuments.pub/reader036/viewer/2022081503/5681433c550346895dafaffe/html5/thumbnails/58.jpg)
58
Funkcja dystrybuanty - interpretacja prawdopodobieństwa
![Page 59: Podstawy statystyki](https://reader036.vdocuments.pub/reader036/viewer/2022081503/5681433c550346895dafaffe/html5/thumbnails/59.jpg)
59
Prawo 3 sigm
Niech pewna zmienna losowa X ma rozkład normalny N(m; ).
Prawdopodobieństwo przyjęcia przez zmienną X wartości z przedziału <m-3, m+3> jest równe 0,997 .
Wynik ten można zinterpretować następująco: w przedziale <m-3, m+3> mieszczą się prawie wszystkie elementy danej populacji (normalnej).
Prawo to jest znane jako prawo 3 sigm.
![Page 60: Podstawy statystyki](https://reader036.vdocuments.pub/reader036/viewer/2022081503/5681433c550346895dafaffe/html5/thumbnails/60.jpg)
60
Standaryzacja rozkładu
Rozkład normalny ze średnią m = 0 oraz odchyleniem standardowym = 1 nazywamy standardowym rozkładem normalnym i oznaczamy symbolem N(0; 1)
Podstawienie
pozwala na przekształcenie dowolnego rozkładu normalnego do standardowego rozkładu normalnego.
zx m
![Page 61: Podstawy statystyki](https://reader036.vdocuments.pub/reader036/viewer/2022081503/5681433c550346895dafaffe/html5/thumbnails/61.jpg)
61
Standardowy rozkład normalny
![Page 62: Podstawy statystyki](https://reader036.vdocuments.pub/reader036/viewer/2022081503/5681433c550346895dafaffe/html5/thumbnails/62.jpg)
62
Rozkład N(0; 1)
Standardowy rozkład normalny jest stablicowany, w tablicach statystycznych najczęściej podawana jest dystrybuanta tego rozkładu.
Zmienne losowe o standardowym rozkładzie normalnym są podstawą konstrukcji kilku kolejnych rozkładów o podstawowym znaczeniu w statystyce. Są to miedzy innymi rozkłady:
2- Pearsona
t - Studenta
F - Fishera-Snedecora