4st201 statistika 2. cvičení 4.8tomaskarel.cz/vse/4st201/prezentace/cv_3_karel_web.pdf · a =...
TRANSCRIPT
Tomáš Karel
LS 2012/2013
Doplňkový materiál ke cvičení z předmětu 4ST201.
Na případné faktické chyby v této presentaci mě prosím upozorněte. Děkuji.
Tyto slidy berte pouze jako doplňkový materiál – není v nich obsaženo
zdaleka všechno, co byste měli umět. Dalším studijním materiálem je učebnice, cvičebnice a také poznámky z přednášek a cvičení!
15.10.2013 Tomáš Karel - 4ST201 2
cv. Program cvičení
1. Úvod, popisná statistika
2. Popisná statistika
3. Míry variability, pravděpodobnost
4. Pravděpodobnost, náhodné veličiny a jejich charakteristiky
5. Pravděpodobnostní rozdělení
6. TEST, odhady parametrů
7. Testování hypotéz
8. Chí – kvadrát test dobré shody, kontingenční tabulky, ANOVA
9. Regrese
10. Regrese, korelace
11. TEST, časové řady (bazické a řetězové indexy)
12. Časové řady
13. Indexní analýza
Absolutní ◦ Rozptyl – kvadratická odchylka od průměru
(Klasický) rozptyl – známe všechny hodnoty všech jednotek (v každém městě je pouze 10 obyvatel)
Výběrový rozptyl – známe pouze některé hodnoty ze souboru
(v každém městě je víc jak 10 obyvatel)
◦ Směrodatná odchylka – je druhá odmocnina z rozptylu
◦ Variační rozpětí - nejvyšší hodnota mínus nejnižší
Relativní ◦ Variační koeficient – směrodatná odchylka dělená průměrem
n2 2
x i
i 1
1s (x x)
n
n2 2
x i
i 1
1s (x x)
n 1
x xs nebo s´
max minR x x
x xx x
s sV ,nebo V´
x x
Máme informace o • skupinových četnostech • skupinových průměrech • skupinových rozptylech
Celkový průměr Celkový rozptyl
in
ix
ix
2s
k
i i
i 1
k
i
i 1
n x
x
n
2 2 2
x xs s s
k2
i i2 i 1x k
i
i 1
(x x) n
s
n
k
ix i2 i 1
k
i
i 1
s n
s
n
Meziskupinová variabilita
Vnitroskupinová variabilita
Pokud místo skupinových absolutních četností ni máme k dispozici skupinové relativní četnosti pi, používáme pro výpočet celkového rozptylu místo vzorce
vzorec
Výpočet rozptylu z variačního koeficientu a průměru
resp. sm. odchylky z variačního koeficintu a průměru
k k2 2 2 2
x i i ix i
i 1 i 1
s (x x) p s p
k k2
i i ix i2 i 1 i 1x k k
i i
i 1 i 1
(x x) n s n
s
n n
2 2
x xs (V x)
x xs V x
Obchodní řetězec odebírá určitý výrobek, jehož cena v průběhu roku sezónně kolísá, od dvou stálých dodavatelů (A a B). Průměrná cena za celý rok od dodavatele A je 9 CZK, její směrodatná odchylka činí 2 CZK, od dodavatele A se nakoupilo 1000 kusů. U dodavatele B činí průměrná cena 10 CZK při směrodatné odchylce 1 CZK, nákup od dodavatele B byl 4000 kusů. Určete a.) variační koeficient vyjadřující variabilitu kolísání nákupní ceny během roku souhrnně za oba dva dodavatele dohromady. b.) zjistěte, zda se na celkové variabilitě nákupní ceny větší měrou podílí průběžné sezónní kolísání cen výrobku u jednotlivých dodavatelů v rámci roku nebo zda jsou důležitější rozdíly mezi průměrnými cenami jednotlivých dodavatelů.
Výrobce A 9 1 000 22=4
Výrobce B 10 4 000 12=1
ix in 2
ixs
1 1 2 2
1 2
n x n x 1000 9 4000 10x 9,8
n n 5000
Celkový průměr: Meziskupinová variabilita: Vnitroskupinová variabilita: Celkový rozptyl: Variační koeficient:
k2
2 2i i2 i 1x k
i
i 1
(x x) n(9 9,8) 1000 (10 9,8) 4000 640 160 8
s1000 4000 5000 50
n
k
2
2 2ix i2 i 1
k
i
i 1
s n2 1000 1 4000 8
s5000 5
n
2 2 2
x meziskup. vnitroskup. x
8 8 88s s s s s 1,76
50 5 50
xx
s 1,76V 0,135
x 9,8
2 2
x
8 8protože je s s
5 50
B) zjistěte, zda se na celkové variabilitě nákupní ceny větší měrou podílí průběžné sezónní kolísání cen výrobku u jednotlivých dodavatelů v rámci roku nebo zda jsou důležitější rozdíly mezi průměrnými cenami jednotlivých dodavatelů.
Vnitroskupinová variabilita je větší, než meziskupinová => Sezónní kolísání cen je důležitější
Soubor o 6 hodnotách má průměr 12 a rozptyl 4,667.
Jak se změní průměr a rozptyl souboru, pokud do souboru přibude hodnota 15?
starý
2
x starý
starý
nový
672 22ii
i 12 2 2i 1x nový nový
2 22
x 12
s 4,667
6 x 15 6 12 15x 12,43
7 7
x 15x
s x 12,437 7
6 (4,667 12 ) 1512,43 5,07
7
Náhodný pokus
pokus, jehož výsledek se i při dodržení podmínek mění, tj. jehož výsledek závisí na
náhodě (např. hod kostkou).
Náhodný jev
výsledek náhodného pokusu (např. na kostce padla šestka). Náhodný jev budeme
značit většinou velkými písmeny, např. A, B atd. Pravděpodobnost náhodného jevu A budeme označovat jako P(A).
Jev jistý (označíme např. jako nebo E) Jev, jež nastane vždy, tj. při každém opakování náhod. pokusu (např. na kostce
padne nějaké číslo z 1, 2, 3, 4, 5, 6), P( ) =1
Jev nemožný (označíme jako Ø) Jev, jež nikdy nenastane (např. na kostce padne číslo 7), P(Ø ) = 0
Elementární jev
nelze vyjádřit jako sjednocení (viz. další slide) dvou jevů, jež jsou různé od tohoto
jevu.
Doplňkový (opačný) jev k jevu A (označíme ) Jev jež nastane právě, když nenastane jev A, P( ) = 1 - P( A )
A
A
Jednou hodíme klasickou hrací kostkou. Znázorněte pomocí Vennových diagramů následující jevy:
a) jev A spočívající v padnutí šesti teček a jev B spočívající v padnutí
sudého počtu teček
b) jev A spočívající v padnutí šesti teček a jev B spočívající v padnutí
sudého počtu teček dělitelných třemi
c) jev C spočívající v padnutí šesti teček, jestliže jev A znamená
padnutí sudého počtu teček a jev B padnutí pěti nebo šesti teček
d) jev D spočívající v padnutí více než šesti teček
(jev jistý značíme E a jev nemožný Ø)
a) jev A spočívající v padnutí šesti teček a jev B spočívající v padnutí sudého
počtu teček
b) jev A spočívající v padnutí šesti teček a jev B spočívající v padnutí sudého
počtu teček dělitelných třemi
c) jev C spočívající v padnutí šesti teček, jestliže jev A znamená padnutí
sudého počtu teček a jev B padnutí pěti nebo šesti teček
d) jev D spočívající v padnutí více než šesti teček
KLASICKÁ DEFINICE PRAVDĚPODOBNOSTI
◦ říká, že pravděpodobnost nějakého jevu je rovna podílu počtu výsledků, jež jsou danému jevu příznivé, ku celkovému (konečnému) počtu výsledků, jež jsou apriori stejně pravděpodobné.
STATISTICKÁ DEFINICE PRAVDĚPODOBNOSTI
◦ říká, že pravděpodobnost nějakého jevu je relativní četností výskytu tohoto jevu v souboru o velké velikosti (v limitě blížící se k nekonečnu).
Příklad nezávislých jevů při hodu dvěma kostkami:
A = na první kostce padne 1, B = na druhé kostce padne 1.
Příklad závislých jevů při hodu dvěma kostkami:
A = na první kostce padne 1, B = součet na obou kostkách bude 10.
Jev je jevem nemožným (nemůže na první kostce padnou 1 a zároveň být součet 10), proto:
)()()( BPAPBAP
36
1
6
1
6
1)()()( BPAPBAP
36
3
6
1)()()(0 BPAPBAP
plocha průniku je při součtu
P(A)+P(B) započítána 2x,
proto jí musíme 1x odečíst
pokud jevy A a B nemají průnik,
nazýváme je neslučitelné (disjunktní)
pokud jevy A a B jsou neslučitelné, přechází pravidlo o sčítání PP. na:
)()()()( BAPBPAPBAP
)()()( BPAPBAP
Příklad neslučitelných jevů při hodu jednou kostkou:
A = padne liché číslo
B = padne sudé číslo
Příklad jevů, které nejsou neslučitelné při hodu jednou kostkou:
A = padne některé z čísel
1, 2, 3 nebo 4
B = padne 4, 5 nebo 6
3 3P(A B) P(A) P(B) 1
6 6
4 3 1P(A B) P(A) P(B) P(A B) 1
6 6 6
Jaká je pravděpodobnost, že při hodu dvěma kostkami padne:
a) na obou kostkách šestka
b) alespoň jedna šestka
c) právě jedna šestka
d) žádná šestka
e) na obou kostkách sudé číslo
Jev A . . . padla šestka na první kostce Jev B . . . padla šestka na druhé kostce Jev C . . . padlo sudé číslo na první kostce
Jev D . . . padlo sudé číslo na druhé kostce
Z publikací Českého statistického úřadu byl převzat počet narozených chlapců a děvčat v letech 1990 – 1997. Vypočítejte přibližnou pravděpodobnost, že narozené dítě bude chlapec a přibližnou pravděpodobnost, že narozené dítě bude děvče.
Absolutní četnosti
Rok Chlapci Děvčata Celkem
1990 67 234 63 860 131 094
1991 66 895 62 955 129 850
1992 62 946 59 196 122 142
1993 62 362 59 108 121 470
1994 54 887 52 028 106 915
1995 49 570 46 827 96 397
1996 46 605 44 158 90 763
1997 46 705 44 225 90 930
Celkem 457 204 432 357 889 561
P(chlapec) 457 204P(chlapec) 0,514
P(celkem) 889 561
P(dívka) 432 357P(dívka) 0,486
P(celkem) 889 561
Na viděnou na příštím cvičení.
Pokud jste něčemu nerozuměli, nebo Vám je něco nejasné,
zastavte se v konzultačních hodinách nebo mi pošlete e-mail. Rád Vám nejasnosti vysvětlím.
Email: [email protected]