Verlag Dashöfer
Statistika v příkladech
Praktické aplikace řešené v MS Excel
Ukázkové texty z připravované učebnice
Doc. Ing. Jan Kožíšek, CSc.
Ing. Barbora Stieberová, Ph.D.
Praha 2011
2
Obsah
Obsah
1. Předmluva ������������������������������������������������������������������������������������������������������������������������������������������������������������������� 3
2. Obsah��������������������������������������������������������������������������������������������������������������������������������������������������������������������������� 4
3. Budoucí struktura kapitol �������������������������������������������������������������������������������������������������������������������������������������������� 4
4. Ukázky učebních textů s příklady ������������������������������������������������������������������������������������������������������������������������������� 5
Ukázka 1: Dvourozměrná náhodná veličina ��������������������������������������������������������������������������������������������������������������� 5
Ukázka 2: Základní pravděpodobnostní rozdělení (modely) ������������������������������������������������������������������������������������ 10
Ukázka 3: Rozdělení spojitých náhodných veličin ��������������������������������������������������������������������������������������������������� 14
Ukázka 4: Příklad testování hypotéz při regresní a korelační analýze ���������������������������������������������������������������������� 19
5. Ukázka úloh �������������������������������������������������������������������������������������������������������������������������������������������������������������� 22
6. Ukázka slovníčku důležitých pojmů ������������������������������������������������������������������������������������������������������������������������� 23
3
1. Předmluva
1. PředmluvaVážení čtenáři,dostává se vám do rukou ukázka z připravovaného vydání učebnice statistiky, která je určena studentům vysokých škol, především technických oborů, a také všem, kteří se setkávají se statistikou při řešení problémů v podnikové praxi – vý-robním manažerům, technikům, kontrolorům nebo manažerům v oblasti řízení kvality.
Kniha je rozdělena do 18 kapitol a zahrnuje jak základní statistické metody používané v celé řadě vědních disciplín a ob-lastí, tak také aplikace statistických metod pro technickou a výrobní praxi – statistiku v metrologii, statistickou analýzu a regulaci výrobního procesu, statistickou přejímku a také statistiku ve spolehlivosti.
Začíná se metodami popisné statistiky, následuje navržení vhodných pravděpodobnostních modelů, aproximace a vyrov-nání. Navazují metody matematické statistiky, a to statistický odhad a ověřování statistických hypotéz včetně neparame-trických testů.
Jednotlivé kapitoly obsahují teoretický výklad doplněný pro rychlé pochopení problematiky velkým množstvím detailně zpracovaných příkladů. Důraz je kladen na správné použití metod v praxi a na interpretaci získaných výsledků. Příklady jsou řešeny početně a také v MS Excel. Tento software byl vybrán pro jeho nejsnazší dostupnost všem čtenářům a jeho názornost při řešení příkladů.
K publikaci je pro lepší pochopení přiloženo CD s řešením všech příkladů v MS Excel, což umožňuje také rozvíjet doved-nost pracovat s tímto softwarem. Samozřejmostí je i soubor úloh pro samostatnou práci včetně výsledků.
Každá kapitola je doplněna anglicko-českým slovníčkem základních pojmů, aby se čtenáři orientovali v zahraniční lite-ratuře a byli vybaveni pro práci v mezinárodních společnostech.
Za připomínky a podněty předem děkujeme.
AutořiPraha, říjen 2011
4
2. Obsah
2. Obsah1. Úvod2. Popisná statistika3� Regresní a korelační analýza4� Základy pravděpodobnosti5� Náhodné veličiny6� Pravděpodobnostní modely7� Limitní vlastnosti náhodných veličin8. Aproximace a vyrovnání9. Náhodný výběr a výběrová rozdělení10. Statistický odhad11. Ověřování statistických hypotéz12. Vybrané neparametrické testy13. Analýza rozptylu14. Statistika v metrologii15. Statistická analýza výrobního procesu16. Statistická regulace procesů17. Statistická přejímka18. Statistika ve spolehlivosti19. Statistické tabulky
3. Budoucí struktura kapitol1. Výkladový učební text s řešenými příklady2. Úlohy3� Výsledky úloh4� Pojmy k zapamatování (odborný česko-anglický slovníček)
5
4. Ukázky učebních textů s př ík lady
4. Ukázky učebních textů s příkladyUkázka 1: Dvourozměrná náhodná veličina
Podmíněná rozděleníV kapitole základy pravděpodobnosti jsme se zabývali podmíněnou pravděpodobností P A B( ) náhodných jevů, tj. prav-děpodobností náhodného jevu A podmíněného existencí (výskytem) náhodného jevu B. Nyní se budeme zabývat podmí-něnými rozděleními náhodných veličin.
Podmíněné pravděpodobnostiU dvourozměrné diskrétní náhodné veličiny zadané tabulkou máme dány pravděpodobnosti p x yi j;( ) uvnitř tabulky a okrajové (marginální) pravděpodobnosti p xi( ) a p y j( ). Pomocí těchto pravděpodobností můžeme definovat podmíně-né pravděpodobnosti P x yi j( ) a P y x( )j i . Tyto podmíněné pravděpodobnosti jsou definovány obdobně jako podmíněné pravděpodobnosti náhodných jevů.
P x yp x y
p yi ji j
j
( ) = ( )( )
, a P y x
p x y
p xj ii j
i( ) = ( )
( ),
�
Podmíněné pravděpodobnosti dvourozměrné diskrétní náhodné veličiny (X, Y):
p x y P x y p y p xi jj
t
i j jj
t
i( , ) ( / ) ( ) ( )= =∑ ∑= =
1 1
, p x y P y x p x p yi ji
s
j i ii
s
j( , ) ( / ) ( ) ( )= =∑ ∑= =
1 1
�
P x yp x y
p yp yp yi j
i
s i ji
s
j
j
j
( / )( )
( )
( )
( )=
=∑∑
= = =1
1 1 , P y xp x y
p xp xp xj i
j
t i jj
t
i
i
i
( / )( , )
( )( )( )=
=∑∑
= = =1
1 1 �
Podmíněné hustoty pravděpodobnosti dvourozměrné spojité náhodné veličiny (X, Y):
f x y f x yf y
( / )( , )
( )=
2
, f(y / x) f x yf x
=( , )
( )1
,
f x y dxf x y dx
f yf yf y
( / )( , )
( )( )( )
= = =−∞
∞
∫
2
2
2
1 a f y x dyf x y dy
f xf xf x
( / )( , )
( )( )( )
= = =−∞
∞
∫
1
1
1
1 �
Podmíněné distribuční funkce diskrétní náhodné veličiny:
F x y P x y y jx xi
1( / ) ( / )= =≤∑ a F y x P y x xi
y yj
2 ( / ) ( / )= =≤∑ ,
kde P X y y j=( ) je podmíněná pravděpodobnostní funkce (pravděpodobnost) náhodné veličiny X pro zvolenou hodnotu y y jj= =( )1, 2, , t… , a P y x xi=( ) je podmíněná pravděpodobnostní funkce (pravděpodobnost) náhodné veličiny Y pro zvolenou hodnotu x x ii= =( )1, 2, , s… �
Podmíněné distribuční funkce spojité dvourozměrné náhodné veličiny (X, Y):
F x y f t y dtf t y dt
f x y dx
fx
x
( / ) ( / )( , )
( , )= = =
−∞
−∞
−∞
∞∫∫
∫
(( , )
( )
t y dt
f y
x
−∞∫
2
,
Statistika v příkladech
6
F y x f z x dzf x z dz
f x y dy
fy
x
( / ) ( / )( , )
( , )= = =
−∞
−∞
−∞
∞∫∫
∫
(( , )
( )
x z dz
f x
x
−∞∫
1
�
Z předcházejících vztahů plyne:
F x y f y dy dt f x y dx F xx
( ) ( ) = ( ) = ( )−∞ −∞
∞
∫ ∫2 1, a F x y f x dx f x y dy dz F yy
( ) ( ) = ( ) = ( )−∞−∞
∞
∫∫ , 2 �
Stochasticky nezávislé náhodné veličiny
Pro stochasticky nezávislé diskrétní náhodné veličiny X a Y platí obdobné vztahy jako u nezávislých náhodných jevů:
P x y p xi j i( ) = ( ) a P y x p yj i j( ) = ( ) � Pro stochasticky nezávislé náhodné veličiny X a Y spojité platí pro libovolnou dvojici (x, y):
f x y f x( ) = ( )1 a f x y f y( ) = ( )2 �
Po dosazení předcházejících vztahů do vzorce pro podmíněné pravděpodobnosti dostaneme:
p x y p x p yi j i j,( ) = ( ) ( ) ,
případně
p x x x p x p x p xs s1 2 1 2, , ..., ( )... ( ) ( ) = ( ) �
Po dosazení do vzorců pro podmíněné hustoty pravděpodobnosti obdržíme hustotu pravděpodobnosti f x y,( ) dvouroz-měrné spojité náhodné veličiny (X, Y) v případě stochastické nezávislosti náhodných veličin X a Y
f x y f x f y,( ) = ( ) ( )1 2 �
Z výsledných vztahů vidíme, že v případě stochastické nezávislosti náhodných veličin X a Y můžeme soudit na pravdě-podobnostní chování dvourozměrné náhodné veličiny (X, Y) z pravděpodobnostního (stochastického) chování jednotli-vých náhodných veličin X a Y. Výsledné vztahy můžeme rozšířit na konečný počet mezi sebou (v souhrnu) nezávislých náhodných veličin
f x x x f x f x f xs s s1 2 1 1 2 2, , , … …( ) = ( ) ( ) ( ) �
Stochastickou (pravděpodobnostní) nezávislost dvou náhodných veličin můžeme definovat také pomocí distribučních funkcích náhodných veličin X a Y
F x y F x1 1( ) = ( ) F y x F y2 2( ) = ( ) ,
F x y F x F y,( ) = ( ) ( )1 2 �
Také tyto vztahy můžeme rozšířit na vícerozměrnou náhodnou veličinu při konečném počtu mezi sebou (v souhrnu) ne-závislých náhodných veličin x x xs1 2, , , … �
F x x x F x F x F xs s s1 2 1 1 2 2, , , … …( ) = ( ) ( ) ( ) �
7
4. Ukázky učebních textů s př ík lady
Příklad 1.1
Tabulka obsahující rozdělení četností názorů na novou reklamu: (n = 354 respondentů)
Úkol:1. Stanovte pravděpodobnostní rozdělení.2. Znázorněte zákon rozdělení graficky.3� Určete podmíněné pravděpodobnosti
P x yi j( ) a P y xj i( )�
Pravděpodobnostní rozdělení
Grafické znázornění
Podmíněné pravděpodobnosti
P x yp x y
p yi ji j
j
( ) = ( )( )
,
P(názor/ženy)
P x yp x y
p y1 11 1
1
0 26550 5
0 531( ) = ( )( )
= =, ,
,,
P x yp x y
p y2 12 1
1
0 14690 5
0 294( ) = ( )( )
= =, ,
,,
Pro 53,1 % žen je reklama výborná.Pro 29,4 % žen je reklama dobrá.17,5 % žen se reklama nelíbí.
Statistika v příkladech
8
Podmíněné pravděpodobnosti
P y xp x y
p yj ii j
j
( ) = ( )( )
,
P(pohlaví/výborná)
P y xp x y
p x1 11 1
1
0 26550 4350
0 610( ) = ( )( )
= =, ,
,,
P y xp x y
p x2 11 1
1
0 169490 4350
0 3896( ) = ( )( )
= =, ,
,,
Reklama je výborná pro:61 % žen 39 % mužů
Podmíněné střední hodnoty a podmíněné rozptyly
Paralelou podmíněných (dílčích) průměrů y ja xi v regresní a korelační analýze popisné (empirické) statistiky jsou u ná-hodných veličin podmíněné střední hodnoty E(Y/X) a E(X/Y), paralelou rozptylů podmíněných průměrů sy
2 a sx2 jsou
podmíněné rozptyly D(Y/X) a D(X/Y)�
Podmíněné střední hodnoty E(Y/X) a E(X/Y) a podmíněné rozptyly D(Y/X) a D(X/Y) slouží k posouzení stochastické ko-relační závislosti (korelačního vztahu) mezi náhodnými veličinami Y a X�
Podmíněné střední hodnoty diskrétních náhodných veličin Y a X:
E Y X x y P y xi jj
t
j i=( ) = ( )=∑
1
a E X Y y x P x yj i i ji
s
=( ) = ( )=∑
1
�
Podmíněné střední hodnoty spojitých náhodných veličin Y a X:
E Y X yf y x dy( ) = ( )−∞
∞
∫ a E Y X xf dx( ) = ( )−∞
∞
∫ x y �
Abychom získali představu o měnlivosti náhodné veličiny Y pro zvolené hodnoty X (tj. pro X xi= ) a o měnlivosti náhod-né veličiny X pro zvolené hodnoty (pevné hodnoty) Y y j= , určíme podmíněné rozptyly.
Podmíněné rozptyly D(Y/X) diskrétní náhodné veličiny Y a D(X/Y) diskrétní náhodné veličiny X:
D Y X y E Y X x P y xj i j ij
t
( ) = − =( ) ( )=∑
2
1
D X Y x E X Y y P x yj j i ji
s
( ) = − =( ) ( )=∑
2
1
�
Podmíněné rozptyly spojitých náhodných veličin Y a X:
D Y X y E Y X f y x dy( ) = − ( ) ( )−∞
∞
∫2 D X Y x E X Y f x y dx( ) = − ( ) ( )
−∞
∞
∫2
�
9
4. Ukázky učebních textů s př ík lady
Příklad 1.2
Vrátíme se k předchozímu příkladu.Vypočítáme si podmíněné střední hodnoty a podmíněné rozptyly pro názor na reklamu.(Abychom mohli stanovit očekávané hodnocení, je třeba převést slovní hodnocení na numerické vyjádření: Výborná – 3, Dobrá – 2, Nic moc – 1.)
Podmíněné střední hodnoty náhodné veličiny X (názor) pro hodnoty Y = ženy, muži
E X Y x P x yi ii
=( ) = ( ) = ⋅ + ⋅ + ⋅ ==∑Æ , , , ,zeny 1
1
3
3 0 5310 2 0 2938 1 0 17514 2 3555
Od žen se očekává průměrné bodové ohodnocení reklamám 2,355.
E X Y x P x yi ii
=( ) = ( ) = ⋅ + ⋅ + ⋅ ==∑muziÆ , , , ,2
1
3
3 0 339 2 0 4237 1 0 2373 2 102
Od mužů se očekává průměrná známka reklamám 2,102.
Podmíněné rozptyly hodnoty náhodné veličiny X (názor) pro hodnoty Y = ženy, muži
D X Y y x E X Y y P x y x P x y E X Y yj i ji
s
i j i i j j=( ) = − =( ) ( ) = ( ) − =( )=∑
2
1
2
=∑
2
1i
s
D X Y =( ) = −( ) ⋅ + −( ) ⋅ + −( )3 2 355 0 5310 2 2 355 0 2938 1 2 3552 2 2, , , , , ⋅⋅ =0 17514 0 5795, ,enyž
Rozptyly u hodnocení mužů a žen jsou obdobné.
Statistika v příkladech
10
Ukázka 2: Základní pravděpodobnostní rozdělení (modely)
Rozdělení diskrétních náhodných veličin
Binomické rozdělení
Budeme uvažovat n nezávislých pokusů, při každém z nich může nastat zdar s pravděpodobností p nebo nenastat s prav-děpodobností 1−π . Uvažujeme-li určité uspořádání výsledků n nezávislých pokusů, potom bude pravděpodobnost, že zdar nastane v x pokusech a nenastane v n x−( ) pokusech, rovna součinu pravděpodobností ve všech jednotlivých nezá-vislých pokusech. Tento součin je roven π πx n x1−( ) − a je vyjádřením tzv. Bernoulliho schématu. Takovýmito uspořádání-mi n nezávislých pokusů, při nichž x krát zdar nastane a n x−( ) krát nenastane, jsou všechny možné kombinace x té třídy z n prvků, tj. jejich počet je . Hledaná pravděpodobnost, že v n nezávislých pokusech zdar nastane x krát a nenastane n x−( ) krát je rovna
P X xnx
x n x=( ) =
−( ) −π π1 �
Rozdělení pravděpodobností dané tímto vztahem nazýváme binomické a charakterizuje tzv. výběr s vracením.
E X n( ) = π
D X n( ) = −( )π π1 , σ π πX n( ) = −( )1 �
Příklad 2.1
Zmetkovitost výrobní linky je 2,5 %. Jaká je pravděpodobnost, že při výběru 15 součástí bude 1 zmetek?
Můžou nastat např. tyto kombinace:
NNNNNNNNNNNNNNZ pravděpodobnost této kombinace 0 025 1 0 0251 10 1, ,−( ) −
NNNNNNNNNNNNNZN pravděpodobnost této kombinace 0 025 1 0 0251 10 1, ,−( ) −
NNNNNNNNNNNNZNN pravděpodobnost této kombinace 0 025 1 0 0251 10 1, ,−( ) −
NNNNNNNNNNNZNNN pravděpodobnost této kombinace 0 025 1 0 0251 10 1, ,−( ) −
Celkem je kombinací 151
Takže hledaná pravděpodobnost P 1151
0 025 1 0 0251 15 1( ) =
−( ) −, ,
Celé rozdělení si můžeme stanovit v MS Excel
BINOM.DIST(počet úspěšných pokusů; počet pokusů; pravděpodobnost úspěchu; PRAVDA, pokud chceme distribuční funkci, NEPRAVDA, pokud chceme pravděpodobnostní funkci)
11
4. Ukázky učebních textů s př ík lady
Hypergeometrické rozdělení
Při statistické přejímce nebo destruktivních zkouškách nevracíme zpět výrobek do dávky nebo ho zničíme a jedná se tedy o tzv. výběr bez vracení�
Pravděpodobnost výskytu x ve výběru n není stálá, a proto znak, který takto vzniká, má jiné pravděpodobnostní chování než binomický znak.
Vybereme-li místo n výrobků za sebou bez vracení zpět n výrobků najednou a ptáme se na pravděpodobnost, že ve výbě-ru n výrobků je právě x výrobků s vlastností a, přičemž v celkové dávce N výrobků je (M/N)100 % s vlastností a, jde o hypergeo metrické rozdělení.
P X x
Mx
N Mn x
Nn
=( ) =
−−
N – počet výrobků celkemM – počet výrobků s vlastností a celkem (tedy např. zmetků)(N-M) – počet výrobků bez vlastnosti a v základním souboru (tedy např. počet dobrých výrobků v celém základním souboru)n – výběrx ≤ n je počet výrobků s vlastností a ve výběru (tedy např. počet zmetků ve výběru n)(n-x) – počet výrobků bez vlastnosti a ve výběru (tedy např. počet dobrých výrobků ve výběru)x ≤ min (n, M)
Pro N →∞ přechází rozdělení hypergeometrické v binomické rozdělení a mizí rozdíl mezi výběrem bez vracení a výbě-rem s vracením.
Můžeme odvodit střední hodnotu a rozptyl přímo z definice
E X n MN
( ) = ⋅ , D X n MN
MN
N nN
( ) = ⋅ −
⋅
−−
1
1 ; σ X D X( ) = ( ) �
Výraz N nN−−1 je tzv. konečnostní násobitel, který má význam v teorii náhodných výběrů. Je patrné, že jej lze zanedbat pro
n N < 0,05, 0 1,( ), M N < 0,10 a N →∞. Pro n −1 je také výběr bez vracení a výběr s vracením totožný, jde o výběr pouze jednoho výrobku (tj. alternativní rozdělení).
Statistika v příkladech
12
Příklad 2.2
Z dodávky 500 výrobků je kontrolováno 5 výrobků. Zmetkovitost činí 6 %. Jaká je pravděpodobnost, že v 5 vybraných výrobcích bude 0, 1, 2, 3, 4, 5 zmetků?
Řešení
P X x
Mx
N Mn x
Nn
=( ) =
−−
P X =( ) =
=⋅ ⋅ ⋅⋅
0
300
4705
5005
470 469 466500 49
… 99 496
0 732⋅ ⋅
= …
,
Pravděpodobnost, že v 5 vybraných výrobcích není žádný zmetek, je 73,2 %.
V MS Excel použijeme následující funkce pro získání hodnot pravděpodobnostní funkce a hodnot distribuční funkce
HYPGEOM.DIST(počet zmetků ve výběru; velikost výběru; počet zmetků v základním souboru; počet hodnot v základ-ním souboru; PRAVDA, pokud chceme distribuční funkci, NEPRAVDA, pokud chceme pravděpodobnostní funkci)
=HYPGEOM.DIST(A6;5;30;500;NEPRAVDA)=HYPGEOM.DIST(A6;5;30;500;PRAVDA)
Poissonovo rozdělení
Poissonovo rozdělení je levostranně nesymetrické, a proto nachází uplatnění u tzv. řídkých jevů (počet vad, počet za-meškaných dnů) jak v technologii, tak v konstrukci nebo v oblasti ekonomických jevů. Používá se pro modelování počtu událostí za jednotku času (kolik automobilů přijede na čerpací stanici za hodinu, kolik zákazníků přijde do obchodu za jeden den, kolik zákazníků se dovolá na zákaznickou linku za hodinu).
Pravděpodobnost, že za jednotku času nastane x událostí:
P X x ex
x
=( ) = −λ λ! , E X( ) = ′ = =µ µ λ1 , D X( ) = =µ λ2 , σ λX( ) = �
13
4. Ukázky učebních textů s př ík lady
Poissonovo rozdělení aproximuje binomické rozdělení pro lim n π λ= pro π → 0, n →∞. Poissonovo rozdělení je jed-noparametrické. Tabulky distribuční i pravděpodobnostní funkce Poissonova rozdělení jsou uvedeny ve statistických tabulkách. Tyto hodnoty lze najít také pomocí MS Excel.
Příklad: 2.3
Průměrný počet nemocných pracovníků na dílně je 5 za měsíc. Určete pravděpodobnost, že za týden onemocní 3 pracovníci.
P X x ex
x
=( ) = −λ λ! P X e=( ) = ( )
=−35 4
30 0935 4
3
!,
V MS Excel využijeme následující funkci
Kde střední představuje λ
=POISSON.DIST(A7;5/4;NEPRAVDA)=POISSON.DIST(A7;5/4;PRAVDA)
Určete pravděpodobnost, že za týden onemocní víc než 3 pracovníci.P X F>( ) = − ( ) = − =3 1 3 1 0 961731 0 038269, ,
Statistika v příkladech
14
Ukázka 3: Rozdělení spojitých náhodných veličin
Rozdělení rovnoměrné
Náhodná veličina X má rovnoměrné rozdělení, jestliže má hustotu pravděpodobnosti:
1b a
x a b−
∈( ) pro ,
f x( ) =
0 pro ostatní x
Distribuční funkce
F xb a
dtb a
t x ab aa
x
a
x( ) =−
=−
[ ] =−−∫
1 1 pro x a b∈( ),
F x( ) = 0 Pro x a<
F x( ) =1 Pro x b>
E X a b( ) = +2
, α3 0= , D Xb a
( ) =−( )2
12, α4 1 8= , , σ X b a( ) = −
2 3�
Toto rozdělení se používá pro charakterizování náhodných veličin spojitých se stejnou pravděpodobností výskytu v urči-tém intervalu stejné délky (např. rozměry, tolerance).
a b
15
4. Ukázky učebních textů s př ík lady
Příklad 3.1
Na prohlídce výstavy je promítán doprovodný film o životě autora vystavovaných děl. Jeho projekce začíná každých 20 minut. Určete pravděpodobnost, že pokud náhodně přijdete do promítacího sálu, a) nebudete čekat víc než 5 minut, b) budete čekat mezi 5 a 10 minutami, c) střední hodnotu a směrodatnou odchylku.
P X F<( ) = ( ) = −−
=5 55 0
20 00 25,
P X F F5 10 10 510 020 0
5 020 0
0 25< <( ) = ( ) − ( ) = −−
−−−
= ,
E X( ) =+
=0 20
210 minut
σ X b a( ) =−
=−
=2 3
20 02 3
5 77, minut
Rozdělení exponenciální
Náhodná veličina se řídí exponenciálním rozdělením, jestliže její hustota pravděpodobnosti je:
0 0 pro x ≤
f x( ) =
λ λ >e xx− pro 0
K exponenciálnímu rozdělení můžeme dojít limitním přechodem od geometrického rozdělení. To vidíme i srovnáním charakteristik :
E X( ) = 1λ
a D X( ) = 12λ
, F x e x( ) = − −1 λ �
Exponenciální rozdělení slouží jako vhodný model pro výpočet pravděpodobnosti životnosti zařízení v teorii spolehlivosti. Je také velmi často používaným rozdělením v teorii front, tj. v teorii hromadné obsluhy, kde modeluje dobu mezi po sobě následujícími událostmi.
Statistika v příkladech
16
Příklad 3.2
Průměrná životnost strojní součástky je 30 000 hodin. Určete:1. pravděpodobnost, že součástka nevydrží více než 2000 hodin2. pravděpodobnost, že součástka vydrží více než 35 000 hodin3� dobu, do kdy se porouchá 95 % součástek
EXPON.DIST(A12;1/30000;NEPRAVDA)EXPON.DIST(A12;1/30000;PRAVDA)
λ =1 30000
P X e dx Fx< 2000 2000 0 0640
2000
( ) = = ( ) =−∫ λ λ ,
P X e dx Fx> 35000 1 1 35000 0 3110
35000
( ) = − = − ( ) =−∫ λ λ ,
x0 95 30000 1 0 95 89871 97, ln , ,= − −( ) = hodiny
17
4. Ukázky učebních textů s př ík lady
Weibullovo rozdělení
Používá se například v teorii spolehlivosti pro modelování doby života:
hustota pravděpodobnosti:f x x e x( ) = ⋅ ⋅ ⋅− −λ α α λ α1 , x > 0, λ >1, α > 0
distribuční funkce:F x e x( ) = − −1 λ α
α =1 přechází Weibullovo rozdělení v exponenciální rozdělení – úby-tek je konstatní
α >1 úbytek se s časem zmenšuje (na začátku se porouchává více součástek)
α <1 úbytek se s časem zvyšuje (na kon-ci se porouchává více součástek)
λ – souvisí se střední hodnotou
Hustota rozdělení pravděpodobnosti Weibullova rozdělení f x
Distribuční funkce Weibullova rozdělení F x( )
Statistika v příkladech
18
Příklad 3.3
Weibullovo rozdělení s parametry α =1 5, a λ = 250 hodin modeluje životnost elektronické součástky. Nalezněte pravdě-podobnost, že elektronická součástka vydrží funkční více než 900 hodin.
Řešíme v MS Excel a hledáme hodnotu distribuční funkce pro 900:
Výsledkem je F 900 0 725( ) = , , takže hledaná pravděpodobnost je P X F ( ) ( ) ,> = − =900 1 900 0 275�
19
4. Ukázky učebních textů s př ík lady
Ukázka 4: Příklad testování hypotéz při regresní a korelační analýze
Příklad 4.1
Posuďte vzájemnou závislost mezi hodnotami benzo(a)pyrenu (ng/m3) naměřeného stacionárně v určité oblasti v průběhu měsíce února s hodnotami naměřených personálních expozic benzo(a)pyrenu (z odběrů krve).
Naměřené údaje Grafické zobrazení lineární regrese a korelace
V MS Excel pro získání dat pro testování použijeme Data – Analýza dat – Regrese (viz kapitola o regresní a korelační analýze) a obdržíme následující výstup.
Korelační koeficient
Koeficient determinace
Æy yi −( )∑ 2
y yi i−( )∑Æ
2
y yi −( )∑ 2
Regresní koeficienty
Hodnota pt-testuT
bs
yx yx
b
=− β Intervaly spolehlivosti pro střední hodnotu
P b t s b t syx b yx yx b− ⋅ ≤ ≤ + ⋅( ) = −− −1 2 1 2 1α αβ α
sb
Hodnota pF testu
Testové kritérium F
FS pS n p
T
R
=−( )−( )
1
Statistika v příkladech
20
Testování regresního koeficientu
a) t-test
H byx yx0 0: = =β
H byx yx1 0: ≠ ≠β
P t T tα α α/ /2 1 2 1≤ ≤( ) = −−
P tb
styx yx
bα α
βα2 1 2 1≤
−≤
= −−
P t tα α α2 1 20 5056 0
0 13481≤
−≤
= −−
,,
P − ≤ ≤( ) =1 9983 3 7514 1 9983 0 95, , , ,
Testové kritérium neleží v intervalu, což podporuje zamítnutí hypotézy o nulové hodnotě regresního koeficientu. t t1 2 0 975 63 1 9983− = =α , ( ) , (Určíme z Excelu jako =T.INV(0,975;63))
Převod na p hodnotu
Převod na p hodnotu spočívá v určení procenta, které je vymezeno testovým kritériem.
Tedy pro hodnotu Tb
syx yx
b
=−
=β
3 7514, nalezneme odpovídající procento. Tuto hodnotu určíme z Excelu (jedná se o dvoustranný test) jako = T.DIST.2T(3,7514;63) = 0,000385, tedy 0,0385 %. Tato hodnota je menší než 5 %, tzn., že hodnota podporuje zamítnutí hypotézy o nulové hodnotě regresního koeficientu. Tzn., že mezi jevy je závislost.
b) Celkový F-test
H byx yx0 0: = =β
H byx yx1 0: ≠ ≠β
Testové kritérium F
FS pS n p
T
R
=−( )−( )
=−( )−( )
=1 2 1
65 214 05655
3,59416,092
,
Kritická hodnota Fisher-Snedecorova rozdělení je F p n p F1 0 951 1 63 3 99− − −( ) = ( ) =α ; ; ,, , (určeno v Excelu jako =F.INV(0,95;1;63)).
Významnost F
Pro hodnotu FS pS n p
T
R
=−( )−( )
=1
14 07312, nalezneme odpovídající procento. Tuto hodnotu určíme z Excelu jako 1– (=F.DIST(14,0732;1;63;1)) = 0,000385, tedy 0,0385 %. Což odpovídá t-testu.
21
4. Ukázky učebních textů s př ík lady
Testování korelačního koeficientu
H0 0: ρ ρ=
H1 0: ρ ρ≠
Tr
rnyx
yx
=−
−[ ]1
22
T =−
−[ ] =0 427
1 0 42765 2 3 748
2
,
,,
P t T tα α2 1 2≤ ≤( )−
P − ≤ ≤( )1 9983 3 748 1 9983, , ,
Testové kritérium neleží v intervalu, tzn., že máme podpořeno zamítnutí hypotézy nula o nulovosti korelačního koefici-entu. Hodnota korelačního koeficientu 0,427 není příliš vysoká - jedná se o střední závislost.
Intervaly spolehlivosti pro parametr β yx
P b t s b t syx b yx yx b− ⋅ ≤ ≤ + ⋅( ) = −− −1 2 1 2 1α αβ α
P byx0 5056 1 9983 0 13478 0 5056 1 9983 0 13478 0 95, , , , , , ,− ⋅ ≤ ≤ + ⋅( ) =
P yx0 23627 0 77493 0 95, , ,≤ ≤( ) =β
Statistika v příkladech
22
Ukázka úloh1. Úloha Vypočtěte procento zmetků, jestliže rozměry součástí mají normální rozdělení s parametry: µ = 6 656, mm, σ 0 0 0280= , mm� Toleranční meze jsou 6 500 0 020
0 100, ,,
++ �
2. ÚlohaDo servisu přijde průměrně 6 požadavků za hodinu. Určete pravděpodobnost, že do servisu přijde 10 požadavků za hodi-nu. Určete pravděpodobnost, že počet požadavků za hodinu nebude větší než 5 požadavků.
3. Úloha Pravděpodobnost výskytu jevu v každém z pokusů je stejná a je rovna 0,2. Pokusy jsou na sobě nezávislé a provádějí se tak dlouho, dokud jev nenastane. Jaká je pravděpodobnost, že se bude muset provádět 5. pokus?
4. Úloha Jaká je pravděpodobnost, že v n = 20 pokusech se výrobek 1. jakostní třídy a možnosti výskytu 0,60 objeví 15krát, výro-bek 2. jakostní třídy s možností výskytu 0,25 objeví 3krát, výrobek 3. jakostní třídy s možností výskytu 0,10 objeví 1krát a zmetek 1krát?
5. Úloha K montáži výrobku jsou potřebné 3 součástky. V dodávce první součástky se objevuje 10 % zmetků, druhé 5 % zmetků, třetí 1 % zmetků. Najděte pravděpodobnost, že při montáží výrobku se neobjeví žádný, 1, 2, 3 zmetky.
6. Úloha V dodávce 200 hotových výrobků bývá 5 % zmetků. Provedeme výběr 5 výrobků. Určete pravděpodobnost, že mezi 5 vy-branými výrobky nebude žádný zmetek.
7. Úloha Určete pravděpodobnosti P X ≤( )18 6, a P X ≤( )20 1, a P X18 6 20 1, ,≤ ≤( ) u normální náhodné veličiny s parametry µ =19 8, a σ = 0 5, �
8. Úloha Určete pravděpodobnosti P U/ / ≤( )1 , P U/ / ≤( )2 , P U/ / ≤( )3 u normované normální náhodné veličiny.
9. Úloha Určete pravděpodobnost výhry v I., II., III., IV. pořadí ve Sportce.
23
6. Ukázka slovníčku důležitých pojmů
Ukázka slovníčku důležitých pojmůStatistický odhad Estimation theory
Parametr základního souboru Population parameter
Výběrová charakteristika Sample statistic
Velikost výběrového souboru Sample size
Bodový odhad Point estimation (point estimator)
Konzistentní odhad Consistent estimator
Nevychýlený odhad Unbiased estimator
Suficience Sufficiency
Vydatný odhad Efficient estimator
Rao-Cramérova nerovnost Cramér–Rao bound (CRB) or Cramér–Rao lower bound (CRLB)
Metoda momentů Method of moments
Metoda největší (maximální) věrohodnosti Maximum-likelihood estimation (MLE)
Věrohodnostní funkce Likelihood function
Intervalový odhad Interval Estimation
Interval spolehlivosti (dvoustranný, jednostranný)
Confidence interval CI (two-tailed, one-tailed) (two-sided, one-sided)
Hladina významnosti Confidence level
Směrodatná odchylka výběrová Standard error
Chyba odhadu un1 2−ασ Margin of error