základy teórie pravdepodobností
DESCRIPTION
Základy teórie pravdepodobností. Často sa hovorí, že štatistika je “ aplikovaný počet pravdepodobností” Š tatistika popisná - vyčerpávajúce skúmanie (veda o štáte, popisná aritmetika) induktívna - výberové skúmanie (štatistické analýzy, výberové vzorky ). - PowerPoint PPT PresentationTRANSCRIPT
1
Základy teórie pravdepodobností
2
Často sa hovorí, že štatistika je “aplikovaný počet pravdepodobnost픊tatistika
popisná - vyčerpávajúce skúmanie (veda o štáte, popisná aritmetika)
induktívna - výberové skúmanie (štatistické analýzy, výberové vzorky)
Most medzi oboma druhmi štatistiky tvorí teória pravdepodobnosti
• tvorí teoretický základ pre posudzovanie spoľahlivosti a presnosti výberových postupov
3
Výberový súborVýberový súbor
Základný
súbor
Základný
súbor
Rozsah ZS >> VS Rozsah ZS >> VS
4
ZÁKLADNÉ POJMY TP:
Náhodný jav, je jav ktorý ako výsledok určitého pokusu (komplexu podmienok) môže alebo nemusí nastať. Označujeme veľkými písmenami zo začiatku abecedy A,B,C....
Extrémnymi prípadmi javov je jav istý a jav nemožný.
Jav istý (I)je taký jav ktorý ako výsledok daného pokusu nastane vždy.
Jav nemožný (O)je taký jav ktorý ako výsledok pokusu nemôže nastať nikdy.
Pravdepodobnosť je číselná miera možnosti nastatia náhodného javu
n
mAP
5
KLASICKÁ definícia pravdepodobnosti (Pierre Simon Laplace)
n
mAP
n.... Počet všetkých možných výsledkov pokusu
m... Počet výsledkov pokusu v ktorých jav A nastane (priaznivé výsledky).
ŠTATISTICKÁ definícia pravdepodobnosti (Richard von Mises)
n
mAP
n lim
Táto definícia je spojená s pojmon relatívnej početnosti, kedy pri malom počte pokusov má relatívna početnosť náhodný charakter.S rastúcim počtom pokusov sa však stabilizuje a približuje k určitému číslu (pravdepodobnosti).
6
Quetélet meral obvod hrude 5738 škótskych
vojakov
7
Základné vlastnosti pravdepodobnosti
10 )A(P
.)(P 00
1)I(P
A A
)A(P)A(P 1
Pravdepodobnosť, ako číselná miera možnosti nastatia náhodného javu, má niektoré dôležité vlastnosti:
1.Pre každý náhodný jav A platí:
3. Pravdepodobnosť javu nemožného 0 ( jav, ktorý ako výsledok náhodného pokusu nikdy nenastane) je rovný nule:
2. Pravdepodobnosť javu istého I ( jav, ktorý ako výsledok
náhodného pokusu nastane vždy ) je rovná jednej:
.
4. Pravdepodobnosť javu opačného k javu sa rovná:
8
Náhodný jav charakterizuje výsledok náhodného pokusu kvalitatívne (slovne). V mnohých prípadoch je však výhodnejšie charakterizovať výsledok kvantitatívne (číselne), k čomu používame náhodnú premennú.
Náhodná premenná je taká premenná, ktorá môže nadobúdať rôzne hodnoty, alebo hodnoty z rôznych intervalov v závislosti na náhode. Náhodné veličiny budeme označovať veľkými písmenami s konca abecedy X,Y,Z a ich konkrétne hodnoty: xj, j=1,2…n
Na štatistické znaky môžme pozerať ako na náhodné premenné NP……….
Členenie NP:diskrétne (DNP) -nadobúdajú izolované, väčšinou celočíselné hodnoty, napr. počet narodených chlapcov z 1000 narodených detí, počet chybných výrobkov….
spojité (SNP)-môžu nadobúdať ľubovoľné hodnoty z ohraničeného, alebo neohraničeného intervalu, napr.: hmotnosť, výška človeka, chyby merania v mm, príjem...
9
Náhodná premenná je plne popísaná zákonom rozdelenia NP
Zákon rozdelenia náhodnej premennej je pravidlo pomocou, ktorého definujeme obor hodnôt NP a pravdepodobnosti s ktorými tieto hodnoty nadobúda.
Môže byť vyjadrený rôznymi formami
pravdepodobnostná tabuľka, alebo rad rozdelenia
distribučná funkcia
funkcia hustoty pravdepodobnosti
DNP má dve formy zákona rozdelenia:
–- pravdepodobnostná tabuľka, alebo rad rozdelenia
–- distribučná funkcia
SNP má dve formy zákona rozdelenia:
– distribučná funkcia
– funkcia hustoty pravdepodobnosti
10
Pravdepodobnostná tabuľka- rad rozdelenia pravdepodobností - popisuje len diskrétnu náhodnú premennú (DNP),
je najjednoduchšou formou zákona rozdelenia
xi x1 x2 ... xnSpolu
pi p1 p2 ... pn 1
V prvom riadku tabuľky sú uvedené všetky možné hodnoty diskrétnej premennej a druhom riadku im zodpovedajúce pravdepodobnosti
11
Distribučná funkcia je univerzálnejšou formou vyjadrenia zákona rozdelenia, slúži k popisu tak diskrétnej ako aj spojitej NP. Každému reálnemu číslu priraďuje pravdepodobnosť,že NP nadobudne hodnotu menšiu než toto číslo tj.:
F(x) = P(X x)
Každá distribučná funkcia má tieto základné vlastnosti
1. , tj. distribučná funkcia nadobúda hodnoty od nuly do jednej vrátane.
2. a
3. Distribučná funkcia je neklesajúca tzn.: ak
4.
5. Distribučná funkcia je spojitá zľava.
10 )X(F
0 )(F 1)(F
)()(x 2121 xFFxx
)()()( 1221 xFxFxXxP
Graf distribučnej funkcie zodpovedá v popisnej štatistike grafu kumulatívnych relatívnych početností.
12
0
0,2
0,4
0,6
0,8
1
-3 -2 -1 0 1 2 3
F(x)
x
x
Distribučná funkcia DNP Distribučná funkcia SNP
13
Funkcia hustoty pravdepodobnosti
Pre spojitú náhodnú premennú je možné definovať zákon rozdelenia pomocou funkcie hustoty pravdepodobnosti f(x), alebo stručne hustota NP )()( xFxf
x
dttfxXPxF )()()(
Funkcia hustoty pravdepodobnosti má tieto základné vlastnosti:
1. )()( xFxf
2.
3.
4.
0)( xf x
2
1
)()()()( 1221
x
x
xFxFdxxfxXxP
1)( dxxf
14
Funkcia hustoty
0
0,1
0,2
0,3
0,4
0,5
-3 -2 -1 0 1 2 3
f(x)
x
F(x)
15
Koncentrovaný popis rozdelenia náhodných premenných využíva (podobne ako v popisnej štatistike), číselné hodnoty, ktoré nazývame charakteristiky náhodných premenných. Najčastejšie používanými charakteristikami sú stredná hodnota, popisujúca polohu (úroveň) náhodnej premennej a rozptyl popisujúci variabilitu náhodnej premennej
Charakteristiky náhodných premenných
k
iii pxXE
1
.)(
dxxfxXE )(.)(
Pre DNP Pre SNP
16
Rozptyl je mierou variability náhodnej premennej, pričom ho môžeme všeobecne definovať v tvare:
222 )()()()( XEXEXExEXD
k
iii pXExXD
1
2 .)()(
Pre DNP Pre SNP
dxxfXExXD )()()( 2
Pri popise náhodných premenných, najmä spojitých, sa veľmi často používajú tiež kvantily: p % kvantilom náhodnej premennej X, ktorá má spojité rozdelenie s distribučnou funkciou a hustotu pravdepodobnosti je číslo , pre ktoré platí:
px
pp dxxfxFxXP )()()( 10 pkde
17
Najčastejšie používané rozdelenia náhodných premenných
Diskrétne rozdelenia NP Rozdelenia spojitej NP
1. Alternatívne rozdelenie2. Binomické rozdelenie 3. Poissonovo rozdelenie4. Hypergeometrické
rozdelenie
a iné
1. Normálne rozdelenie
2. Normované normálne rozdelenie
3. Rovnomerné rozdelenie
4. Exponenciálne rozdelenie
5. Weibullovo rozdelenie
6. Gama rozdelenie
a iné
Výberové rozdelenia
•chí- kvadrát rozdelenie
•Studentovo t – rozdelenie
•F- rozdelenie
2
18
Alternatívne rozdelenieNáhodná premenná X má alternatívne rozdelenie
s parametrom , kde , a ak nadobúda len dve hodnoty x = 0, a x = 1 a to s pravdepodobnosťami a , kde .
Stredná hodnota alternatívneho rozdelenia je
a rozptyl
Uvedenú náhodnú premennú nazývame nula – jedničková, v praxi sa používa pri popise výskytu určitého javu.
p 10 ppXP 1)0(
pXP )1( 10 p
pXE )(
)1()( 2 ppppXD
Rozdelenia diskrétnej náhodnej premennej
19
Binomické rozdeleniePredpokladajme, že určitý pokus opakujeme n- krát za tých istých podmienok ( tj. takých pokusov, kedy výsledok žiadneho pokusu neovplyvní pravdepodobnosť výsledkov iných pokusov), pri ktorých môže nastať jav A s pravdepodobnosťou p, a nenastane s pravdepodobnosťou .
Pravdepodobnosť, že sa jav A objaví práve k- krát, je daná vzťahom:
pq 1
knkk q.p
k
n)kX(Pp
kde k = 0, 1, 2, ..., n
Hodnoty n a p sú parametre binomického rozdelenia tj. také veličiny, ktoré musíme poznať, aby sme mohli ľubovoľnému X priradiť jeho pravdepodobnosť . Pre strednú hodnotu a rozptyl náhodnej premennej s binomickým rozdelením platí
np)X(E npq)X(D
20
Poissonovo rozdelenie
Predpokladajme, že počet pokusov n je dostatočne veľký (stačí ) a pravdepodobnosť p je veľmi malá (prakticky ), potom môžeme binomické rozdelenie aproximovať Poissonovým rozdelením s parametrom
Pravdepodobnostná funkcia Poissonovho rozdelenia je daná vzťahom
n30n ,10p
p.n
e.
!xp
k
kKde k = 0, 1, 2, ...
Pre strednú hodnotu a rozptyl náhodnej veličiny s Poissonovým rozdelením platí ich rovnosť, tj )X(D)X(E
Poissonovo rozdelenie tým lepšie aproximuje binomické rozdelenie, čím väčší je počet pokusov n a čím menšia je pravdepodobnosť p Riadi sa ním počet javov v priestorovej jednotke alebo počet udalostí v časovej jednotke. Niekedy sa zvykne Poissonovo rozdelenie označovať ako zákon vzácnych resp. zriedkavých javov. Príkladom môže byť počet výskytov vzácneho ochorenia zvierat, výskyt porúch strojného zariadenia v čase t, a pod.
21
Hypergeometrické rozdelenie
Predpokladajme, že v súbore N prvkov ich M má určitú vlastnosť A. Zo súboru náhodne vyberieme n prvkov, bez toho aby sme ich vracali späť do pôvodného súboru ( tzv. výber bez opakovania ). Počet prvkov s vlastnosťou A , ktoré boli vybrané do výberu prvkov je zrejme náhodná premenná X, ktorá môže nadobúdať hodnoty
)n,Mmin(,),NMn,max(k 0
s pravdepodobnosťami
n
N
kn
MN
k
M
pk
Ak je rozsah výberu príliš malý vzhľadom na rozsah základného súboru , je možné hypergeometrické rozdelenie úspešne nahradiť binomickým rozdelením. V praxi sa často vyskytuje tiež aproximácia hypergeometrického rozdelenia Poissonovým rozdelením s parametrom
náhrada je kvalitná už pri a .
Hypergeometrické rozdelenie sa využíva v teórii výberových šetrení a štatistickej kontrole akosti.
N
Mn
1,0N
M1,0
M
n
22
Rozdelenia spojitej náhodnej premennejNormálne rozdelenie (Gaussovo)
Normálne rozdelenie má v štatistike kľúčové postavenie, slúži ako pravdepodobnostný model chovania veľkého počtu náhodných javov v biológii, technike i ekonómii. Normálne rozdelenie je vhodným pravdepodobnostným modelom takých náhodných premenných, ktoré sú súčtom veľkého počtu nezávislých alebo len slabo závislých veličín ( zložiek ) Veľký význam normálneho rozdelenia je aj v tom, že za určitých podmienok je možné pomocou neho aproximovať rad iných spojitých i nespojitých rozdelení. Uvedeným podmienkam vyhovuje mnoho dôležitých premenných, s ktorými sa v praxi často stretávame napr.: úroda tej istej rastliny na rôznych pozemkoch, výška, hmotnosť, chyby merania a iné.
Hustota pravdepodobnosti normálne rozdelenej náhodnej premennej je daná vzťahom:
2
2
2
2
1)(
x
exf x
kde konštanty a sú parametre normálneho rozdelenia, kde je stredná hodnota, charakterizujúca polohu tohto rozdelenia, a je jeho rozptyl.
22
23
)(XE 2)( XDačo stručne zapíšeme
2,NNormálne rozdelenie má tvar zvonovitej krivky, ktorá nadobúda maxima v bode a pri sa asymptoticky približuje k osi x.
x x
Funkcia hustoty pravdepodobnosti
y=normal(x;0;1)
0,00
0,15
0,30
0,45
0,60
-3,50 -1,75 0,00 1,75 3,50
24
Pre distribučnú funkciu normálneho rozdelenia platí vzťah:
dtexFx t
2
2
2
)(
2
1)(
0
0,2
0,4
0,6
0,8
1
1,2
1 4 7 10 13 16 19 22 25 28 31 34 37 40 43 46 49 52 55 58 61
25
Normované normálne rozdelenie
Parametre normovaného normálneho rozdelenia sú
resp. , normovaná náhodná premenná U má teda normálne rozdelenie so strednou hodnotou 0 a rozptylom 1, čo stručne zapíšeme N(0,1). Stačí teda poznať normované normálne rozdelenie N(0,1), pomocou ktorého s využitím transformácie
Každé normálne rozdelenie
je možné pomocou transformácie U upraviť na normované
N(0,1)
Hustota pravdepodobnosti je symetrická okolo nuly, preto platí:
0)( XE1)(2 XD
X
U
)(1)( uFuF
popíšeme akékoľvek normálne rozdelenie 2,N
2,N
26
Častou úlohou pri aplikácii normálneho rozdelenia je nájsť pravdepodobnosť toho, že náhodná premenná X nadobudne hodnoty z intervalu x1 až x2 . Pri výpočte tejto pravdepodobnosti využívame
normovanie takto:
)()( 2121
21 uUuPxXx
PxXxP
1221 )()( uFuFuUuP
z vlastnosti distribučnej funkcie vyplýva :
Podobne postupujeme aj pri výpočte pravdepodobnosti toho, že náhodná premenná X je menšia než vopred zvolená konštanta x
)()()( uFuUPxX
PxXP
27
Porovnanie normálnych rozdelení
0
0,1
0,2
0,3
0,4
0,5
-4 -3 -2 -1 0 1 2 3 4
funk
cia
hus
toty
N(0,1)
N(0,1.5)
N(1,1)
28
pravidlo 6 - sigma
-0,05
0,05
0,15
0,25
0,35
0,45
-3 -2 -1 0 1 2 3
- ++2-2
-3 +3
68,26%
95,45%
99,73%
29
Typ rozdelenia Parametre E(X) D(X) Hustota pravdepodobnosti Distribučná funkcia
Rovnomerné a, b
Exponenciálne
Weibullovo
a, b, c
Gama a,b a.b
2
ba 12
2ab ab
xf
1
ab
axxF
1
2
1
xexf . xexF 1
0xf
0x
0xF 0x
a
cxb
b
b
ecxa
bxf
1
0xf
cx
cx
b
a
x
exF
1
0xF
ba2 a
x
b
b
eba
xxf
1
0x
0x
30
Výberové rozdelenia Ft,,2S normálnym rozdelením sú úzko spojené tri dôležité rozdelenia spojitých náhodných premenných: chí- kvadrát rozdelenie , Studentovo t – rozdelenie a F- rozdelenie. Majú mimoriadny význam pri analýze štatistických údajov, získaných náhodným výberom
2 -rozdelenie
vUUU ,,, 21 Ak sú , nezávislé náhodné premenné, z ktorých každá má normálne rozdelenie N(0,1), potom súčet štvorcov týchto náhodných premenných, tj. premenná:
v
iiU
1
22má - rozdelenie s v stupňami voľnosti. Počet stupňov voľnosti je daný počtom nezávislých sčítancov, a je jediným parametrom tohto rozdelenia. Kvantily tohto rozdelenia je možné bežne vyhľadávať v tabuľkách resp. vypočítať s pomocou dostupného štatistického softwaru.
2
Má rozsiahle použitie v teórii odhadu, testovaní štatistických hypotéz, pri overovaní nezávislosti kvalitatívnych znakov ......
31
32
► Studentovo t-rozdelenie
U Z U2 v
t
Nech a sú nezávislé náhodné premenné, z ktorých
má normálne rozdelenie N(0,1) a Z má -rozdelenieso stupňami voľnosti .
Náhodná premenná
:
v
Z
Ut
má Studentovo t- rozdelenie s v stupňami voľnosti. Počet stupňov voľnosti je jediný parameter tohto rozdelenia. Stretávame sa s ním v matematickej štatistike - odhady, testy hypotéz ....
33
F - rozdelenie
Ak uvažujeme dve nezávislé náhodné premenné a s -rozdelením a a stupňami voľnosti, potom náhodná premenná :
21
22
21v 2v
2
22
1
21
v
vF
má F - rozdelenie s a stupňami voľnosti, čo sú zároveň aj dva parametre tohto rozdelenia
1v 2v
Stretávame sa s ním v matematickej štatistike - testy hypotéz, ANOVA ....
34