intervalové odhady
TRANSCRIPT
MATEMATICKÁ STATISTIKABODOVÉ A INTERVALOVÉ ODHADY
ROMAN MAJDA
Roman Majda 2
OBSAH
1) Vývoj matematické statistiky
2) Matematická statistika vs. teorie pravděpodobnosti
3) Statistická indukce
4) Teorie odhadu
5) Požadavky na kvalitní odhad
6) Odhad střední hodnoty
7) Odhad rozptylu a směrodatné odchylky
Roman Majda 3
VÝVOJ MATEMATICKÉ STATISTIKY
• Paralelně s teorií pravděpodobnosti
• První postupy v 18. století
• Počátek 19. stol – Carl Friedrich Gauss a Adrien-Marie Legendre – metoda nejmenších čtverců
• Počátek 20. století – matematické metody statistiky se začaly rychle rozvíjet (biologický výzkum)
• Mat. stat. jako samostatná disciplína v dnešním pojetí – britský biolog Ronald Fisher
• Bouřlivý rozvoj – empirické vědy, získávání a interpretace dat
Roman Majda 4
MATEMATICKÁ STAT. VS. TEORIE PRAVDĚPODOBNOSTI
• v teorii pravděpodobnosti předpokládáme, že známe skutečné rozdělení pravděpodobností základních náhodných veličin resp. matematický model základního souboru náhodných jevů
• Statistická dedukce
• matematická statistika se snaží formulovat závěry a tvrzení o náhodných veličinách na základě dat získaných pokusem, pozorováním nebo měřením, tj. na základě známých realizací náhodných veličin
• Statistická indukce
Roman Majda 5
STATISTICKÁ INDUKCE
• Zobecnění (základní úloha mat. stat.)
• Jak informace zjištěné o prvcích výběru zobecnit na celou populaci – vždy riziko omylu
• Výběrová data pořízena náhodným výběrem
• Typy:
• Teorie odhadu • Bodovýodhad• Intervalový odhad
• Testování hypotéz
Roman Majda 6
TEORIE ODHADU
• Jak z napozorovaných hodnot NV získat co nejlepší odhady neznámých parametrů jejího rozdělení
• Výběrový soubor >> konkrétní hodnoty sledovaných charakteristik. (Při dalším výběru >> pravděpodobně jiné hodnoty sledovaných charakteristik)
• >> Námi sledovaná charakteristika = náhodná veličina
• Velkou roli hraje rozdělení těchto charakteristik (statistik)
Roman Majda 7
ODHADY• Bodový
• odhad charakteristiky vyjádřen jediným číslem
• je bodovým odhadem µ
• Nemáme informaci o kvalitě odhadu
• rozdíl odhad-skutečnost?
• Intervalový
• 2 čísla (Dolní a Horní mez) a mezi nimi skutečná hodnota hledaného parametru s předem zvolenou pravděpodobností
• 100(1 – α)% interval spolehlivosti (konfidenční interval)
• 1 – α je koeficient spolehlivosti
• α hladina významnosti
• většinou α = 0,01 nebo častěji α = 0,05
Roman Majda 8
POŽADAVKY NA KVALITNÍ ODHAD
• Nestranost
Výběrová statistika (charakteristika) T je nestranným odhadem statistiky Θ, je-li střední hodnosta . Znamená to, že tento odhad systematicky nenadhodnocuje ani nepodhodnocuje odhadovaný parametr. Platí-li, že
pak je statistika T asymptoticky nestranným odhadem Θ.
Roman Majda 9
POŽADAVKY NA KVALITNÍ ODHAD
• Vydatnost
Nestranost ≠ „dobrý odhad“
Chceme aby bodové odhady byly rozloženy co nejtěsněji kolem odhadovaného parametru .
Ze dvou nestranných odhadů parametru Θ je lepší ten, který má menší rozptyl, protože pro tento odhad lze spíše očekávat, že se bude méně lišit od skutečné hodnoty Θ.
• Nejlepším nestranným odhadem parametru Θ nazýváme nestranný odhad, který má ze všech nestranných odhadů parametru Θ nejmenší rozptyl a tuto vlastnost nazýváme vydatnost.
Roman Majda 10
POŽADAVKY NA KVALITNÍ ODHAD
• Konzistence
Konzistence znamená, že čím větší bude rozsah výběru n, tím bude hodnota statistiky blíže ke skutečné hodnotě odhadovaného parametru.
Za konzistentní odhad statistiky Θ označíme takovou statistiku T která splňuje rovnost
pro libovolné reálné číslo .
Roman Majda 11
POŽADAVKY NA KVALITNÍ ODHAD• Robustnost
Za robustní odhad statistiky Θ označíme takovou statistiku T, u které nemají vychýlené hodnoty způsobené např. hrubou chybou měření příliš velký vliv na kvalitu odhadu
INTERVALOVÝ ODHAD• podstatou intervalového odhadu charakteristik Θ je
určit statistiky TD a TH, tak aby platilo (oboustranný)
Nebo pro jednostranné
Roman Majda 12
ODHAD STŘEDNÍ HODNOTY
• Bodovým odhadem střední hodnoty
je výběrový průměr
Je to nevychýlený odhad.
Roman Majda 13
ODHAD STŘEDNÍ HODNOTY• Intervalový
Pokud byl náš výběr získán z rozdělení , rozptyl není znám
• Oboustranný
odhad směrodatné odchylky výběru (standardní chyba)
přípustná chyba
• Jednostrané
Roman Majda 14
ODHAD ROZPTYLU A SMĚRODATNÉ ODCHYLKY
• Bodovým odhadem roptylu
je výběrový rozptyl
Je to nevychýlený a konzistentní odhad
15
ODHAD ROZPTYLU A SMĚRODATNÉ ODCHYLKY
• Intervalový
Když neznáme parametr a výběr byl proveden z rozdělení , pak je interval spolehlivosti
• Oboustranný
• Jednostranné
Roman Majda
Roman Majda 16
PŘÍKLAD
Útvar kontroly podniku Edison testoval životnost žárovek. Kontroloři vybrali z produkce podniku náhodně 50 žárovek a došli k závěru, že průměrná doba života těchto 50-ti žárovek je 950 hodin a příslušná výběrová směrodatná odchylka doby života je 100 hodin. Určete 95%-ní interval spolehlivosti životnosti žárovek firmy Edison.
Roman Majda 17
ŘEŠENÍ
Známe směrodatnou odchylku, pak
Tento interval spolehlivosti nám říká, že s 95% pravděpodobností se životnost produkovaných žárovek pohybuje od 922,3 do 977,7 hodin.
Roman Majda 18
DĚKUJI ZA POZORNOST