statistické metody - nástroj poznání a rozhodování anebo zdroj omylů a lží

Download Statistické metody - nástroj poznání a rozhodování anebo zdroj omylů a lží

If you can't read please download the document

Upload: august

Post on 09-Jan-2016

31 views

Category:

Documents


1 download

DESCRIPTION

Statistické metody - nástroj poznání a rozhodování anebo zdroj omylů a lží. Zdeněk Karpíšek “Jsou tři druhy lží: lži, odsouzeníhodné lži a statistiky.” “Statistika je logická a přesná metoda, jak nepřesně sdělit polopravdu.”. Od vědy o státu a hazardních her k matematické statistice. - PowerPoint PPT Presentation

TRANSCRIPT

  • Statistick metody - nstroj poznn a rozhodovnanebo zdroj omyl a l

    Zdenk Karpek

    Jsou ti druhy l: li, odsouzenhodn li a statistiky.

    Statistika je logick a pesn metoda, jak nepesn sdlit polopravdu.

  • Od vdy o sttu a hazardnch her kmatematick statistice

    Statistika:

    seln daje o hromadnch jevech

    sbr, zpracovn a vyhodnocovn statistickch daj

    teoretick disciplna

    Ti etapy statistickho zkoumn:

    zskvn statistickch daj statistickm zjiovnm (etenm)

    kontrola, verifikace, tdn a agregace statistickch soubor

    vyhodnocovn a rozbor zskanch statistickch daj

    Aplikace vsledk + zptn vazba

  • Od vdy o sttu a hazardnch her kmatematick statistice

    Popisn statistika:

    vytvoen a tdn statistickch soubor

    seln a grafick zpracovn

    Teorie pravdpodobnosti:

    nhodn jevy a pravdpodobnost

    nhodn veliiny, vektory a procesy

    Matematick statistika:

    nhodn vbr

    odhady parametr a rozdlen

    testovn statistickch hypotz

  • Od vdy o sttu a hazardnch her kmatematick statistice

    Historie:

  • Od vdy o sttu a hazardnch her kmatematick statistice

    Historie:

  • Od vdy o sttu a hazardnch her kmatematick statistice

    Historie:

  • Od vdy o sttu a hazardnch her kmatematick statistice

    Historie:

  • Populace, vbr, nhoda a neuritost pat ksob

    Zkladn soubor (populace) = souhrn statistickch jednotek

    Statistick jednotky - statistick znaky - hodnoty

  • Populace, vbr, nhoda a neuritost pat ksob

    Zkladn soubor ( vbrov soubor, rozsah

    Vbry:

    mal (obvykle do 30 a 50)

    velk (dov stovky, tisce i vce)

    Poadavky na vbr:

    reprezentativn (informace bez omezen)

    homogenn (bez vlivu dalch faktor)

    nhodn

    Neuritost vbru = zkreslen informac o zkladnm souboru

  • Populace, vbr, nhoda a neuritost pat ksob

    Statistick soubor = soubor pozorovanch hodnot (x1, x2, , xn)

    znaku X na vybranch statistickch jednotkch

    Druhy vbr:

    bezopakovn

    sopakovnm

    zmrn

    oblastn

    mechanick

  • Prmry a jejich ctnosti i nectnosti

    Zpracovn statistickho souboru = pprava + grafick znzornn + vpoet selnch charakteristik

    Roztdn soubor - tdy, sted a etnost

    Grafy = vizuln informace o poloze, variabilit, symetrii, modalit,

  • Prmry a jejich ctnosti i nectnosti

    seln (empirick) charakteristiky = seln informace

    o poloze, variabilit, symetrii, modalit,

    Aritmetick prmr = (x1 + x2 + (((+ xn)/n

    Medin = prostedn hodnota uspodanho souboru

    Pklad:

    Msn platy 10 pracovnk (v tis. K): 3, 3, 4, 4, 5, 6, 7, 7, 11, 50.

    Prmrn msn plat = 100/10 = 10.

    Medin msnho platu = 5 a 6 ( (5 + 6)/2 = 5,5.

    Prmrn msn plat po zmn (50 na 100) = 150/10 = 15.

    Medin msnho platu po zmn (50 na 100) = 5 a 6 ( (5 + 6)/2 = 5,5.

    Graf2

    2

    2

    1

    1

    2

    0

    0

    0

    1

    0

    0

    0

    0

    0

    0

    0

    0

    0

    0

    0

    0

    0

    0

    0

    0

    0

    0

    0

    0

    0

    0

    0

    0

    0

    0

    0

    0

    0

    0

    0

    0

    0

    0

    0

    0

    0

    0

    1

    0

    3 4 5 6 7 11 50

    5,5 10

    etnost

    Tdy

    etnost

    Histogram

    List7

    Tdyetnost

    32

    42

    51

    61

    72

    80

    90

    100

    111

    120

    130

    140

    150

    160

    170

    180

    190

    200

    210

    220

    230

    240

    250

    260

    270

    280

    290

    300

    310

    320

    330

    340

    350

    360

    370

    380

    390

    400

    410

    420

    430

    440

    450

    460

    470

    480

    490

    501

    Dal0

    List7

    3 4 5 6 7 11 50

    5,5 10

    etnost

    Tdy

    etnost

    Histogram

    List1

    33322

    34422

    45511

    46611

    57722

    611801

    750901

    7100

    11111

    50120

    130

    140

    150

    160

    170

    180

    190

    200

    210

    220

    230

    240

    250

    260

    270

    280

    290

    300

    310

    320

    330

    340

    350

    360

    370

    380

    390

    400

    410

    420

    430

    440

    450

    460

    470

    480

    490

    500

    511

    List2

    List3

  • Prmry a jejich ctnosti i nectnosti

    Vlastnosti prmru:

    pomrn citliv na zmnu hodnot souboru

    u kladn (zporn) asymetrickch soubor je prmr vt (men) ne medin

    konvergence s rostoucm rozsahem souboru kprmru cel populace

    rychl konvergence rozdlen pravdpodobnosti prmru k normlnmu rozdlen

  • Mme promnlivost veliin a vztahy mezi nimi

    Rozptyl (disperze) = prmr kvadrt odchylek od prmru

    Smrodatn odchylka = druh odmocnina z rozptylu

    Graf1

    01

    00

    11

    10

    22

    22

    21

    11

    11

    00

    01

    Hmotnost

    etnost

    Balky kvy

    List1

    67656501

    68676600

    69696711

    69696810

    70706922

    70707022

    71717121

    71727211

    72737311

    73757400

    37.497501

    List1

    Hmotnost

    etnost

    Balky kvy

    List2

    List3

    Pklad:

    Dva soubory hmotnosti balku kvy (v gramech):

    1. automat: 67; 68; 69; 69; 70; 70; 71; 71; 72; 73

    2. automat: 65; 67; 69; 69; 70; 70; 71; 72; 72; 75

    Prmrn hmotnost je stejn = 70

    Rozptyl (smrodatn odchylka) pro 1. automat = 3,00 (1,732)

    Rozptyl (smrodatn odchylka) pro 2. automat = 7,49 (2,737)

  • Mme promnlivost veliin a vztahy mezi nimi

    Koeficient korelace = normovan kovariance = prmr souin odchylek od prmr/souin smrodatnch odchylek (hodnoty od -1 do 1)

  • Mme promnlivost veliin a vztahy mezi nimi

    Koeficient korelace = 0 nemus znamenat nezvislost

    Regresn analza = "jemnj" vyjden zvislosti mezi znaky a predikce

    y = 0,361 + 0,181x ; y(10) ( 2,172; r = 0,984798

    y(10) ( ; y(10) (

  • Mme promnlivost veliin a vztahy mezi nimi

  • Rozdlen pravdpodobnosti a zkon velkch sel jsou obrazem ns i okolnho svta

    Pravdpodobnost P(A) - teoretick mra monosti nastoupen nhodnho jevu A

    Klasick definice: P(A) = m/n

    m = poet pznivch ppad jevu A

    n = poet vech monch ppad

    Axiomatick definice - zaloen na teorii mnoin

    Funkn charakteristiky: distribun funkce, hustota aj.

    seln charakteristiky: stedn hodnota, rozptyl aj.

    Rozdlen pravdpodobnosti pro modelovn relnch jev: binomick, hypergeometrick, normln aj.

  • Rozdlen pravdpodobnosti a zkon velkch sel jsou obrazem ns i okolnho svta

    Bernoulliv zkon velkch sel - asymptotick chovn relativn etnosti

    Normln rozdlen - vznamn postaven pi modelovn relnho svta

  • Rozdlen pravdpodobnosti a zkon velkch sel jsou obrazem ns i okolnho svta

  • Rozdlen pravdpodobnosti a zkon velkch sel jsou obrazem ns i okolnho svta

  • Vbrov charakteristiky a kletba statistikova

    Zkladn lohy matematick statistiky:

    odhady parametr a rozdlen

    testovn statistickch hypotz o parametrech a rozdlench

    Principy matematick statistiky:

    hodnoty zskan vbrem ze zkladnho souboru jsou nhodn

    zskan statistick soubor je hodnotou nhodnho vbru

    Statistick indukce:

  • Vbrov charakteristiky a kletba statistikova

    Nap.:

    Stedn hodnota vbrovho prmru = stedn hodnota pozorovan veliiny ("prmru" populace) a rozptyl vbrovho prmru ( 0 pro n ( ( , take pro dostaten velk n je takka jist prmr souboru blzk neznm stedn hodnot; avak tento rozptyl ( 0 s rychlost n1/2. Velmi asto vak rozdlen vbrovho prmru konverguje krozdlen normlnmu:

  • Vbrov charakteristiky a kletba statistikova

  • Je lep odhad statistika anebo experta?

    Odhad parametru ( = vbrov charakteristika T(X1,,Xn)

    Bodov odhad (: t = T(x1,..,xn)

    Intervalov odhad ( se spolehlivost 1 - (: konfidenn interval

    (

    Riziko chybnho odhadu = (

  • Je lep odhad statistika anebo experta?

    Pklad:

    Pi przkumu nzoru z dotzanch n osob eklo "ano" x osob.

    Pro spolehlivost 0,95:

    n

    x

    Bodov odhad (%)

    Intervalov odhad (%)

    Od

    Do

    400

    80

    20

    16,08

    23,92

    1600

    320

    20

    18,04

    21,96

    6400

    1280

    20

    19,02

    20,98

  • Nezamtnut statistick hypotzy jet nen potvrzen jej sprvnosti

    Statistick hypotzy = tvrzen o vlastnostech pozorovanho statistickho znaku

    Nulov hypotza H0 ( Alternativn hypotza HA

    Algoritmus testovn hypotzy pomoc statistickho souboru:

    1. Stanoven hypotz H0 a HA.

    2. Volba testovho kritria T(X1,,Xn).

    3. Vpoet hodnoty testovho kritria

    t = T(x1,..,xn).

    1. Stanoven hladiny vznamnosti (

    a kritickho oboru W(.

    2. Rozhodnut o hypotzch H0 a HA.

    Hladina vznamnosti:

    ( = obvykle 5% anebo 1%

  • Nezamtnut statistick hypotzy jet nen potvrzen jej sprvnosti

    Rozhodnut:

    t ( W( ( H0 zamtme a HA nezamtme

    t ( W( ( H0 nezamtme a HA zamtme

    H0

    PLAT

    NEPLAT

    ZAMTME

    CHYBA 1. DRUHU

    -------

    NEZAMTME

    -------

    CHYBA 2. DRUHU

    Rizika :

    pravdpodobnost chyby 1. druhu = hladina vznamnosti (

    pravdpodobnost chyby 2. druhu sniujeme zvenm rozsahu

    Aspekty:

    nezamtnut hypotzy neznamen vdy jej pijet (

    ( zvme rozsah vbru a znovu testujeme

    nezamtnut nebo pijet hypotzy nen potvrzen jej platnosti

  • Nezamtnut statistick hypotzy jet nen potvrzen jej sprvnosti

  • Pouvn statistickch metod pi zen jakosti technologickch proces nen samoeln ani mdou

    Statistick metody (SPC) = nstroje pro hodnocen a zen jakosti vroby (QC)

    Shewhartovy regulan diagramy:

    regulace menm (normln rozdlen)

    regulace porovnvnm (binomick a Poissonovo rozdlen)

  • Pouvn statistickch metod pi zen jakosti technologickch proces nen samoeln ani mdou

    Aplikace:

    vbry relativn malch skupin sledovanch vrobk ke kontrole bhem vroby ve stanovench asovch intervalech

    grafick zpracovn selnch charakteristik pro informace o negativnch vlivech na kvalitu vroby

    pi vyboen sledovan charakteristiky mimo statisticky uren meze zsah nebo vyhodnocen pro ppravu dal vroby

    Dsledek : finann efekt pro vrobce a zven dvry odbratele

    Nyn: SPC soust norem pro QC na sttn a nadsttn rovni i obsahem pruek jakosti u jednotlivch firem (certifikace)

    Dal metody: zpsobilost vrobnch proces, statistick pejmky, optimalizace nklad aj.

  • Spolehlivost vrobku se d mit a spn vyuvat

    Spolehlivost vrobku = jeho schopnost plnit poadovan innosti

    Statistick princip: doba bezporuchovho stavu, doba opravy apod. sledovanho objektu jsou nhodn veliiny

    Charakteristiky spolehlivosti:

    funkn: funkce spolehlivosti, intenzita poruch, hustota obnov aj.

    seln: stedn doba do poruchy, koeficient pohotovosti aj.

  • Spolehlivost vrobku se d mit a spn vyuvat

    Postupy:

    odhady charakteristik ze statistickch soubor asto speciln orientovanmi metodami podle realizace zkouek (nap.cenzorovan vbry)

    plny drby

    pravdpodobnostn modely systm - celk (nap. vrobn linky, energetick bloky)

    optimalizace spolehlivosti vzhledem k nkladm

    Efekty spolehlivosti: uitn hodnota, bezpenosti, cena

  • Pro a jak nkdy statistiky lou, a co dl

    No to snad ne!?

  • Pro a jak nkdy statistiky lou, a co dl

  • Pro a jak nkdy statistiky lou, a co dl

    k se, e statistiky nkdy lou. Pojmy, metody a postupy matematick statistiky jsou soust matematiky, tedy produktem naeho abstraktnho mylen. Jejich aplikace (tzv. statistiky) jsou vsledkem konkrtn innosti lid, kter me bt seriozn anebo naopak neseriozn. Ve druhm ppad pak me jt bu o nevdomost anebo zmr. Tak i onak za to samy statistiky nemohou - lht me jen lovk. Statistiky proto nelou, avak hor to bv sjejich realiztory a vykladai, kte znich nkdy polopravdy, nepravdy, ppadn a li vytvej. Racionln a zodpovdn pouvn statistickch metod naopak pin pozitivn vsledky tm, e roziuje nae poznn okolnho svta i sebe sama a umouje nm eln rozhodovat o naem dalm konn. Avtom lze vidt i jejich mon pnos vbudoucnosti.