1_lezione_concetti statistici di base_2°anno 2010-2011

Upload: sergio

Post on 10-Apr-2018

212 views

Category:

Documents


0 download

TRANSCRIPT

  • 8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011

    1/146

  • 8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011

    2/146

  • 8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011

    3/146

  • 8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011

    4/146

  • 8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011

    5/146

  • 8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011

    6/146

  • 8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011

    7/146

  • 8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011

    8/146

  • 8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011

    9/146

  • 8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011

    10/146

  • 8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011

    11/146

  • 8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011

    12/146

  • 8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011

    13/146

  • 8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011

    14/146

  • 8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011

    15/146

  • 8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011

    16/146

  • 8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011

    17/146

  • 8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011

    18/146

  • 8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011

    19/146

  • 8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011

    20/146

  • 8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011

    21/146

  • 8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011

    22/146

  • 8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011

    23/146

  • 8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011

    24/146

  • 8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011

    25/146

  • 8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011

    26/146

  • 8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011

    27/146

  • 8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011

    28/146

  • 8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011

    29/146

  • 8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011

    30/146

  • 8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011

    31/146

  • 8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011

    32/146

  • 8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011

    33/146

  • 8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011

    34/146

  • 8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011

    35/146

  • 8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011

    36/146

  • 8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011

    37/146

  • 8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011

    38/146

  • 8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011

    39/146

  • 8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011

    40/146

  • 8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011

    41/146

  • 8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011

    42/146

  • 8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011

    43/146

  • 8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011

    44/146

  • 8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011

    45/146

  • 8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011

    46/146

  • 8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011

    47/146

  • 8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011

    48/146

  • 8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011

    49/146

  • 8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011

    50/146

  • 8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011

    51/146

  • 8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011

    52/146

  • 8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011

    53/146

  • 8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011

    54/146

  • 8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011

    55/146

  • 8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011

    56/146

  • 8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011

    57/146

  • 8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011

    58/146

  • 8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011

    59/146

  • 8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011

    60/146

  • 8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011

    61/146

  • 8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011

    62/146

  • 8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011

    63/146

  • 8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011

    64/146

  • 8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011

    65/146

  • 8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011

    66/146

  • 8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011

    67/146

  • 8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011

    68/146

  • 8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011

    69/146

  • 8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011

    70/146

  • 8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011

    71/146

  • 8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011

    72/146

  • 8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011

    73/146

  • 8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011

    74/146

  • 8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011

    75/146

  • 8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011

    76/146

  • 8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011

    77/146

  • 8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011

    78/146

  • 8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011

    79/146

  • 8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011

    80/146

  • 8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011

    81/146

  • 8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011

    82/146

  • 8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011

    83/146

  • 8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011

    84/146

  • 8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011

    85/146

  • 8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011

    86/146

  • 8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011

    87/146

  • 8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011

    88/146

  • 8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011

    89/146

  • 8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011

    90/146

  • 8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011

    91/146

  • 8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011

    92/146

  • 8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011

    93/146

    LA MODA

  • 8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011

    94/146

    LA MODA

    La moda lindice di tendenza centrale che minimizza lperdite di informazioni.In alcune distribuzioni pu accedere che siano presentiuna o pi mode allaumentare del numero diosservazioni:distribuzioni unimodale, bimodale, plurimodale

    Lamoda

    un indice di tendenza centrale che individua ilgruppo o il dato che compare con maggior frequenza

    Per caratteriqualitativi:

    Per caratteriquantitativi:

    la moda la modalit che sipresenta con maggior frequenza

    la moda il valore che sipresenta con maggior frequenza

  • 8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011

    95/146

    Dove:

    Nel caso di distribuzioni in classi di diversa ampiezzala classe modale quella con la pi altadensit difrequenza (la frequenza assoluta in rapporto allampiezza della class

    Per le distribuzioni in classi di uguale ampiezza, sicalcola la classe modale come segue:

    successivalaemodaleclassedellafrequenzalatradifferenza

    precedentelaemodaleclassedellafrequenzalatradifferenza

    modaleclassedellaampiezzac

    modaleclassedellainferioreconfine

    moda

    2

    1

    21

    1

    1

    1

    ====

    ++=

    L

    c L

  • 8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011

    96/146

    Cause di morte Frequenze assoluteTumori 315Malattie sistema circolatorio 418Malattie sistema respiratorio 82

    Malattie sistema digerente 49Non definite 19Accidentali 57

    La moda Malattie sistema circolatorio

    1 Esempio di calcolo della moda (carattere qualitativo)

  • 8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011

    97/146

    Tab. 5 - Distribuzione dei mesi secondo le ore di straordinario effettuateda un infermiere di un ospedale

    Ore di lavoro straordinario Frequenzaassoluta

    Frequenzarelativa

    0 1 0,0835 2 0,1677 3 0,250

    10 3 0,25011 1 0,083

    12 2 0,167Totale 12 1

    La prima moda 7, la seconda moda 10

    2 Esempio di calcolo della moda (carattere quantitativo)

  • 8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011

    98/146

    Classi peso Frequenza assoluta Valore centrale[69,5 72,5) 3 71[72,5 75,5) 4 74[75,5 78,5) 22 77[78,5 81,5) 53 80[81,5 84,5) 92 83[84,5 87,5) 71 86[87,5 90,5) 46 89[90,5 93,5) 15 92

    [93,5 96,5) 4 95Totale 310

    )[

    ( ) ( )[ ] 4,833719253925392

    5,81

    84,5-81,5

    21

    1

    1 =+

    +=

    + c L moda-

    modaleclasse-

    =

    =

    3 Esempio di calcolo della classe modale e della moda in unadistribuzione in classi (classi della stessa ampiezza)

    4 Esempio di calcolo della classe modale in una distribuzione in

  • 8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011

    99/146

    Numero posti letto Frequenzaassoluta

    Ampiezza dellaclasse

    Densit difrequenza

    26-50 251 25 10,0451-100 368 50 7,36101-150 288 50 5,76151-200 159 50 3,18201-300 304 100 3,04301-500 173 200 0,87501-800 99 300 0,33

    La classe modale apparente 51-100

    La classe modale corretta 26-50

    Tab. 6

    - Strutture di degenza classificate in base al numero di posti letto

    30099

    33,0 =

    4 Esempio di calcolo della classe modale in una distribuzione inclassi (classi con ampiezze diverse)

  • 8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011

    100/146

  • 8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011

    101/146

    LA MEDIANA

    La mediana per definizione occupa il valore centralein una serie ordinata di dati.

    Le osservazioni vengono separate dal valoremediano in due parti numericamente uguali, il 50%con valori inferiori e il 50% con valori superiori.

    La mediana non risente dei valori estremi di unaserie ordinata ed preferita in tali casi alla mediaaritmetica.

  • 8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011

    102/146

    Il procedimento di calcolo della mediana

    passa per 3 fasi:

    1. ordinamento dei dati in modo crescente2. calcolo della posizione della mediana

    3. identificazione del valore corrispondente a taleposizione

  • 8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011

    103/146

    Per ilcalcolo della posizione mediana bisogna tener conto della numerosit delle osservazioni n

    Se n dispari si avruna sola posizione mediana

    Se n pari si avrannodue posizioni mediane

    +

    +

    12

    2

    21

    n

    n

    n

    Lamediana data dal valore/modalit/classe corrispondealla posizione mediana (o alle posizioni mediane).

  • 8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011

    104/146

  • 8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011

    105/146

    Paziente Et Sesso Titolo di studio 1 54 M Nessun titolo 2 57 F Laurea 3 62 F Laurea 4 46 F Nessun titolo 5 39 F Diploma 6 54 M Licenza elementare 7 57 F Licenza elementare 8 60 M Nessun titolo

    9 51 F Licenza media

    1 Esempio di calcolo della mediana (carattere qualitativo)

    dispari)numero(9n =

  • 8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011

    106/146

    Posizione Titolo di studio

    1 Nessun titolo2Nessun titolo3Nessun titolo4 Licenza elementare5 Licenza elementare6 Licenza media7 Diploma8 Laurea9 Laurea

    Paziente Titolo di studio

    1 Nessun titolo2 Laurea3 Laurea4 Nessun titolo5 Diploma6 Licenza elementare7 Licenza elementare8 Nessun titolo9 Licenza media

    "ELEMENTARELICENZA" medianaLa 52

    192

    1

    dispari)numero(9n

    =+=+

    =

    n

    I N ORDI NE

    C RE

    S C E NT E

  • 8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011

    107/146

    Paziente Et Sesso Livello Creatininemia

    1 54 M Basso 2 57 F Basso 3 62 F Alto 4 46 F Medio

    5 39 F Medio 6 54 M Basso 7 57 F Medio 8 60 M Medio 9 51 F Alto

    10 54 F Alto

    2 Esempio di calcolo della mediana (carattere qualitativo)

    pari)numero(10n =

  • 8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011

    108/146

    Posizione Livello Creatininemia

    1 Basso

    2 Basso3 Basso4Medio5Medio6Medio7Medio8 Alto9 Alto

    10 Alto

    Paziente Livello Creatininemia

    1 Basso2 Basso3 Alto4 Medio5 Medio6 Basso

    7 Medio8 Medio9 Alto

    10 Alto

    Medio"" MedianaLa

    Medio""entecorrispondmodalitla 612

    101

    2

    Medio""entecorrispondmodalitla 52

    102

    pari)(numero10n

    =+=+

    ==

    =

    n

    n

    I N ORDI NE

    C RE

    S C E NT E

    d l l d ll d ( l )

  • 8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011

    109/146

    Paziente Et Sesso Umore

    1 54 M Buono 2 57 F Buono 3 62 F Ottimo 4 46 F Ottimo

    5 39 F Normale 6 54 M Basso 7 57 F Discreto 8 60 M Buono 9 51 F Discreto

    10 54 F Basso

    3 Esempio di calcolo della mediana (carattere qualitativo)

    pari)numero(10n =

  • 8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011

    110/146

    Posizione Umore

    1 Basso

    2 Basso3 Normale4 Discreto5 Discreto6 Buono7 Buono8 Buono9 Ottimo

    10 Ottimo

    Paziente Umore

    1 Buono

    2 Buono3 Ottimo4 Ottimo5 Normale6 Basso7 Discreto8 Buono9 Discreto

    10 Basso

    Buono""eDiscreto""sonomedianemodalitLe

    Buono""entecorrispondmodalitla 612

    101

    2

    Discreto""entecorrispondmodalitla 52

    102

    pari)(numero10n

    =+=+

    ==

    =

    n

    n

    4 E i di l l d ll di ( li i ) i

  • 8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011

    111/146

    Titolo di studio Frequenza assoluta

    Nessun titolo 1.862

    Licenza elementare 9.903

    Licenza media 4.491

    Diploma 3.093

    Laurea 1.160

    Totale 20.509

    4 Esempio di calcolo della mediana (carattere qualitativo) in unadistribuzione di frequenza

    Tit l di t di F Frequenza assoluta

  • 8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011

    112/146

    Titolo di studio Frequenzaassoluta

    Frequenza assolutacumulata

    Nessun titolo 1.862 1.862

    Licenza elementare 9.903 11.765

    Licenza media 4.491 16.256

    Diploma 3.093 19.349

    Laurea 1.160 20.509

    Totale 20.509

    1.862 + 9.903

    1.862 + 9.903 + 4.491

    1.862

    "ELEMENTARELICENZA" medianaLa 255.102

    1509.202

    1

    dispari)numero(509.20n

    =+=+

    =

    n

    La modalit licenza elementare la mediana.La mediana della distribuzione la modalit relativa al dato statistico che

    nellordinamento stabilito occupa il posto di mezzo.

    LA MEDIANA PER CARATTERI QUANTITATIVI:

  • 8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011

    113/146

    LA MEDIANA PER CARATTERI QUANTITATIVI:

    1. Nel caso di unaserie di misure singole e ordinate(o caratteri continui)per n dispari la medianacorrisponde al valore in posizione

    per n pari la medianasi colloca tra le due posizioni centrali e(si parla di modalit mediane)

    il valore mediano viene calcolato come mediaaritmetica dei valori corrispondenti a queste dueposizioni

    21+n

    2n

    12

    +n

  • 8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011

    114/146

    2. Per ledistribuzioni in classi si identifica la classemediana; nel caso di classi di uguali ampiezzasi calcola il valore mediano tra quelli compresinellintervallo di classe utilizzando la formula:

    medianaclassedellafrequenza

    medianaclassela precedonocheclassidellecumulatafrequenza

    medianaclassedellaampiezzac

    medianaclassedellainferioreconfine

    2 mediana

    1

    1

    ====

    +=

    med

    cum

    med

    cum

    f

    f

    L

    c f

    f n L

    5 E i di l l d ll di ( tt tit ti )

  • 8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011

    115/146

    Paziente Sesso Et PA diastolica(mmHg) PA sistolica(mmHg)

    1 M 63 70 110

    2 F 56 90 95

    3 F 48 80 130

    4 F 48 85 85

    5 M 50 70 95

    6 F 54 70 85

    7 M 58 65 100

    8 M 67 90 130

    9 F 61 90 85

    5 Esempio di calcolo della mediana (carattere quantitativo)

  • 8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011

    116/146

    Posizione PA sistolica(mmHg)

    1 85

    2 85

    3 85

    4 95

    5 956 100

    7 110

    8 130

    9 130

    52

    192

    1 =+

    =+n

    95 la modalit mediana

    50%

    50%

    I N ORDI NE

    C RE

    S C E NT E

    6 Esempio di calcolo della mediana nel caso di

  • 8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011

    117/146

    Classi peso Valore centrale Frequenzaassoluta Frequenzacumulata[69,5 72,5) 71 3 3[72,5 75,5) 74 4 7[75,5 78,5) 77 22 29

    [78,5 81,5) 80 53 82[81,5 84,5) 83 92 174[84,5 87,5) 86 71 245[87,5 90,5) 89 46 291[90,5 93,5) 92 15 306[93,5 96,5) 95 4 310

    Totale 310

    9,83392

    821555,812 mediana 1 =

    +=

    += c f

    f n

    Lmed

    cum

    6 Esempio di calcolo della mediana nel caso diuna distribuzione in classi

    Esercizio 1 (e.)Corso di Statistica 3

  • 8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011

    118/146

    Foglie 1 2 3 4 5 6 7 8 9 10

    Lunghez. in cm 1 2 2 3 4 1 2 1 3 2

    Moda = 2

    Mediana: dopo aver ordinato in senso crescente le unit

    calcoliamo le due posizioni mediane n/2 = 5 (n/2)+1 = 6,al posto 5 e 6 corrispondono i valori 2 e 2,Trattandosi di un carattere qualitativo si fa la media aritmeticadei due valori mediani: Me= 2

    Foglie 1 2 3 4 5 6 7 8 9 10Lunghez. in cm 1 1 1 2 2 2 2 3 3 4

    (e)

    Nella seguente tabella sono riportate le lunghezze di 10 foglie di menta,registrate al centimetro piu prossimo. Si definisca la variabile X di interesse,

    (a). si dica se equantitativa o qualitativa, discreta o continua.(b). dopo aver definito opportunamente le classi di modalita, calcolare(c) le frequenze assolute e le frequenze relative;(d) la media aritmetica di X;(e) la moda, la mediana.

    I QUANTILI

  • 8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011

    119/146

    I QUANTILI

    I quantili sono unestensione della mediana. Iquantili suddividono la distribuzione in q distribuzioni parziali,aventi ognuno la q-esima parte della numerosit totale.

    I pi utilizzati sono sono i :

    Percentili/Centili con q = 100Decili con q = 10Quartili con q = 4

    Ilquartile divide la distribuzione in quattro parti, aventiognuna il 25% della numerosit

  • 8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011

    120/146

    I Quartile ripartisce la distribuzione in due distribuzioni, laprima costituita dal 25% della distribuzione complessiva,laltra dal 75%2 Quartile coincide con la Mediana

    3 Quartile ripartisce la distribuzione in due distribuzioni, laprima costituita dal 75% della distribuzione complessiva,laltra dal 25%

    Il procedimento di calcolo simile al calcolo della mediana:

    Quartili Decili Percentili

    ( )14

    += N i

    Qi ( )110

    += N i Di ( )110+= N

    i P i

    RELAZIONI TRA INDICI DI TENDENZA

  • 8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011

    121/146

    Le possibili relazioni tra i valori medi di una distribuzione dipendondalla sua forma e nel caso di una distribuzione unimodale sipresentano tre casi:

    1_curva simmetrica

    media = moda = mediana

    2_curva obliqua a destra, con asimmetria positiva (a destra)

    moda < mediana < media 3_In una curva obliqua a sinistra, con asimmetria negativa (a

    sinistra)

    media < mediana < moda

    RELAZIONI TRA INDICI DI TENDENZACENTRALE

    RELAZIONI TRA INDICI DI TENDENZA CENTRA

  • 8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011

    122/146

    RELAZIONI TRA INDICI DI TENDENZA CENTRA

    INDICI DI TENDENZA CENTRALE E LORO

  • 8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011

    123/146

    UTILIZZAZIONEIN RELAZIONE ALLA SCALA DI MISURA DEI DATI

    INDICI DI TENDENZACENTRALE UTILIZZABILI

    Qualitativi sconnessi moda

    Qualitativi ordinati indici di posizioneQuantitativi medie analitiche, indici di posizione

    Corso di Statistica

  • 8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011

    124/146

    I Facolt di Medicina e ChirurgiaCORSO DI STATISTICA 2

    Dott. Laura Perrotta- Lezione 3 - Gli indici di dispersione -

    A.A. 2006/2007

    INDICI DI DISPERSIONECorso di Statistica

  • 8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011

    125/146

    INDICI DI DISPERSIONE

    Gliindici di dispersione sono indici che danno unamisura della variabilit dei termini della distribuzionerispetto ad una media.

    Un indice di tendenza centrale non sufficiente, infatti,a descrivere completamente un fenomeno.

    Indici di tendenza centrale e indici di dispersione

    devono essere associati per fornire uninformazionecompleta.

    Gli indici di dispersione sono sempre associati ad unamedia per indicare la variabilit intorno ad essa.

    Tab. 1 Non c dispersione rispetto alla variabile

    Corso di Statistica

  • 8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011

    126/146

    Paziente Sesso Et PA diastolica(mmHg)

    PA sistolica(mmHg)

    1 M 50 70 1102 F 50 90 953 F 50 80 1304 F 50 85 855 M 50 70 95

    Paziente Sesso Et PA diastolica(mmHg)

    PA sistolica(mmHg)

    1 M 20 70 1102 F 20 90 95

    3 F 50 80 1304 F 80 85 855 M 80 70 95

    ab.

    Tab. 2

    ( ) ( ) 505

    80...20 Tab.2 50

    55050505050

    Tab.1 1 =++==++++==

    =

    n

    xn

    i

    i

    C dispersione rispetto alla variabile et

    Corso di Statistica

  • 8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011

    127/146

    166,00

    168,00

    170,00

    172,00

    174,00

    176,00

    178,00

    180,00c m

    S A R D E G N A

    S I C I L I A

    C A L A B R I A

    B A S I L I C A T A

    P U G L I A

    C A M P A N I A

    M O L I S E

    A B R U Z Z O

    L A Z I O

    M A R C H E

    U M B R I A

    T O S C A N A

    E M I L I A R O M A G N A

    L I G U R I A

    F R I U L I V E N E Z I A G I U L I A

    V E N E T O

    T R E N T I N O

    A L T O

    A D I G E

    L O M B A R D I A

    V A L L E D ' A O S T A

    P I E M O N T E

    S A R D E G N A

    S I C I L I A

    C A L A B R I A

    B A S I L I C A T A

    P U G L I A

    C A M P A N I A

    M O L I S E

    A B R U Z Z O

    L A Z I O

    M A R C H E

    U M B R I A

    T O S C A N A

    E M I L I A R O M A G N A

    L I G U R I A

    F R I U L I V E N E Z I A G I U L I A

    V E N E T O

    T R E N T I N O

    A L T O

    A D I G E

    L O M B A R D I A

    V A L L E D ' A O S T A

    P I E M O N T E

    Media italiana

    Grafico 1 - Stature degli iscritti nelle liste di leva dei nati nellanno 1969

  • 8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011

    128/146

    INTERVALLO DI VARIAZIONE

    Corso di Statistica

  • 8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011

    129/146

    INTERVALLO DI VARIAZIONE

    (o RANGE)Lintervallo di variazione la pi elementare misura didispersione riferita ai dati quantitativi ed calcolato comedifferenza tra il valore pi alto e quello pi basso di una serie di

    intervallo di variazione = valore pi alto valore pi basso(o Range)

    I due valori estremi (max e min) forniscono lindicazione del domdella variabile e indicano un primo approccio descrittivo

    Corso di Statistica

  • 8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011

    130/146

    Paziente Sesso Et PA diastolica(mmHg)

    PA sistolica(mmHg)

    1 M 20 70 1102 F 20 90 953 F 50 80 1304 F 80 85 855 M 80 70 95

    Lintervallo di variazione calcolato per la variabile PA diastolica il seguente 90 70 = 20

    Min = 70Max = 90Range = 20

    INDICI DI VARIABILITA ASSOLUTACorso di Statistica

  • 8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011

    131/146

    INDICI DI VARIABILITA ASSOLUTAPER MISURE QUANTITATIVE

    SCARTO MEDIO SEMPLICE ASSOLUTO

    DEVIANZA VARIANZA

    DEVIAZIONE STANDARD

    Sono gli indicatori statistici di fondamentale importanza per la statistica descrittiva

    VARIABILITA COMPLESSIVACorso di Statistica

  • 8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011

    132/146

    VARIABILITA COMPLESSIVA

    Lavariabilit complessiva costituita dallinsieme degliscarti di tutte le misure dalla media.Per la propriet delle medie la somma degli scarti dalla medi nulla a causa della compensazione tra scarti positivi enegativi.Utilizzando lartificio del valore assoluto, possiamoconsiderare lentit dello scarto senza tener conto del segnonegativo.La variabilit complessiva data da:

    Nota:calcolare gli N(N-1) / 2 scarti tra tutte le osservazioni diventa troppolaborioso

    || m X

    Corso di Statistica

  • 8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011

    133/146

    Se rapportiamo la variabilit complessiva al numero delleosservazioni otteniamo loscarto medio semplice assoluto

    Che costituisce il pi elementare indice di dispersione consignificato statistico, poco considerato per via dellartifizio delvalore assoluto

    N m X i i ||

    SCARTO MEDIO SEMPLICE ASSOLUTO

    DEVIANZA

    Corso di Statistica

  • 8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011

    134/146

    DEVIANZA

    In alternativa al valore assoluto si ricorre al quadrato degliscarti dalla media e si perviene alla formula delladevianza :

    Definita come la somma dei quadrati degli scarti dalla media

    La devianza sempre maggiore o uguale di zero e costituisce

    il numeratore della varianza

    ( )( )2

    22

    N

    X X m X i i

    i ii i

    =

    ( ) 0 X DEV

    Corso di Statistica

  • 8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011

    135/146

    Domanda:

    Di fronte a due serie di misure di una stessa variabile c

    medie uguali, ma devianze diverse, la devianza dellaprima serie maggiore perch i suoi dati sono pidispersi o semplicemente perch il numero degli scarti

    pi elevato?

  • 8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011

    136/146

    L d i ti li f i d l di

    Corso di Statistica

  • 8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011

    137/146

    VARIANZA

    Definiamovarianza il rapporto tra la devianza e ilnumero delle osservazioni:

    ( ) N

    m X i i =

    22

    La devianza non contiene linformazione del numero di

    osservazioni N utilizzate nel calcolo

    Paziente Sesso Et PA diastolica PA sistolica

    Corso di Statistica

  • 8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011

    138/146

    (mmHg) (mmHg)1 M 40 70 110

    2 F 40 90 953 F 50 80 130 70 M 55 70 95

    Paziente Sesso Et PA diastolica(mmHg)

    PA sistolica(mmHg)

    1 M 50 75 1002 F 60 90 953 F 75 88 974 F 40 86 945 M 25 84 95

    050.1 50620.10 50

    22

    11

    ====

    devdev

    Var 1 = 151,71Var 2 = 210

    La seconda distribuzione per et presenta unamaggiore dispersione intorno alla media

    VARIANZA CAMPIONARIACorso di Statistica

  • 8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011

    139/146

    In campo biostatistico si preferisce utilizzare la formula dellavarianza campionaria

    Per N molto grande ininfluente ai fini del risultato dellavarianza dividere per N o N-1.Per N molto piccolo se dividiamo la devianza per N-1 rispetta N otterremo una varianza campionaria maggiore rispetto aquella semplice.Le N-1 osservazioni costituiscono i gradi di libert, cio leosservazioni indipendenti nel calcolo della varianza.

    ( )

    1

    2

    2

    =

    N

    m X S i i

    DEVIAZIONE STANDARDCorso di Statistica

  • 8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011

    140/146

    DEVIAZIONE STANDARD

    La variabilit deve essere associata alla tendenza centrale per fornire una descrizione completa di un fenomeno.Il valore della varianza deriva dal quadrato degli scarti dalla med ha un ordine di grandezza differente dal dato originale.Per un problema di interpretazione del dato convenienteesprimere la variabilit con lo stesso ordine di grandezza dellemedie: trasformiamo la varianza sotto il segno di radice eotteniamo la

    Deviazione standard oscarto quadratico medio

    che rappresenta la dispersione di una serie di dati

    ( )

    n

    m X n

    ii

    = =1

    2

  • 8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011

    141/146

    i S A di li A i li ( )

    1_Esempio di confronto tra variabilitCorso di Statistica

  • 8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011

    142/146

    Paziente Sesso Et PA diastolica(mmHg)

    PA sistolica (mmHg)

    1 M 50 75 1002 F 47 90 953 F 74 88 974 F 40 86 945 M 61 84 95

    Paziente Sesso Et PA diastolica(mmHg)

    PA sistolica (mmHg)

    1 M 28 70 1102 F 45 90 953 F 50 80 1304 F 63 85 855 M 80 75 95

    ( ) ( ) ( ) ( ) ( ) ( )

    ( ) ( ) ( ) ( ) ( )9,7

    5

    80758085808080908070

    8,55

    6,84846,84866,84886,84906,8475

    805

    75...70 6,84

    5

    4868889075

    22222

    2

    222221

    2

    1

    21

    1

    =++++

    =

    =++++

    =

    =

    =++

    ==++++

    ==

    =

    =

    n

    x

    n

    x

    n

    ii

    n

    i

    i

    2_Esempio di confronto tra variabilit

    Corso di Statistica

  • 8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011

    143/146

    Paziente Sesso Et Glicemia(mg/100ml)

    Calcemia(mg/100ml)

    1 M 50 85 8

    2 F 37 80 10

    3 F 63 70 9

    4 M 41 90 5

    5 M 36 100 13

    ( ) ( ) ( ) ( ) ( ) ( )

    ( ) ( ) ( ) ( ) ( )91,2

    5

    913959991098

    18,115

    851008590857085808585

    95

    1359108 85

    5

    10090708085

    22222

    2

    222221

    2

    1

    21

    1

    =++++

    =

    =++++

    =

    =

    =++++

    ==++++

    ==

    =

    =

    n

    x

    n

    x

    n

    ii

    n

    i

    i

    mg/100ml1811mg/100ml85Glicemia 11 ==

    Corso di Statistica

  • 8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011

    144/146

    %39,32100991,2100CV% (2)

    %15,1310085

    18,11100CV% (1)

    mg/100ml 91,2 mg/100ml 9 Calcemia

    mg/100ml18,11 mg/100ml85 Glicemia

    2

    2

    1

    1

    22

    11

    ===

    ===

    ==

    Confrontando i coefficienti di variazione risulta pi variabila calcemia

  • 8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011

    145/146

    codice paziente et Posizione et CENTRALETENDENZADIINDICI

    Corso di Statistica

  • 8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011

    146/146

    1 62 1 30

    2 39 2 39

    3 46 3 464 53 4 46

    5 54 5 47

    6 68 6 52

    7 63 7 53

    8 62 8 54

    9 67 9 5710 30 10 60

    11 66 11 61

    12 46 12 62

    13 67 13 62

    14 70 14 62

    15 60 15 6316 57 16 66

    17 62 17 67

    ( )

    ( ) ( ) ( )

    ( ) ( ) ( )4,13...6,176,2620

    6,5670...6,56396,5630

    10,63st.deviazione

    40 range70 massimo30 minimo

    A'VARIABILITDIINDICI

    6,56

    5,60Mediana62 Moda

    222

    222

    1

    2

    =+++=

    =+++=

    =

    =

    =

    ===

    =

    ==

    =

    n

    an

    ii