Download - Slides Statistica Intro
-
8/12/2019 Slides Statistica Intro
1/23
Statistica I - a.a.2009/10 - Prof. Paroli 1
Corsi di Laurea Triennali diEconomia
Prof.ssa Roberta Paroli
Corso diSTATISTICA I (gruppo A-Cl)a.a. 2009/2010
Statistica I - a.a.2009/10 - Prof. Paroli 2
STRUTTURA DEL CORSOSTRUTTURA DEL CORSO
ORARIO DEL CORSO:ORARIO DEL CORSO:lun. 15.30lun. 15.30 --18.3018.30 -- aula Manzoni (G022)
giov. 13.30giov. 13.30 --15.3015.30 -- aula Manzoni (G022)
ESERCITAZIONIESERCITAZIONI: dott.ssa Marta Nai Ruscone????????
INFORMAZIONI GENERALI
Statistica I - a.a.2009/10 - Prof. Paroli 3
RICEVIMENTORICEVIMENTOMARTEDI 10:30 12:30
Dipartimento di Scienze Statistiche
via Necchi 9 I piano
e-mail:
aula virtuale:
www.unicatt.it/docenti/paroli
Statistica I - a.a.2009/10 - Prof. Paroli 4
TESTITESTIGli appunti dilezionied esercitazionisono fondamentali
Il materiale delle lezioni disponibile su Blackboard.
TEORIAFrosini B.V.(2001) Metodi Statistici: teoria e applicazioni economiche e
sociali , Carocci, RomaSantamaria L.(2006) Statistica descrittiva: applicazioni di carattere
economico e aziendale, Vita e Pensiero
Pacini B. e Raggi M.(2006) S tatistica per lanalisi operativa dei dati Carocci, Roma
-
8/12/2019 Slides Statistica Intro
2/23
Statistica I - a.a.2009/10 - Prof. Paroli 5
ESERCIZI
Sono scaricabili da Blackboard:
I testi desame degli a.a. 2008/2009 - 2007/2008 -2006/2007 - 2005/2006 2004/2005 - 2003/2004 -2002/2003 - 2001/2002 2000/2001
con soluzioni esteseper gli
a.a. 2001/2002a.a. 2002/2003
a.a. 2003/2004
con soluzioni sinteticheper gli
a.a. 2000/2001a.a. 2004/2005
a.a. 2005/2006
a.a. 2006/2007
solo i testi
Statistica I - a.a.2009/10 - Prof. Paroli 6
ESAMEESAME:: scritto esercizi di calcolo e teorici
orale domande di teoriaDurata della prova: 1h 30
Sono previste le prove intermedieSono previste le prove intermedie
ESAME
Ammissione alle prove intermedie : Le prove intermedie sono pensateper chi partecipa assiduamente alle lezioni, essendo riferite principalmenteagli argomenti trattati in aula nellanno in corso. Pertanto si rivolgonogeneralmente ai frequentanti. Ove la didattica del corso lo consenta, nepu essere prevista lestensione anche ad altre tipologie di studenti.La prova intermedia facoltativa per lo studente.
Statistica I - a.a.2009/10 - Prof. Paroli 7
I prova: nella settimana delle prove intermedieProgramma:statistica univariata/bivariata Durata: 1 ora o 45min
La prova consister di esercizi in parte di calcolo e in parte teorici.Lesito sar comunicato entro Natale 2009.
II prova: in uno degli appelli della sessione invernaleProgramma:statistica bivariata e probabilit Durata: 1 ora o 45min
Alla II prova potr accedere solo chi avr ottenuto esito positivo nellaI prova intermedia.La prova consister di esercizi in parte di calcolo e in parte teorici.
Prova orale: obbligatoria per tutti
PROVE INTERMEDIEPROVE INTERMEDIE
Statistica I - a.a.2009/10 - Prof. Paroli 8
Non prevista la possibilit di effettuare alcuncambio corso (gruppo di lettere / professore)e non valgono i cambi corso effettuati gli anniscorsi
TRASFERIMENTO GRUPPO
Ciascuno pu pero frequentare le lezioni con il docente preferito ma dovr obbligatoriamente sostenere lesame con il docentedel suo gruppo di lettere(anche se non quello preferito!!!!!)
-
8/12/2019 Slides Statistica Intro
3/23
Statistica I - a.a.2009/10 - Prof. Paroli 9
- La buona educazione vorrebbe che si salutasse il docente (meglio buongiorno o buonasera; salve Prof. non molto gradito)
- Indicare sempre nome, cognome, matricola e linsegnamento(ogni docente tiene pi di un corso e non conosce tutti gli studentiper nome non siamo al liceo).- Scrivere in italiano, usando la punteggiatura. Rileggere la mailper verificare che non ci siano errori di grammatica ( vero che lamail vi d anonimato, ma se lerrore molto grave .ciricordiamo di voi!)
- Non correggiamo esercizi via mail, dunque non rispondiamoalle mail che lo richiedono- Non chiedeteci via mail le aule dellesame (scritto o orale),perch anche noi le scopriamo guardando la bacheca on-line.
LE MAIL AL DOCENTE
Statistica I - a.a.2009/10 - Prof. Paroli 10
1) Frequentare le lezioni e le esercitazioni non OBBLIGATORIOma sicuramente utile2) Studiare sempre prima la TEORIA e, solo dopo averla capita,fare gli esercizi. Fare il viceversa non d gli stessi risultati.3) Ripetere a voce alta pensando di dovere spiegare a qualcunoquello che studiate. Dovete essere convinti di quello che dite pensate a quando lavorerete!4) Studiare volta per volta. Questo vi far capire meglio i nuoviargomenti5) Fare domande quando non si capisce (il ricevimento studenti da sfruttare non solo la settimana prima degli esami!)
COME SI STUDIA STATISTICA???
Statistica I - a.a.2009/10 - Prof. Paroli 11
INTRODUZIONE
Statistica I - a.a.2009/10 - Prof. Paroli 12
COSA E LA STATISTICA???
Se si muove biologia, se cambia colore chimica, se si rompe fisica, se ti fadormire statistica
(Bob Hogg - Universit Iowa)
FRASI CELEBRI ..
-
8/12/2019 Slides Statistica Intro
4/23
Statistica I - a.a.2009/10 - Prof. Paroli 13
Ci sono tre generi di bugie:le piccole, le grandi e le statistiche
(Mark Twain)
To r t u r a a b b a s t a n z a a l u n g o i d a t i e de s s i co n f e s s e r a n n o q u a l u n q u e c o s a
Statistica I - a.a.2009/10 - Prof. Paroli 14
e nei fumetti
Statistica I - a.a.2009/10 - Prof. Paroli 15 Statistica I - a.a.2009/10 - Prof. Paroli 16
-
8/12/2019 Slides Statistica Intro
5/23
Statistica I - a.a.2009/10 - Prof. Paroli 17
Un insieme di strumenti logici e matematico-probabilistici per la misura e il trattamento di insiemidi informazioni configurabili come fenomeni di massa(grandi quantit di dati).
La sua conoscenza non solo cruciale in ambitoscientifico, ma fondamentale nella gestione aziendale edi non trascurabile importanza nella vita quotidiana.
Uno strumento di supporto nei processi decisionali(specie in quelle situazioni in cui si devono prenderedecisioni in condizione di incertezza grazie allapportodecisivo della teoria della probabilit).
Pi seriamente.. cosa la STATISTICA ?????
Statistica I - a.a.2009/10 - Prof. Paroli 18
La STATISTICA si pu utilizzare in contesti moltodifferenti:
- per studiare landamento di un titolo di borsa- per controllare la qualit di un processo produttivo- per monitorare le vendite di un negozio- per misurare la soddisfazione dei clienti- per effettuare confronti (ad es. tra due squadre di
calcio)- per leggere i risultati delle analisi mediche- per le analisi demografiche- Vediamo alcuni esempi
Statistica I - a.a.2009/10 - Prof. Paroli 19
A quanto ammonta il livello giornaliero degli inquinanti dellaria?Varia nel tempo?
statistica ed inquinamento
PM 10
viaVico/Olivetani
(Zona1)S. Ambrogio
Statistica I - a.a.2009/10 - Prof. Paroli 20
L'inflazione un processo di aumento del livello generaledei prezzi dell'insieme dei beni e servizi destinati al consumodelle famiglie. Generalmente, si misura attraverso lacostruzione di un indice dei prezzi al consumo .Un indice dei prezzi al consumo uno strumento statistico chemisura le variazioni nel tempo dei prezzi di un insieme di beni eservizi, chiamato paniere, rappresentativo degli effettiviconsumi delle famiglie in uno specifico anno.In Italia, come nella maggior parte dei paesi, il calcolodell'indice affidato all'Istituto nazionale di statistica (ISTAT).
In particolare, l'Istat produce tre diversi indici dei prezzi alconsumo: per l'intera collettivit nazionale (NIC), per lefamiglie di operai e impiegati (FOI) e l'indice armonizzatoeuropeo (IPCA).
statistica ed economia
Come si misura linflazione???
-
8/12/2019 Slides Statistica Intro
6/23
Statistica I - a.a.2009/10 - Prof. Paroli 21
Periodo di riferimento: agosto 2008Aggiornato il 15 settembre 2008
+5,5Variazione percentuale rispetto allo stesso mesedi due anni precedenti
+3,9Variazione percentuale rispetto allo stesso mesedell'anno precedente
+0,1Variazione percentuale rispetto al mese precedente
135,5Indice generale
Indice dei prezzi al consumo FOI
Per adeguare periodicamente i valori monetari, ad esempiogli affitti o gli assegni dovuti al coniuge separato, si utilizza
l'indice dei prezzi FOI.
Statistica I - a.a.2009/10 - Prof. Paroli 22
statistica e popolazione
Ad esempio d informazioni sulla natalit.
Statistica I - a.a.2009/10 - Prof. Paroli 23 Statistica I - a.a.2009/10 - Prof. Paroli 24
o sul fenomeno migratorio
-
8/12/2019 Slides Statistica Intro
7/23
Statistica I - a.a.2009/10 - Prof. Paroli 25
come pu unazienda accrescere e sfruttare al meglio le sueconoscenze sul mercato in cui opera, sui suoi clienti, suiconcorrenti?
statistica e marketing
Esempio 1
Statistica I - a.a.2009/10 - Prof. Paroli 26
Esempio 2
Esempio 3
Statistica I - a.a.2009/10 - Prof. Paroli 27
perch intervistando un piccolo gruppo di persone (un campione)possiamo dire qualcosa su tutta la popolazione? Quali regole nellascelta del campione occorre seguire per ottenere risultati affidabili?
statistica e sondaggi
SONDAGGI DI MERCATO: per conoscere abitudini, preferenze,gusti e aspettative del consumatore. Per testare lefficacia di unnuovo prodotto o varianti dello stesso prima di lanciarlo sul
mercatoSONDAGGI DI OPINIONE: conoscere lopinione pubblica sullequestioni di interesse generale (e non solo) attinenti le sfere:dellattivit sociale, del costume, della politica, delletica, dellareligioneSONDAGGI POLITICO-ELETTORALI:www.sondaggipoliticoelettorali.it
Statistica I - a.a.2009/10 - Prof. Paroli 28
Per altri esempi visita il sito ISTATwww.istat.it
-
8/12/2019 Slides Statistica Intro
8/23
Statistica I - a.a.2009/10 - Prof. Paroli 29
Dati , statistiche e probabilit sonopresenti in tutte le notizie della stampa ein TV:
ma chi sa leggerle e interpretarle con
chiarezza?
Statistica I - a.a.2009/10 - Prof. Paroli 30
Attenzione a distinguere tra lettura e
interpretazionedei risultati.
La lettura deve essere oggettiva.L interpretazione pu essere diversa se diversisono i punti di partenza da cui ci si muove.Non ci si deve sorprendere se uno stessorisultato viene interpretato in modo diverso daanalisti che partono da punti di vista diversi.
Statistica I - a.a.2009/10 - Prof. Paroli 31
Obiettivo del corso
FAR DORMIRE ?????
FORNIRE GLI STRUMENTI PEROTTENERE E LEGGERECORRETTAMENTE I RISULTATI
DELLE ANALISI DEI DATIStatistica I - a.a.2009/10 - Prof. Paroli 32
ANALISI STATISTICA UNIVARIATA
- Indici di posizione
Medie non analitiche
Medie analitiche
- La variabilit e la mutabilit statistica
Misure assolute di variabilit
Misure assolute di mutabilit/eterogeneit
Indici relativi e normalizzati
- Indici di forma- Rapporti statistici
Numeri indici
PROGRAMMAPROGRAMMA
-
8/12/2019 Slides Statistica Intro
9/23
Statistica I - a.a.2009/10 - Prof. Paroli 33
ANALISI STATISTICA MULTIVARIATA
- Indipendenza statistica
- Connessione fra due caratteri qualitativi
misure della connessione
- Studio della relazione in media fra due caratteri
funzione di regressione
- Misure di dipendenza lineare: correlazione
- Regressione ai minimi quadrati- Cenni al modello di regressione lineare multipla
Statistica I - a.a.2009/10 - Prof. Paroli 34
CALCOLO DELLE PROBABILIT- Definizione di probabilit
- Teoremi di base del calcolo delle probabilit
- I principali modelli probabilistici
ELEMENTI DI INFERENZA STATISTICA (???)- Cenni al campionamento
- Stima puntuale
- Stima intervallare- Cenni sulla verifica statistica delle ipotesi
Programma diun corso diSTATISTICA II
Statistica I - a.a.2009/10 - Prof. Paroli 35
Altri corsi di STATISTICA
Statistica Applicata I modulo: INFERENZA II modulo: caratterizzante a seconda del cdl scelto
(statistica economica, econometria, teoria deicampioni, statistica per il marketing, .)
Nella laurea specialistica potrete trovare altriesami di Statistica
Statistica I - a.a.2009/10 - Prof. Paroli 36
STATISTICA DESCRITTIVASTATISTICA DESCRITTIVAsintesi delle osservazioni campionarie o dei dati
censuari
STATISTICA PROBABILISTICASTATISTICA PROBABILISTICAstudio del meccanismo generatore delle
realizzazioni campionarie(modello campione)
STATISTICA INFERENZIALESTATISTICA INFERENZIALE
dal campione al suo meccanismo generatore(campione modello)
BRANCHE DELLA STATISTICA
-
8/12/2019 Slides Statistica Intro
10/23
Statistica I - a.a.2009/10 - Prof. Paroli 37
- Definizione degli obiettivi- Astrazione
individuazione delle variabiliosservabili/proxy
- Individuazione della popolazioneo definizione del piano di campionamento(se si tratta di una indagine campionaria)
- Rilevazionesperimentazione, questionari, .
FASI DELLA RICERCA STATISTICA
Statistica I - a.a.2009/10 - Prof. Paroli 38
- Registrazione dei datiorganizzazione daticlassificazione
- Elaborazione dei datisintesiinterpretazione
inferenza
Statistica I - a.a.2009/10 - Prof. Paroli 39
ANALISI DEI DATIANALISI DEI DATI
DATA BASE
analisi esplorative analisi confermative
TECNICHESTATISTICHE
(DATA MINING)
Statistica I - a.a.2009/10 - Prof. Paroli 40
I DATI
Qualsiasi analisi dei dati presuppone che essisiano organizzati in modo che i risultati non
siano influenzati dalla cattiva costruzione deldatabase.
Le regole fondamentali sono: verifica delle fonti verifica della qualit dei dati creazione della matrice dei dati
-
8/12/2019 Slides Statistica Intro
11/23
Statistica I - a.a.2009/10 - Prof. Paroli 41
tabella formata dalle osservazioni di tutti idati
rilevati per ognielementooggetto dellindagine
DATA BASE = matrice dei dati
xknxinx2nx1nn
xkjxijx2jx1j j
xk2xi2x22x122xk1xi1x21x111XkXiX2X1
Statistica I - a.a.2009/10 - Prof. Paroli 42
EURISKO: I BILANCI DELLE FAMIGLIE ITALIANEnel 1998 questionario capofamiglia
INDAGINE BANCA DITALIA INFORMAZIONI RIGUARDANTI struttura famiglia occupazione e redditi strumenti di pagamento e forme di risparmio abitazioni e altri beni immobiliari consumi e spese familiari forme assicurative
ESEMPIO DATA-BASE
Statistica I - a.a.2009/10 - Prof. Paroli 43
NQUEST NCOMP SEX PARENT ANASC ETA STACIV STUDIO Is t ruz_anni APQUAL APSETT ETALAV1 4 0 2 1959 39 1 3 8 1 4 152 4 0 3 1978 20 2 5 12 1 7 163 4 0 2 1947 51 1 5 12 3 9 214 3 1 1 1948 50 1 5 13 2 9 185 3 1 1 1960 38 1 7 18 4 2 186 1 0 1 1938 60 3 7 17 4 9 257 4 0 2 1954 44 1 5 12 2 9 208 2 1 1 1937 61 1 2 5 1 3 169 1 0 1 1961 37 2 3 8 1 9 15
10 2 1 1 1941 57 1 5 13 2 3 2011 4 0 2 1954 44 1 3 8 1 9 1812 4 1 3 1974 24 2 3 8 2 2 2013 4 1 1 1954 44 1 3 8 1 2 2114 4 1 1 1950 48 1 5 13 5 7 2415 4 1 1 1949 49 1 3 8 1 9 1516 2 0 1 1964 34 2 5 13 2 4 1617 3 1 3 1978 20 2 3 8 1 4 1518 4 0 2 1946 52 1 3 8 1 9 1819 3 0 2 1963 35 1 3 8 2 2 1820 3 1 1 1968 30 1 5 13 2 2 1921 4 1 3 1974 24 2 5 13 1 4 1522 3 1 1 1950 48 1 5 13 4 4 2423 4 1 1 1960 38 1 5 13 2 5 1524 5 0 2 1957 41 1 3 8 1 2 1525 5 0 3 1970 28 1 3 8 1 4 1826 4 1 1 1966 32 1 2 5 1 2 16
27 4 0 3 1976 22 2 5 13 4 2 2028 2 0 1 1947 51 2 6 15 2 9 2029 3 0 3 1969 29 2 5 13 2 3 2630 5 0 2 1948 50 1 5 13 2 9 2131 5 0 2 1950 48 1 5 12 3 9 1832 2 1 1 1945 53 4 2 5 1 3 1533 2 1 3 1957 41 2 7 18 3 9 27
un estratto .
Statistica I - a.a.2009/10 - Prof. Paroli 44
- Unit statistiche o sperimentalisupporto fisico/materiale dellindagine
- popolazione/universo- campione
- Caratteripropriet dellunit sperimentale
- qualitativi- quantitativi
TERMINOLOGIA
-
8/12/2019 Slides Statistica Intro
12/23
Statistica I - a.a.2009/10 - Prof. Paroli 45
- Modalit del caratteremodo di manifestarsi del carattere
- attributi qualitative- misure quantitative
Statistica I - a.a.2009/10 - Prof. Paroli 46
tabella formata dalle osservazioni di tutti icaratteri rilevati per ogni unit statistica
CODFAM PAR SESS DATANASC COMNASSTCIVITITSTU PROF DATAPROV COMMA DATAMATR NCOMPON1538404 25 M 3/5/1953 072004 29 6/30/2001 00084320 01 F 1/19/1962 034027 CG 39 034027 5/6/1989 30139424 05 M 2/25/1951 034027 CG 29 45307 034027 7/20/1974 30139424 06 F 4/27/1955 034025 CG 16 99116 2/8/1965 034027 7/20/1974 30025597 18 F 9/19/1959 034027 CG 39 23916 034027 4/7/1980 40087423 03 F 7/18/1968 034033 CG 16 12/16/1975 034027 10/11/1987 30131457 01 F 9/9/1966 280042 CG 39 12505 9/3/1993 034027 3/27/1999 40087423 01 M 2/3/1965 034027 CG 29 034027 10/11/1987 3
0039567 03 F 11/14/1951 034012 CG 29 6/6/1967 034027 10/20/1973 40065549 01 M 7/14/1950 034010 CG 29 21604 4/22/1963 034027 6/27/1976 30056435 01 M 9/10/1948 034027 CG 29 99102 034027 6/1/1974 30025597 04 M 2/15/1956 034027 CG 29 14701 7/13/1960 034027 4/7/1980 40056435 03 F 10/24/1951 034027 CG 39 23916 034027 6/1/1974 30155733 05 M 11/19/1951 034027 CG 29 62302 6/27/1974 034027 3/30/1974 3
caratteri
unitstatistiche
Statistica I - a.a.2009/10 - Prof. Paroli 47
- QUALITATIVI / CATEGORICI. sconnessi. ordinati
- QUANTITATIVI / METRICI. discreti. continui
TIPI DI CARATTERI
Statistica I - a.a.2009/10 - Prof. Paroli 48
modalitmodalit = attributi
- sconnessi (scala nominale). comune di residenza. tipo di industria. tipo di fabbricazione
- ordinati (scala ordinale). titolo di studio. grado di vendibilit. risultato di un esame (A,B,C, ) ...
CARATTERI QUALITATIVI
-
8/12/2019 Slides Statistica Intro
13/23
Statistica I - a.a.2009/10 - Prof. Paroli 49
esempio :
moltodaccordo Indifferente decisamentecontrario
(punteggi espressi su scale convenzionali )
osservazione :NON HA SENSO CONFRONTARE DISTANZE
TRA MODALIT(anche se codificate con valori numerici)
Statistica I - a.a.2009/10 - Prof. Paroli 50
NQUEST NCOMP SEX PARENT ANASC STACIV STUDIO APQUAL YL ORETOT
1 4 F coniuge 1959 coniug. media inf. operaio 18000 45
2 4 F figlio/a 1978 celibe media sup. operaio 8000 25
3 4 F coniuge 1947 coniug. media sup. insegn. 28000 65
4 3 M capo fam. 1948 coniug. media sup. impieg. 48000 42
5 3 M capo fam. 1960 coniug. laurea dirigente 40000 50
6 1 F capo fam. 1938 separato laurea dirigente 36000 42
7 4 F coniuge 1954 coniug. media sup. impieg. 29500 36
8 2 M capo fam. 1937 c oniug. elem. operaio 15000 45
9 1 F capo fam. 1961 celibe media inf. operaio 22100 40
sconnessi ordinati
Statistica I - a.a.2009/10 - Prof. Paroli 51
modalitmodalit = misure
numeri reali che descrivono una propriet oggettivadellunit statistica
- discretiinsieme di modalit: finito , numeri interi
- continuiinsieme di modalit: infinito , numeri reali
CARATTERI QUANTITATIVI
Statistica I - a.a.2009/10 - Prof. Paroli 52
- ordinamento dei numeri reali
- definibile una funzione distanza tramodalit
d = |x 2 - x1| = |x 1 - x2| 0per la quale
d = 0 x1 = x 2ed inoltre
|x 1 - x3| |x 1 - x2| + |x 2 - x3|
osservazioneHANNO SENSO LE DIFFERENZE (E LE SOMME)
-
8/12/2019 Slides Statistica Intro
14/23
Statistica I - a.a.2009/10 - Prof. Paroli 53
NQUEST NCOMP SEX PARENT ANASC STACIV STUDIO APQUAL YL ORETOT
1 4 F c oniuge 1959 coniug. media inf. operaio 18000 45
2 4 F figlio/a 1978 celibe media sup. operaio 8000 25
3 4 F c oniuge 1947 coniug. media sup. ins egn. 28000 65
4 3 M c apo fam. 1948 c oniug. media s up. impieg. 48000 42
5 3 M c apo fam. 1960 coniug. laurea dirigente 40000 50
6 1 F c apo fam. 1938 s eparat o laurea dirigent e 36000 42
7 4 F c oniuge 1954 coniug. media sup. impieg. 29500 36
8 2 M capo fam. 1937 c oniug. elem. operaio 1 5000 45
9 1 F c apo fam. 1961 celibe media inf. o peraio 22100 40
discreti continui
Statistica I - a.a.2009/10 - Prof. Paroli 54
organizzazione dei dati elementari
prospetti/elenchi delle osservazioni
se i dati sono tanti utile riorganizzarli inTABELLE
utilizzando la nozione fondamentale diFREQUENZA
TABELLE DI FREQUENZA
Statistica I - a.a.2009/10 - Prof. Paroli 55
SIMBOLOGIA- v j = singoli valori (j=1,2,, n)
(le osservazioni di base)
- xi = modalit distinten i = frequenze (i=1,2,, k)
N.B. n e k sono solitamentediversi tra loro!!!
Numero diunitstatistiche
Numero dimodalitdifferenti
Statistica I - a.a.2009/10 - Prof. Paroli 56
frequenza assoluta = numero di unit statisticheche presentano una data modalit (n i):
ni0 interi e ki=1ni =n
frequenza relativa = numero di unit statistichesul totale che presentano una data modalit (f i ):
f i= n i /n
0 f i 1 e ki=1f i=1
TIPI DI FREQUENZETIPI DI FREQUENZE
-
8/12/2019 Slides Statistica Intro
15/23
Statistica I - a.a.2009/10 - Prof. Paroli 57
modalit x i n i f i = n i/nx 1 n 1 f 1 x 2 n 2 f 2 : : :
x k n k f k n 1
per la quale si verifica che
i=1
k n i = n
i=1
k
f i = 1
Tabella di frequenza in generale:
Statistica I - a.a.2009/10 - Prof. Paroli 58
esempio : qualit dei pezzi prodotti da una linea di produzione
x i conteggio n iidoneo |||| |||| |||| |||| 19
2a scelta |||| |||| | 11difettoso |||| 4
scarto || 236
totale dei pezzi esaminati
Statistica I - a.a.2009/10 - Prof. Paroli 59
Ni = frequenze assolute cumulate == n 1+n 2++ni = i j=1 n j
N1=n 1 Nk=n
Fi = frequenze relative cumulate =
= f 1+f 2++f i = i j=1 f j F1=f 1 Fk=1
frequenza cumulata = numero/frazione diunit statistiche che presentano una data modalit
minore o uguale alla corrente (Nio F
i)
Statistica I - a.a.2009/10 - Prof. Paroli 60
esempio 1 : n stanze per abitazione
x i n i N i1 184 1842 451 184+451=635
3 312 635+312=9474 197 947+197=1144
5 84 1144+84=1228oltre 26 1228+26=1254
1254
dati rilevati su n = 1254 unit sperimentali
-
8/12/2019 Slides Statistica Intro
16/23
Statistica I - a.a.2009/10 - Prof. Paroli 61
esempio 2 : n. punti vendita di una azienda
x i n i f i F i
1 10 0.24 0.242 8 0.20 0.24+0.20= 0.443 6 0.15 0.44+0.15= 0.594 14 0.34 0.59+0.34=0.935 3 0.07 0.93+0.07=1.00
41 1.00
Statistica I - a.a.2009/10 - Prof. Paroli 62
Serie statistiche
modalit n i f i = n i/n
x 1 n 1 f 1 x 2 n 2 f 2 : : :
x k n k f k
n 1
Tabelle di frequenza per caratteriqualitativi/quantitativi discreti
Statistica I - a.a.2009/10 - Prof. Paroli 63
e s em p i o 1 : carattere qualitativo
variabile stato civilex i ni f i
Coniugato/a 130 0.650Celibe/nubile 63 0.315
Separato/divorziato 3 0.015Vedovo/a 4 0.020
200 1
Statistica I - a.a.2009/10 - Prof. Paroli 64
e s em p i o 2 : carattere quantitativo discreto
numero di punti vendita di una azienda
xi n i1 102 83 64 145 3
41
E se fossero i punti vendita dei supermercati??? potremmoavere anche 100 punti vendita !!!!Cosa succede alla tabella???
-
8/12/2019 Slides Statistica Intro
17/23
Statistica I - a.a.2009/10 - Prof. Paroli 65
SE IL CARATTERE PRESENTA MOLTEMODALIT DISTINTE
pu essere conveniente accorpare lemodalit inCLASSI
RAGGRUPPAMENTO IN CLASSICostruzione di intervalli di valori chiusi o aperti(da escluso, a incluso)
Statistica I - a.a.2009/10 - Prof. Paroli 66
Seriazioni statistiche
classi ni f i h0 h1 n1 f 1 h1 h2 n2 f 2
: :hk-1 hk nk f k
n 1
Classi o intervalli:-devono essere disgiunte (senza sovrapposizioni)- devono essere esaustive (devono contenere il minimo ed ilmassimo osservati)- solitamente si intendono chiuse a destra
Tabelle di frequenza per caratteriquantitativi ripartiti in classi
Statistica I - a.a.2009/10 - Prof. Paroli 67
e se m p i o : variabile reddito annuo 5 classi
Classi n i f i = n i/n
0 20 35 0.17520 30 42 0.21030 40 54 0.27040 80 59 0.29580 100 10 0.05
200 1
N.B. ATTENZIONE ALLAMPIEZZA DELLE CLASSI !!!!Se non costante si calcolano le densit di frequenza
Statistica I - a.a.2009/10 - Prof. Paroli 68
classi ni a i di
h0 h1 n1 a 1 n1 /a 1h1 h2 n2 a 2 n2 /a 2
: : :
hk-1 hk nk ak nk /a k n
densit di frequenza (di) = % di frequenzaassoluta (o relativa) nellintervallo
di = n i /a ioppure
f i /a iconai = ampiezza classe i-esima = h i hi-1
-
8/12/2019 Slides Statistica Intro
18/23
Statistica I - a.a.2009/10 - Prof. Paroli 69
e s e m p i o : variabile reddito annuo 5 classi
Classi n i ai d i = n i/a i 0 20 35 20 1.7520 30 42 10 4.230 40 54 10 5.440 80 59 40 1.47580 100 10 20 0.5
200
In questo modo si possono confrontare le frequenze neivari intervalli !!! (es. quale classe di reddito ha max freq.)
Statistica I - a.a.2009/10 - Prof. Paroli 70
linsieme delle coppie modalit+frequenze
X = {(x i,n i); i=1,2,,k}
detto
- mutabile statistica se il carattere qualitativo
- variabile statistica se il carattere quantitativo(discreto o continuo)
Statistica I - a.a.2009/10 - Prof. Paroli 71
ESEMPIO RIASSUNTIVO
La seguente matrice di dati si riferisce al data-base della contabilit clientidi una certa azienda
c o d i c e c l i e n t e c a t e g o r i a r e s i d e n z a F a t t u r a t o p r o d .A p r o d .B p r o d .C0 0 0 1 g ro s s is ta I ta lia 1 1 .2 2 1 2 7 0 3 7 0 40 0 0 2 g ra n d e d is tr ib I ta lia 3 0 .5 3 4 8 2 0 4 5 5 5
0 0 0 3 g ra n d e d is tr ib F ra n c ia 3 4 .5 5 5 5 5 0 5 8 0 40 0 0 4 g ro s s is ta I ta lia 1 5 .1 2 0 2 1 0 30 0 0 5 g ro s s is ta S v izze ra 2 8 .9 8 4 7 5 0 3 5 5 40 0 0 6 g ra n d e d is tr ib S v izze ra 2 0 .5 3 2 5 7 0 5 5 0 50 0 0 7 g ro s s is ta G e rm a n ia 1 2 .1 8 1 3 4 0 3 6 5 50 0 0 8 g ra n d e d is tr ib A u s tria 2 7 .6 5 3 8 5 0 6 8 0 50 0 0 9 g ro s s is ta I ta lia 1 7 .2 3 2 3 2 0 3 1 0 50 0 1 0 d e tta g lia n te G e rm a n ia 1 2 .4 3 1 7 5 0 2 2 5 40 0 1 1 g ro s s is ta F ra n c ia 1 3 .2 3 1 2 2 0 4 6 0 50 0 1 2 d e tta g lia n te I ta lia 1 3 .1 4 1 8 7 5 2 7 5 40 0 1 3 g ro s s is ta F ra n c ia 3 8 .0 5 6 4 4 0 3 8 5 50 0 1 4 d e tta g lia n te I ta lia 4 4 .5 3 7 5 0 1 7 5 40 0 1 5 d e tta g lia n te G e rm a n ia 4 6 .4 7 1 4 0 2 3 5 40 0 1 6 g ro s s is ta O la n d a 4 0 .1 2 6 7 5 0 4 8 2 50 0 1 7 d e tta g lia n te I ta lia 1 3 .8 8 2 5 7 0 0 30 0 1 8 g ro s s is ta F ra n c ia 2 3 .3 6 3 5 0 0 4 8 0 40 0 1 9 d e tta g lia n te O la n d a 6 .7 6 9 5 0 1 2 0 30 0 2 0 g ro s s is ta S v izze ra 1 9 .8 8 2 7 8 0 3 8 0 5 Statistica I - a.a.2009/10 - Prof. Paroli 72
CARATTERISTICHE DATACARATTERISTICHE DATA--BASEBASE
n= 20 unit statistiche6 caratteri rilevatitipi di caratteri:
- Categoria : qualitativo ordinabile- Residenza : qualitativo sconnesso- Fatturato : quantitativo continuo- Prod. A/B/C : quantitativi discreti
-
8/12/2019 Slides Statistica Intro
19/23
Statistica I - a.a.2009/10 - Prof. Paroli 73
DISTRIBUZIONI DI FREQUENZADISTRIBUZIONI DI FREQUENZA
Carattere Categoria
x i n i f iDettagliante 6 0.3
Grossista 10 0.5Grande distribuzione 4 0.2
20 1
Statistica I - a.a.2009/10 - Prof. Paroli 74
Carattere Residenza
x i n i f i N iItalia 7 0.35
Francia 4 0.2Svizzera 3 0.15
Germania 3Austria 1Olanda 2
20 1
Statistica I - a.a.2009/10 - Prof. Paroli 75
Carattere Prodotto C =numero di pezziacquistati del prodotto di tipo C
x i n i3 34 85 9
20
!!!!! Provate a fare anche quelle deiProdotti A e B !!!!!
Statistica I - a.a.2009/10 - Prof. Paroli 76
Carattere Fatturatopoich si tratta di un carattere di tipo continuo bisogna scegliere
una opportuna ripartizione in classi
5 classi con stessa ampiezza pari a 10
x i ni0 10 1
10 20 920 30 430 40 340 50 3
20
-
8/12/2019 Slides Statistica Intro
20/23
Statistica I - a.a.2009/10 - Prof. Paroli 77
4 classi con ampiezza differente pari a 10, 10, 20, 15
x i ni a i di 0 10 1 10 1/10=0.1
10 20 9 10 9/10=0.920 40 7 20 7/20=0.3540 55 3 15 3/15=0.2
20
classi di ampiezza diversasi calcolano ledensitdi frequenza
Statistica I - a.a.2009/10 - Prof. Paroli 78
Dalla lettura delle frequenze si possono trarre alcuneosservazioni:
il 50% dei clienti dellazienda sono grossisti, il 30%dettaglianti ed il restante 20% della grande distribuzione
per il 35% sono italiani, tra il 15% - 20% francesi,svizzeri e tedeschi
per la maggior parte hanno fatturato tra 10 e 20per il prodotto C il numero di pezzi maggiormente
acquistati 5 (per i prodotti A e B????)
Statistica I - a.a.2009/10 - Prof. Paroli 79
RAPPRESENTAZIONI GRAFICHE
A) RAPPRESENTAZIONI DI DISTRIBUZIONI DIFREQUENZA
- caratteri qualitativi. diagrammi a torta. diagrammi a rettangoli separati
- caratteri quantitativi discreti. diagrammi a bastoncini (canne dorgano)
- caratteri quantitativi continui. Istogrammi
Statistica I - a.a.2009/10 - Prof. Paroli 80
Grafici su coordinate cartesiane in cui:
asse ascisse = modalit
asse ordinate = frequenze
assolute relative densit
-
8/12/2019 Slides Statistica Intro
21/23
Statistica I - a.a.2009/10 - Prof. Paroli 81
- diagrammi a torta (caratteri sconnessi)in corrispondenza ad ogni modalit si disegna un settorecircolare il cui angolo al centro proporzionale allafrequenza.
F53%
M47%
sex ni fiF 16 0,53M 14 0,47
30 1
Caratteri qualitativi
Per trovare langolo i:360 : i = n : n i360 : i = 1 : f i
Statistica I - a.a.2009/10 - Prof. Paroli 82
- diagrammi a rettangoli separati (caratteri sconnessie ordinati)in corrispondenza ad ogni modalit si disegna un rettangolocon altezza proporzionale alla frequenza
sex
02468
101214161820
F M
n i
sex ni fiF 16 0,53M 14 0,47
30 1
Statistica I - a.a.2009/10 - Prof. Paroli 83
titolo di studio ni filicenza elementare 10 0.111111diploma media sup 50 0.555556laurea 30 0.333333
90 1
0
10
20
30
40
50
60
licenza elementare diploma media sup laurea
titolo di studio
n i
carattere qualitativoordinato
Statistica I - a.a.2009/10 - Prof. Paroli 84
diagrammi a bastonciniin corrispondenza ad ogni modalit si disegna unsegmento con altezza proporzionale alla frequenza
Caratteri quantitativi discreti
n c o m p
02
468
1012
1416
0 1 2 3 4 5 6
n i
NCOMP ni fi
1 2 0,0672 4 0,1333 7 0,2334 14 0,4675 3 0,100
30 1
-
8/12/2019 Slides Statistica Intro
22/23
Statistica I - a.a.2009/10 - Prof. Paroli 85
istogrammain corrispondenza ad ogni classe si disegna un
rettangolo con base proporzionale allampiezza dellaclasse e altezza proporzionale alla frequenza(o alla densit se le classi sono di diversa ampiezza)
Caratteri quantitativi continui(o discreti con modalit in classi)
anasc
0
2
4
6
8
10
12
1936-|1946 1946-|1956 1956-|1966 1966-|1976 1976-|1986
n i
ANASC ni fi1936-|1946 4 0,1331946-|1956 10 0,3331956-|1966 8 0,2671966-|1976 6 0,200
1976-|1986 2 0,06730 1,000
Statistica I - a.a.2009/10 - Prof. Paroli 86
Carattere = ore lavorative settimanalihi-1 hi ni ai di=n i/a i17 25 13 8 1.6325 35 32 10 3.235 45 81 10 8.145 50 8 5 1.6
classi con ampiezza diversa
altezze rettangoli = densit di frequenza
classi con ampiezza diversa
Statistica I - a.a.2009/10 - Prof. Paroli 87
d i
Statistica I - a.a.2009/10 - Prof. Paroli 88
B) GRAFICO DELLE FREQUENZE CUMULATE
Grafico cartesiano per la rappresentazionedellandamento dei valori delle frequenze cumulateassolute o relative (N i o Fi).
GRAFICO AGRADINI
Fi
xi
max F i(n sefosserole N i)
-
8/12/2019 Slides Statistica Intro
23/23
Statistica I - a.a.2009/10 - Prof. Paroli 89
x i ni N i1 184 1842 451 6353 312 9474 197 11445 84 1228
oltre 26 12541254
esempio: n. di stanze per abitazione
1 2 3 4 5 6 ..
Ni
n=1254
184
xi
Statistica I - a.a.2009/10 - Prof. Paroli 90
serie dipendenti dal tempo :
grafico in coordinate cartesiane ortogonali incui il tempo (variabile t) sullasse delle ascisse,mentre i valori della serie sono sullasse delleordinate
0
5
10
15
20
25
30
35
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22
C) GRAFICO PER SERIE STORICHE O TEMPORALI