30 rapida italswiz linea 3 40 45 48 40 italswiz

18
1 Applicazioni statistiche del foglio elettronico. Complementi di Statistica 8.11.4 Il grafico azionario. Esso permette di confrontare momenti fondamentali di andamenti societari nei confronti del mercato azionario, figura 1 La sua lettura è intuitiva; si noti la diversa situazione delle azioni delle società esaminate. Confronta soprattutto la posizione reciproca nei momenti di apertura, chiusura e numero di azioni scambiate. Le tre variabili considerate e il nome delle società non sono evidentemente collegabili tra loro. Il grafico tuttavia permette la valutazione e il confronto immediato tra le società considerate. Nella parte del capitolo dedicata alla statistica troverai anche i grafici in cui è prevista la rappresentazione dei valori di due variabili poste in relazione tra loro (X; Y). 8.13 . Presentazione dei dati per categorie. Dopo aver costruito un foglio elettronico, potresti aver bisogno di presentare i tuoi dati in forma particolare evidenziando categorie particolari. EXCEL ti permette ciò con le tabelle Pivot 1 : questa tabelle richiedono che l’utente abbia costruito il foglio elettronico con particolare cura nelle categorie delle colonne e delle righe. Le tabelle Pivot mettono in evidenza alcune categorie che devi scegliere dal foglio di origine. Si dice tabella Pivot in quanto le intestazioni di riga e di colonna di un incrocio di dati possono essere ruotate intorno ai dati, per avere diverse visualizzazioni dei dati di origine. La tabella 1 riporta una tabella di foglio elettronico con le rilevazioni mensili dei valori rilevati in un anno. Osserva che si è preferito indicare il trimestre per ciascun mese. Ciò è necessario per ottenere una tabella Pivot in cui sia presentata la somma per ciascun trimestre. Si vuole raggruppare i dati per trimestre, ossia costruire una tabella in cui per ogni tipo di dati si ottenga la somma dei dati dei tre mesi cosi come appaiono in tabella 2 Tabella 1 A B C D E F G 1 Trimestre mese dati 1 dati 2 Totale riga media riga ds riga 2 1 gennaio 23 25 48 24 1,4142 3 1 febbraio 67 17,46 84,46 42,23 35,03 4 1 marzo 53 27,54 80,54 40,27 18,003 5 2 aprile 28 27,56 55,56 27,78 0,3111 6 2 maggio 34 34,27 68,27 34,135 0,1909 7 2 giugno 67 38,45 105,45 52,725 20,188 8 3 luglio 89 54,58 143,58 71,79 24,339 9 3 agosto 67 41,4 108,4 54,2 18,102 1 Pivot dall’inglese perno. Nella pallacanestro il pivot sta al centro dell’attacco. Volume scambi Apertura Chiusura NuovaItalia 12 23 24 ItaLswiz 25 18 30 Tranvai 18 15 10 Rapida 29 12 40 linea 3 40 45 48 Metro 34 40 18 NuovaItalia NuovaItalia NuovaItalia ItaLswiz ItaLswiz ItaLswiz Rapida Rapida Rapida linea 3 linea 3 linea 3 Metro Metro Metro 0 10 20 30 40 50 60 Volume scambi Apertura Chiusura Figura 1

Upload: others

Post on 26-Jul-2022

5 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: 30 Rapida ItaLswiz linea 3 40 45 48 40 ItaLswiz

1

Applicazioni statistiche del foglio elettronico. Complementi di Statistica

8.11.4 Il grafico azionario.

Esso permette di confrontare momenti fondamentali di andamenti societari nei confronti del mercato azionario, figura 1

La sua lettura è intuitiva; si noti la diversa situazione delle azioni delle società esaminate. Confronta soprattutto la posizione reciproca nei momenti di apertura, chiusura e numero di azioni scambiate. Le tre variabili considerate e il nome delle società non sono evidentemente collegabili tra loro. Il grafico tuttavia permette la valutazione e il confronto immediato tra le società considerate.

Nella parte del capitolo dedicata alla statistica troverai anche i grafici in cui è

prevista la rappresentazione dei valori di due variabili poste in relazione tra loro (X; Y).

8.13 . Presentazione dei dati per categorie.

Dopo aver costruito un foglio elettronico, potresti aver bisogno di presentare i tuoi dati in forma particolare evidenziando categorie particolari. EXCEL ti permette ciò con le tabelle Pivot1: questa tabelle richiedono che l’utente abbia costruito il foglio elettronico con particolare cura nelle categorie delle colonne e delle righe. Le tabelle Pivot mettono in evidenza alcune categorie che devi scegliere dal foglio di origine. Si dice tabella Pivot in quanto le intestazioni di riga e di colonna di un incrocio di dati possono essere ruotate intorno ai dati, per avere diverse visualizzazioni dei dati di origine. La tabella 1 riporta una tabella di foglio elettronico con le rilevazioni mensili dei valori rilevati in un anno. Osserva che si è preferito indicare il trimestre per ciascun mese. Ciò è necessario per ottenere una tabella Pivot in cui sia presentata la somma per ciascun trimestre. Si vuole raggruppare i dati per trimestre, ossia costruire una tabella in cui per ogni tipo di dati si ottenga la somma dei dati dei tre mesi cosi come appaiono in tabella 2 Tabella 1

A B C D E F G

1 Trimestre mese dati 1 dati 2 Totale riga media riga ds riga

2 1 gennaio 23 25 48 24 1,4142

3 1 febbraio 67 17,46 84,46 42,23 35,03

4 1 marzo 53 27,54 80,54 40,27 18,003

5 2 aprile 28 27,56 55,56 27,78 0,3111

6 2 maggio 34 34,27 68,27 34,135 0,1909

7 2 giugno 67 38,45 105,45 52,725 20,188

8 3 luglio 89 54,58 143,58 71,79 24,339

9 3 agosto 67 41,4 108,4 54,2 18,102

1 Pivot dall’inglese perno. Nella pallacanestro il pivot sta al centro dell’attacco.

Volume

scambi Apertura Chiusura

NuovaItalia 12 23 24

ItaLswiz 25 18 30

Tranvai 18 15 10

Rapida 29 12 40

linea 3 40 45 48

Metro 34 40 18

NuovaItalia

NuovaItalia NuovaItaliaItaLswiz

ItaLswiz

ItaLswizRapida

Rapida

Rapidalinea 3

linea 3linea 3

Metro

Metro

Metro

0

10

20

30

40

50

60

Volume scambi Apertura Chiusura

Figura 1

Page 2: 30 Rapida ItaLswiz linea 3 40 45 48 40 ItaLswiz

2

10 3 settembre 28 67,28 95,28 47,64 27,775

11 4 ottobre 48 32,56 80,56 40,28 10,918

12 4 novembre 59 74,37 133,37 66,685 10,868

13 4 dicembre 19 58,72 77,72 38,86 28,086

14

15 Totali 582 499,2 1081,19 540,595 58,556

16 Media 48,5 41,6 90,0991667 45,0495833 4,8796

17 ds 22,09 18,07 40,1669397 20,0834698 2,8416

Osserva che la tabella è una tabella a due entrate le righe sono i dati, le colonne sono i trimestri: l’incrocio è tra Dati e Trimestre. Per costruirla devi seguire il procedimento che segue Nella tabella di origine seleziona le parti che ti interessano, curando che non vi siano righe o colonne prive di denominazione.

Seleziona le celle da A1 a F13.

Dalla riga dei comandi: Dati Rapporto tabella Pivot e grafico Pivot .. : si apre la creazione guidata Tabella pivot. (figura 2)

Puoi inserire i dati e le categorie attraverso la procedura guidata di tre passaggi:

1. Scegli l’origine dei dati: la procedura ti suggerisce

a. Origine dei dati

i. Elenco o database Microsoft Excel

ii. Altre possibilità che ti invito ad esplorare.

b. Tipo di rapporto

Trimestre

Dati 1 2 3 4 Totale complessivo

Somma di dati 1 143 129 184 126 582

Somma di dati 2 70 100,28 163,26 165,65 499,19

Totale colonne 213 229,28 347,26 291,65 1081,19

Tabella 2

Figura 2

Page 3: 30 Rapida ItaLswiz linea 3 40 45 48 40 ItaLswiz

3

i. Tabella Pivot

ii. ….

Utilizzando le scelte suggerite puoi passare al passaggio successivo (figura 3)

1. Clic su Fine. Si apre la schermata di preparazione della tabella pivot.

2. Scelta dell’intervallo

a. Se hai selezionato i dati di origine il programma ti presenta la tua selezione nella forma Foglio1!$A$1:$F$13. Accettando tale scelta puoi passare al passo successivo. Eventualmente puoi fare la scelta delle celle attraverso la tabella di Figura 50 come specificato al passaggio b1 e b2.

b. Puoi cambiare i dati di origine con le procedure usuali di accesso a file diversi: i. Sfoglia per individuar il file di origine.

ii. Seleziona per individuare i dati; ovvero scrivi l’intervallo dei dati che devi elaborare

3. Come nelle costruzione dei grafici, puoi ora scegliere se costruire la tabella pivot su un nuovo

foglio elettronico o nello stesso foglio elettronico.

In quest’ultimo caso il programma costruirà la tabella pivot in un foglio aggiunto a quelli già previsti ad esempio Foglio 4

4. Nota lo schema della tabella e un menù che presenta le categorie di dati che potrai inserire in

posizione opportuna, scelta nella parte inferiore del menu.

5. Scegli la posizione opportuna da Elenco dei capi

della tabella pivot Aggiungi a e con un doppio

clic sulla categoria essa verrà inserita nella

posizione scelta ossia sui campi colonna e sui

campi riga. Puoi anche trascinare i vari campi

nella posizione da te scelta posizionando il mouse

su di essi e spostarti tenendo premuto il tasto

sinistro.

6. Le operazioni con i campi che avrai posizionato su

Rilasciare qui i dati.

Tabella 3

n. soggetto Specialità Sesso 1 Fisica M 2 Matematica F 3 Filosofia M 4 Comunicazione M 5 Filosofia F 6 Filosofia F 7 Matematica M 8 Fisica M 9 Comunicazione F

10 Fisica M 11 Comunicazione F 12 Matematica F 13 Lettere M 14 Matematica F

Figura 3.

Page 4: 30 Rapida ItaLswiz linea 3 40 45 48 40 ItaLswiz

4

Nella Tabella 4 puoi vedere l’applicazione della tabella Pivot ad una tabella in cui sono stati classificati degli

studenti per corso di Laurea e sesso. Il risultati nella tabella incrocia i corsi di laurea per il sesso degli

studenti indicando per ciascun corso di laurea il numero degli studenti maschi e delle studentesse.

Figura 4

La figura 4 ti mostra che sono stati inseriti nei campi riga la colonna specialità e nei campi colonna la colonna Sesso. Infine aggiungi una delle due variabili nel campo denominato Rilasciare qui i dati. Il risultato nella tabella 4

Tabella 4

Nella tabella 5 colonne e righe sono state scambiate

Page 5: 30 Rapida ItaLswiz linea 3 40 45 48 40 ItaLswiz

5

Tabella 5

Conteggio di Spec Spec

Sesso Comunicazione Filosofia Fisica Lettere Matematica Totale complessivo

F 2 2 3 7

M 1 1 3 1 1 7

Totale complessivo 3 3 3 1 4 14

Figura 5

Quest’ultime due tabelle esprimo il significato di pivot. Puoi capirlo meglio se consideri la figura 58: tabella delle percentuali, Calcola le percentuali anche nel caso della tabelle delle figura 56

NOTA: Solitamente l’elenco dei campi compare contemporaneamente alla maschera della tabella. Se ciò non avviene puoi usare la riga di comando della tabella pivot Visualizza Barra degli strumenti Tabella pivot clic sull’ultima icona.

8.16.5 Tabelle di contingenza

Nella statistica descrittiva elementare si cerca di stabilire una relazione tra i valori di due variabili utilizzano le occorrenze dei valori di due variabili.

La tabella 6 presenta un gruppo di studenti per ciascuno di essi è stato rilevato il corso di laurea e il sesso. Devi valutare la distribuzione dei maschi e delle femmine nei diversi corsi di laurea Tale operazione è chiamata incrocio di due variabili ed il risultato si chiama tabella di contingenza. Per questa procedura puoi usare la procedura tabella Pivot. La tabella 7 presenta il risultato ottenuto con la procedura Pivot dalla tabella 6, inserendo la colonna Laurea nell’ area di colonna, la colonna Sesso nell’area di riga e la Laurea nell’ area dati. Puoi esprimere i risultati della tabella in forme diverse quali le percentuali della tabella 7. Per far ciò clic col tasto destro sul valore di una cella:

dal menu che compare scegli Impostazioni campo … compare la tabella Campo pivot table puoi scegliere la forma dati che preferisci dal menu di

Mostra dati. Nella tabella 4 è stato scelto % di

colonna . ESERCIZIO 1: Nella tabella di contingenza del paragrafo che precede scegli e valuta le altre forme del menu Mostra dati.

ESERCIZIO 2: In un foglio elettronico scrivi nella colonna 1 intestata CITTÀ il nome di 5 città che ripeterai casualmente in modo da usare 30 righe, nella colonna di fianco intestata MESE inserisci casualmente i 12 mesi dell’anno. Calcola la tabella di contingenza CITTÀ per MESE.

Conteggio di laurea

Sesso

LAUREA F M Totale complessivo

Comunicazione 2 1 3

Filosofia 2 1 3

Fisica 3 3

Lettere 1 1

Matematica 3 1 4

Totale complessivo 7 7 14

Tabella 6

conteggio di laurea Sesso

LAUREA F M Totale

Comunicazione 28,57% 14,29% 21,43%

Filosofia 28,57% 14,29% 21,43%

Fisica 0,00% 42,86% 21,43%

Lettere 0,00% 14,29% 7,14%

Matematica 42,86% 14,29% 28,57%

Totale 100,00% 100,00% 100,00%

Tabella 7

Page 6: 30 Rapida ItaLswiz linea 3 40 45 48 40 ItaLswiz

6

8.13.1 Complementi.

Impostazione campo. Puoi scegliere il calcolo eseguito tra le diverse espressioni di ciascun campo posizionandoti su i dati di un’operazione su un campo calcolato dalla tabella pivot e facendo clic col tasto destro, figura 8. Dal menu che compare puoi scegliere vari tipi di conteggio:

a. Conteggio: conta il numero di volte in cui compare un

dato nella categoria scelta.

b. Somma: somma i numeri per ciascuna categoria.

c. Media,

d. Deviazione Standard,

e. Minimo, massimo,

f. … ed altri.

Al solito sei invitato a provare i diversi tipi di operazioni possibili tra i campi inseriti.

Aggiornamento. La tabella pivot non è aggiornata automaticamente se modifichi i dati della tabella di origine. Per aggiornarla devi dalla riga dei comandi individuare Dati e nel menu scegliere Aggiorna dati. NOTA: Dalla tabella pivot puoi con un clic col tasto destro su un campo calcolato far comparire il menu grafico di scelta per alcune procedure.

Grafico. Dopo aver selezionato un insieme di celle puoi dal menu Inserisci attivare la procedura Grafico, oppure al solito ciccare sull’ icona del grafico.

8.16.2 Test del chi quadrato

Il test del chi quadrato è un test che determina la decidibilità di una tabella a due entrate ossia di une tabelle di n colonne per m righe, essendo n ed m due numeri interi.

Figura 6

Tabella 6 bis

Page 7: 30 Rapida ItaLswiz linea 3 40 45 48 40 ItaLswiz

7

Spesso tale tabella è una tabella di contingenza in cui date due variabile ed i loro valori, si conteggiano le occorrenze contemporanee di ciascun valore di ciascuna variabile che si dicono frequenze osservate e

indicheremo con fo. Il test del chi quadrato di un tabella così formulata esamina i valori di ciascuna cella e li confronta con i valori ottenuti moltiplicando il totale di riga per il totale di colonna diviso per il totale complessivo,

frequenze teoriche ft..

Il confronto dei valori ricavati dell’esperimento ed i valori ottenuti nel modo suddetto permette una valutazione della decidinbilità della tabella che è legata anche ai gradi di libertà della stessa. Decidibilità significa probabilità che i dati trovati prefigurino un relazione tra le due variabili con una probabilità di errore nota.

La formula del chi quadrato è la seguente:

n

t

to

f

ff

1

2

2 )(

Nel calcolo del chi quadrato compaiono due variabili: Le frequenze osservate, ossia i dati rilevati da un esperimento.

Le frequenze teoriche ossia le frequenze calcolate tenendo conto delle frequenze totali

dei valori di ciascuna variabile.

Nell’esempio sono considerate le volte che ogni valore compare per ciascuna variabile e le volte che compiono contemporaneamente i singoli valori di due variabili. Data la tabella delle frequenze osservate è necessario calcolare la te frequenze teoriche o previste e procedere alla determinazione degli elementi della formula. Essi sono nella tabella Determinazioni delle frequenze teoriche … Nota che la formula non considera la posizione delle frequenze osservate; puoi quindi disporre il calcolo come nella tabella. Lascio alla tua iniziativa il completamento dei calcoli ricordandoti che esiste la procedura copia e incolla e il riferimento assoluto e relativo. La statistica del chi quadrato che ti ho presentato è una delle applicazioni; al chi quadrato sono collegate ad altre statistiche che potrai affrontare nei tuoi studi. Tabella 7: Calcolo del chi quadrato

ANALISI DELLE OPINIONI frequenze osservate

gruppo Favorevole Contrario Incerto Totale riga

1° corso 38 69 27 134

2° corso 26 50 19 95

3° corso 41 64 14 119

Totale colonna

105 183 60 348

Determinazione delle frequenze teoriche e calcolo del chi quadrato

Disponi i valori delle frequenze osservate nella prima ruga ed esegui i calcoli indicati nella prima colonna

frequenze osservate

fo 38 69 27 26 50 19 41 64 14

chi quadrato: somma valori

ultima riga

frequenze teoriche

tabellatot

totcolrigatot

ft

.

*.

40,43103 70,46552 23,10345

Page 8: 30 Rapida ItaLswiz linea 3 40 45 48 40 ItaLswiz

8

2)( ftfo 5,909929 2,147741 15,18312

2)( ftfo /ft 0,146173 0,030479 0,65718 2 =

8.16.3 Coefficiente lineare di Pearson

Coefficiente di correlazione lineare di Pearson

L’esercizio di tabella 8 suggerisce un procedimento per il calcolo del coefficiente lineare di correlazione di Pearson. Con questo esempio è illustrato l’utilizzo del foglio elettronico per sviluppare formule matematiche. Il coefficiente di correlazione lineare di Pearson esprime l’aderenza dei dati ad una rappresentazione lineare ottenuta rappresentando le coppie di punteggi ottenute da gruppi di individui . Esso vale zero in caso di correlazione nulla, e non raggiunge mai l’unità, salvo nel caso di una tabella infinita. Ti invito a porre particolare attenzione all’uso delle funzioni del foglio elettronico (fx) MEDIA e DEV.ST ed alla procedura di COPIA con il riferimento assoluto $ ed il riferimento relativo quando serve. L’esercizio ti mostra l’applicazione del foglio elettronico alla risoluzione di formule che richiedono calcoli ripetitivi. Nel caso esaminato la formula da risolvere è .

Con Zx e Zy punteggi standard o normalizzati. Trovandoti a calcolare una formula come quella del coefficiente di Pearson devi individuare le variabili e la procedure semplici (funzioni) da usare. Il procedimento richiede

Individuare le variabili ossia i punteggi da correlare indicati con X ed Y nella tabella.

Devi notare che le due variabili non sono evidenti nelle formula che per essere applicata

richiede il calcolo dei punteggi standard, indicati con Zx e Zy nella formula. La formula di

calcolo di un punteggio standard è.

Il calcolo dei punteggi standard richiede il calcolo della media e della deviazione standard

dei punteggi X ed Y.

)(

)(

xSD

xxZ x

dove

DSpunteggixSD

nteggimediadeipux

punteggiox

)(

Devi quindi fare il prodotto dei punteggi standard e calcolare la media dei prodotti.

L’uso della procedura COPIA evita la scrittura ripetuta di alcune espressioni.. .

n

ZZ

r

n

yx

xy

1

)*(

Page 9: 30 Rapida ItaLswiz linea 3 40 45 48 40 ItaLswiz

9

ESERCIZIO: Costruisci una decina di tabelle per determinare il coefficiente di Pearson, il grafico a dispersione con i valori di R2. Calcola inoltre con la procedura statistica (funzione) il coefficiente momento di correlazione di Pearson in cui userai come matrici le due colonne della tabella. Ti ricordo che impostate le formule puoi successivamente copiare la tabella iniziale modificando solo i valori delle colonne di dati per ottenere i dati che ti sono richiesti. Infine costruisci una tabella in cui confrontare il coefficiente di correlazione Pearson, il coefficiente momento di Pearson ed il valore di R2 .Traccia anche il grafico a linee delle tre sequenze di valori.

Aggiunta dell’analisi dati a EXCEL 2007

Dal pulsante di Office in Excel devi selezionare Opzioni di Excel

Compare la scheda Opzioni nella quale devi sceglire componenti aggiuntivi.

Infine scegli sulla parte bassa di tale scheda Componenti aggiuntivi di Excel e clicca su Vai …

La procedura apre la scheda Componenti aggiuntivi tra i quali con una spunta puoi attivare Strumenti di analisi. Nel nastro Dati compare la scheda Analisi dati che puoi attivare ottenedo al possibilità di esegure le procedure utili.

A B C D E F G

1 Coppie Punteggi Punteggi standard Prodotti

2 X Y Zx Zy Zx * Zy

3 A 3 5 -1,312784923 -1,347315674 1,768735704

4 B 6 9 -0,875189949 -0,875755188 0,766452138

5 C 9 11 -0,437594974 -0,639974945 0,28004982

6 D 11 18 -0,145864991 0,185255905 -0,027022351

7 E 15 19 0,437594974 0,303146027 0,132655178

8 F 17 25 0,729324957 1,010486755 0,73697321

9 G 23 28 1,604514906 1,36415712 2,188810434

10 Media 12 16,42857 0,835236305

11 DevST 6,855655 8,482475

1 Coppie Punteggi Punteggi standard Zx*Zy

2

3 A 3 5 =(B3-B$10)/B$11 =(C3-C$10)/C$11 =D3*E3

4 B 6 9

5 C 9 11

6 D 11 18

7 E 15 19

8 F 17 25

9 G 23 28

10 Media

=MEDIA

(B3:B9)

procedura

COPIA da B10

11 DevST =DEV.ST

(B3:B9)

procedura

COPIA da

B10..B11

Dati (B3:C9) e RISULTATI

PROCEDURE USATE

… COPIA da D3 ...COPIA da E3 ...COPIA da F3

Coeff. di

Pearson

Coeff. di

Pearson

Tabella 8: Calcolo del coefficiente lineare di Person

Page 10: 30 Rapida ItaLswiz linea 3 40 45 48 40 ItaLswiz

10

Procedure ottenibili dall’analisi dati seleziona do la procedura utile.

8.16.4 Statistiche descrittive

Nella prima parte hai usato la procedura media e deviazione standard; altre statistiche elementari sono presenti in Excel che potrai utilizzare secondo le esigenze delle tue ricerche.

In questo esempio devi utilizzare lo strumento analisi dati per ottenere la tabella con varie statistiche, figura 7.

Per attivare in Excel l’analisi dati accedi da Strumenti della riga dei comandi: Strumenti Componenti aggiuntivi metti un segno di spunta su

Analisi Dati La procedura Analisi dati è aggiunta al menu di strumenti. Con un clic compare la tabella delle analisi dati disponibili.

Figura 8

Figura 7

Page 11: 30 Rapida ItaLswiz linea 3 40 45 48 40 ItaLswiz

11

Utilizza Strumenti Analisi dati Statistica descrittiva (Figura 7) Completa la tabella che compare in figura 8 indicando 1. L’intervallo di input: dati da elaborare

Tabella 9

2. Se i dati sono in colonna o in riga. 3. Se in tale intervallo sia compreso il titolo

(Etichette) 4. L’intervallo di output: dove devono essere

inseriti i dati (indica la prima cella libera). 5. Il livello di confidenza per la media. 6. Altri elementi a tua scelta … prova! Infine clic su OK La tabella 9 presenta i risultati di una elaborazione con i dati nella colonna A.

8.16.6 La correlazione e la covarianza.

In una rilevazione di coppie di valori appartenenti ad un gruppo di elementi, sorge talora il problema di valutare se l’insieme delle coppie stabilisca una regola ossia se vi sia un collegamento tra il primo ed i secondo valore dell’insieme delle coppie. La correlazione valuta tale collegamento. Ulteriori notizie sulla correlazione la trovi nel paragrafo precedente in cui viene introdotto un metodo elementare per calcolare l’indice di correlazione di Pearson. Per calcolare la correlazione tra due variabili devi attivare in Excel l’analisi dati. La Figura 9 presenta la tabella della procedura che si apre La procedura:

Dalla tabella Analisi dati scegli Correlazione

Nella figura 9 di Correlazione che appare devi indicare la matrice2 dei dati compresa

l’intestazione delle colonne e la cella nella quale inizierà la presentazione della

correlazione.

La correlazione tra più variabili e la covarianza seguono procedure analoghe.

Esempio di elaborazione

Osserva come la procedura abbia calcolato la correlazione di DATI A e DATI B con se stessi,valore 1, e tra di loro, valore 0,368798.

2 Si intende per matrice un insieme di dati ordinati per riga e per colonna; nel caso indicato è

l’intervallo comprendente tutti i dati da usare.

A C D

Dato Elaborazioni

23

53 Media 33,9375

28 Errore standard 4,37747

23 Mediana 27

56 Moda 23

64 Deviazione standard 17,50988

53 Varianza campionaria 306,5958

27 Curtosi -0,99207

65 Asimmetria 0,8618

19 Intervallo 50

27 Minimo 15

15 Massimo 65

18 Somma 543

27 Conteggio 16

22 Livello di confidenza(95,0%) 9,330355

Figura 9

Page 12: 30 Rapida ItaLswiz linea 3 40 45 48 40 ItaLswiz

12

Dati origine Correlazione

DATI A DATI B DATI A DATI B

2 12,3 DATI A 1

3 16,5 DATI B 0,368798 1

4 12,4

6 12,5

8 26,5

12 21,4

23 12,5

34 23,4

Tabella 10

ESERCIZIO 1: Ricopia su un foglio elettronico i dati del paragrafo 8.2.2 e calcola col procedimento appena appreso la correlazione della matrice così costruita. ESERCIZIO 2: Scambia le due colonne dell’esercizio 1 e quelle del paragrafo 8.2.5. Confronta i risultati.

8.16.7 Il campionamento

Nella raccolta di dati od oggetti da sottoporre ad analisi, è utile scegliere i soggetti sui quali condurre l’indagine in modo “casuale”. Sulle motivazioni di tale procedura rimando ai testi di metodologia della ricerca. Alcune tecniche di campionamento ricorrono ai numeri casuali che potremo definire così: insiemi di numeri con uguale probabilità di trovarsi in una qualsiasi posizione dell’elenco. La definizione data si riferisce ai numeri casuali in una distribuzione uniforme, per altre definizioni ti rinvio ad altri testi. Excel introduce varie procedure basate sui numeri casuali per il campionamento; in questo paragrafo te ne presento alcune. Excel permette con le sue procedure le seguenti scelte:

estrazioni casuali da un elenco,

ricerca di numeri casuali tra 0 ed 1,

ricerca di numeri casuali in un intervallo definito dall’utente

Procedure

Estrazioni casuali da un elenco Dopo aver scritto e selezionato i numeri (elenco numeri) da Strumenti scegli Analisi dati Campionamento. Nella tabella, figura 10 che compare scrivi l’intervallo di input dei dati da cui estrarre il campione, scegli sul tipo di campionamento, scrivi il numero di campioni e la prima cella che il programma userà per l’elenco dei campioni. Il risultato appare nella tabella 12, colonne Elenco numeri e Campione Casuale. L’elenco si riferisce alla etichetta numerica assegnata a ciascun soggetto. I numeri casuali sono un’estrazione con procedure matematiche di 5 numeri corrispondenti a cinque etichette richiesti per l’analisi che si vuole compiere.

Figura 10

Page 13: 30 Rapida ItaLswiz linea 3 40 45 48 40 ItaLswiz

13

Numeri casuali tra 1 e 1000

Puoi ottenerli dalla procedura (funzione) matematica CAMPIONE.TRA . Nella tabella che compare dovrai indicare tra quali numeri è compreso il numero casuale che ti interessa calcolare. La procedura (funzione) restituisce un solo numero casuale. Usando copia e incolla puoi ottenere la quantità di numeri che ti servono.

Numeri casuali tra 0 e 1

Puoi ottenerli con la procedura matematica CAMPIONE() La tabella che compare ti avvisa che non devi indicare alcun argomento della funzione. Anche questa procedura calcola un solo numero casuale. L’uso di copia ed incolla ti permette di ottenere più valori. Lascio a te l’applicazione di queste procedure. Evidentemente trattandosi di numeri casuali non otterrai i risultati che compaiono nell’elenco della tabella 4. La tecnica usuale di campionamento consiste nella scelta casuale di alcuni soggetti da un elenco ottenuto da una popolazione di caratteristiche adatta alla ricerca che si sta compiendo. È indispensabile applicarla quando si vogliono usare i test statistici.

Elenco numeri

Numeri estratti

Numeri casuali tra 1 e 1000

Numeri casuali tra 0 ed 1

2139 241 0,853961128

2657 902 0,365765324

3175 641 0,451719831

3693 2657 878 0,068597731

4211 5247 471 0,371796373

4729 6283 371 0,906836443

5247 6713 760 0,25224737

5765 8887 61 0,005985739

6283 888 0,425311899

6801 180 0,056288383

7319 824 0,327435377

3452 695 0,053938068

4539 785 0,78560488

5626 457 0,048275492

6713 210 0,880362303

7800 586 0,316354307

8887 529 0,222138591

9974 926 0,446838665

11061 38 0,180095656

12148 127 0,900733451

13235 415 0,808330662

14322 586 0,43471092

216 0,839355614

868 0,061449232

485 0,054879863 Tabella 11

Page 14: 30 Rapida ItaLswiz linea 3 40 45 48 40 ItaLswiz

14

Considerazioni finali sull’ analisi dati attraverso la statistica.

Ti ho presentato in questa parte del capitolo dedicato a Excel alcune delle numerose procedure statistiche possibili col foglio elettronico. È evidentemente impossibile in un corso dedicato all’informatica applicata elementare presentare tutte le procedure possibili. Anzi è forse inutile: è più interessante che tu abbia presente un metodo per utilizzare l’informatica nella tua attività. Per affrontare un problema devi aver presente:

La natura e l’enunciato del problema

Le relazioni che intervengono nel problema.

Le variabili che intervengono.

Il tipo e le caratteristiche delle variabili.

Come tali variabili si possano combinare.

Se esistano procedure informatiche che rendano più sicure e facili le tue elaborazioni.

Esercizi Proposti.

Esercizio n. 1: Completa la seguente tabella secondo le richieste esplicitate in essa.

Colonna A Colonna B Colonna C (Colonna A- Colonna B)

diviso Dev ST Colonna B

Mesi Punti anno 1990 Punti anno 1991

Gennaio 124 0,26+p,gennaio

Febbraio 145 0,26+p.febbraio

Marzo 167 Ecc,

Aprile 345 Ecc.

Maggio 645

Giugno 123

Luglio 371

Agosto 212

Settembre 316

Ottobre 417

Novembre 345

Dicembre 137

Media

Dev St

Page 15: 30 Rapida ItaLswiz linea 3 40 45 48 40 ItaLswiz

15

Cura di usare la procedura copia ogni qualvolta sia possibile; fai attenzione anche

all’uso della procedura $ per evitare modifiche di celle indesiderate.

NOTA: Per costruire la sequenza dei mesi dopo aver scritto i primi due mesi

seleziona le due celle ed a partire dal quadratino nell’angolo destro usa la procedura

sequenza.

Es. 2: Con la procedura sequenza calcola una progressione numerica dei dati

negli anni successivi a quelli indicati.

Es. 3. Costruisci il grafico lineare dei dati del 1991 e traccia la linea di tendenza

per un periodo successivo di 4 mesi.

Es. 4: Ripeti l’esercizio n. 3 e traccia la linea di tendenza successivamente con le

seguenti caratteristiche, inserendo anche in tutti i casi l’equazione e il valore di R2 :

Lineare

Polinomiale di 2° grado

Polinomiale di 3* grafo

Polinomiale di 4* grado.

Es. 5: Scrivi una relazione nella quale commenti i risultati ottenuti nell’esercizio n.

4, inserendovi i grafici. E commentando il valore di R2.

Es. 6. Ricopia i dati numerici del foglio elettronico allegato e calcola le percentuali come indicato.

Page 16: 30 Rapida ItaLswiz linea 3 40 45 48 40 ItaLswiz

16

8.7.2 Il Foglio elettronico e le decisioni.

Alcune situazioni richiedono la previsione del comportamento di un particolare elemento di un insieme di dati relativi a diversi aspetti della realtà.

Nel paragrafo precedente abbiamo inserito un’estensione a periodi futuri di dati rilevati in un periodo determinato.

Ora vedremo ulteriori esempi di previsioni basate su rilevazioni e sulla possibilità di vedere col foglio elettronico … cosa succederà se ... Le domande che ci si pone in questo genere di problemi sono del tipo : Quante rate dovrò pagare se invece di pagare una rata di 100.000 lire potessi pagarne una da 120.000 ? Per estinguere un debito ho tempo tre anni anziché quattro quale sarà l’ammontare della rata ? Se il tasso di natalità cambia, entro quanti anni si dovrà prevedere un minor afflusso di studenti all’università ? Ecc. Molte di queste domande richiedono l’uso di un insieme di formule risolutive per calcolare i risultati, che possono essere diversi cambiando uno o più valori delle variabili intervenienti. EXCEL, nei casi più semplici può venirci incontro con due elementi: il risolutore e la ricerca obiettivo. Va tuttavia notato che tuttora, nonostante il loro sviluppo, gli attuali personal computer sono non adeguatamente potenti per questo tipo di analisi, onde il tempo di risoluzione del problema non è compatibile con le esigenze di un intervento nella realtà che sia efficace. Conseguentemente gli esempi che faremo saranno solo introduttivi di una tecnica informatica che ancora oggi è riservata a strumenti più potenti. Resta in ogni modo importante rendersi conto delle possibilità insite nell’informatica. Con strumenti algoritmici e hardware più potenti si potrebbe pensare ad una ricerca che invece di fare esperimenti, simula gli esperimenti al computer. Si tratta di strumenti che a partire da una o più caselle in cui esistono formule che coinvolgono valori esistenti in altre celle, modificano i valori delle caselle per soddisfare condizioni poste dall’operatore.

8.7.2 Uso della ricerca obiettivo

In EXCEL 2007 in Strumenti e Dati analisi di simulazione. Ricerca obiettivo modifica il valore di una o più celle che intervengono in una formula che determina il valore di una azione. Supponiamo di conoscere la relazione esistente tra il numero di persone che desiderano accedere ai terminali di una banca dati per averne informazione su particolari problemi e il numero di possibili accessi contemporanei, costruendo così un indice di accessibilità che sarà più grande quante più persone possono accedere contemporaneamente all’informazione, Costruiamo quindi un indice dato dal rapporto tra possibili utenti e numero di terminali disponibili contemporaneamente ; facendo il rapporto tra numero di terminali e numero di utenti abbiamo il massimo di rendimento quando ogni persona ha a disposizione un terminale, in tal caso l’indice ha il valore massimo ossia 1 quando ogni persona può accedere in qualunque momento ad un accesso. Ciò però comporta l’esame dei problemi di spesa giacché ogni posto di accesso ha un costo. Impostiamo il lavoro sul foglio elettronico Nella cella b4 è impostata la formula = B3 / B2 , nella cella B6 = B3 * B5. Per avere elementi di confronto ricopiamo la colonna B sulla colonna D modificando l’intestazione per maggior chiarezza. Attenzione : copiare con il comando copia, la ricerca obiettivo agisce su formule non su dati costanti. Indi posizioniamoci sulla cella D6 e da strumenti selezioniamo Ricerca obiettivo :.

Page 17: 30 Rapida ItaLswiz linea 3 40 45 48 40 ItaLswiz

17

A B C D E

1 Dati origine Dati risultanti

2 Persone 300 300

3 posti 20 16,66666667

4 accessibilità 0,066666667 0,055555556

5 costo unit. 300 300

6 costo finale 6000 5000

7 Tabella 12 obiettivo.

Compare una tabella di scelta che indica la cella $D$6 e richiede quale valore deve assumere e il valore di quale cella si deve modificare. Chiediamo di portare la spesa a 5000 e di modificare la cella D4. Indi confermiamo. Il risultato è che diminuendo la spesa a 5000 occorre diminuire i posti a 16 e l’indice di accessibilità è ridotto a 0,055 contro l’indice da noi individuato con 20 posti di 0,066. Sta ora a chi può decidere se accontentarsi dei risultati ottenuti o cercare altri fondi per ampliare le possibilità del sistema

8.7.3 Uso del Risolutore.

EXCEL 2007 dalla scheda Strumenti e Dati Analisi simulazione In questo esempio ricopiando i soliti dati nella colonna G, abbiamo richiamato da Strumenti Risolutore, alla comparsa del quadro di programmazione abbiamo imposto : Cella obiettivo G4 Uguale a 0,7 (potevamo porla uguale al massimo o al minimo, ma avremo complicato la discussione delle soluzioni che impongono conoscenze di statistica e teoria dell’ottimizzazione). Abbiamo aggiunto i vincoli (clic su aggiungi) : G2 intero G3 intero Copia risolta

A B C D E G

1 Dati origine Dati obiettivo Dati risolutore

2 Persone 300 300 50

3 posti 20 16,66666667 35

4 accessibilità 0,066666667 0,055555556 0,7

5 costo unit. 300 300 300

6 costo finale 6000 5000 10500

7 Tabella 13

Dopo le aggiunte abbiamo avviato il risolutore con clic su risolvi. I risultati ottenuti sono rappresentati nella figura. Potevamo imporre condizioni più complesse, ma in taluni casi il Risolutore avrebbe rilevato l’impossibilità di risolvere le richieste nei tempi e nel numero di passaggi che noi avevamo imposto, In tal caso il programma avrebbe precisato che la soluzione non era accettabile o che il risultato era dubbio, proponendoci soluzioni che il ricercatore doveva vagliare per la loro eventuale accettazione.

Page 18: 30 Rapida ItaLswiz linea 3 40 45 48 40 ItaLswiz

18

INDICE ANALITICO

analisi dati ........................................................... 10 campionamento ................................................. 12 categorie ............................................................... 1 chi quadrato ......................................................... 7 coefficiente lineare ............................................... 8 contingenza..Tabella di ......................................... 5 copia ................................................................... 16 correlazione ........................................................ 11 decidinbilità .......................................................... 7 frequenze osservate ............................................. 7 frequenze teoriche ............................................... 7 funzioni

EXCEL ................................................................ 8 grafici

azionario ........................................................... 1

incrocio ................................................................ 5 intestazioni .......................................................... 1 linea di tendenza ............................................... 15 media ................................................................... 1 numeri casuali .................................................... 12 occorrenza ........................................................... 7 Pearson ................................................................ 8 procedura

procedure ........................................................ 8 punteggi standard o normalizzati ........................ 8 Ricerca obiettivo ................................................ 16 Risolutore ........................................................... 17 Statistica descrittiva ........................................... 11 tabella Pivot. ........................................................ 5 tabelle Pivot ......................................................... 1

8.11.4 Il grafico azionario. ........................................................................................................................ 1 8.13 . Presentazione dei dati per categorie. .............................................................................................. 1 8.13.1 Complementi. ................................................................................................................................. 6 8.16.2 Test del chi quadrato ...................................................................................................................... 6 8.16.3 Coefficiente lineare di Pearson....................................................................................................... 8 Aggiunta dell’analisi dati a EXCEL 2007 ..................................................................................................... 9 8.16.4 Statistiche descrittive ................................................................................................................... 10 8.16.6 La correlazione e la covarianza. .................................................................................................... 11

Esempio di elaborazione ............................................................................................................................. 11 8.16.7 Il campionamento ......................................................................................................................... 12

Considerazioni finali sull’ analisi dati attraverso la statistica. ..................................................................... 14 Esercizi Proposti. .......................................................................................................................................... 14

8.7.2 Il Foglio elettronico e le decisioni. .................................................................................................. 16 8.7.2 Uso della ricerca obiettivo .............................................................................................................. 16 8.7.3 Uso del Risolutore. .......................................................................................................................... 17

INDICE ANALITICO ....................................................................................................................................... 18