lauerea specialistica in produzioni zootecniche mediterranee modelli matematici e statistici [6–...
TRANSCRIPT
LAUEREA SPECIALISTICA IN PRODUZIONI ZOOTECNICHE MEDITERRANEE
MODELLI MATEMATICI E STATISTICI[6– Modelli statistici]
Proff. Giuseppe Pulina & Corrado Dimauro
Università di Sassari
IL TEOREMA DEI MINIMI QUADRATI E LA CURVA DI GAUSS
IL METODO DEI MINIMI QUADRATI
Il primo ad utilizzare tale metodo fu Carl Friederich Gauss (1777-1855)
TEOREMA
Il valore medio delle osservazioni Om è il valore
medio della grandezza misurata che minimizza
La somma degli errori al quadrato
DIMOSTRAZIONE
Oi = i-esima osservazione Om = il valore medio
x = il valore vero εi = l’errore di cui è affetta l’i-esima osservazione
Siano:
11 mOO
22 mOO
nmn OO
Poiché m
n
ii nOO 0
n
ii
Consideriamo la somma degli scarti dal valore vero al quadrato
222
21 )(..........)()()( nOxOxOxxS
Che può essere scritta, relativa alla media, come:
222
21 )(.......)()()( nmmm OxOxOxxS
Dobbiamo dimostrare che questa somma è minima quando x =Om
Sviluppando i quadrati si ottiene:
222
222
22
2
211
21
2
2)(2
......................................................
2)(2
2)(2)(
nnmmnm
mmm
mmm
OOxOx
OOxOx
OOxOxxS
Da cui ordinando si ha:
n
i
n
im
n
imm nOnxnOxnOnxxS1
2
11
22 222)(
Raggruppando si ottiene:
n
imOxnxS1
22)()( n
inx1
2 n
imnO1
2
Essendo = 00n
ii
Si ha alla fine: n
imOxnxS1
22)()(
Questa funzione ha un minimo in mOx
Da cui sostituendo si ha: n
ixS1
2)(
)(xS
x mO
n
i1
2
LA CURVA DI GAUSS
Il prototipo della curva di Gauss è
2
2
)( h
x
exf
Con h = parametro di larghezza
Studiamo questa funzione
80706050403020100-10
400
300
200
100
0
C1
Fre
quency
Histogram of C1
80706050403020100-10
400
300
200
100
0
C1
Fre
quency
Histogram of C1, with Normal Curve
La funzione ha quindi un massimo
2
2
)( h
x
exf
2
1
1 ;2
eh
F
2
1
2 ;2
eh
F
)1;0(M
E due flessi
2
2
2)( h
x
exf
2
1
1 ;ehF
2
1
1 ;ehF
2
2
2)( h
x
exf
h = parametro di larghezza?
2
2
2)( h
x
exf
Non è ancora nella sua forma finale
1)( dxxf Condizione di normalizzazione
2
2
2 2
1)( h
x
eh
xf
2
2
2 2
1)( h
Xx
eh
xf
Sostituendo x con x-X
Il massimo sarà )1;(XM
X X X
f(x)
x
2
2
2 2
1)( h
Xx
eh
xf
Si può dimostrare che
h
X
Ed infine si ha
2
2
2 2
1)(
x
exf
La deviazione standard come limite di confidenzadel 68%
1)( dxxf
2
2
2 2
1)(
x
exf
b
a
dxxf )( Probabilità che una data misura cada in [a,b]
dxxf )( Probabilità che una data misura cada tra [μ-σ, μ+σ ]
68,0P
68%
I MODELLI STATISTICI
I modelli statistici sono strumenti matematici e algebrici in grado di analizzare le componenti regolari e casuali di un insieme di dati
In questo corso analizzeremo le relazioni fra variabili con il metodo della regressione multipla. Tale classe di modelli appartiene ai metodi dell’Analisi a più variabili.
Saranno analizzate principalmente le tecniche della regressione lineare multipla [modelli lineari o linearizzabili] e una parte sarà dedicata alla regressione non lineare (esponenziale; allometrica)
Le applicazioni saranno eseguite con le routine di MS-Excell®
Il fine dell’analisi della regressione multipla è quello di stabilire, se esiste, una relazione fra una variabile risposta (variabile dipendente, generalmente indicata con y) e un insieme di variabili indipendenti, generalmente indicate con x1, x2…xn.
Il modello statistico generale è il seguente
yi = a + b1x1i+b2x2i,+…+bnxni+εi
In cui yi= variabile dipendente; x.i = variabile indipendente; εi= scostamento casuale dal modello o residuo (media =0, varianza σ2); a = intercetta (stessa dimensione della y); b = coefficienti (o regressori parziali) del modello.
Nelle scienze zootecniche l’analisi della regressione multipla è ampiamente utilizzata per la messa a punto di modelli di previsione del comportamento di una variabile di interesse zootecnico (es.: produzione di latte, accrescimento, qualità di prodotti, ingestione alimentare, ecc..) rispetto ad altre variabili [chiamate “predittori del modello”]
REGRESSIONE LINEARE SEMPLICE
Consideriamo il caso in cui una certa variabile detta variabile dipendente è influenzata da una o più variabili dette variabili dipendenti.
Il caso più semplice è: la y dipende solo da un’altra variabile x.
ESEMPIO: relazione tra peso ed ingestione in pecore Sarde in asciutta
0,8
0,9
1
1,1
1,2
1,3
1,4
37 39 41 43 45 47 49 51 53
peso
inge
stio
nePLOT DEI DATI SU UN SISTEMA DI ASSI
Il metodo impiegato per la stima dei parametri dell’equazione che meglio si adatta ai dati è quello detto DEI MINIMI QUADRATI
La procedura generale dei minimi quadrati è la seguente:
f (x i) y i i
min)]([ 2
1
i
n
ii xfy
min)( 2 iS
Equazione cartesiana della retta:
In statistica:
Una equazione in questa forma rappresenta un modello deterministico
ii mxqy
ii xy 10
0,8
0,9
1
1,1
1,2
1,3
1,4
37 39 41 43 45 47 49 51 53
peso
inge
stio
ne
y i 0 1x i
Vogliamo ottenere la stima dei parametri del modello:
Per ottenere la retta di regressione
La stima di E(y) è data dall’equazione
iii xy 10
E(y i) 0 1x i
ii xy 10ˆˆˆ
Metodo dei minimi quadrati per la stima dei parametri
0 1e
Consideriamo il cosiddetto residuo
Il metodo dei minimi quadrati permette di scegliere la retta migliore per minimizzare la somma:
y i ˆ y i
2 (y i ˆ y i )2 (y i ˆ 0 ˆ 1x i)2
Sviluppando i quadrati si ottiene:
210 )ˆˆ( ii xy
Questa funzione è minima quando la derivata prima rispetto β0 e a β1 è zero:
iiiiii xyyxxy 101022
120
2 222
0
y i2 0
2 12x i
2 201x i 2y i0 2y i1x i 0
1
y i2 0
2 12x i
2 201x i 2y i0 2y i1x i 0
Sviluppiamo la prima:
0
y i2 0
2 12x i
2 201x i 2y i0 2y i1x i 0
0222 10 ii yx
y i n0 1 x i
Sviluppiamo la seconda:
1
y i2 0
2 12x i
2 201x i 2y i0 2y i1x i 0
21x i2 2x iy i 20x i 0
x iy i 0 x i 1 x i2
x iy i 1 x i2 0 x i
y i n0 1 x i
Le due derivate costituiscono un sistema di equazioni:
Poniamo: 2ixx xS ix xS
iixy yxS iy yS
01
01
nSS
SSS
xy
xxxxy
E sostituendo:
Risolvendo il sistema di equazioni si ottiene:
1 Sxy
SxSy
n
Sxx (Sx )2
n
E sostituendo:
1 x i y i
x i yi
n
x 2
( x i )2n
β0 sarà calcolata sostituendo nell’equazione della retta:
xy 10
REGRESSIONE LINEARE MULTIPLA
Ingestione Peso ProdLatte
2,833 45,0 1,7
2,459 44,0 1,4
2,087 35,0 1,2
2,130 41,0 1
2,941 42,0 2
3,003 43,4 2,1
2,524 46,9 1,2
2,663 45,2 1,5
2,295 39,8 1,2
3,160 50,1 2,2
2,926 49,2 1,9
2,722 45,3 1,5
3,031 46,2 2
2,353 44,2 1,2
2,310 41,2 1,24
3,154 52,1 2,05
3,094 47,7 2,11
2,785 48,2 1,75
2,108 38,1 1,1
2,440 49,0 0,9
Esempio: è noto che l’ingestione alimentare degli animali zootecnici dipende, tra le altre cose, dalla mole e dal livello produttivo.
La matrice dei dati riportata a fianco riguarda dei rilievi sperimentali effettuati su pecore in lattazione di razza Sarda.
Il quesito è: riusciamo a prevedere l’ingestione di sostanza secca di una pecora Sarda in base al suo peso corporeo e alla sua produzione di latte?
Il modello fornisce un’unica previsione e un insieme di correlazioni parziali. Ciascun coefficiente “b” rappresenta un contributo indipendente di ciascuna variabile alla previsione del valore della variabile dipendente (y).
Il fatto di dover fornire un contributo indipendente significa che la variabili “x” sono indipendenti fra loro, cioè non sono correlate. In termini geometrici, gli assi delle variabili (tutte, dipendente e indipendenti) sono fra loro ortogonali.
Il primo passo dell’analisi della regressione lineare multipla è l’EDA (exploratory data analysis) che consiste
1. nel “plottare” le singole variabili indipendenti rispetto alla variabile dipendente;2. nel calcolare la matrice della correlazione fra le variabili indipendenti. Se fra due di esse la correlazione è “importante” [ad es, esiste (cioè è differente da zero per p<0,05) ed è superiore al 20-25%, una delle variabili deve essere eliminata per evitare fenomeni di collinearità.]
L’EDA consente di verificare:
1. Se l’andamento della singola variabile indipendente rispetto alla dipendente è lineare
2. Se vi è una correlazione “importante” fra le due
3. Se le variabili indipendenti sono correlate fra di loro
4. Se esiste una aggregazione di dati [cluster] e dei dati “lontani” detti outliers
Risposte ai singoli quesiti EDA.
1. Si: il “regressore” può essere trattato con un modello lineare. No: si deve utilizzare una trasformata (es, logaritmo, inversa, ecc.) oppure un ordine superiore (quarato, cubo).
2. Si: la variabile va inserita nel modello lineare. No: va esclusa.
3. Si: va scartata una delle due, di solito quella meno correlata con la y (cioè quella che spiega una minore quota di variabilità).
4. Si: deve essere cambiata la scala (cluster); devono essere ricontrollati i dati e “scaricati” quelli anomali (grande attenzione a non “scaricare” dati “buoni”)
Un altro assunto importante per l’analisi della regressione multipla è la distribuzione normale delle variabili e degli errori (o residui).
Ing. kgSS peso (kg) Latte (kg)
Media 2,6509 Media 44,68 Media 1,5625
Errore standard 0,081213717 Errore standard 0,958359 Errore standard 0,094821
Mediana 2,6925 Mediana 45,1 Mediana 1,5
Moda #N/D Moda #N/D Moda 1,2
Deviazione standard 0,363198786 Deviazione standard 4,285913 Deviazione standard 0,424052
Varianza campionaria 0,131913358 Varianza campionaria 18,36905 Varianza campionaria 0,17982
Curtosi -1,368363617 Curtosi 0,000342 Curtosi -1,52423
Asimmetria -0,135963248 Asimmetria -0,44209 Asimmetria 0,086596
Intervallo 1,073 Intervallo 17,1 Intervallo 1,3
Minimo 2,087 Minimo 35 Minimo 0,9
Massimo 3,16 Massimo 52,1 Massimo 2,2
Somma 53,018 Somma 893,6 Somma 31,25
Conteggio 20 Conteggio 20 Conteggio 20
3,23,02,82,62,42,22,0
5
4
3
2
1
0
Ing. kgSS
Fre
quen
cyHistogram of Ing. kgSS, with Normal Curve
53514947454341393735
5
4
3
2
1
0
peso (kg)
Fre
quen
cyHistogram of peso (kg), with Normal Curve
2,22,01,81,61,41,21,0
6
5
4
3
2
1
0
latte
Fre
quen
cyHistogram of latte, with Normal Curve
Pecore Sarde
1,5
1,7
1,9
2,1
2,3
2,5
2,7
2,9
3,1
3,3
30 35 40 45 50 55
Peso corporeo (kg)
Ing
esti
on
e S
S (
kg/d
)EDA - Correlazioni (1)
Pecore Sarde
1,5
2
2,5
3
3,5
0,5 1 1,5 2 2,5
Produzione di latte (kg/d)
Ing
esti
ne
SS
(kg
/d)
2,0
351,5
2,0latte
2,2
2,4
2,6
40
2,8
3,0
3,2
451,0
Ing. kgSS
50peso (kg)
EDA – Visione di insieme dei dati
35
2,0
2,2
2,4
2,6Ing. kgSS
peso (kg)
40
peso (kg)45
2,8
3,0
3,2
50
2,0
1,5 latte
1,0
latte
EDA – Visione di insieme dei dati [superficie]
EDA - Correlazioni (2)
Ing. kgSS peso (kg) latte
Ing. kgSS 1
peso (kg) 0,742347 1
latte 0,931149 0,486831 1
Collinearità fra le variabili indipendenti
Non vi è nessuna aggregazione [cluster] di dati né outliers.
La varianza di un set di misure
La covarianza tra due set di misure 2
))((
n
yyxxi
ii
xy
1
)( 2
2
N
xxN
ii
xx
sxy > 0 se x ed y tendono a cadere al di sopra delle lore medie
sxy < 0 se x ed y tendono a cadere al di sotto delle lore medie
Es. Peso statura
LA CORRELAZIONE PARZIALE
Correlazione Negativa Positiva
Piccola −0,3 a −0,1 0,1 a 0,3
Media −0,5 a −0,3 0,3 a 0,5
Grande −1,0 a −0,5 0,5 a 1,0
11
La correlazione tra due set di misure
yyxx
xyxy
Es. Peso statura
Matrice di varianza e covarianza di un set di p misure
pppp
p
p
......
:......::
......
......
21
22212
12111
Matrice di correlazione di un set di p misure
1......
::::
......1
......1
21
212
112
pp
p
p
R
Supponiamo di avere tre variabili: x, y, z
Ci interessa la correlazione tra x ed y, ma sospettiamo che z influenzi tale
correlazione.
Ad esempio x=HG ed y=cn:
quale è l’influenza di z=HD?
quale è la correlazione netta tra HG e cn?
Calcoliamo rxy.z
rxy.z uguale a rxy
rxy.z diverso da rxy
Algoritmo di calcolo:
1) Regressione x-z e residui
2) Regressione y-z e residui
3) La correlazione parziale rxy.z è la correlazione tra i residui
La bontà della regressione è valutabile :
1. Dal valore del coefficiente di determinazione R2
2. Dalla distribuzione casuale dei residui
3. Dall’ininfluenza della eliminazione (trimming) di uno o più dati “estremi” sui valori dei regressori [a oppure b.]
4. Dall’esistenza deI regressore [a oppure b.] il cui valore deve essere significativamente diverso da zero.
VALUTAZIONE DELLA REGRESSIONE
Risultati dell’analisi della regressione effettuata con MS-Excell®
CoefficientiErrore
standard Stat tValore di
significatività
Intercetta (SS) 0,3058 0,1602 1,9095 0,0732
Variabile X 1 (PC) 0,0298 0,0041 7,2852 0,0000
Variabile X 2 (L) 0,6479 0,0414 15,6556 0,0000
L’equazione ottenuta è la seguente:
Ingestione (kg/d SS) = 0,3058 (ns) + 0,0298 PC (kg) + 0,6479 L (kg/d) [+ ε]
Osservazione (Y) Prevista (Ŷ) Residui(ε)
2,833 2,750 0,083
2,459 2,525 -0,066
2,087 2,127 -0,040
2,130 2,177 -0,047
2,941 2,854 0,087
3,003 2,961 0,042
2,524 2,482 0,042
2,663 2,626 0,037
2,295 2,270 0,025
3,160 3,226 -0,066
2,926 3,004 -0,078
2,722 2,629 0,093
3,031 2,980 0,051
2,353 2,402 -0,049
2,310 2,338 -0,028
3,154 3,188 -0,034
3,094 3,096 -0,002
2,785 2,877 -0,092
2,108 2,155 -0,047
2,440 2,351 0,089
Sviluppo dell’equazione calcolata
Risultati dell’analisi della regressione effettuata con MS-Excell®
Statistica della regressione
R multiplo 0,985334
R al quadrato 0,970882
R al quadrato corretto 0,967457
Errore standard 0,06552
Osservazioni 20
ANALISI VARIANZA
gdl SQ MQ F Significatività F
Regressione (Ŷ) 2 2,433375 1,216687 283,4204 0,00000
Residuo (ε) 17 0,072979 0,004293
Totale (Y) 19 2,506354
R2 = coefficiente di determinazione. Misura la quota di variabilità “spiegata” dalla regressione sulla variabilità totale
Y
Y
SQ
SQR ˆ2
MQ
Variabile X 1 Tracciato dei residui
-0,150
-0,100
-0,050
0,000
0,050
0,100
0,150
30 35 40 45 50 55
Variabile X 1
Res
idui Variabile X 2 Tracciato dei residui
-0,150
-0,100
-0,050
0,000
0,050
0,100
0,150
0,8 1,3 1,8 2,3
Variabile X 2
Res
idu
i
Variabile X 1 Tracciato delle approssimazioni
1,5
2
2,5
3
3,5
30 35 40 45 50 55
Variabile X 1
YY
Y prevista
Variabile X 2 Tracciato delle approssimazioni
1,5
2
2,5
3
3,5
0,5 1 1,5 2 2,5
Variabile X 2
Y
Y
Y prevista
35
2,0
2,5Prevista
peso (kg)
40
peso (kg)45
3,0
50
2,0
1,5 latte
1,0
latte
Forma geometrica della regressione [superficie]
Un ulteriore modo per verificare la bontà del modello è quello di “plottare” i dati attesi su quelli osservati. Il modello è tanto migliore quanto l’R2 è maggiore, se il parametro “a” non differisce significativamente da zero e se il parametro “b” non differisce significativamente da 1.
Ingestione pecore Sarde
y = x
R2 = 0,9709
2,000
2,200
2,400
2,600
2,800
3,000
3,200
3,400
2,000 2,200 2,400 2,600 2,800 3,000 3,200 3,400
Osservata
Pre
vis
ta
Coeff. ES Stat t PInferiore
95%Superiore
95%
Intercetta 0,0772 0,1060 0,7283 0,4758 -0,1455 0,2999
Variabile X 1 0,9709 0,0396 24,4987 0,0000 0,8876 1,0541
Validazione modello ingestioney = 1,2976x - 0,1018
R2 = 0,5951
1,00
1,50
2,00
2,50
3,00
3,50
4,00
4,50
5,00
1,50 1,70 1,90 2,10 2,30 2,50 2,70 2,90 3,10Osservati
Att
esi
Coefficienti ES Stat t P Inf95% Sup95%
Intercetta -0,1018 0,3865 -0,2634 0,7937 -0,8850 0,6813
Variabile X 1 1,2976 0,1760 7,3748 0,0000 0,9411 1,6541
La validazione di un modello è la sua applicazione su un dataset indipendente. Nel caso del modello di ingestione da noi studiato, la sua applicazione ad una altro dataset ha fornito i seguenti risultati.
Stima dei parametri della curva di lattazione secondo il modello di Wood con il metodo della regressione lineare multipla.
latte (kg/d)
mese secondipare
1 35,8
2 41,2
3 39,7
4 37,4
5 35,1
6 32,9
7 31,2
8 29,1
9 25,5
10 22,2
Prendiamo in considerazione i dati di produzione giornaliera di una vacca secondipara Frisona, rilevati con cadenza mensile.
secondipare
0
10
20
30
40
50
1 2 3 4 5 6 7 8 9 10
settimane
latt
e (k
g/d)
L’equazione gamma-modificata originariamente proposta da Wood (1966) è la seguente [vedi modulo 3 del corso]
y(t) = a tb e-ct
Il modello di wood può essere trasformato nella forma logaritmica
ln (y) = ln (a) + b ln (t) + ct
che rappresenta una equazione di regressione multipla utilizzabile per il fitting sui dati sperimentali
Y = A + bx + ct In cui Y = ln(y); A = ln(a); x = ln(t)
Per poter applicare il modello logaritmico i dati devono essere riarrangiati nel seguente modo
log(latte) log(mese) mese
3,578 0,000 1
3,718 0,693 2
3,681 1,099 3
3,622 1,386 4
3,558 1,609 5
3,493 1,792 6
3,440 1,946 7
3,371 2,079 8
3,239 2,197 9
3,100 2,303 10
CoefficientiErrore
standard
Intercetta 3,725633 0,021721
Variabile X 1 0,336426 0,041645
Variabile X 2 -0,13703 0,010083
a = exp(3,725633) = 41,5b = 0,336c = -0,137R2= 0,9841
y (t) = 41,5 t0,336 e-0,137 t
Curva di lattazione delle secondipare
05
1015202530354045
1 2 3 4 5 6 7 8 9 10
Mesi
Latte
(kg/
d)
Curva di lattazione stimata con il modello di Wood
y (t) = 41,5 t0,336 e-0,137 t; R2=0,9841
Curva di lattazione secondipara Frisona (latte kg)
y = 0,988x + 0,3767
R2 = 0,9825
20
25
30
35
40
45
20 25 30 35 40 45
Osservato
Sti
mat
o
0
5
10
15
20
25
30
35
40
45
50
1 2 3 4 5 6 7 8 9 10
settimane
latt
e (k
g/d
)
primipare secondipare pluripare
Esercizio: evoluzione della produzione di latte in vacche Frisone: calcolare il valore dei parametri della curva di lattazione.
latte (kg/d)
settimana primipare secondipare pluripare
1 27,4 35,8 38,1
2 30,5 41,2 43,9
3 29,9 39,7 41,6
4 30,2 37,4 39
5 29,1 35,1 35,5
6 28,6 32,9 32,6
7 27,4 31,2 29,8
8 25,4 29,1 27
9 22,8 25,5 24,2
10 21,3 22,2 20,2
Evoluzione della produzione di latte in vacche Frisone
Cenni di tecniche di regressione non lineare
Tra le tecniche di regressione non lineare analizzeremo:
1. La regressione allometrica
2. La regressione esponenziale
3. I modelli polinomiali di grado superiore al 2°
La regressione allometrica segue il modello
baxy In cui i parametri da stimare sono “a” e “b”
Prima di procedere all’applicazione del modello si effettua l’EDA sui dati sperimentali
Il grafico si riferisce alla produzione di latte e di grasso di pecore di razza Sarda. L’ipotesi è che l’andamento segua un modello allometrico
0
20
40
60
80
100
120
140
160
180
200
0 0,5 1 1,5 2 2,5 3
Produzione di latte (kg/giorno)
Pro
du
zio
ne
di g
rass
o (
g/g
iorn
o)
L’equazione trovata conferma che il la secrezione complessiva di grasso è meno che proporzionale a quella di latte con una ragione d’esponente pari a 0,85.
Si impiega la routine grafica di Excell ® [click sui dati con il pulsante destro del mouse; aggiungi linea di tendenza; potenza; opzioni; equazione; R2] per trovare l’equazione.
y = 71,213x0,8439
R2 = 0,9181
0
20
40
60
80
100
120
140
160
180
200
0 0,5 1 1,5 2 2,5 3
Produzione di latte (kg/giorno)
Pro
du
zio
ne
di g
rass
o (
g/g
iorn
o)
Velocità di secrezione del grasso in pecore Frisone
4,0
5,0
6,0
7,0
8,0
9,0
10,0
0 5 10 15 20 25 30
intermungitura (ore)
pro
du
zin
oe
di
gra
sso
(g
/h)
I dati a fianco si riferiscono alla velocità di secrezione oraria del grasso nel latte di pecore Frisone (Mickusick et al JDS 2002)
Si impiega la routine grafica di Excell ® per trovare l’equazione.
Ritmo di secrezione del grasso in pecore Frisone
y = 14,128x-0,3243
R2 = 0,9639
4,0
5,0
6,0
7,0
8,0
9,0
10,0
0 5 10 15 20 25 30
intermungitura (ore)
pro
du
zin
oe
di
gra
sso
(g
/h)
L’equazione dice che la velocità di secrezione al tempo x=1 è di 14 g/h (circa) e che si riduce di una ragione esponenziale di circa 1/3 per ora.
La regressione esponenziale segue il modello matematico
bxaey
In cui i parametri da stimare sono “a” e “b”
Frazione cisternale del latte in pecore Sarde
30
35
40
45
50
55
60
0 5 10 15 20 25 30
intermungitura (ore)
fra
zio
ne
cis
tern
ale
(%
)
I dati a fianco si riferiscono alla frazione cisternale di latte in pecore Sarde in funzione dell’intermungitura (Pulina et al, 2005)
Frazione cisternale del latte in pecore Sarde
y = 30,739e0,0279x
R2 = 0,8988
30
35
40
45
50
55
60
65
0 5 10 15 20 25 30
intermungitura (ore)
fra
zio
ne
cis
tern
ale
(%
)
Si impiega la routine grafica di Excell ® [click sui dati con il pulsante destro del mouse; aggiungi linea di tendenza; opzioni; esponenziale; equazione; R2] per trovare l’equazione.
Il modello polinomiale multiplo è il seguente
nn xbxbxbay ..2
21
Velocità di secrezione del latte in pecore Frisone
92949698
100102104106108
0 5 10 15 20 25 30
intermungitura (ore)
pro
du
zio
ne
di
latt
e (g
/h)
I parametri da stimare sono la “a” e i “b.”
I dati a fianco si riferiscono alla velocità di secrezione oraria del latte in pecore Frisone (Mickusick et al JDS 2002)
Velocità di secrezione del latte in pecore Frisone
y = 0,0011x4 - 0,0463x3 + 0,5351x2 - 0,8537x + 94,736
R2 = 0,8131
90
95
100
105
110
0 5 10 15 20 25 30
intermungitura (ore)
pro
du
zio
ne
di
latt
e (g
/h)
Si impiega la routine grafica di Excell ® [click sui dati con il pulsante destro del mouse; aggiungi linea di tendenza; opzioni; polinomiale; equazione; R2] per trovare l’equazione.
n.b. = excell calcola polinomi fino al 6° grado; dal 3° in poi i parametri perdono significato biologico!!
…infatti, l’aumento del grado del polinomio comporta il passaggio della curva su tutti i dati. Nel nostro caso un polinomio di 6° grado si comporta così:
Velocità di secrezione del latte in pecore Frisone
y = -0,0006x5 + 0,0455x4 - 1,2074x3 + 14,502x2 - 76,457x + 237,58
R2 = 1
90
95
100
105
110
0 5 10 15 20 25 30
intermungitura (ore)
pro
du
zio
ne
di
latt
e (g
/h)
…con l’ovvia conseguenza di descrivere tutto e non spiegare nulla.
Fine del corso e buon lavoro.