cómic análisis de la varianza con dos factores e interacción
TRANSCRIPT
Estadística Ciencias AmbientalesFacultad de CienciasDepartamento de MatemáticasProfesor: Santiago de la Fuente Fernández
ANÁLISIS VARIANZA MULTIFACTORIALANOVA II CON INTERACCIÓN
ANÁLISIS DE LA VARIANZA CON DOS FACTORES E INTERACCIÓN
Modelo: ( ) Uy ijjiij +βα+β+α+μ= J,,2,1jI,,2,1i LL ==
ijy ≡ representa la respuesta de la variable en el i-ésimo nivel del FACTOR 1 ( )α y en el jésimo nivel del FACTOR 2 ( )β
( ) ( ) ijjiijij yE βα+β+α+μ==μ es el valor medio de ijy
iα ≡ representa el efecto que sobre la media global μ tiene en el NIVEL i el FACTOR 1 ( )α
jβ ≡ representa el efecto que sobre la media global μ tiene en el NIVEL j el FACTOR 2 ( )β
( )ijβα ≡ representa el efecto de la interacción entre el NIVEL i del FACTOR 1 ( )α y el NIVEL j del FACTOR 2 ( )β
U ≡ es la variación aleatoria de las ijy (igual para todas).
Supondremos que U sigue una distribución ( )σ,0N , lo que implica que ijy sigue una distribución ( )σμ ,N ij
( ) ( ) 0J
1jij
I
1iij
J
1jj
I
1ii =βα=βα=β=α ∑∑∑∑
====
FACTOR 2 ( )βNiveles 1 2 J Medias
Filas
1
11n11
112
111
y..................yy
12n12
122
121
y..................yy
.........
.........
.........
.........
.........
.........
.........
.........
J1nJ1
2J1
1J1
y..................yy
••1y
2
21n21
212
211
y..................yy
22n22
222
221
y..................yy
.........
.........
.........
.........
.........
.........
.........
.........
J2nJ2
2J2
1J2
y..................yy
••2y
.........
...........................
.........
...........................
.........
...........................
.........
.........
FACT
OR
1
(α)
I
1In1I
12I
11I
y..................yy
2In2I
22I
21I
y..................yy
.........
...........................
IJnIJ
2IJ
1IJ
y..................yy
••Iy
Mue
stra
ale
ator
ia
n ij o
bser
vaci
ones
cas
illa
(i, j)
Mediascolumnas ••1y ••2y ••Jy •••y
( )( )2ijjiijk ;Ny σβα+β+α+μ∈ independientes
El origen de la descomposición de la varianza total, donde ijnk =
( ) ( ) ( )( )
( ) ( )448447644844764444 84444 76 jiij ˆ
j
ˆ
ijiijijijkijk yyyyyyyyyyyy
β
•••••
α
•••••
βα
•••••••••••• −+−++−−+−=−
( ) ( )
( )
( )
( )( )( )
( )
( )
( )
( )4444 34444 214444 34444 214444444 34444444 21
4444 34444 21
4444 84444 76
1JSCE
I
1i
J
1j
K
1k
2j
1ISCE
I
1i
J
1j
K
1k
2i
1J1ISCE
I
1i
J
1j
2K
1kjiij
1KJISCR
I
1i
J
1j
K
1k
2ijijk
1KJISCT
I
1i
J
1j
K
1k
2ijk
yyyyyyyy
yyyy
−β
= = =•••••
−α
= = =•••••
−−αβ
= = =••••••••
−
= = =•
−
= = =•••
∑∑∑∑∑∑∑∑∑
∑∑∑∑∑∑
−+−++−−+
+−=−
operando, resulta:
( )
( )
( )
( )
( )( )( )
( )
( )
( )
( )444 3444 21444 3444 21444444 3444444 214444 34444 21
4444 84444 76
1JSCE
J
1j
2j
1ISCE
I
1i
2i
1J1ISCE
I
1i
J
1j
2jiij
1KJISCR
I
1i
J
1j
K
1k
2ijijk
1KJISCT
I
1i
J
1j
K
1k
2ijk
yyKIyyKJyyyykyy
yy
−β
=•••••
−α
=•••••
−−αβ
= =••••••••
−
= = =•
−
= = =•••
∑∑∑∑∑∑∑
∑∑∑
−+−++−−+−
=−
( ) ( ) ( )β+α+βα+= SCESCESCESCRSCT
SCT ≡ Variabilidad total de todos los datosSCR ≡ Variabilidad debida a los factores
( )βαSCE ≡ Variabilidad debida a las interacciones( )αSCE ≡ Variabilidad debida a los distintos niveles del Factor 1( )βSCE ≡ Variabilidad debida a los distintos niveles del Factor 2
TABLA ANOVA: ANÁLISIS ESTADÍSTICOFuente
variación Suma cuadrados grados libertad Varianza Test F
Factor ( )α ( ) ( )∑=
••••• −=αI
1i
2i yyKJSCE ( )1I −
( )( )1I
SCES2−α
=α 2r
2
SSF α
α =
Factor ( )β ( ) ( )∑=
••••• −=βJ
1j
2j yyKISCE ( )1J −
( )( )1JSCES2
−β
=β 2r
2
S
SF ββ =
Interacción
( )
( )∑∑= =
•••••••• +−−=
=βαI
1i
J
1j
2jiij yyyyK
SCE
( ) ( )1J1I −−( )
( )( )1J1ISCES2
−−βα
=βα 2r
2
S
SF αβ
βα =
Residual ( )∑∑∑= = =
•−=I
1i
J
1j
K
1k
2ijijk yySCR ( )1KJI − ( )1kJI
SCRS2r −=
Total ( )∑∑∑= = =
•••−=I
1i
J
1j
K
1k
2ijk yySCT 1KJI −
ANÁLISIS ESTADÍSTICO: Contraste del Efecto de cada factor
0únlgA:H0:H
i1
I21o
≠α=α==α=α L
0únlgA:H0:H
j1
J21o
≠β=β==β=β L ( )
( ) 0únlgA:H
j,i0:H
ji1
jio
≠βα
∀=βα
EL FACTOR 1 ( )α NO INFLUYE EL FACTOR 2 ( )β NO INFLUYE NO HAY INTERACCIONES
ESTADÍSTICOS DE CONTRASTE:
0únlgA:H0:H
i1
I21o
≠α=α==α=α L
0únlgA:H0:H
j1
J21o
≠β=β==β=β L ( )
( ) 0únlgA:H
j,i0:H
ji1
jio
≠βα
∀=βα
EL FACTOR 1 ( )α NO INFLUYE EL FACTOR 2 ( )β NO INFLUYE NO HAY INTERACCIONES
Se acepta la hipótesis nula cuando:
( ) ( )1KJI,1I,2r
2F
SSF −−αα
α ≤=
Se acepta la hipótesis nula cuando:
( ) ( )1KJI,1J,2r
2
FS
SF −−α
ββ ≤=
Se acepta la hipótesis nula cuando:
( )( ) ( )1KJI,1J1I,2r
2
FS
SF −−−α
βαβα ≤=
Cuando se rechaza la hipótesis nula Ho se pueden hacer pruebas simultáneas entre todas las posibles parejas de niveles en cadafactor. Uno de los tests más empleados en las Pruebas Post hoc es el Test de Bonferroni.
CONDICIONES DEL ANÁLISIS ESTADÍSTICO ANOVA
• NORMALIDAD .- Los datos obtenidos en cada nivel de los factores se ajustan razonablemente a una distribución normal. - ijy sigue una distribución normal ( )σμ ,N ij j,i∀ -
• HOMOCEDASTICIDAD.- La variabilidad de los datos en cada nivel de los factores es similar (contraste de igualdad de
varianzas) - ( ) j,iyVar ij2 ∀=σ
• LINEALIDAD.- Los residuos (diferencia de los datos a su media, en cada nivel de los factores) se distribuyen alrededor del cero. ( ) 0UE =
• INDEPENDENCIA.- Las observaciones se realizan de forma independiente unas de otras (diseño de la obtención de datos).
En caso de existir desviaciones significativas sobre estos requisitos, los resultados posteriores pueden ser incorrectos.
EYSENCK (1974).- En un estudio sobre memoria verbal se seleccionaron al azar 50 personas mayores y 50 jóvenes (Factor 1: Edad).Dentro de cada uno de estos grupos se asignaron, al azar, 10 personas a 5 distintos grupos a los que se les presentó una misma listade 27 palabras. A cada uno de los 5 grupos se les dieron las siguientes instrucciones (Factor 2: Método).Grupo 1 (Contar): Se les pidió que contasen el número de letras de cada palabra. Grupo 2 (Rimar): Se les pidió que rimasen cadapalabra con otra. Grupo 3 (Adjetivar). Se les pidió que a cada palabra le asignasen un adjetivo. Grupo 4 (Imaginar): Se les pidió que acada palabra le asignasen una imagen. Grupo 5 (Recordar):Se les pidió que memorizasen las palabras.
FACTOR 2 (Método) J = 5I = 2 J = 5 K = 10Contar Rimar Adjetivar Imaginar Recordar
MayoresI = 2
98681046577
79666116387
111386141113131011
121116119
2312101911
1019145101114151111
Fact
or 1
(Ed
ad)
Jóvenes
8646765797
1078104710677
14111814132217161211
20161615181620221419
21191715221622221821
K = 10
A los 4 primeros grupos no se les dijo que deberían recordar las palabras. Finalmente, tras revisar la lista 3 veces, se recogió elnúmero de palabras recordadas por cada grupo (variable respuesta).
FACTOR 2 (Método) J = 5I = 2 J = 5 K = 10
Contar Rimar Adjetivar Imaginar Recordar medias por filas
MayoresI = 1
7y11 =• 9,6y12 =• 11y13 =• 4,13y14 =• 12y15 =•06,10y1 =••
JóvenesI = 2
5,6y21 =• 6,7y22 =• 8,14y23 =• 6,17y24 =• 3,19y25 =•16,13y2 =••
Fact
or 1
(Ed
ad)
medias porcolumnas
75,6y 1 =•• 25,7y 2 =•• 9,12y 3 =•• 5,15y 4 =•• 65,15y 5 =•• 6,11y =•••
74,2694SCT74,2694s79,266761,11y 22 ===σ= •••••••••
( ) ( ) ( ) ( ) ( )[ ] 25,24061,1116,1361,1106,1050yy10.5yyKJSCE 222
1i
2i
I
1i
2i =−+−=−=−=α ∑∑
=•••••
=•••••
( ) ( ) ( ) ( ) ( ) ( ){
( ) ( ) ( ) } 94,151461,1165,1561,115,1561,119,12
61,1125,761,1175,620yy10.2SCEyyKISCE
222
225
1j
2j
J
1j
2j
=−+−+−+
+−+−=−=β=−=β ∑∑=
•••••=
•••••
( ) ( ) ( )
( ) ( ) ( ){( ) ( ) ( )( ) ( ) ( )( ) } 3,19003,19.1061,1165,1516,133,19
61,1165,1506,101261,115,1516,136,1761,115,1506,104,13
61,119,1216,138,1461,119,1206,101161,1125,716,136,7
61,1125,76,109,661,1175,616,135,661,1175,606,10710
yyyy10yyyyKSCE
2
222
222
222
2
1i
5
1j
2jiij
I
1i
J
1j
2jiij
==+−−+
++−−++−−++−−+
++−−++−−++−−+
++−−++−−++−−=
=+−−=+−−=βα ∑∑∑∑= =
••••••••= =
••••••••
( ) ( ) ( ) ( ) ( ) ( )β−α−βα−=β+α+βα+= SCESCESCESCTSCRSCESCESCESCRSCT a
( ) ( ) ( ) 25,7853,19094,151425,20474,2694SCRSCESCESCESCTSCR =−−−=⇒β−α−βα−=
TABLA ANOVA: ANÁLISIS ESTADÍSTICOFuente
variación Suma cuadrados grados libertad Varianza Test F
Factor ( )α ( ) 25,204SCE =α 11I =− ( ) 25,2401I25,240S2 =
−=α 54,27
725,825,240F ==α
Factor ( )β ( ) 94,1514SCE =β 41J =− 74,3784
94,1514S2 ==β 41,43725,8
74,378F ==β
Interacción ( ) 3.190SCE =βα ( ) ( ) 41J1I =−− 58,474
3,190S2 ==βα 45,5725,858,47F ==βα
Residual 25,785SCR = ( ) 901KJI =− 725,890
25,785S2r ==
Total 74,2694SCT = 991KJI =−
SCT ≡ 2694,74 (Variabilidad total de todos los datos)SCR ≡ 785,25 (Variabilidad debida a los factores)
( )βαSCE ≡ 190,3 (Variabilidad debida a las interacciones)( )αSCE ≡ 204,25 (Variabilidad debida a los distintos niveles del Factor 1)( )βSCE ≡ 1514,94 (Variabilidad debida a los distintos niveles del Factor 2)
ANÁLISIS ESTADÍSTICO: Contraste del Efecto de cada factor
0únlgA:H0:H
i1
I21o
≠α=α==α=α L
0únlgA:H0:H
j1
J21o
≠β=β==β=β L ( )
( ) 0únlgA:H
j,i0:H
ji1
jio
≠βα
∀=βα
EL FACTOR 1 ( )α NO INFLUYE EL FACTOR 2 ( )β NO INFLUYE NO HAY INTERACCIONES
ESTADÍSTICOS DE CONTRASTE:
0únlgA:H0:H
i1
I21o
≠α=α==α=α L
0únlgA:H0:H
j1
J21o
≠β=β==β=β L ( )
( ) 0únlgA:H
j,i0:H
ji1
jio
≠βα
∀=βα
EL FACTOR 1 ( )α NO INFLUYE EL FACTOR 2 ( )β NO INFLUYE NO HAY INTERACCIONES
Se acepta la hipótesis nula cuando:
( ) ( )1KJI,1I,2r
2F
SSF −−αα
α ≤=
Se acepta la hipótesis nula cuando:
( ) ( )1KJI,1J,2r
2
FS
SF −−α
ββ ≤=
Se acepta la hipótesis nula cuando:
( )( ) ( )1KJI,1J1I,2r
2
FS
SF −−−α
βαβα ≤=
90,1,05,02r
2F96,354,27
SSF =>== α
α 90,4,05,02r
2
F49,241,43S
SF =>== ββ 90,4,05,02
r
2
F49,245,5S
SF =>== αβαβ
Se rechazan todas las hipótesis nulas. En consecuencia, influyen los factores.
Se verifica que la diferencia de medias es significativa, con una significación de 0,05