cap8

29
Capítulo VIII Análisis de CorrelaciónSimple, Múltiple,Parcial Correlación Es la medidadel grado derelación entredos o más variables. Con variables nominales sueleutilizarseel términoAsociación para indicar el grado de relación entrelas variables. Correlación Simple Lacorrelaciónentredosvariablescuantitativasparaverificarsu relaciónsellama:CorrelaciónSimple,porquesóloinvolucrauna variableindependiente.Mientrasquelarelación entrevariasvariables independientes con una dependiente se le llama: Correlación Múltiple. Larelaciónentredosvariablesmanteniendoelrestoconstante recibeel nombredeCorrelación Parcial. La correlación con una sola variable independiente se llama: Simple. La correlación con más de una sola variable independiente se llama: Múltiple. Lacorrelacióndeungrupodevariablesdependientesconungrupo devariablesindependientes,esdecir,entregruposdevariablesse llama:CorrelaciónCanónica. Coeficiente deCorrelación segúnlanaturalezade lasvariables El gradoderelaciónentrevariables dependedela naturaleza delas variables involucradas en el estudio o investigación. Enestesentido,siambasvariablessonnominaleslarelaciónserá descrita con el Estadístico Ji-Cuadrado. Si ambas variables son

Upload: josue-vilcabana

Post on 10-Jul-2015

180 views

Category:

Education


0 download

DESCRIPTION

aprendizaje cognitivo

TRANSCRIPT

Capítulo VIII

Análisis de CorrelaciónSimple, Múltiple,Parcial

Correlación

Es la medidadel grado derelación entredos o más variables. Con

variables nominales sueleutilizarseel términoAsociación para

indicar el grado de relación entrelas variables.

Correlación Simple

Lacorrelaciónentredosvariablescuantitativasparaverificarsu

relaciónsellama:CorrelaciónSimple,porquesóloinvolucrauna

variableindependiente.Mientrasquelarelación entrevariasvariables

independientes con una dependiente se le llama: Correlación

Múltiple.

Larelaciónentredosvariablesmanteniendoelrestoconstante

recibeel nombredeCorrelación Parcial.

La correlación con una sola variable independiente se llama: Simple.

La correlación con más de una sola variable independiente se llama:

Múltiple.

Lacorrelacióndeungrupodevariablesdependientesconungrupo

devariablesindependientes,esdecir,entregruposdevariablesse

llama:CorrelaciónCanónica.

Coeficiente deCorrelación segúnlanaturalezade lasvariables

El gradoderelaciónentrevariables dependedela naturaleza delas

variables involucradas en el estudio o investigación.

Enestesentido,siambasvariablessonnominaleslarelaciónserá

descrita con el Estadístico Ji-Cuadrado. Si ambas variables son

92

ordinalessedescribelarelaciónconelCoeficientedeCorrelaciónde

Spearman. Si ambas variables son intercalares mediante el

Coeficiente de Pearson. Siuna variable es nominalyla otra es

intervalar la relación puede ser descrita mediante el Coeficiente

OmegaCuadrado.Siambasvariablessondicotómicasobinariasla relación

puedeestablecerse medianteel CoeficientePhi.

Larelaciónentredosfenómenospuedeser:estricta,funcionalo

nula.Larelaciónentretallaypesonoesestricta,yaquenoexiste

unaproporcionalidadsimpleentreambasvariables;perotampocoes

nula,puesdelo contrarioambasvariablesseríanindependientes

entresí(mientrasqueenestecasoexiste,indudablemente,cierta

correlación:lagentealtaes,engeneral,máspesada).Noobstante,

estarelaciónnoresultafuncional,porquedelocontrariosepodría

captarmatemáticamenteladependenciamedianteunaecuaciónde dos

variables.

La correlación tiene las mismas propiedades de los vectores:

magnitud, direccióny sentido.

Entalsentido,sehabladeCorrelaciónPositiva oDirectacuando

ambascaracterísticas(expresadasmediantevaloresdelasvariables)

presentanlamismatendencia(porejemplo,tallaypeso)porquea

medidaqueunaaumentaseesperaquelaotravariableaumente

peroestarelaciónenlosseresvivosnoesindefinidasinohastacierta edad.

Esdecir, hayuna variablereguladora la edad en estecaso.

Enestemismoordendeideas,sehabladeCorrelaciónNegativao

Inversacuandounavariableaumentaylaotradisminuye,mostrando

tendenciasclaramenteopuestas,eselcasodelaofertayelprecioen

elámbitodelaeconomía.Cuandolaofertaaumenta,elpreciotiende a bajar.

Los diagramas de dispersión o Scattergramas suelenserútilespara

estudiar elgrado de relación entredosvariables.

93

Positiva Negativa Aleatoria Aleatoria Nula

Perfecta perfecta positiva negativa

Correlación como medida de la Confiabilidad de un

InstrumentodemediciónoTest

Lacorrelacióneslabaseutilizadaparaevaluarlaconfiabilidadde

uninstrumentodemediciónotest.Silospuntajesdeuntestfueron

medidosenbaseaunaescalaLikertotipoLikert,seutilizaráel Coeficiente

Cronbach, pero si los puntajes provienen de

alternativasdicotómicasobinarias(si,no)seutilizaráelCoeficiente

deKuder-Richardson.Unainterrogantequesaltaalamentede

inmediatoes¿CómoanalizarunTestquetienepreguntasenescala

(si,no)yenescalaLikert? Porsupuestoqueestasituaciónnos

conduceatrabajarmásenelsentidoquedebeaplicarseeltesten dos

oportunidades diferentes y luego correlacionar mediante un

coeficientedecorrelacióndePearson,larelacióndelospuntajes

totalesdelaprimeraaplicaciónconlosdelasegunda.Sisemantiene

entrelasdosaplicacionesunacorrelaciónqueporlomenosesmayor

que0,70seconcluyequeel testes confiable.

Porotraparte,existeuncoeficientedeparticiónpormitadeso

Correlación de Spearman-Brown que mide el grado de

homogeneidaddeuntest;cuandolas correlaciones entrelaprimeray

lasegundamitaddeltest,oentrepareseimpareseslomáselevada

posibleyentodocasomayorque0,70,seconcluyeigualmenteque el testes

confiable.

94

LaCorrelacióntambiénhaceposibleelcálculodelCoeficientede

Determinación

R2 queseutilizacomomedidadelaBondadde

Ajuste deun ModelodeRegresión,como se verá más adelante.

Engeneral,sielvalordeR-cuadradoesmayorencomparacióna

otromodelo,elmodeloqueposeaunR-cuadradomayorseráelde

mejorajuste.ElR-cuadrado,comienzaaserimportantesisobrepasa el

valor 0,70. Este coeficientesiemprees positivo.

EjemplosdeAplicacióndelaCorrelación

Correlación dePearson

CorrelaciónProductoMomentoconocidatambiéncomoCorrelación

dePearson o Correlación deBravais-Pearson.

El STATISTIXcontieneen su algoritmocomputacional la fórmula:

rxy

(X X)(Y Y)

(X X)2

(Y Y)2

Como se observa en el numerador tenemos la fórmula de

covarianza(X,Y)yeneldenominadorlaraizcuadradadelavarianza deX y Y.

Una vez vaciados los datos en el paquete informático de

computación sesiguela secuencia:

STATISTIX>LINEAR MODELS>CORRELATIONPEARSON

Sea la determinación dela correlación simpleentreX eY:

X 2, 4, 6, 8

Y 3, 6, 9, 12

95

Una vezintroducidos los datos,

Seguimosla secuencia dada anteriormente:

Cuya salida es:

Elresultado anterior revela una correlación alta,directa yperfecta.

96

Altaporqueda mayor de 0,70,directa porqueal crecer, crece Yen la

misma proporción (loindica el signopositivo del coeficientede

correlación dePearson) y perfecta porquedio uno.

Existe una escala parainterpretar el coeficiente decorrelacióndada por

algunos autores:

Rango Significado

0,00a 0,29

0,30a 0,69

0,70a 1,00

Bajo

Moderado

Alto

Sin embargo, no existeun acuerdo entrelos distintos autores,

entreotros (Hernández, 2003, p.532) y encontramos otros baremos

deinterpretación:

Magnituddela Correlación Significado

-1,00

-0,90

-0,75

-0,50

-0,10

0,00

+0,10

+0,50

+0,75

+0,90

+1,00

Correlación negativa perfecta

Correlación negativa fuerte

Correlación negativa considerable

Correlación negativa media

Correlación negativa débil

Correlación nula

Correlación positivadébil

Correlación positivamedia

Correlación positivaconsiderable

Correlación positivamuy fuerte

Correlación positivaperfecta

ValorPdeSignificación deR

Otroaspecto importantea considerares la significanciadelvalor de r,

quevienedadopor el valor P queloacompaña.

97

Si el valor P queacompaña a Res menor que0,05, concluímos que la

correlación es significativa y esto indica quees una correlación o

relación real, no debida al azar. Por ejemplo, si lasalidadel software

muestra un R=0,80; P<0,05,nos indica quela correlación es

significativa.

Varianza defactoresComunes

El valor de Relevado al cuadradoindicael porcentajedela variación

de una variabledebida ala variación delaotra yviceversa.

Por ejemplo, sila correlación entreproductividad y asistencia al

trabajo es de0,80. Esto es,

r 0,80

r2 0,84

Expresa quelaproductividad explica el 64%dela variacióndela

asistencia al trabajoo quela asistenciaal trabajo explica el 64%de la

productividad.

Correlación deSpearman

Esta correlación midela relación entredos variables ordinales. Por

ejemplo, para correlacionar los puntajes dedos test medidos

en una escala Likert.

Ejemplo,sea la determinación de la correlación entrelos ordenes

dellegadadado pordos jueces en 8 competenciasdenatación.

Númerode Competencias

Nadador 1 2 3 4 5 6 7 8

Juez1 10 11 9 13 7 14 6 15

Juez2 11 13 8 10 9 15 7 14

Diferencia

(D)

-1 -2 +1 +3 -2 -1 -1 +1

D2 1 4 1 9 4 1 1 1

98

El coeficientedeSpearman secalcula así:

r 1D

6

s n(n

2

2

1)

r 16(22)2

0,74 S

8(82 1)

Elvalorde0,74nosindicaqueexisteunacorrelaciónpositiva

relativamentealtaentrelapuntuacióndadaporunoyotrojuez,es

decir,queelnadadorqueobtuvounpuestodellegadaaltoenun

jueztambiénloobtuvoconelotro.Yasímismo,elqueobtuvobaja con un

juez, obtuvobaja con elotro.

Con el softwarevaciamos los datos:

Seguimosla secuencia:

99

Aparece la cajadediálogo siguiente:

Mostrando la salida(output) siguiente:

La diferencia en el resultado amano y con el softwareseatribuye a

errores deredondeo. No obstantese interpreta dela mismamanera

el resultado obtenido.

Correlación entre dos variables dicotómicas

Estecoeficientedeasociación queabordaremos midela correlación

entredos variablesnominales(desiy no, o de1 y 0).

El coeficientedeasociación Phi

( )

se calcula de la siguiente manera.

Veamos un ejemplo, sedesea encontrarla asociaciónentreacierto en

la elección delacarrera y haber recibido o no orientación

100

vocacional.Deunamuestra de50estudiantes universitarios se

registróel siguientearreglo en una tabla 2x2:

Éxito Fracaso Total

Orientados 19 11 30

Noorientados 5 15 20

Total 24 26 50

Estearreglo en símbolos es:

Éxito Fracaso Total

Orientados A B A+B

Noorientados C D C+D

Total A+C B+D A+B+C+D

Para Phila fórmulaes:

AxD BxC

(A C)(B D)(A B)(C D)

19x15 11x5

(24)(26)(30)(20)

0,376

Para interpretar Phicomo se sabequeexisteuna relación directa

entrePhi yji-cuadrado (Phi es igualala raíz cuadrada deJi sobreN)

Entoces podemos usar esta relación para afirmar quesiji-cuadrado es

significativo también lo es Phi.Enrealidad Phi es unavariación de la

fórmuladel coeficientedecorrelación r dePearson.

Veamos su determinación usando el software. Para hacerlo no

necesitamos unarchivo como tal, sino introducimoslos datos

medianteelteclado. Así:

101

La opción Two by TwoTables no da elsiguientecuadrodediálogo:

De lo antes expuesto, apreciamos que Phi=0,38y es significativo si

inspeccionamos el valor correspondientea Ji-cuadrado

102

(Ji=7,06;P=0,0079) vemos quetambién Phies significativo con un

P=0,0079.

Correlación Biserial Puntual

Esunamedidadelarelaciónquepuedehaberentreunavariable

continua(convariascategorías)unavariabledicotomizada(queel

investigadorobligóaserdicotómica).Tambiénmidelarelaciónentre una

dicotómica y una dicotomizada. Es un caso particular de la

correlaciónPearsoniana.Nosevaadesarrollarporquelamayoríade

losautoresrecomiendautilizarenestasituaciónlacorrelaciónde

Pearson.

CorrelaciónentreunaVariableNominaldevariascategoríasy

una VariableIntercalar(u ordinal)

Omega Cuadrado(2)

Estecoeficientedeasociaciónsegún Weimer(1996, p.624) está

indicado en aquelloscasos en los cuáles se requiera la asociación en

treuna variablenominal y otra (intervalar u ordinal).

Estecaso puedepresentarseen el ámbito deun ANOVA cuyo valor F

halla dado significativo ysabiendo según estevalor F quehay una

relación entrelas dos variables ahora nuestrointerés radica en

conocer el grado de intensidaddela asociación.

Elestadístico omega cuadrado(2)es un estimadorcomúndela

fuerza delas asociación entrela variabledel tratamiento yla

dependienteen unarreglo deANOVA deun solo criterio de

clasificación. Fuederivado por Hays ytienela siguientefórmula:

ˆ2 SCTRAT (k 1)CMERROR

SCT CMERROR

Donde:

103

(2): Omega cuadradodeHays

SCTRAT: Suma deCuadrados entreTratamientos

CMERROR: Cuadrado medio del error

SCT: Sumadecuadrados totales

K: es el número detratamientos

Elestadístico(2)Omega Cuadradode Hays noestá incorporado

todavía en algunossoftwareperola mayoría deellos proveelos

insumosnecesarios para poder determinarlo en forma indirecta.

Para suinterpretación debeutilizarseel siguientebaremo:

Rango (2) deOmegaCuadrado Intensidad deRelación

0,00a 0,29

0,30a 0,69

0,70a 1,00

Débil

Moderada

Fuerte

Con el Estadístico Omega Cuadrado de Hays no debe hablarse de direccionalidad positivaonegativaporqueno hay forma de saber la direccionalidad

104

Ejemplo de aplicación del Omega CuadradodeHays

Serealizó un experimento para determinar:

(a) Si son distintas las medias del número de cirugías de

pacientes externos realizadas (por semana) en tres

hospitales: General del Sur,Universitario y Coromoto.

(b) Laintensidaddelarelaciónentreelnúmerodecirugíaspor

semana y el tipo dehospital

Hospital General

del Sur

Hospital Universitario

deMaracaibo

Hospital Coromoto

19

19

18

14

12

25

23

22

21

22

25

23

23

13

14

16,4=Media 22,6=Media 19,6=Media

La matriz dedatos(en formato categorical) para el Statistixes:

cirugias hospital

19

25

25

19

23

23

18

22

23

14

21

13

12

22

14

1

2

3

1

2

3

1

2

3

1

2

3

1

2

3

105

Las opciones del menú son:

La caja de diálogo es:

Aunquela Fde Fisher no resultó significativa, serealizará el cálculo

del Omega cuadrado como ejemplo didáctico:

106

Entonces el OmegaCuadrado es:

ˆ2 SCTRAT (k 1)CMERROR

SCT CMERROR

ˆ2 96,13 (3 1)14,8

273,733 14,8

125,73

288,533

0,4357

En consecuencia, el 43,57%dela varianza en el número de

cirugíaspuedeser atribuido a lavariablehospital.

Se hace hincapié enel hecho que sólo debe realizarse el cálculo del Omega Cuadrado cuandoel estadístico F hallaresultado significativo.

Correlación Parcial

La correlación parcial se define como la correlación entre dos

variables manteniendo las variables intervinientes controladas.

Es muy útil cuando entre las variables no se manifiestas las

verdaderascorrelacionesacausadequeunaterceravariableopaca la

correlación entreaquellasdos.

Unejemplodeestetiposeobservaenelefectomediadorque

ejercenlascalificaciones(variableinterviniente)enelefectoquela

motivación del alumno tiene sobre la evaluación que hace del

profesor; los resultados de las investigaciones educacionales

muestran,porejemplo,quelosalumnosconbajamotivaciónhaciael

trabajoacadémicoevaluarán desfavorablementecuandoobtienen

calificacionesbajasyfavorablecuandoobtienenaltascalificaciones. Por lo

tanto, si el interés está dirigido a determinar la relación

verdaderaogenuinaentremotivaciónyevaluación,seránecesario emplear

un control estadístico que permita extraer tanto de la

107

Y2 12

r

r :

: Y2

12

motivacióncomodelaevaluación,elefectodelascalificaciones.Este control

selogra calculando elcoeficientedecorrelación parcial.

Lacorrelaciónparcialesunaestimacióndelacorrelaciónentredos

variablesdespuésderemoverdeellaslosefectosdeotravariables

(variablemediadorao interviniente)

Simbólicamente, ry1.2representalacorrelaciónparcialentreYyX1

después quesehaexcluidodeellas el efecto deX2.

La fórmula queseemplea es:

r rY1 rY2r12

Y1.2

(1 r2 )(1 r2)

Es decir, en elnumeradortenemos:

rY1:es la correlación simpleentreY y X1

rY2 :

es la correlación simpleentreY y X2

r12:es la correlación simpleentreX1y X2

Enel denominador figura:

2 es el coeficientededeterminación entreY y X2

2 es el coeficientededeterminación entreX1y X2

A este coeficiente también se le denomina: Coeficiente de

CorrelaciónParcialdePrimerOrden,debidoaquesólosecontrolóo

parcializóunavariableX2.Sisecontrolapordosvariablessedenota como:

rY1.23

:yselellamaCoeficientedeCorrelaciónParcialdeSegundo

Orden y así sucesivamente.

En el modelo de la regresión lineal múltiple,elcoeficiente de

correlaciónparcial,seconcibecomounarelaciónentrevarianzas

residuales.Enestecontexto,tambiénseempleaelcoeficientede correlación

parcialal cuadrado.

108

r Y2

Paraentendermejorelsignificadodelcoeficientedecorrelación parcial y

su correspondiente coeficiente al cuadrado, resulta útil

emplearelmismodiagramaquepresentanCohenyCohen(1983)y

quecomúnmenteesempleadoparaexplicarlanocióndevarianza

compartida.

Eneldiagramalavarianzadecadavariableserepresentaporun

círculodeáreaigualalaunidad.Lasáreassuperpuestasdedos

círculosrepresentanlarelaciónentrelasdosvariables,cuantificada

por r2.El área total de Y cubierta por las áreas de X1 y X2 representanlaproporcióndelavarianzadeYqueesexplicadapor

dosvariablesindependientesyserepresentapor

R2.

Eldiagrama muestra, queesta proporción es igualala suma delasáreas a, b y c.

Las áreas a y b representan aquella porción de Y explicada

únicamenteporX1yX2,respectivamente;entantoqueeláreac

representalaproporcióndeYqueesexplicadasimultáneamentepor X1y

X2.

ElcoeficientedecorrelaciónparcialalcuadradodeYconX1

parcializando o controlando a X2seexpresa así:

a R R2

2

Y1.2 a m

Y12 Y.2

1 R2

109

R

r Y2

Y2 Donde 2

r2, esdecir, rY2 eselcoeficientedecorrelaciónde

orden ceroentreYy X2. Nótese queen la fórmulaanterior:

a R R2 2

2

Y1.2 a m

Y12 Y.2 , el 1 R2

rY1.2 representa la proporción de la

varianzadeYqueesestimadaoexplicadasóloporX1,esdecir,el

coeficientedecorrelaciónparcialalcuadradorespondealapregunta:

¿cuánto de la varianza en Y que no es estimada por las otras

variables,es estimada por X1?

EjemplodeAplicación deCorrelación Parcial

Acontinuaciónsepresentalainformaciónsuministradapor32

supervisores de la empresa MAXY,en la cualse registró por el gerente

de recursos humanos, la motivación de logro X1 y la

percepcióndelambientedetrabajoX2,ademásdelaevaluacióndel

desempeño Y. El gerentepretendeverificar la hipótesissiguiente:

“La motivación de logro delsupervisor y la percepción que el

mismo tiene del ambiente de trabajo, contribuirán de manera

importantea explicar la evaluación deldesempeño queellos hacen”

MatrizdeDatos

Supervisor Desempeño

Y

Motivación de

LogroX1

Percepción del

AmbienteX2

01

02

03

04

05

06

07

08

09

10

6

9

4

6

3

8

4

2

10

1

5

7

5

6

3

8

2

2

5

1

4

4

6

9

5

4

5

4

7

3

110

R

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

31

32

10

6

9

9

6

5

10

7

9

8

10

9

5

2

2

5

10

2

6

8

1

4

8

10

4

3

4

5

9

19

3

4

8

4

10

2

2

5

5

4

4

8

1

5

6

5

7

6

6

7

7

6

5

5

8

6

4

4

5

8

7

6

7

4

2

6

Nota:La escala devaloración fuede01a 10

Enesteejemplo,lascorrelaciones simples (orden cero) son:

rY1 0,529

rY2 0,447

r12 0,247

El coeficientededeterminación múltiplees:

2

Y.12

0,385

111

r Y2

r

El coeficiente de correlación parcial de Y (desempeño) con

motivacióndelogro(X1)controlandoporPercepcióndelambientede

trabajo (X2) es:

a R R2

2

Y1.2 a m

Y12 Y2

1 R2

Sustituyendo en la fórmula anterior:

2

Y1.2

0,385 0,199

1 0,199

0,232, la raíz cuadrada de este valor es la

correlación parcial deY con X1eliminando la influencia deX2:

rY1.2 0,4816,querepresentalaverdaderacorrelaciónentreYyX1 después de

remover X2 y representa una baja correlación entre

evaluacióndeldesempeñoymotivacióndelogrodelossupervisores,

controlando por el efecto dela percepción del ambientelaboral.

EnSTATISTIX,lasecuenciaempleadaparaobtenerestoscoeficientes

es:

Se dejaallectorlatareade

verificar dichoscálculos

112

Coeficiente deConfiabilidad Alphade Cronbach:

Validez Es la eficacia conqueun instrumento midelo quesepretende

medir Confiabilidad Es el grado con queseobtienen resultados similares en distintas aplicaciones

113

114

S

S

S

S

CoeficientedeConfiabilidad deHoyt:

El coeficientedeconfiabilidaddeHoyt es:

S2

r 1 error tt 2

sujetos

2

r 1Serror

11,08

0,77

tt 2

sujetos 4,75

Donde: 2

error 1,08(varianza del error) 2

sujetos 4,75(varianza debida a los sujetos) De acuerdo a la escala de interpretación dadapor RuizBolivar

(2002;p.70):

Rangos Categoría

0,81a 1,00

0,61a 0,80

0,41a 0,60

0,21a 0,40

0,01a 0,20

Muy alta

Alta

Moderada Baja

Muy baja

Sepuedeconcluir,queel instrumentodemedición en estudio tiene

un coeficientedeconfiabilidad alto.

Nota:el coeficientedeHoyt aparece reseñado en:

RuizBolivar, C. (2002) Instrumentos deInvestigación Educativa.

Procedimientos para su diseñoy validación.Cideg. Lara. Venezuela; pp.68-70

115

116

117

118

119