pearson y de sperman

17
Instituto Universitario Politécnico “Santiago Mariño” Extensión Caracas Ingeniera Civil 42 A Coeficientes de correlación de Pearson y de Sperman Autor: Palencia John.CI: 24.991.633 Asignatura: Estadística Profesora: María Romano

Upload: john-palencia

Post on 09-Apr-2017

73 views

Category:

Education


1 download

TRANSCRIPT

Page 1: Pearson y de Sperman

Instituto Universitario Politécnico

“Santiago Mariño”

Extensión Caracas

Ingeniera Civil 42 A

Coeficientes de correlación de Pearson y de Sperman

Autor:

Palencia John.CI: 24.991.633

 Asignatura: Estadística

Profesora:

María Romano

Page 2: Pearson y de Sperman

Coeficiente de Pearson

Es un índice que mide el grado de covariación entre distintas variables relacionadas linealmente. Adviértase que decimos "variables relacionadas linealmente". Esto significa que puede haber variables fuertemente relacionadas, pero no de forma lineal, en cuyo caso no proceder a aplicarse la correlación de Pearson.

En el caso de que se esté estudiando dos variables aleatorias X y Y sobre una población; el coeficiente de correlación de Pearson se simboliza con la letra P x y siendo la expresión que nos permite calcularlo:

Page 3: Pearson y de Sperman

Uso de los coeficientes de correlación de Pearson 

Identifica el dependiente variable que se probará entre dos observaciones derivadas independientemente. Uno de los requisitos es que las dos variables que se comparan deben observarse o medirse de manera independiente para eliminar cualquier resultado sesgado.

Reporta un valor de correlación cercano a 0 como un indicador de que no hay relación linear entre las dos variables.

Reporta un valor de correlación cercano al 1 como indicador de que existe una relación linear positiva entre las dos variables. Un valor mayor a cero que se acerque a 1 da como resultado una mayor correlación positiva entre la información.

Para cantidades grandes de información, el cálculo puede ser tedioso.

Page 4: Pearson y de Sperman

Karl Pearson 

Karl Pearson (Londres 27 de marzo de 1857- Londres, 27 de abril de 1936) fue un prominente científico, matemático y pensador británico, que estableció la disciplina de la estadística matemática. Desarrolló una intensa investigación sobre la aplicación de los métodos estadísticos en la biología y fue el fundador de la bioestadística.

Page 5: Pearson y de Sperman

Ejemplo Coeficiente de Pearson

La gráfica (a) representa una correlación positiva, es decir, conforme los valores de X aumentan, también aumentan los valores de Y.

(b) muestra una correlación negativa, de modo que al incrementarse los valores de la variable independiente, los valores de la dependiente disminuyen.

(c) no indica correlación.

Page 6: Pearson y de Sperman

Ejemplo Coeficiente de Pearson

Dónde:r = coeficiente de correlación de Pearson.Sxy = sumatoria de los productos de ambas variables.Sx = sumatoria de los valores de la variable independiente.Sy = sumatoria de los valores de la variable dependiente.Sx2 = sumatoria de los valores al cuadrado de la variable independiente.Sy2 = sumatoria de los valores al cuadrado de la variable dependiente.N = tamaño de la muestra en función de parejas.

Page 7: Pearson y de Sperman

Ventajas Coeficiente de Pearson

Cuando en el fenómeno estudiado las dos variables son cuantitativas se usa el coeficiente de correlaciones de Pearson.

Es llamado así en homenaje a Karl Pearson. Las dos variables son designadas por X e Y.  El valor del coeficiente de correlación es independiente de cualquier unidad usada para medir

variables. Mientras más grande sea la muestra más exacta será la estimación.

Page 8: Pearson y de Sperman

Desventajas Coeficiente de Pearson

El valor 0 representa falta de correlación. Cuando las variables X e Y son independientes, el numerador se anula y el coeficiente de correlación

poblacional tiene el valor cero. En cambio una correlación nula no implica la independencia de variables. Requiere supuestos acerca de la naturaleza o formas de las poblaciones afectadas. Requiere que las dos variables hayan ido medidas hasta un nivel cuantitativo continuo y que la

distribución de ambas sea semejante a la de la curva normal.

Page 9: Pearson y de Sperman

Coeficiente de Correlación Spearman

La correlación de Spearman es una medida de relación lineal entre dos variables. Se diferencia de la correlación de Pearson en que utiliza valores medidos a nivel de una escala ordinal. Si alguna de las variables está medida a nivel de escala de intervalo/razón deberá procederse antes de operar el estadístico a su conversión en forma ordinal.

El estadístico ρ viene dado por la expresión:

Page 10: Pearson y de Sperman

Uso de Coeficiente de Correlación Spearman

Permite predecir el valor de una variable dado un valor determinado de la otra variable.  Se trata de valorar la asociación entre dos variables cuantitativas estudiando el método conocido como

correlación.  Dicho cálculo es el primer paso para determinar la relación entre las variables. Consiste en la posibilidad de calcular su distribución muestral y así poder determinar su error típico de

estimación. Reporta un valor de correlación cercano a 1 como un indicador de que existe una relación lineal positiva

entre las 2 variables. Un valor mayor a cero que se acerque a 1 da como resultado una mayor correlación positiva entre la información.

Page 11: Pearson y de Sperman

Charles Edward Spearman 

Charles Edward Spearman (Londres, 10 de septiembre de 1863-Londres, 7 de septiembre de 1945) fue un psicólogo inglés. Estudió en las universidades de Leipzig, Wurzburgo y Göttingen y enseñó e investigó en la Universidad de Londres (1907 - 1931). Formuló la teoría de que la inteligencia se compone de un factor general y otros específicos. Creyó en la existencia de un factor general que interviene en todas las fases de la conducta humana y atribuyó a las capacidades específicas papel determinante en cada actividad.

Page 12: Pearson y de Sperman

Ventajas Coeficiente de Correlación Spearman

No está afectada por los cambios en las unidades de medida.  Al ser Spearman una técnica no paramétrica es libre de distribución probabilística (2, 5, 9). Los supuestos son menos estrictos. Es robusto a la presencia de outliers (es decir permite ciertos

desvíos del patrón normal).  La manifestación de una relación causa-efecto es posible sólo a través de la comprensión de la

relación natural que existe entre las variable y no debe manifestarse sólo por la existencia de una fuerte correlación (1, 5). 

No se asume relación lineal entre las variables.

Page 13: Pearson y de Sperman

Desventajas Coeficiente de Correlación Spearman

Requiere supuestos acerca de la naturaleza o formas de las poblaciones afectadas.  Requiere que las dos variables hayan ido medidas hasta un nivel cuantitativo continuo y que la

distribución de ambas sea semejante a la de la curva normal. El valor 0 representa falta de correlación. Cuando las variables X e Y son independientes, el numerador se anula y el coeficiente de correlación

poblacional tiene el valor cero.  En cambio una correlación nula no implica la independencia de variables.

Page 14: Pearson y de Sperman

Ejemplo Coeficiente de Correlación Spearman

El tamaño de la muestra influye que durante el ordenamiento en rangos puedan existir ligas o empates. Para estos casos, los pasos son los mismos, pero la fórmula no es aplicable. Las ecuaciones que se deben utilizar en esta condición son las siguientes:

Dónde:rs = coeficiente de correlación de Spearman.SX2 = sumatoria de los cuadrados de la variable independiente.

Page 15: Pearson y de Sperman

Ejemplo Coeficiente de Correlación Spearman

Dónde:N = tamaño de la muestra.SLx = sumatoria de las ligas o empates de la variable independiente.

Dónde:Li = valor del número de rangos empatados.

Page 16: Pearson y de Sperman

Ejemplo sin ligas o empates