coeficientes de correlación pearson y sperman

12
Coeficientes de correlación Pearson y Spearman Republica Bolivariana de Venezuela Ministerio del Poder Popular para la Educación I.U.P «Santiago Mariño» Barcelona, edo. Anzoátegui Realizado por: Jaimes Garnica Leidy C.I: 25 921 484

Upload: andreagarnicaj

Post on 14-Feb-2017

70 views

Category:

Engineering


1 download

TRANSCRIPT

Page 1: Coeficientes de correlación pearson y sperman

Coeficientes de correlación Pearson y Spearman

Republica Bolivariana de VenezuelaMinisterio del Poder Popular para la Educación

I.U.P «Santiago Mariño»Barcelona, edo. Anzoátegui

Realizado por: Jaimes Garnica LeidyC.I: 25 921 484

Page 2: Coeficientes de correlación pearson y sperman

Como determinar el uso de los coeficientes de correlación de Pearson y Sperman

Un coeficiente de correlación, mide el grado de relación o asociación

existente generalmente entre dos variables aleatorias.

Coeficiente de correlación de Pearson

Tiene como objetivo medir la fuerza o grado de asociación entre dos variables aleatorias cuantitativas que poseen una distribución normal bivariada conjunta. El coeficiente se define por la siguiente fórmula:

Cuando ρ=+ la relación es directa entre las variables. Si ρ=- la relación es inversa y si ρ= 0 son independientes. Dicho coeficiente se puede expresar en términos de su estadístico como:

Page 3: Coeficientes de correlación pearson y sperman

El coeficiente de correlación de Pearson es la media geométrica entre las pendientes de los modelos de regresión lineal simple Y/X, X/Y así:

donde: βo = intercepto del modelo.β1= pendiente del modelo, cambio esperado en y por unidad de cambio en x

Por el método de los mínimos cuadrados ordinarios Ahora Xi = βo ′ + β1 ′ Yi + εi ′

Page 4: Coeficientes de correlación pearson y sperman

• Permite predecir el valor de una variable dado un valor determinado de la otra variable.

• Se trata de valorar la asociación entre dos variables cuantitativas estudiando el método conocido como correlación. Dicho cálculo es el primer paso para determinar la relación entre las variables. 

•  Consiste en la posibilidad de calcular su distribución muestral y así poder determinar su error típico de estimación.

• Reporta un valor de correlación cercano a 0 como un indicador de que no hay relación lineal entre 2 variables.

• Reporta un valor de correlación cercano a 1 como un indicador de que existe una relación lineal positiva entre las 2 variables. Un valor mayor a cero que se acerque a 1 da como resultado una mayor correlación positiva entre la información.

Usos

Page 5: Coeficientes de correlación pearson y sperman

Ventajas Desventajas

• El valor del coeficiente de correlación es independiente de cualquier unidad usada para medir variables.

• Mientras mas grande sea la muestra mas exacta será la estimación. 

• Puede utilizarse para medir el grado de relación de dos variables siempre y cuando ambas sean cuantitativas. 

• Su magnitud indica el grado de asociación entre las variables

• Error que se comete para la medida.

• Cuanto mayor número de pares o de personas es más fiable. 

• No refleja cambios en los patrones de compra conforme pasa el tiempo. 

•  Requiere supuestos acerca de la naturaleza o formas de las poblaciones afectadas

• Requiere que las dos variables hayan ido medidas hasta un nivel cuantitativo continuo y que la distribución de ambas sea semejante a la de la curva normal.

Page 6: Coeficientes de correlación pearson y sperman

Coeficiente de correlación de Spearman

El coeficiente de correlación de Spearman es un coeficiente no paramétrico alternativo al coeficiente de correlación de Pearson. Charles Spearman contribuyó al análisis del factor, a la teoría de la inteligencia, elaboró una prueba de la teoría mental.

Se define el coeficiente de correlación de rangos de Spearman como el coeficiente de correlación lineal entre los rangos Ri(x) y Ri(y), en la fórmula de Pearson se reemplaza Xi por Ri(x) y Yi por Ri (y) quedando:

Por lo tanto el coeficiente de correlación de Spearman resulta como:

Page 7: Coeficientes de correlación pearson y sperman

  La interpretación de coeficiente de Spearman es igual que la del coeficiente de correlación de Pearson. Oscila entre -1 y +1, indicándonos asociaciones negativas o positivas respectivamente, 0 cero, significa no correlación pero no independencia. La tau de Kendall es un coeficiente de correlación por rangos, inversiones entre dos ordenaciones de una distribución normal bivariante.

• Para aplicar la correlación de Spearman se requiere que al menos las variables estén medidas en al menos escala ordinal, es decir, de forma que las puntuaciones que la representan puedan ser colocadas en dos series ordenadas.

• Una generalización del coeficiente de Spearman es útil en la situación en la cual hay tres o más condiciones, varios individuos son observados en cada una de ellas, y predecimos que las observaciones tendrán un orden en particular. Por ejemplo, un conjunto de individuos pueden tener tres oportunidades para intentar cierta tarea, y predecimos que su habilidad mejorará de intento en intento. 

•  El coeficiente de correlación de Spearman es recomendable utilizarlo cuando los datos presentan valores extremos, ya que dichos valores afectan mucho el coeficiente de correlación de Pearson, o ante distribuciones no normales. No está afectada por los cambios en las unidades de medida.

Usos

Page 8: Coeficientes de correlación pearson y sperman

•  Este coeficiente es una medida de asociación lineal que utiliza los rangos, números de orden, de cada grupo de sujetos y compara dichos rangos. Existen dos métodos para calcular el coeficiente de correlación de los rangos: uno, señalado por Spearman y otro, por Kendall. El r de Spearman llamado también rho de Spearman es más fácil de calcular que el de Kendall.

Ventajas • Al ser Spearman una técnica no

paramétrica es libre de distribución probabilística

• Los supuestos son menos estrictos. Es robusto a la presencia de outliers (es decir permite ciertos desvíos del patrón normal). La manifestación de una relación causa-efecto es posible sólo a través de la comprensión de la relación natural que existe entre las variable y no debe manifestarse sólo por la existencia de una fuerte correlación

Desventajas •  Es recomendable usarlo cuando

los datos presentan valores extremos, ya que dichos valores afectan mucho el coeficiente de correlación de Pearson, o ante distribuciones no normales. r no debe ser utilizado para decir algo sobre la relación entre causa y efecto.

Page 9: Coeficientes de correlación pearson y sperman

Ejemplo del Coeficiente de correlación de Pearson

La siguiente tabla representa las notas en Algebra y Física de estudiantes elegidos al azar:

De los datos se tiene que: n=10

Page 10: Coeficientes de correlación pearson y sperman

Determine la recta de regresión de y sobre x Para determinar las constantes, tenemos:

Luego, el sistema de ecuaciones que debemos resolver es el siguiente:

Luego reemplazando en a1 en: se tiene que:

Page 11: Coeficientes de correlación pearson y sperman

Por lo tanto, la ecuación de la recta de regresión de y sobre x es:Y=29.23 + 0.66x

Determine el centroide ()

Luego el centroide es () = (79.8, 81.9)

Halle el coeficiente de correlación