coeficiente de relacion de pearson y spearman

12
Republica Bolivariana De Venezuela Ministerio Del Poder Popular Para La Educación Superior I.U.P. “SANTIAGO MARIÑO” Bachiller: Duryelis García C.I 25.312.1474

Upload: 20740076

Post on 16-Feb-2017

150 views

Category:

Science


0 download

TRANSCRIPT

Page 1: Coeficiente de relacion de pearson y spearman

Republica Bolivariana De Venezuela Ministerio Del Poder Popular Para La Educación Superior

I.U.P. “SANTIAGO MARIÑO”

Bachiller:Duryelis García C.I 25.312.1474

Page 2: Coeficiente de relacion de pearson y spearman

Coeficiente de relación de PearsonEn estadística, el coeficiente de correlación de Pearson es una medida de la relación lineal

entre dos variables aleatorias cuantitativas. A diferencia de la covarianza, la correlación de Pearson es independiente de la escala de medida de las variables.

De manera menos formal, podemos definir el coeficiente de correlación de Pearson como un índice que puede utilizarse para medir el grado de relación de dos variables siempre y cuando ambas sean cuantitativas.

𝜌 ₓ ᵧ= 𝜎 𝑥𝑦𝜎 𝑥𝑦=𝐸 [ (𝑋 −𝜇𝑥 ) ]−(𝑋 −𝜇 𝑦 )¿ ¿

𝜎 𝑥𝜎 𝑦Donde: es la varianza de (X, Y). es la desviación típica de la variable X. es la desviación típica de la variable Y.

Page 3: Coeficiente de relacion de pearson y spearman

Uso Del Coeficiente De Pearson Identifica el dependiente variable que se probará entre dos observaciones derivadas independientemente. Uno de los requisitos es que las dos variables que se comparan deben observarse o medirse de manera independiente para eliminar cualquier resultado sesgado.

Para cantidades grandes de información, el calculo puede ser tedioso.

Reporta un valor de correlación cercano a 0 como un indicador de que no hay relación linear entre las dos variables. Reporta un valor de correlación cercano al 1 como indicador de que existe una relación linear positiva entre las dos variables. Un valor mayor a cero que se acerque a 1 da como resultado una mayor correlación positiva entre la información.

Reporta un valor de correlación cercano a -1 como indicador de que hay una relación linear negativa entre las dos variables.

Interpreta el coeficiente de correlación de acuerdo con el contexto de los datos particulares. El valor de correlación es esencialmente un valor arbitrario que debe aplicarse de acuerdo con las variables que se comparan.

Page 4: Coeficiente de relacion de pearson y spearman

Aplicación de uso de enfoques de Pearson a problemas de estadísticos

En la perspectiva de Pearson, para establecer el nivel de significación estadística habría que atender al impacto de cada tipo de error en el objetivo del investigador, y a partir de ahí se decidiría cuál de ellos es preferible minimizar. Pearson llamaron alfa al error tipo I y beta al error tipo II; a partir de este último tipo de error, introdujeron el concepto de “poder de una prueba estadística”, el cual se refiere a su capacidad para evitar el error tipo II, y está definido por 1-beta, y en estrecha relación con éste se ha desarrollado el concepto de “tamaño del efecto” que algunos han propuesto como sustituto de los valores p en los informes de investigación científica. Las pruebas paramétricas más conocidas y usadas son la prueba T de Student, la prueba F, llamada así en honor a Fisher, y el coeficiente de correlación de Pearson, simbolizado por r.En la perspectiva de Pearson, para establecer el nivel de significación estadística habría que atender al impacto de cada tipo de error en el objetivo del investigador, y a partir de ahí se decidiría cuál de ellos es preferible minimizar. Pearson llamaron alfa al error tipo I y beta al error tipo II; a partir de este último tipo de error, introdujeron el concepto de “poder de una prueba estadística”, el cual se refiere a su capacidad para evitar el error tipo II, y está definido por 1-beta, y en estrecha relación con éste se ha desarrollado el concepto de “tamaño del efecto” que algunos han propuesto como sustituto de los valores p en los informes de investigación científica.

Page 5: Coeficiente de relacion de pearson y spearman

Enfoque de Pearson Aplicación de la prueba estadística

Las observaciones de cada variable se deben ordenar en rangos, así como obtener las diferencias entre los rangos, efectuar la sumatoria y elevar ésta al cuadrado.Educación de algunas madres y calificación de desarrollo mental de los hijos.Calculo de los grados de libertad (gl). {gl = numero de parejas - 1 = 8 - 1 = 7}El valor rs calculado se compara con los valores críticos de rs del coeficiente de correlación por rangos de Spearman. El valor crítico de rs con 7 grados de libertad, para una probabilidad de 0.05 del nivel de significancia es 0.714, o sea, mayor que el calculado. Por lo tanto, éste tiene una probabilidad mayor que 0.05. Decisión Como el valor de probabilidad de rs de 0.69 es mayor que 0.05, se acepta Ho y se rechaza Ha. Interpretación El coeficiente de correlación de Spearman de 0.69 es menor que los valores críticos de la tabla, pues a éstos corresponde la probabilidad de obtener esa magnitud, al nivel de confianza de 0.05 y 0.01, para 0.714 y 0.893. Esto significa que para aceptar Ha, se requiere tener un valor igual o más lato que 0.714.

Page 6: Coeficiente de relacion de pearson y spearman

Ventajas y desventajas de la correlación de Pearson

Ventajas :

► Reporta un valor de correlación cercano a -1 como indicador de que hay una relación linear negativa entre las dos variables.

► Interpreta el coeficiente de correlación de acuerdo con el contexto de los datos particulares. El valor de correlación es esencialmente un valor arbitrario que debe aplicarse de acuerdo con las variables que se comparan.

Desventajas:

El coeficiente de correlación debe ser seleccionado en base a las escalas de medidas usadas en cada una de las variables.

El tamaño de muestra para construir intervalo de confianza para el coeficiente de correlación poblacional de Pearson es función de la longitud del intervalo, de la probabilidad de confianza y del coeficiente de correlación muestral. Por esta razón se sugiere un procedimiento secuencial para este propósito.

Page 7: Coeficiente de relacion de pearson y spearman

Coeficiente de correlación de spearman En estadística, el coeficiente de correlación de Spearman, ρ (rho) es una medida de la correlación (la asociación o interdependencia) entre dos variables aleatorias continuas. Para calcular ρ, los datos son ordenados y reemplazados por su respectivo orden.El estadístico ρ viene dado por la expresión:

donde D es la diferencia entre los correspondientes estadísticos de orden de x - y. N es el número de parejas.Se tiene que considerar la existencia de datos idénticos a la hora de ordenarlos, aunque si éstos son pocos, se puede ignorar tal circunstanciaPara muestras mayores de 20 observaciones, podemos utilizar la siguiente aproximación a la distribución t de Student.

La interpretación de coeficiente de Spearman es igual que la del coeficiente de correlación de Pearson Oscila entre -1 y +1, indicándonos asociaciones negativas o positivas respectivamente, 0 cero, significa no correlación pero no independencia. La tau de Kendall es un coeficiente de correlación por rangos, inversiones entre dos ordenaciones de una distribución normal bivariante.

Page 8: Coeficiente de relacion de pearson y spearman

Uso del coeficiente de correlación de spearman

► A partir de un conjunto de n puntuaciones, la fórmula que permite el cálculo de la correlación entre dos variables X e Y, medidas al menos en escala ordinal, es la siguiente:

► Donde d es la distancia existente entre los puestos que ocupan las puntuaciones correspondientes a un sujeto i cuando estas puntuaciones han sido ordenadas para X y para Y.

𝑟 𝑠=1−6∑ 𝑑𝑖

2

𝑛(𝑛2−1)

Page 9: Coeficiente de relacion de pearson y spearman

Aplicación de uso de enfoques de spearman a problemas de estadísticos.

Enfoque psicométrico de los factores de la inteligencia (Spearman, Catell, Thurstone)

• El enfoque psicométrico utiliza técnicas de análisis factorial con la idea de descubrir las diferencias individuales de la inteligencia entre las personas. Para ello se recurre al uso de los tests de inteligencia.

• Spearman distingue dos factores: el factor “G” y el factor “S”. El “G” es la inteligencia general (común a la mayoría de las personas). El “S” son las habilidades específicas de la inteligencia (verbal, numérica, espacial, etc.)

Page 10: Coeficiente de relacion de pearson y spearman

Propiedades del Coeficiente de Correlación de Spearman

► El coeficiente de correlación de Spearman se encuentra siempre comprendido entre los valores -1 y 1. Es decir, -1 < rs < 1.

► Cuando todos los sujetos se sitúan en el mismo puesto para la variable X y para la variable Y, el valor de rs es 1. Si ocupan valores opuestos, es decir, al primer sujeto en X le corresponde el último lugar en Y, al segundo en X le corresponde el penúltimo en Y, etc., entonces el valor de rs es -1.

► El coeficiente rs es un caso particular de rxy, puesto que se calcula a partir de éste, por aplicación del coeficiente de Pearson a valores ordinales considerados como puntuaciones.

Page 11: Coeficiente de relacion de pearson y spearman

Ventajas y desventajas de coeficiente de correlación de spearman

Ventajas:► Al ser Spearman una técnica no paramétrica

es libre de distribución probabilística.► Los supuestos son menos estrictos. Es

robusto a la presencia de outliers (es decir permite ciertos desvíos del patrón normal).

► La manifestación de una relación causa-efecto es posible sólo a través de la comprensión de la relación natural que existe entre las variable y no debe manifestarse sólo por la existencia de una fuerte correlación.

Desventajas:

► Es asociada entre dos variables aleatorias continuas.

► 0 cero, significa no correlacion pero no independencia.

► R no debe ser usado para decir algo sobra la relación causa y efecto.