seminario iv: correlación

9
FC 96 65 100 90 72 95 61 82 Eda d 47 58 35 72 69 52 24 80 medimos la frecuencia cardiaca (FC) y la edad. 1. Di si en la muestra, existe asociación lineal o correlación entre las dos variables y por qué. Y si existe, ¿Cómo es la correlación? 2. Averigua, usando SPSS y también sin usar SPSS, si existe correlación entre FC y edad en la población de donde proviene la muestra, para un nivel significación de 0.01, razonando paso a paso la decisión tomada.

Upload: manucla50

Post on 09-Feb-2017

149 views

Category:

Science


0 download

TRANSCRIPT

FC 96 65 100 90 72 95 61 82

Edad 47 58 35 72 69 52 24 80

En una muestra de 8 personas medimos la frecuencia cardiaca (FC) y la edad.1. Di si en la muestra, existe asociación lineal o correlación entre las dos variables y por qué. Y si existe, ¿Cómo es la correlación?2. Averigua, usando SPSS y también sin usar SPSS, si existe correlación entre FC y edad en la población de donde proviene la muestra, para un nivel significación de 0.01, razonando paso a paso la decisión tomada.

Para comenzar, introducimos los datos en el programa estadístico estadísticos en SPSS y creamos el diagrama de dispersión. A priori, la grafica no presenta correlación, ya que es difícil trazar una línea imaginaria que esté cerca de todos los puntos representados.

Establecemos las hipótesis

- H0= No existe correlación entre las variables, por lo que r =0- H1= Existe correlación entre las variables, por lo que r≠0

El siguiente paso es comprobar si las variables presentan una distribución normal.Para ello tenemos dos posible pruebas:• Shapiro-Wilk si n < 50• Kolmogorov-Smirnov si n > 50.Por tanto, utilizaremos la prueba de normalidad de Shapiro-Wilk

Pruebas de normalidad

,188 8 ,200* ,908 8 ,342,149 8 ,200* ,971 8 ,906

Frecuencia_cardiadaEdad

Estadístico gl Sig. Estadístico gl Sig.Kolmogorov-Smirnova Shapiro-Wilk

Este es un límite inferior de la significación verdadera.*.

Corrección de la significación de Lillieforsa.

Como el p-Valor o la significancia es mayor que nuestro α (intervalos de confianza), podemos aplicar el índice de correlación de Pearson

0,342 > 0,05

En esta imagen calculamos el índice de correlación de Pearson. Como la fórmula es larga y requiere de muchos cálculos, utilizamos la tabla para hacerlos mas fáciles de realizar.

Como vemos, la correlación es 0,04, un número muy bajo.

Con esta fórmula, utilizando el estadístico T-Student, comprobamos si la muestra es representativa de la población.El siguiente paso, buscamos cual es el punto crítico en una tabla de T-Student y lo comparamos con el resultado de arriba.

Con 6 grados de libertad y un α de 0,01, el nivel crítico es de 3,1427.

Como 3,1427 > 0,058, la muestra no es representativa de la población

Si utilizáramos SPSS, no haría falta calcular la correlación de Pearson, ya que lo calcularía el programa.

Podemos concluir también que como el P-Valor es mayor que el nivel de confianza α (0,919 > 0,01) los datos que nos salen en la muestra NO SON REPRESENTATIVOS DE LA POBLACIÓN

CONCLUSIÓN

Como la correlación está muy lejos de la perfección, que sería r=1, la muestra nos informa que no tiene porque ser representativa de la población. Al comprobarlo (con el P-Valor y α), confirmamos que la muestra no es representativa de la población. Por tanto, tendríamos que rechazar la hipótesis alterna, aceptando la hipótesis nula H₀