estadistica pearson y sperman
TRANSCRIPT
República Bolivariana de VenezuelaMinisterio del Poder Popular Para La Educación
I.U.P. Santiago Mariñoescuela - 44 Ing electrónica
Estadistica
Alfredo hernandez
CI. 26.911.103
escuela - 44
ing electrónica
A diferencia de la covarianza, la correlación
de Pearson es independiente de la escala de medida de las variables
que puede utilizarse para medir el grado de relación de
dos variables siempre y cuando ambas sean
cuantitativas
Es un índice estadístico que mide la relación lineal entre dos variables cuantitativas
De manera menos formal, podemos definir el coeficiente
de correlación de Pearson como un índice
En el caso de que se esté estudiando dos variables aleatorias X y Y sobre una población el coeficiente
de correlación de Pearson se simboliza con la letra P,x,y siendo la expresión que nos permite
calcularlo
es la covarianza de X,Yes la desviación típica de la Xes la desviación típica de la Y
De manera análoga podemos calcular este coeficiente sobre un estadístico muestral, denotado como
Si r = 1, existe una correlación positiva perfecta.
Si 0›r≥1, existe una correlación positiva.
Si r = -1, existe una correlación negativa perfecta.
Si -1≤ r›0, existe una correlación negativa.
Siendo:
Sx la covarianza de (X,Y)
Sx y Sy las desviaciones típicas de las distribuciones marginales.
El cálculo del coeficiente de correlación lineal se realiza dividiendo
la covarianza por el producto de las desviaciones estándar de ambas
variablesr = Sxy
Sx.Sy
El valor del índice de correlación varía en el intervalo [-1, + 1]:
Si r = 0, no existe relación lineal. Pero esto no necesariamente implica una independencia total entre las dos variables, es decir, que la variación de una de ellas puede influir en el
valor que pueda tomar la otra. Pudiendo haber relaciones no lineales entre dos
variables. Estas pueden calcularse con la razón de correlación.
El valor del índice de correlación varía en el
intervalo [-1, + 1]
puede llegar a tener entre 4 correlaciones: positiva,
positiva perfecta, negativa y negativa perfecta
si no es ninguna de las 4 correlaciones ya sea
positava o negativa significa que no tiene relacion lineal
se simboliza con la letra P,x,y
Posee Razon y Covarianza
normalmente es denotado como "r"
Permite predecir el valor de una variable dado un valor
determinado de la otra variablese trata de valorar la asociación
entre dos variables cuantitativas estudiando el método conocido
como correlación
Dicho cálculo es el primer paso para determinar la
relación entre las variables
Consiste en la posibilidad de calcular su distribución muestral y así poder
determinar su error típico de estimación
Reporta un valor de correlación cercano a 0
como un indicador de no hay relación lineal
entre 2 variables
Reporta un valor de correlación cercano a 1 como un indicador de que existe una
relación lineal positiva entre las 2 variables. un valor mayor a cero que se
acerque a 1 da como resultado una mayor correlación positiva entre la información
Mientras más grande sea la muestra más exacto será la
estimación.
El valor de coeficiente de correlación es independiente de
cualquier unidad usada para medir variables.
Requiere supuestos acerca de la naturaleza o formas de las
poblaciones afectadas.
Requiere que las dos variables hayan ido medidas hasta un nivel
cuantitativo continuo y que la distribución de ambas sea
semejante a la curva normal.
Ausencia de covariación
Ausencia de covariaciónAusencia de covariación
El coeficiente de correlación de Spearman permite identificar si
dos variables se relacionan en una función monótona (es decir, cuando un número aumenta, el
otro también o viceversa)
P (rho) es una medida de la correlación (la asociación o interdependencia) entre dos
variables aleatorias continuas. Para calcular ρ, los datos son
ordenados y reemplazados por su respectivo orden.
El estadistico P viene dado por la siguiente expresion
Donde D es la diferencia entre los correspondientes estadísticos de orden de x - y. N es el número de
parejas.
El coeficiente de correlación de Spearman es menos sensible que el de Pearson para los valores muy lejos
de lo esperado. En este ejemplo: Pearson = 0.30706 Spearman = 0.76270
La correlación de sperman puede ser calculada con la de
pearson si antes se han transformado las puntuaciones en
rangos
Se tiene que considerar la existencia de datos idénticos a la hora de ordenarlos,
aunque si éstos son pocos, se puede ignorar tal circunstancia
Este coeficiente se emplea cuando una o ambas
escalas de medidas de las variables son ordinales
Permite identificar si dos variables se relacionan en una
función monótona
La interpretación de coeficiente de Spearman es igual que la del coeficiente de correlación de Pearson. Oscila entre -
1 y +1
La interpretación de coeficiente de Spearman es igual que la del coeficiente de correlación de Pearson. Oscila entre -1 y +1,
indicándonos asociaciones negativas o positivas respectivamente, 0 cero, significa no correlación pero no independencia.
La correlación estimada entre X y Y se halla calculando el coeficiente de pearson para el conjunto de rangos apareados
Donde D es la diferencia entre los correspondientes
estadísticos de orden de x - y. N es el número de parejas.
Se puede representar las puntuaciones en 2 series ordenadas
cuando todos los sujetos estan situados en el mismo puesto ya sea tanto en la
variable X como en la Y el valor de P es igual a 1
si sucede lo contrario es decir que las puntuaciones de los
sujetos sean opuestas tanto en la variable X como en la Y P
sera igual a -1
Apartir de un conjunto n puntuaciones, la formula que permite el calculo de la correlacion entre dos variables X e Y,
mediadas al menos en escala ordinal, es la siguiente:
P igual 0 quiere decir que no hay
correlacion
p diferente de 0 quiere decir que hay correlacion
Al ser una tecnica no parametra, es libre de distribucion probabilistica.
No esta afectada por los cambios en las unidades de medidas.
Es recomendable usarlo cuando los datos valores extremos, ya que
dichos valores afectan el coeficiente de correlación de pearson, o ante
distribuciones anormales.
R no debe ser usado para interpretar algo entre la relacion
causa y efecto.
Se analiza la satisfacción de los clientes de un concesionario de vehículos que ofrece tres
niveles de servicio para los automóviles nuevos: sin servicio, servicio estándar y servicio
premium. Toma una muestra aleatoria de clientes y les pregunta si se sienten
insatisfechos, indiferentes o satisfechos con el servicio al cliente. Los datos incluyen dos variables ordinales: paquete de servicio y
satisfacción del cliente. Usted desea determinar si existe una asociación entre el nivel de servicio
que reciben los clientes y su satisfacción general. Ingresa los datos en la siguiente tabla
de dos factores:
Sin servicio
Insatisfecho
162
Indiferente
99
Satisfecho
39
Servicio Premium
Insatisfecho
36
Indiferente
93
Satisfecho
171
Servicio Estándar
Insatisfecho
104
Indiferente
91
Satisfecho
105La rho de Spearman y la r de Pearson para esta tabla son ambas 0.424.
Usted concluye que existe una asociación positiva entre el nivel de servicio y la satisfacción del cliente: los clientes que eligen un plan de
servicio más alto tienden a expresar más satisfacción con esta empresa.
http://www.monografias.com/trabajos85/coeficiente-correlacion-karl-pearson/coeficiente-correlacion-karl-pearson.shtml
http://html.rincondelvago.com/coeficiente-de-la-correlacion-de-pearson-media-moda-y-mediana.html
https://es.wikipedia.org/wiki/Coeficiente_de_correlaci%C3%B3n_de_Pearsonhttps://es.wikipedia.org/wiki/Coeficiente_de_correlaci%C3%B3n_de_Spearman
http://es.wikihow.com/calcular-el-coeficiente-de-correlaci%C3%B3n-de-Spearman
http://www.monografias.com/trabajos85/coeficiente-correlacion-rangos-spearman/coeficiente-correlacion-rangos-spearman.shtml