estadisticamanuelbeltraan 150515133729-lva1-app6892

13
ESTADÍSTICA BACHILLER: Beltrán Manuel C.I:24829627 INSTITUTO UNIVERSITARIO POLITECNICO “SANTIAGO MARIÑO” Profesor: Pedro Beltrán Seccion:IV

Upload: manuelbeltran2015

Post on 17-Aug-2015

26 views

Category:

Documents


0 download

TRANSCRIPT

ESTADÍSTICABACHILLER: Beltrán Manuel

C.I:24829627

INSTITUTO UNIVERSITARIO POLITECNICO “SANTIAGO MARIÑO”

Profesor: Pedro BeltránSeccion:IV

Determinar El uso De Los Coeficientes De Correlación De Pearson

El coeficiente de correlación de Pearson, normalmente denotado como "r", es un valor estadístico que mide la relación linear entre dos variables. Los rangos de valor van de +1 a -1, lo que indica una perfecta relación linear positiva y negativa respectivamente entre ambas variables. El cálculo del coeficiente de correlación normalmente se realiza con programas de estadística, como SPSS y SAS, para dar los valores posibles más precisos en estudios científicos. Su interpretación y uso varía de acuerdo con el contexto y propósito del respectivo estudio en donde se calcula.

USO:

Identifica el dependiente variable que se probará entre dos observaciones derivadas independientemente. Uno de los requisitos es que las dos variables que se comparan deben observarse o medirse de manera independiente para eliminar cualquier resultado sesgado.

Para cantidades grandes de información, el calculo puede ser tedioso. Reporta un valor de correlación cercano a 0 como un indicador de que no hay

relación linear entre las dos variables. Reporta un valor de correlación cercano al 1 como indicador de que existe una relación linear positiva entre las dos variables. Un valor mayor a cero que se acerque a 1 da como resultado una mayor correlación positiva entre la información.

Reporta un valor de correlación cercano a -1 como indicador de que hay una relación linear negativa entre las dos variables.

El cálculo del coeficiente de correlación (r) entre peso y talla de 20 niños varones se muestra . La covarianza, que en este ejemplo es el producto de peso (kg) por talla (cm), para que no tenga dimensión y sea un coeficiente, se divide por la desviación típica de X (talla) y por la desviación típica de Y (peso) con lo que obtenemos el coeficiente de correlación de Pearson que en este caso es de 0.885 e indica una importante correlación entre las dos variables. Es evidente que el hecho de que la correlación sea fuerte no implica causalidad. Si elevamos al cuadrado el coeficiente de correlación obtendremos el coeficiente de determinación (r2=0.783) que nos indica que el 78.3% de la variabilidad en el peso se explica por la talla del niño. Por lo tanto existen otras variables que modifican y explican la variabilidad del peso de estos niños. La introducción de más variable con técnicas de análisis multivariado nos permitirá identificar la importancia de que otras variables pueden tener sobre el peso.

Ejemplo

Formulas De Pearson

Ventajas

La ventaja que tiene este coeficiente sobre otras herramientas para medir la correlación, como puede ser la covarianza, es que los resultados del coeficiente de correlación están acotados entre -1 y +1. Esta característica nos permite comparar diferentes correlaciones de una manera más estandarizada.

Desventajas

Si bien 'r' (coeficiente de correlación) es una herramienta poderosa, debe ser utilizada con cuidado.

Los coeficientes de correlación más utilizados sólo miden una relación lineal. Por lo tanto, es perfectamente posible que, si bien existe una fuerte relación no lineal entre las variables, r está cerca de 0 o igual a 0. En tal caso, un diagrama de dispersión puede indicar aproximadamente la existencia o no de una relación no lineal.

Hay que tener cuidado al interpretar el valor de 'r'. Por ejemplo, se podría calcular 'r' entre el número de calzado y la inteligencia de las personas, la altura y los ingresos. Cualquiera sea el valor de 'r', no tiene sentido y por lo tanto es llamado correlación de oportunidad o sin sentido.

'R' no debe ser utilizado para decir algo sobre la relación entre causa y efecto. Dicho de otra manera, al examinar el valor de 'r' podríamos concluir que las variables X e Y están relacionadas. Sin embargo, el mismo valor de 'r no nos dice si X influencia a Y o al revés. La correlación estadística no debe ser la herramienta principal para estudiar la causalidad, por el problema con las terceras variables.

El coeficiente de correlación de Sperman, ρ (rho) es una medida de la correlación (la asociación o interdependencia) entre dos variables aleatorias continuas. Para calcular ρ, los datos son ordenados y reemplazados por su respectivo orden.

El estadístico ρ viene dado por la expresión:

Determinar El uso De Los Coeficientes De Correlación De Sperman

donde D es la diferencia entre los correspondientes estadísticos de orden de x - y.N es el número de parejas.Se tiene que considerar la existencia de datos idénticos a la hora de ordenarlos, aunque si éstos son pocos, se puede ignorar tal circunstancia.

USOS:

Para aplicar el coeficiente de correlación de Sperman se requiere que las variables estén medidas al menos en escala ordinal, es decir, de forma que las puntuaciones que las representan puedan ser colocadas en dos series ordenadas.

A veces, este coeficiente es denominado por la letra griega ρs (rho), aunque cuando nos situamos en el contexto de la Estadística Descriptiva se emplea la notación rs

La fórmula de cálculo para rs puede derivarse de la utilizada en el caso de rxy; bastaría aplicar el coeficiente de correlación de Pearson a dos series de puntuaciones ordinales, compuestas cada una de ellas por la n primeros números naturales.

 

- Al ser Sperman una técnica no paramétrica es libre de distribución probabilística (2, 5, 9).   - Los supuestos son menos estrictos. Es robusto a la presencia de outliers (es decir permite ciertos desvíos del patrón normal).   - La manifestación de una relación causa-efecto es posible sólo a través de la comprensión de la relación natural que existe entre las variable y no debe manifestarse sólo por la existencia de una fuerte correlación (1, 5).

Ejemplo: Con base en la información de las 44 truchas y ante el no cumplimiento de los supuestos del coeficiente de correlación de Pearson se aplicó la técnica no paramétrica de Sperman dando como resultado la siguiente salida ( figura 4 ).  

Ventajas

Desventajas

Indicándonos asociaciones negativas o positivas respectivamente, 0 cero, significa no correlación pero no independencia.

La tau de Kendall es un coeficiente de correlación por rangos, inversiones entre dos ordenaciones de una distribución normal bivariante

Usos de enfoques Pearson:

Métodos Estadísticos para Investigadores”. Desde entonces, el contraste de Hipótesis es considerado uno de los métodos de inferencia estadística de utilización obligada en casi todas las disciplinas.

Si bien hoy en día los estudiantes de Estadística aprenden a testear hipótesis aplicando una secuencia de pasos más o menos estandarizada, es importante recordar que no estamos ante una teoría unificada, sino ante la amalgama de los estudios sistemáticos realizados separadamente por Fisher por un lado y Neyman y Pearson por el otro. Fisher desarrolló su teoría que denominó Pruebas de Significación y Neyman y Pearson las llamadas Pruebas de Hipótesis. Desde 1930, fecha en que aparecieron los trabajos de NP., la teoría de los tests de hipótesis fue dominada por el paradigma de la decisión. Esto ha llevado al estado actual de cosas en el cual predomina la teoría de Neyman-Pearson como modelo ó esquema de razonamiento para la toma decisiones, pero la práctica estadística en la investigación, aplicando los mismos procedimientos, interpreta los datos como evidencia para validar teorías.

Aplicar usos de enfoques Pearson y enfoque Sperman a problemas estadísticos.

Enfoque psicométrico de los factores de la inteligencia (Sperman, Catell, Thurstone)

• El enfoque psicométrico utiliza técnicas de análisis factorial con la idea de descubrir las diferencias individuales de la inteligencia entre las personas. Para ello se recurre al uso de los test de inteligencia.

• Spearman distingue dos factores: el factor “G” y el factor “S”. El “G” es la inteligencia general (común a la mayoría de las personas). El “S” son las habilidades específicas de la inteligencia (verbal, numérica, espacial, etc.)

Usos de enfoque Sperman:

Bibliografía

http://html.rincondelvago.com/coeficiente-de-la-correlacion-de-pearson-media-moda-y-mediana.html

http://www.scielo.org.co/scielo.php?pid=S0120-06902007000200010&script=sci_arttexthttp://dta.utalca.cl/estadistica/ejercicios/interpretar/Metodos/12noparam.pdf

www.monografias.com › Matemáticas › Estadística

https://es.wikipedia.org/wiki/Coeficiente_de_correlación_de_Spearman

http://www.ehowenespanol.com/coeficiente-correlacion-pearson-como_84118/