regresion y correlación
TRANSCRIPT
PROBABILIDAD Y ESTADÍSTICA
INSTITUTO TECNOLOGICO MILPA ALTA II
INGENIERÍA EN SISTEMAS COMPUTACIONALES
PROBABILIDAD Y ESTADÍSTICA
INTEGRANTES:Marisol Villegas AbadMarco Antonio ReynosoDiego Mozqueda MezaAldo CidMario Argenis
CATEDRÁTICO: Ing. Gabriel Domínguez Amacende
PROBABILIDAD Y ESTADÍSTICA
UNIDAD 5ESTADÍSTICA APLICADA
5.3 REGRESIÓN Y CORRELACIÓN
PROBABILIDAD Y ESTADÍSTICA
REGRESIÓNEl diagrama de dispersión es una técnica estadística utilizada para estudiar la relación entre dos variables. Por ejemplo, entre una característica de calidad y un factor que le afecta.
CURVA DE AJUSTEFrecuentemente encontramos que existe una relación entre dos o más variables, y la expresamos por medio de una ecuación matemática.
PROBABILIDAD Y ESTADÍSTICA
•Uno de los propósitos principales de la curva de ajuste es estimar una de las variables (la variable dependiente) de la otra (la variable independiente).
•El proceso de estimación se conoce como regresión.
•Si y se va estimar a partir de x por medio de alguna ecuación la llamamos ecuación de regresión de y sobre x y a la curva correspondiente curva de regresión de y sobre x.
REGRESIÓN
PROBABILIDAD Y ESTADÍSTICA
REGRESIÓN
La relación entre dos variables se representa mediante una gráfica de dos dimensiones en la que cada relación está dada por un par de puntos (uno para cada variable).La variable del eje horizontal x normalmente es la variable causa, y la variable del eje vertical y es la variable efecto.
PROBABILIDAD Y ESTADÍSTICA
REGRESIÓN
MÉTODO DE MÍNIMOS CUADRADOSMás de una curva parece ajustar a un conjunto de datos, por lo que se hace necesario obtener la mejor recta o curva de ajuste.
De todas las curvas de aproximación de un conjunto de puntos de datos dados, la curva que tenga la propiedad de que
Es la mejor curva de ajuste.
PROBABILIDAD Y ESTADÍSTICA
REGRESIÓN
Las fórmulas para aplicar la regresión lineal son:
Pendiente
Ordenada al origen
PROBABILIDAD Y ESTADÍSTICA
En un experimento para probar las características de porosidad (y) relacionadas con el peso unitario de varias muestras de concreto, arrojo los siguientes resultados:
Obs x y x2 xy y2
1 99 28.8 9801 2851.2 829.442 101.1 27.9 10221.21 2820.69 778.413 102.7 27 10547.29 2772.9 7294 103 25.2 10609 2595.6 635.045 105.4 22.8 11109.16 2403.12 519.846 107 21.5 11449 2300.5 462.257 108.7 20.9 11815.69 2271.83 436.818 110.8 19.6 12276.64 2171.68 384.169 112.1 17.1 12566.41 1916.91 292.4110 112.4 18.9 12633.76 2124.36 357.2111 113.6 16 12904.96 1817.6 25612 113.8 16.7 12950.44 1900.46 278.8913 115.1 13 13248.01 1496.3 16914 115.4 13.6 13317.16 1569.44 184.9615 120 10.8 14400 1296 116.64suma 1640.1 299.8 179849.73 32308.59 6430.06
PROBABILIDAD Y ESTADÍSTICA
Se estima que el cambio de porosidad relacionado con el incremento de 1 lb/ft3 en el peso unitario es -0.905% (una disminución). La ecuación de la recta de regresión (recta de mínimos cuadrados) es y = 118.91 – 0.905x
PROBABILIDAD Y ESTADÍSTICA
99 104 109 114 119 12410
12
14
16
18
20
22
24
26
28
30
f(x) = − 0.904730657948258 x + 118.909916806729R² = 0.973887369180527
Variacion de la porosidad del concreto en función de su densidad
Series1Linear (Series1)
densidad
poro
sidad
Se estima que el cambio de porosidad relacionado con el incremento de 1 lb/ft3 en el peso unitario es -0.905% (una disminución). La ecuación de la recta de regresión (recta de mínimos cuadrados) es y = 118.91 – 0.905x
PROBABILIDAD Y ESTADÍSTICA
•Se denota con r y mide qué tan bien la recta de regresión de mínimos cuadrados se ajusta a los datos muéstrales.
•Si la variación total se explica totalmente por la recta de regresión, es decir si r2 = 1 o r = ±1, decimos que hay una correlación lineal perfecta (y en tal caso también regresión lineal perfecta).
•El coeficiente de correlación r es una medida de cuán fuerte es la relación entre x y y en la muestra observada.
COEFICIENTE DE CORRELACIÓN
PROBABILIDAD Y ESTADÍSTICA
Determinar la relación entre dos contaminantes, según la siguiente tabla, se describen los datos acerca de la concentración de ozono x (ppm) y la concentración secundaria de carbono y (μg/m3)
x y
0.066 4.6 0.3036
0.088 11.6 1.0208
0.12 9.5 1.14
0.05 6.3 0.315
0.162 13.8 2.2356
0.186 15.4 2.8644
0.057 2.5 0.1425
0.1 11.8 1.18
0.112 8 0.896
0.055 7 0.385
0.154 20.6 3.1724
0.074 16.6 1.2284
0.111 9.2 1.0212
0.14 17.9 2.506
0.071 2.8 0.1988
0.11 13 1.43
sumaΣ 1.656 170.6 20.0397
Como las variables tienen un coeficiente diferente de cero, sabemos que son dependientes en el sentido de probabilidad. Además podemos utilizar una ecuación para predecir el valor de Y a partir del valor de X.