Estimación por intervalo en la regresión:
Bandas de Confianza
BIOMETRIA II10-O
Estimación por Intervalo
• Si recordamos de nuestros primeros cursos tenemos dos formas de estimar:–La estimación Puntual–La estimación por Intervalo
Estimación Puntual
• Es cuando sólo damos un dato como estimado del valor que deseamos estimar.
• Este estimador se llama “Estimador Puntual”• Ejemplos son el promedio X es un estimador
puntual del parámetro μ• La varianza muestral s2 es un estimador
puntual de la Varianza Poblacional δ2
Estimación por intervalo
• Cuando en vez de un solo valor colocamos dos valores, uno inferior y otro superior y suponemos que en medio de esos dos esta el valor que deseamos estimar, entonces hacemos una estimación por intervalo.
Estimación por intervalo
Posibles Valores
Intervalo Corto
Intervalo largo
Compromisos
• Cuando hacemos una estimaciónPuntual solo tenemos una oportunidad de atinar al valor que deseamos estimar
• Si hacemos un intervalo corto tenemos pocos valores (mas precisión) pero podemos equivocarnos o no atinar al valor del parámetro (poca probabilidad)
• Si hacemos un intervalo largo tenemos más probabilidad pero menor precisión
Intervalo de confianza
• Cuando conocemos la distribución de frecuencias que sigue la variable podemos aplicarla ya que conocemos la probabilidad.
• Esto cambia y ahora podemos establecer lo que conocemos como INTERVALOS de CONFIANZA.
• Los intervalos de confianza se establecen para un parámetro (ej. La Media) y se dan normalmente al 95 ó 99%
Intervalo de Confianza
Posibles Valores
Intervalo al 95% de confianza
Intervalo al 99% de confianza
Estimador Puntual
Intervalos de Confianza en la Regresión
• Como mencionamos antes el modelo de regresión “pasa” por la supuesta media de cada una de las subpoblaciones de y para cada valor de X
• Por lo tanto y^ es un estimador puntual de la media.
Estimadores de la media
Intervalos de confianza
• Sabemos que uno de los supuestos de la regresión es que la Y se distribuye normalmente
• Por lo tanto podemos aplicar la misma fórmula que usamos para el intervalo de confianza.
I.C. = X- ± Z α½ * (e.s)
I.C. = X- ± Z α½ * (e.s)
• En donde I.C. es Intervalo de Confianza• X- es el promedio u estimador de la μ• Z α½ es el valor de la distribución normal
stadandar para un valor dado de alfa y como este es de dos colas se toma sólo la mitad– Normalmente es 1.96 cuando se usa el 95% de
confianza (α = 0.05)• (e. s.) es el error estándar o desv. Estandar del
estimador.
Aplicación
• Así podemos plantear un intervalo de confianza para cada una de las medias de las sub poblaciones.
Bandas de confianza
• Uniendo los límites superiores de los límites de cada intervalo de confianza obtenemos el límite superior de la banda de confianza (o banda de confianza superior de confianza)
• Uniendo los límites inferiores de confianza obtenemos el límite inferior de la banda de confianza (o banda de confianza inferior de confianza)
Banda Superior de confianza
Banda Inferior de confianza
Estimación del Error Estándar
• Cuando se tiene más de una observación en cada punto de X es fácil calcular el e.s.
• Cuando solo se tiene un valor se hace una estimación ponderada de los e.s. Basados en la desviación general.
• Es por esto que la estimación es más imprecisa hacia los valores extremos.
• Hay otros intervalos de confianza para la estimación, que básicamente usa otra forma de estimar el e.s. Bandas de Estimación
BANDAS DE CONFIANZA Y DE PREDICCIÓN.
ANÁLISIS
UN INTERVALO O BANDA DE CONFIANZA ES UNA MEDIDA DE LA CERTIDUMBRE EN LA FORMA DE UNA LINEA DE REGRESIÓN. EN GENERAL, UNA BANDA AL 95% DE CONFIANZA IMPLICA UN 95% DE PROBABILIDAD DE QUE LA LINEA REAL DE CORRELACIÓN CAIGA DENTRO DE ESTA BANDA.
UN INTERVALO O BANDA DE PREDICCIÓN ES UNA MEDIDA DE LA CERTIDUMBRE EN LA DISPERSIÓN DE LOS VALORES INDIVIDUALES. EN GENERAL, UNA BANDA AL 95% DE CONFIANZA IMPLICA QUE UN 95% DE LOS DATOS SOBRE LOS QUE SE HA REALIZADO LA REGRESIÓN ESTÁN CONTENIDOS DENTRO DE ESTA BANDA.
Ejemplo Predicted Standard Lower 95% Upper 95%
Dias Medici Medici Error Conf. Limit Conf. Limit
Row (X) (Y) (Yhat|X) of Yhat of Y Mean|X of Y Mean|X
1 10 5 10.4091 3.2339 3.0936 17.7246
2 11 18 12.7636 2.7872 6.4585 19.0688
3 12 10 15.1182 2.3827 9.7282 20.5082
4 13 21 17.4727 2.0453 12.846 22.0995
5 14 27 19.8273 1.8129 15.7261 23.9284
6 15 17 22.1818 1.7286 18.2715 26.0921
7 16 30 24.5364 1.8129 20.4352 28.6375
8 17 20 26.8909 2.0453 22.2642 31.5176
9 18 34 29.2455 2.3827 23.8555 34.6354
10 19 27 31.6 2.7872 25.2948 37.9052
11 20 35 33.9545 3.2339 26.639 41.2701
Bandas de Confianza
Bandas para la estimación
Intervalos de Confianza para la estimación Predicted Standard Lower 95% Upper 95%
Dias Medici Medici Error Prediction Prediction
Row (X) (Y) (Yhat|X) of Yhat Limit of Y|X Limit of Y|X
1 10 5 10.4091 6.5822 -4.4809 25.2991
2 11 18 12.7636 6.3747 -1.6569 27.1841
3 12 10 15.1182 6.2084 1.0737 29.1627
4 13 21 17.4727 6.0869 3.7031 31.2423
5 14 27 19.8273 6.0129 6.2252 33.4293
6 15 17 22.1818 5.988 8.6361 35.7275
7 16 30 24.5364 6.0129 10.9343 38.1384
8 17 20 26.8909 6.0869 13.1213 40.6605
9 18 34 29.2455 6.2084 15.201 43.2899
10 19 27 31.6 6.3747 17.1795 46.0205
11 20 35 33.9545 6.5822 19.0645 48.8446
Bandas de confianza de la Estimación