7. inferencia estadística · inferencia en poblaciones normales métodos estadísticos para la...
Post on 13-Oct-2018
227 Views
Preview:
TRANSCRIPT
7. Inferencia Estadística
Métodos Estadísticos para la Mejora de la Calidad 1
Tema 7: Inferencia Estadística
1. Intervalos de confianza para μ con muestras grandesp μ g2. Introducción al contraste de hipótesis3. Contraste de hipótesis de la media μ con muestras grandes4. Interpretación de un contraste usando el p-valorp p5. Relación entre contrastes de hipótesis e intervalos de confianza6. Inferencia en poblaciones normales
Métodos Estadísticos para la Mejora de la Calidad 2
1. Intervalos de confianza para μ con muestras grandes
l d é d b ó l iSea X una v. aleatoria de interés con distribución cualquiera y con
Si n es grande (n>30)
1
Z
Métodos Estadísticos para la Mejora de la Calidad 30
Z ∼ N(0,1)
1- α1- α
α /2 α /2
Métodos Estadísticos para la Mejora de la Calidad 4
-4 -3 -2 -1 0 1 2 3 40
-zα/2 zα/2
Si tomásemos infinitas muestras, y con cada una calculásemos el intervalo
/ 2x z σ± / 2x z
nα±
Entonces, el 100(1-α)% de esos intervalos tendría el valor de μ
Z ∼ N(0,1)
1- α1- α
0
α /2 α /2
Métodos Estadísticos para la Mejora de la Calidad 5
-4 -3 -2 -1 0 1 2 3 40
-zα/2 zα/2
En la práctica:
Sólo una muestra
Sólo un intervaloSólo un intervalo
El intervalo sí o no contendrá a μ
A la incertidumbre de si lo contendrá le llamaremos confianzaconfianza
Z ∼ N(0,1)
1- α1- α
-4 -3 -2 -1 0 1 2 3 40
α /2 α /2
Métodos Estadísticos para la Mejora de la Calidad 6
-zα/2 zα/2
intervalo de confianza de nivel de confianza 100×(1-α)% para μ
/ 2(1 ) :IC x znασ
α μ⎧ ⎫⎪ ⎪⎪ ⎪− ∈ ±⎨ ⎬⎪ ⎪⎪ ⎪
Ejemplo Una muestra aleatoria extraída de una población con σ²=100 de n=144
n⎪ ⎪⎪ ⎪⎩ ⎭
j pobservaciones tiene una media muestral =160. se pide:
(a) Calcular un intervalo de confianza del 95% para μ.
(b) Calcular un intervalo de confianza del 90% para μ.
(a)
(b)
Mayor confianza=más anchos90%
Métodos Estadísticos para la Mejora de la Calidad 7
Mayor confianza=más anchos95%
X
Cuestiones
¿Verdadero falso o incierto?/ 2(1 ) :IC x z
nασ
α μ⎧ ⎫⎪ ⎪⎪ ⎪− ∈ ±⎨ ⎬⎪ ⎪⎪ ⎪⎩ ⎭¿Verdadero, falso o incierto?
• El intervalo de confianza nos dice entre qué valores variará μ de unas muestras a otras
⎩ ⎭
muestras a otras
• Es imposible que μ esté fuera del intervalo de confianza
• El intervalo de confianza que hemos visto sólo es válido si X es normal
• El intervalo de confianza que hemos visto sólo es válido si es normalX
• Lo mejor será construir intervalos de confianza del 100%, así no tendremos incertidumbre
• El intervalo de confianza me dice entre qué valores estará la media poblacional con una confianza determinada
• Si tengo pocos datos, el intervalo de confianza puede no ser válido
Métodos Estadísticos para la Mejora de la Calidad 8
/ 2(1 ) :IC x zασ
α μ⎧ ⎫⎪ ⎪⎪ ⎪− ∈ ±⎨ ⎬⎪ ⎪/ 2 nα⎪ ⎪⎪ ⎪⎩ ⎭
Es también un parámetro, y será desconocido
Lo sustituimos por un estimadorLo sustituimos por un estimador
/ 2ˆ(1 ) :IC x z σ
α μ⎧ ⎫⎪ ⎪⎪ ⎪− ∈ ±⎨ ⎬/ 2(1 ) :IC x z
nαα μ ∈ ±⎨ ⎬⎪ ⎪⎪ ⎪⎩ ⎭
¿Qué estimador usamos para σ²?
Métodos Estadísticos para la Mejora de la Calidad 9
¿Qué estimador usamos para σ² ?
Método de los momentos: varianza muestralMétodo de los momentos: varianza muestral
Se puede demostrar que es SESGADO
subestima la verdadera varianza
Métodos Estadísticos para la Mejora de la Calidad 10
¿Qué estimador usamos para σ² ?
es SESGADO
Corregimos el sesgo
Nuestro estimador ‘oficial’ será el estimador insesgado
• Cuasivarianza• Pseudo varianza• Varianza corregida
Métodos Estadísticos para la Mejora de la Calidad 11
Varianza corregida• Varianza corregida por grados de libertad
intervalo de confianza de nivel de confianza 100×(1-α)% para μ
/ 2
ˆ(1 ) : sIC x z
nαα μ⎧ ⎫⎪ ⎪⎪ ⎪− ∈ ±⎨ ⎬⎪ ⎪⎪ ⎪n⎪ ⎪⎪ ⎪⎩ ⎭
Ejemplo Se mide la duración de 200 componentes electrónicos hasta su avería. De esos 200 datos se tiene que la media muestral es 1300 horas y la cuasivarianza es 10.000 (horas al cuadrado). Calcula un intervalo de confianza de μ de nivel de confianza 95%confianza 95%
1300X =2ˆ 10.000
2000 05
Sn
==
100001300 1.96200
μ⎧ ⎫⎪ ⎪⎪ ⎪∈ ±⎨ ⎬⎪ ⎪⎪ ⎪⎩ ⎭
[1286;1314]μ ∈
0.025
0.051.96z
α =
=
⎩ ⎭
Métodos Estadísticos para la Mejora de la Calidad 12
Determinación del tamaño muestral
intervalo de confianza de nivel de confianza 100×(1-α)% para μ
Acabamos de ver que...
(1 ) :IC x z σ⎧ ⎫⎪ ⎪⎪ ⎪∈ ±⎨ ⎬/ 2(1 ) :IC x znαα μ− ∈ ±⎨ ⎬⎪ ⎪⎪ ⎪⎩ ⎭
{ }x Lμ ∈ ±
¿Cuál debe ser n para conseguir un L determinado?
Lo estimo con alguna Lo estimo con alguna muestra piloto
Informática. Universidad Carlos III de Madrid 13
Ejemplo Sea X el contenido de impurezas en un material obtenido en cierto proceso productivo (miligramos de impureza por kilogramo de producto obtenido). Se toma una muestra aleatoria de 200 observaciones obteniéndose una media toma una muestra aleatoria de 200 observaciones obteniéndose una media muestral del consumo de 120 mg/Kg y una desviación típica muestral 20 mg/Kg.
120X =
0
ˆ 20200
Sn
==
Estimar mediante un intervalo de un 95% de confianza el contenido medio de impurezas.
¿Qué tamaño muestral sería necesario tomar para que L=1 mg?
Informática. Universidad Carlos III de Madrid 14
Tema 7: Inferencia Estadística
1. Intervalos de confianza para μ con muestras grandesp μ g2. Introducción al contraste de hipótesis3. Contraste de hipótesis de la media μ con muestras grandes4. Interpretación de un contraste usando el p-valorp p5. Relación entre contrastes de hipótesis e intervalos de confianza6. Inferencia en poblaciones normales
Métodos Estadísticos para la Mejora de la Calidad 15
2. Introducción al contraste de hipótesis
Veamos la idea de contraste de hipótesis con un ejemplo
Ejemplo Un fabricante de transistores del tipo BC547B sabe que cuando su producción se mantiene en los niveles de calidad deseables, el valor de la llamada ganancia en corriente de los transistores (conocida por β, adimensional) sigue una distribución normal de media 290 y varianza 760.
Son en realidad estimaciones con muchísimos datos históricos. A efectos prácticos, los consideramos como si fuesen los poblacionales
β2
290760
μ
σ
=
=760σ = 760σ =760σ =
290μ=
¿Cómo puedo saber si se mantiene el proceso en los mismos parámetros?los mismos parámetros?
Métodos Estadísticos para la Mejora de la Calidad 16
¿Se mantiene la media? ¿Ha aumentado la variabilidad?
Ejemplo
β 290μ=¿Cómo puedo saber si se mantiene el proceso en los mismos parámetros?β
2
290760
μ
σ
=
=760σ =
p p
290μ=
¿Se mantiene la media?
¿Ha aumentado la variabilidad?
Son hipótesis que quiero comprobar¿Cómo lo puedo hacer?
• Tomo una muestra de observaciones
• A la vista de los datos decido si mantengo o no la hipótesis (el objetivo no es estimar sino validar)
Si 290x >> parece muy probable que la media SI haya cambiado
Si 290x parece muy probable que la media NO haya cambiadoSi 290x parece muy probable que la media NO haya cambiado
A la vista de los datos, tomo la decisión que sea más plausible
Métodos Estadísticos para la Mejora de la Calidad 17
(nunca estaré seguro al 100%)
¿Cómo me puede ayudar la estadística?
Ejemplo
β 2
290760
μ
σ
=
=
Veamos el método estadístico:
β 760σ =760σ = Objetivo: Validar una hipótesis con los datos
Contraste de hipótesis
290μ=
X XX X
Contraste de hipótesis
Las hipótesis serán restricciones sobre los parámetros
X3 ... XnX1 X2
2ˆ,X SHipótesis nula
H
Hipótesis alternativa
H1
¿Se mantiene la media?
290μ= ó 290μ≠
H0 H1
alternativa bilateral
¿Ha aumentado la variabilidad?
2 760σ ≤ 2 760σ >ó alternativa unilateral
• Entre H0 y H1 está todo el rango de valores posibles
• H0 debe tener siempre el signo =
• Se aceptará H0 salvo que haya mucha evidencia en contra
Métodos Estadísticos para la Mejora de la Calidad 18
• Se aceptará H0 salvo que haya mucha evidencia en contra
Ejemplo
β 2
290760
μ
σ
=
=H0 H1
β 760σ =760σ = 290μ= 290μ≠
2 760σ ≤ 2 760σ >
290μ=
X XX X ˆ
760σ ≤ 760σ >
X3 ... XnX1 X2 2ˆ,X S
Rechazamos H0 sólo si hay mucha evidencia en contra. Es decir, si los
datos hacen lo que dice H1 de forma muy evidentey
En la sección siguiente veremos cómo obtener los límites de las
regiones de aceptación y rechazo
Métodos Estadísticos para la Mejora de la Calidad 19
Tema 7: Inferencia Estadística
1. Intervalos de confianza para μ con muestras grandesp μ g2. Introducción al contraste de hipótesis3. Contraste de hipótesis de la media μ con muestras grandes4. Interpretación de un contraste usando el p-valorp p5. Relación entre contrastes de hipótesis e intervalos de confianza6. Inferencia en poblaciones normales
Métodos Estadísticos para la Mejora de la Calidad 20
3. Contraste de hipótesis de la media μ con muestras grandes
P hi ó i b l di i l i i Para contrastar una hipótesis sobre la media μ seguimos los siguientes pasos:
E ifi l hi ót i l l lt ti Q t t Especificamos la hipótesis nula y la alternativa. Queremos contrastar alguna de estas hipótesis, donde μ0 es un valor concreto
PASO 1:
0 0
1 0
::
HH
μ μ
μ μ
=
≠0 0
1 0
::
HH
μ μ
μ μ
≤
>0 0
1 0
::
HH
μ μ
μ μ
≥
<
En el ejemplo de los transistores. Se desea saber si la población de Ejemplo j p ptransistores del proceso productivo mantiene la media en μ0 =290
H0 H1
Ejemplo
290μ= 290μ≠
H0 H1
Métodos Estadísticos para la Mejora de la Calidad 21
PASO 2: Hallamos una medida de la discrepancia entre los datos y H0
Si la discrepancia es grande: se rechaza H0Si la discrepancia es grande: se rechaza H0
Esa medida se denomina estadístico de contraste
¿Cómo se busca el estadístico de contraste, que resuma la información relevante para un
Usando las propiedades de los estimadores, e introduciendo la
información de H0
S b t d
contraste? información de H0
Sabemos que, para muestras grandes
Estadístico de contraste
Métodos Estadísticos para la Mejora de la Calidad 22
En el ejemplo de los transistores. Se desea saber si la población de transistores del proceso productivo mantiene la media en μ0 =290
H0 H1
Ejemplo
290μ= 290μ≠
H0 H1
Con 100 observaciones:
Resume en un número la información para decidir entre H0 y H1
Para valorar el estadístico de contraste, buscamos una distribución de referencia que nos diga si es un valor grande o pequeño
PASO 3:
referencia que nos diga si es un valor grande o pequeño
La distribución de referencia es la del estadístico de contraste cuando μ=μ N(0,1)
Métodos Estadísticos para la Mejora de la Calidad 23
estadístico de contraste cuando μ=μ0( , )
Rechazamos H0 si los datos hacen lo que dice H1 de forma muy evidente.
PASO 4: Localizamos en qué zonas de la distribución de referencia rechazaremos H0.
Caso (a) PASO 1:
290X
PASO 2: PASO 3:
0 1: 290; : 290H Hμ μ= ≠ 0290
ˆ /XTS n−
= T0~N(0,1)
Rechazamos H0 si
290 290
290 0xt −<< 290x −
290x << 290x >>
0 0ˆ /
ts n
= <<0
290 0ˆ /
xts n
= >>
N(0,1)Si H0 es falsa tenderemos a estar
por esta zona
Si H0 es falsa tenderemos a estar
por esta zona
Métodos Estadísticos para la Mejora de la Calidad 240
Rechazamos H0 si los datos hacen lo que dice H1 de forma muy evidente.
PASO 4: Localizamos en qué zonas de la distribución de referencia rechazaremos H0
290XCaso (b) PASO 1: PASO 2: PASO 3:
T0~N(0,1)0 1: 290; : 290H Hμ μ≤ > 0290
ˆ /XTS n−
=
Rechazamos H0 si
290
290x −
290x >>
0290 0
ˆ /xts n
= >>
N(0,1) Si H0 es falsa tenderemos a estar
por esta zona
Métodos Estadísticos para la Mejora de la Calidad 250
Rechazamos H0 si los datos hacen lo que dice H1 de forma muy evidente.
PASO 4: Localizamos en qué zonas de la distribución de referencia rechazaremos H0
290XCaso (c) PASO 1: PASO 2: PASO 3:
T0~N(0,1)0 1: 290; : 290H Hμ μ≥ < 0290
ˆ /XTS n−
=
Rechazamos H0 si
290290x <<
290 0xt −<<0 0
ˆ /t
s n= <<
N(0,1)Si H0 es falsa tenderemos a estar
por esta zona
Métodos Estadísticos para la Mejora de la Calidad 260
PASO 1: PASO 2: PASO 4:
0 0 1 0: ; :H Hμ μ μ μ= ≠(a)
Rechazo H0 Rechazo H0
Acepto H0
(a)
0 0 1 0: ; :H Hμ μ μ μ≤ >
Rechazo H0Acepto H0
PASO 3:
(b)(b)
0 0 1 0: ; :H Hμ μ μ μ≥ <
N(0,1)
Rechazo H0 Acepto H0(c)
(c)
Métodos Estadísticos para la Mejora de la Calidad 27
La región de rechazo está donde señala H1
Metodología general para hacer un contraste de hipótesis
Especificamos la hipótesis nula y la alternativa. PASO 1:
Estadístico de contrastePASO 2:
PASO 3: Distribución de referencia
PASO 4: Localizamos las zonas donde estará la región de rechazo
Rechazo H0 Acepto H0
¿Qué área ocupa la región de rechazo?
?• La región de rechazo ocupa un área pequeña
• Ese área se llama α=nivel de significación g
• Su valor lo decide el analista
• Suele ser α=0.05, 0.10, 0.01Valor crítico
Métodos Estadísticos para la Mejora de la Calidad 28
En el ejemplo de los transistores. Se desea saber si la población de transistores del proceso productivo mantiene la media en μ0 =290
H0 H1
Ejemplo
290μ= 290μ≠
H0 H1
Nivel de significación α=0 05
Con 100 observaciones:
Acepto H0
Nivel de significación, α=0.05 T0~N(0,1)
Rechazo H0 Rechazo H0
1
α/2=0.025 α/2=0.025
0 1 2 3-1-2-3
1.96-1.96
Métodos Estadísticos para la Mejora de la Calidad 29
-2.78Rechazamos H0Valores críticos
En el ejemplo de los transistores. Se desea saber si la población de transistores del proceso productivo mantiene la media en μ0 =290
H0 H1
Ejemplo
290μ= 290μ≠
H0 H1
Con 100 observaciones:
Nivel de significación α=0 05 T0~N(0,1)Nivel de significación, α=0.05
La diferencia entre la media de la muestra (282.3) y la de la hipótesis
(290) es significativa (al 5%)(290) es significativa (al 5%)
C l i i l d Concluimos, con un nivel de significación del 5%, que la media
poblacional ha cambiado
Métodos Estadísticos para la Mejora de la Calidad 30
Cuestiones
¿Verdadero falso o incierto?¿Verdadero, falso o incierto?
• Mediante un contraste de hipótesis buscamos el respaldo de los datos a alguna suposición sobre la poblaciónalguna suposición sobre la población
• Si rechazo la hipótesis de que μ=100 con α=0.05, la conclusión es que es imposible que μ=100
• Quiero contrastar la hipótesis de que μ=100 con α=0.05. Con unos datos obtengo y el contraste me lleva a Aceptar H0. Entonces quiere decir que con un nivel de significación de 0.05 μ=104.3
104.3x =decir que con un nivel de significación de 0.05 μ 104.3
• Quiero contrastar la hipótesis de que μ=100 con α=0.05. Con unos datos obtengo y el contraste me lleva a Aceptar H0. Entonces quiere d i i l d i ifi ió d 0 05
104.3x =decir que con un nivel de significación de 0.05 100x =
• Si tomamos pocos datos, el contraste puede ser erróneo
• Un analista puede aceptar una hipótesis nula con α=0.05, pero rechazarla con α=0.01
Métodos Estadísticos para la Mejora de la Calidad 31
Según los estudios antropométricos, los jóvenes españoles entre 18 y 25 años tienen una estatura media de μ0 =177 cm.
S l l d 50 jó d il ñ d d d l
Ejemplo
Se toman las alturas de 50 jóvenes madrileños en ese rango de edad y resulta
175.9x cm= ˆ 5.93s cm=
¿H id i fi i t d i l jó d il ñ ¿Hay evidencia suficiente para decir que los jóvenes madrileños tiene una estatura media inferior a la nacional?
Especificamos la hipótesis nula y la alternativa. PASO 1:
Dos opciones
Estatura media inferior
E di i f i
177μ <
177≥Estatura media no inferior 177μ ≥
177H ≥0
1
: 177: 177
HH
μμ≥<
Métodos Estadísticos para la Mejora de la Calidad 32
Según los estudios antropométricos, los jóvenes españoles entre 18 y 25 años tienen una estatura media de μ0 =177 cm.
S l l d 50 jó d il ñ d d d l
Ejemplo
Se toman las alturas de 50 jóvenes madrileños en ese rango de edad y resulta
¿H id i fi i t d i l jó d il ñ
0
1
: 177: 177
HH
μμ≥<
175.9x cm= ˆ 5.93s cm=
¿Hay evidencia suficiente para decir que los jóvenes madrileños tiene una estatura media inferior a la nacional?
1
Estadístico de contrastePASO 2:
PASO 3: Distribución de referencia N(0,1)
L dif i l di
PASO 4: Localizamos las zonas donde estará la región de rechazo
Acepto H0La diferencia entre la media muestral (175.9) y la hipótesis nula
no es significativa (al 5%)Rechazo H0
Acepto H0
α=0.05
La diferencia observada se atribuye, con un nivel de significatividad del 5%, a la
α 0.05
0 1 2 3-1-2-3Valor crítico=-1.65
Métodos Estadísticos para la Mejora de la Calidad 33
variabilidad de la muestra y no a diferencias reales
-1.31
La verdad(que nunca sabré con sólo n datos)El resultado del
contraste
(H1 cierta)H0 cierta H0 falsa
(H1 falsa)
contraste(sólo n datos)
Acepto H0(Rechazo H1)
( )( )
ACIERTO!!ACIERTO!! ERROR TIPO IILo cometo con
probabilidad que
Rechazo H0 ACIERTO!!ACIERTO!!ERROR TIPO I
L t
p qdepende de cada
caso
(Acepto H1)ACIERTO!!ACIERTO!!Lo cometo con
probabilidad
α
Cuando demos la conclusión de un contraste
Métodos Estadísticos para la Mejora de la Calidad 34
debemos dar siempre el nivel de significación, para dar una medida de su precisión
Metodología general para hacer un contraste de hipótesis
1 D t i H H t i d t H d b t l i 1. Determinar H0 y H1 teniendo en cuenta que H0 debe tener el signo = y que el método favorecerá dicha hipótesis.
2. Buscar el estadístico de contraste que será la medida de discrepancia entre la muestra y H0.
3. A partir de las propiedades del estadístico de contraste, y el nivel de significación, delimitamos con los valores críticos las regiones de aceptación y rechazo.aceptación y rechazo.
4. Localizamos si el valor que toma el estadístico de contraste cae en la región de aceptación o en la de rechazo.
Métodos Estadísticos para la Mejora de la Calidad 35
Tema 7: Inferencia Estadística
1. Intervalos de confianza para μ con muestras grandesp μ g2. Introducción al contraste de hipótesis3. Contraste de hipótesis de la media μ con muestras grandes4. Interpretación de un contraste usando el p-valorp p5. Relación entre contrastes de hipótesis e intervalos de confianza6. Inferencia en poblaciones normales
Métodos Estadísticos para la Mejora de la Calidad 36
4. Interpretación de un contraste usando el p-valor
El resultado de un contraste tiene dos elementos:El resultado de un contraste tiene dos elementos:
1. Aceptamos o rechazamos H0
2. El nivel de significación
Conclusión del contraste
Medida de su incertidumbreα2. El nivel de significación Medida de su incertidumbreα
El nivel de significación es una medida de incertidumbre poco precisa
Ejemplo0 0 1 0: ; :H Hμ μ μ μ≥ < 0.05α=Hacemos el contraste con
Caso 1 Caso 2
Rechazo H0 Acepto H0 Rechazo H0 Acepto H0
0 050.05α= 0.05α=
1 65-1.65t0=-1.7
Rechazamos H0
-1.65t0=-3
Rechazamos H0
Métodos Estadísticos para la Mejora de la Calidad 37
En ambos casos la conclusión sería la misma: Rechazamos con α=0.05
Sin embargo en el caso 2 estamos más seguros ¿Cómo expresarlo?
Vamos a ver otra forma mejor de medir la incertidumbre del resultado del contraste
El p-valor es el nivel de significación que deberíamos usar para dejar al valor del estadístico de contraste justo en la frontera de la región de rechazo
Caso 1Caso 1
0.05α=
Rechazo H0Acepto H0
p-valor= p0.045
t0=-1.7Rechazamos H0
Métodos Estadísticos para la Mejora de la Calidad 38
Rechazamos H0Como p-valor<α El p-valor es más informativo que el nivel de significación
El p-valor es el nivel de significación que deberíamos usar para dejar al valor del estadístico de contraste justo en la frontera de la región de rechazo
Caso 2
Rechazo H0Acepto H0
0 050.05α=
p-valor= 0 00 30.0013
t0=-3Rechazamos H0
En este Caso 2 el p-valor es realmente pequeño Estamos mucho más
Rechazamos H0Como p-valor<<α
Métodos Estadísticos para la Mejora de la Calidad 39
pequeño. Estamos mucho más seguros de nuestra conclusión
0 0 1 0: ; :H Hϑ ϑ ϑ ϑ≤ >
Aceptamos H0
αp-valor>α
Rechazamos H0
tt0
p-valor<α
Métodos Estadísticos para la Mejora de la Calidad 40t0
0 0 1 0: ; :H Hϑ ϑ ϑ ϑ≥ <
Rechazamos H0
p-valor>α
Aceptamos H0
αp valor α
t0
p-valor<α
Métodos Estadísticos para la Mejora de la Calidad 41t0
0 0 1 0: ; :H Hϑ ϑ ϑ ϑ= ≠
/ 2αp-valor>α
/ 2αp valor>α
-|t0| |t0|p-valor: es la suma de las dos áreas
p-valor>α
Métodos Estadísticos para la Mejora de la Calidad 42-|t0| |t0|
Tema 7: Inferencia Estadística
1. Intervalos de confianza para μ con muestras grandesp μ g2. Introducción al contraste de hipótesis3. Contraste de hipótesis de la media μ con muestras grandes4. Interpretación de un contraste usando el p-valorp p5. Relación entre contrastes de hipótesis e intervalos de confianza6. Inferencia en poblaciones normales
Métodos Estadísticos para la Mejora de la Calidad 43
5. Relación entre contrastes de hipótesis e intervalos de confianza
I l d fi l di l i i f ióIntervalos de confianza para la media y contrastes usan la misma información
ˆ /XTS
μ−=
/S n
00 ~ (0,1)ˆ /
XT NS n
μ−=
Rechazo H0 Rechazo H0
0 0 1 0: ; :H Hμ μ μ μ= ≠N(0,1)
Acepto H0
t
/ 2α / 2αSe puede demostrar que la realización de un contraste de hipótesis bilateral
: ; :H H ≠ t0
con nivel de significación α es equivalente a realizar un intervalo de confianza de nivel
0 0 1 0: ; :H Hμ μ μ μ= ≠
Métodos Estadísticos para la Mejora de la Calidad 44
a a u e a o de co a a d(1-a) y comprobar si μ0 está dentro o fuera
de dicho intervalo.
En el ejemplo de los transistores. Se desea saber si la población de transistores del proceso productivo mantiene la media en μ0 =290
C 100 b i
Ejemplo
290μ=
290μ≠H0
H1
Con 100 observaciones:
Contraste de hipótesis
Rechazo H0Rechazo H0
Acepto H0
0 1 2 3-1-2-3
α/2=0.025
Rechazamos H0:μ=290
α/2=0.025
0 1 2 3123
1.96-1.96-2.78
Intervalo de confianza de nivel (1 a)Intervalo de confianza de nivel (1-a)
Métodos Estadísticos para la Mejora de la Calidad 45
No contiene al 290
Tema 7: Inferencia Estadística
1. Intervalos de confianza para μ con muestras grandesp μ g2. Introducción al contraste de hipótesis3. Contraste de hipótesis de la media μ con muestras grandes4. Interpretación de un contraste usando el p-valorp p5. Relación entre contrastes de hipótesis e intervalos de confianza6. Inferencia en poblaciones normales
Métodos Estadísticos para la Mejora de la Calidad 46
6. Inferencia en poblaciones normales
1. Inferencia en muestras pequeñasp q2. Inferencia con la distribución t de Student3. Inferencia sobre μ4. Inferencia sobre σ²
Métodos Estadísticos para la Mejora de la Calidad 47
1. Inferencia en muestras pequeñas
En el tema anterior usamos que si X es una v. aleatoria de interés con distribución cualquiera y con
si n es grande (n>30)
C i é d dí i b d Construimos métodos estadísticos basados en la aproximación a esa normal
Métodos Estadísticos para la Mejora de la Calidad 48
¿Y si n no es grande?
1. Inferencia en muestras pequeñas
¿Y si n no es grande?¿Y si n no es grande?
Las propiedades estadísticas de
/X
nμ
σ−
ˆ /XS n
μ−
cambian!! Dependen de la distribución de X
Los intervalos y los contrastes del tema Los intervalos y los contrastes del tema anterior no serían correctos
En el caso de X normal, se tiene que independientemente del tamaño de n
X X~ (0,1)/
X Nnμ
σ−
~ˆ /XS n
μ− Distribución
t de Student
Métodos Estadísticos para la Mejora de la Calidad 49
/ nσ /S n
6: Inferencia en poblaciones normales
1. Inferencia en muestras pequeñasp q2. Inferencia con la distribución t de Student3. Inferencia sobre μ4. Inferencia sobre σ²
Métodos Estadísticos para la Mejora de la Calidad 50
2. Inferencia con la distribución t de Student
• La distribución t de Student es una variable aleatoria continua, simétrica, de media cero, y de perfil muy parecido a la normal estándar.
• Depende de un parámetro g que se denomina grados de libertad Su • Depende de un parámetro g que se denomina grados de libertad. Su notación habitual es tg
Métodos Estadísticos para la Mejora de la Calidad 51
2. Inferencia con la distribución t de Student
Puede demostrarse que si X N(μ,σ²),
1~ˆ / nX tS
μ−
−/S n
La distribución cambia con n
Si el tamaño muestral es grande
( )X μ−1~ ~ (0,1)ˆ / n
X t NS n
μ−
Métodos Estadísticos para la Mejora de la Calidad 52
6. Inferencia en poblaciones normales
1. Inferencia en muestras pequeñasp q2. Inferencia con la distribución t de Student3. Inferencia sobre μ4. Inferencia sobre σ²
Métodos Estadísticos para la Mejora de la Calidad 53
3. Inferencia sobre μ
Intervalos de confianza para m
⎧ ⎫⎪ ⎪ˆ
en lugar de α /2z
αα μ −
⎧ ⎫⎪ ⎪− ∈ ±⎨ ⎬⎪ ⎪⎩ ⎭
1; /2(1 ) : n
SIC X t
n⎪ ⎪⎩ ⎭
Métodos Estadísticos para la Mejora de la Calidad 54
En una explotación minera las rocas excavadas se someten a un análisis químico para determinar su contenido de Cadmio. Después de
li 25 bti
Ejemplo
analizar 25 rocas se obtiene que
= 9.77xSuponiendo que el contenido de Cadmio sigue una distribución
=ˆ 3.164sp q g
normal. Se quiere construir un intervalo de confianza al 95% para el contenido medio de Cadmio en las rocas de la mina.
⎧ ⎫⎪ ⎪±⎨ ⎬ˆ
(1 ) :S
IC X t αα μ −⎪ ⎪− ∈ ±⎨ ⎬⎪ ⎪⎩ ⎭
1; /2(1 ) : nIC X tn
Métodos Estadísticos para la Mejora de la Calidad 55
En una explotación minera las rocas excavadas se someten a un análisis químico para determinar su contenido de Cadmio. Después de
li 25 bti
Ejemplo
analizar 25 rocas se obtiene que
= 9.77xSuponiendo que el contenido de Cadmio sigue una distribución
=ˆ 3.164sp q g
normal. Se quiere construir un intervalo de confianza al 95% para el contenido medio de Cadmio en las rocas de la mina.
Para n=25
y a=0.05
a/2=0 025a/2=0.025
=24;0.025 2.06t
⎧ ⎫±⎨ ⎬3.164
(0 95) : 9 77 2 06 (8 47 11 07)ICMétodos Estadísticos para la Mejora de la Calidad 56
μ ∈ ± =⎨ ⎬⎩ ⎭
(0.95) : 9.77 2.06 (8.47,11.07)25
IC
Para n=25
y a=0.05a/2=0.025
2 06=24;0.025 2.06t
Usando la aproximación N(0,1) como si fuese para muestras grandes...
a/2=0.025
=0 025 1.96z
Métodos Estadísticos para la Mejora de la Calidad 57
0.025
Usando la t de Student: intervalo exacto
μ ⎧ ⎫∈ ± =⎨ ⎬⎩ ⎭
3.164(0.95) : 9.77 2.06 (8.47,11.07)
25IC
⎩ ⎭25
Usando la aproximación a N(0 1) para muestras grandes
⎧ ⎫±⎨ ⎬3.164
9 77 1 96 (8 53 11)
Usando la aproximación a N(0,1) para muestras grandes
μ ⎧ ⎫∈ ± =⎨ ⎬⎩ ⎭9.77 1.96 (8.53,11)
25
Si no usamos la t de Student, daremos un intervalo más estrecho del que tiene realmente un confianza del 95%. Este intervalo tiene una confianza menor de la que pensamosconfianza menor de la que pensamos
Métodos Estadísticos para la Mejora de la Calidad 58
Para poblaciones normales usaremos siempre la t de Student
3. Inferencia sobre μ
Contraste de hipótesis
(a) H :μ=μ ; frente a H :μ≠μ(a) H0:μ=μ0; frente a H1:μ≠μ0,
(b) H0:μ≤μ0; frente a H1:μ>μ0,
(c) H0:μ≥μ0; frente a H1:μ<μ0.
Se hacen igual, pero usando las siguientes distribuciones de referenciaSe hacen igual, pero usando las siguientes distribuciones de referencia
X X00 ~ (0,1)
/XZ N
nμ
σ−
= 00 1~ˆ / n
XT tS n
μ−
−=
/ nσ /S n
Métodos Estadísticos para la Mejora de la Calidad 59
PASO 1: PASO 2: PASO 4:
0 0 1 0: ; :H Hμ μ μ μ= ≠(a)
Rechazo H0 Rechazo H0
Acepto H0
(a) α /2zα− /2zα−1; /2ntα−− 1; /2nt
0 0 1 0: ; :H Hμ μ μ μ≤ >
Rechazo H0Acepto H0
PASO 3:
(b)(b)
αzα−1;nt
0 0 1 0: ; :H Hμ μ μ μ≥ < Rechazo H0 Acepto H0
0 ~ (0,1)Z N
0 1~ nT t −(c)
(c) α−zα−− 1;nt
Métodos Estadísticos para la Mejora de la Calidad 60La región de rechazo está
donde señala H1
α−1;n
Ejemplo Se quiere saber si la media de la ganancia β de los transistores BC547B se mantiene el valor nominal μ=290
H0 : μ=290 H1: μ≠290
Con 100 datos:
p-valor del test de la chi-cuadrado para el ajuste de una normal:
l 0 43p-value=0.43
P d i lid d X
Métodos Estadísticos para la Mejora de la Calidad 61
Podemos asumir normalidad en X
Ejemplo Se quiere saber si la media de la ganancia β de los transistores BC547B se mantiene el valor nominal μ=290
H0 : μ=290 H1: μ≠290a=0.05
Con 100 datos:
Rechazo H0 Rechazo H0
Con un nivel de significación del 5%, rechazamos H0
d f l dAcepto H0
(a)99;0.025t− 99;0.025t
La diferencia entre los datos y 290 es significativa
99;0.025
1.98-1.98=( 1 96)z
El tamaño muestral es grande, y por eso el valor crítico es muy similar al de N(0,1)
Métodos Estadísticos para la Mejora de la Calidad 62
=0.025( 1.96)z
6. Inferencia en poblaciones normales
1. Inferencia en muestras pequeñasp q2. Inferencia con la distribución t de Student3. Inferencia sobre μ4. Inferencia sobre σ²
Métodos Estadísticos para la Mejora de la Calidad 63
4. Inferencia sobre σ²
Estimadores de s2
( )2n
iX X−∑ ( )2n
iX X−∑( )2 1iS
n==∑ ( )
2 1ˆ1
iSn
==−
∑
sesgado (cuasivarianza)
insesgadog
En poblaciones normales la distribución muestral de estos En poblaciones normales, la distribución muestral de estos estimadores está relacionada con la distribución chi-cuadrado
Métodos Estadísticos para la Mejora de la Calidad 64
4. Inferencia sobre σ²
La distribución chi-cuadrado
• La chi-cuadrado es una variable aleatoria no negativa. Es asimétrica positiva
• Depende de un parámetro g que se llama grados de libertad2
• Su notación es2gχ
Si X es normal
2212
ˆ( 1) ~ nn S χσ −−σ2
212 ~ n
nS χσ −σ
Métodos Estadísticos para la Mejora de la Calidad 65
4. Inferencia sobre σ²
Intervalos de confianza para σ²Intervalos de confianza para σ²
Operando igual que en el caso de la media...
⎧ ⎫
No son simétricos alrededor de la
2 22
2 21; / 2 1;1 / 2
ˆ ˆ( 1) ( 1)(1 ) : ;n n
n s n sICα α
α σχ χ− − −
⎧ ⎫⎪ ⎪− −⎪ ⎪− ∈⎨ ⎬⎪ ⎪⎪ ⎪⎩ ⎭alrededor de la
estimación2 2
22 2(1 ) : ;ns nsIC α σ
⎧ ⎫⎪ ⎪⎪ ⎪− ∈⎨ ⎬⎪ ⎪2 21; / 2 1;1 / 2n nα αχ χ− − −
⎪ ⎪⎪ ⎪⎩ ⎭
Métodos Estadísticos para la Mejora de la Calidad 66
En una explotación minera las rocas excavadas se someten a un análisis químico para determinar su contenido de Cadmio. Después de
li 25 bti
Ejemplo
analizar 25 rocas se obtiene que
= 9.77x
Suponiendo que el contenido de Cadmio sigue una distribución
=ˆ 3.164s =2ˆ 10.01s
p q gnormal. Se quiere construir un intervalo de confianza al 99% para la varianza poblacional s2
2 22
2 2
ˆ ˆ( 1) ( 1)(1 ) : ;n s n sIC α σχ χ
⎧ ⎫⎪ ⎪− −⎪ ⎪− ∈⎨ ⎬⎪ ⎪⎪ ⎪1; / 2 1;1 / 2n nα αχ χ− − −⎪ ⎪⎩ ⎭
Métodos Estadísticos para la Mejora de la Calidad 67
En una explotación minera las rocas excavadas se someten a un análisis químico para determinar su contenido de Cadmio. Después de
li 25 bti
Ejemplo
analizar 25 rocas se obtiene que
= 9.77x
Suponiendo que el contenido de Cadmio sigue una distribución
=ˆ 3.164s =2ˆ 10.01s
p q gnormal. Se quiere construir un intervalo de confianza al 99% para la varianza poblacional s2
a/2=0.005 α/2=0.005Para una confianza del 99%
tenemos α/2=0.005
224;0.995 9.89χ = 2
24;0.005 45.6χ =
2 22 24 3.165 24 3.165(0.99) : ,
45.6 9.89IC σ
⎛ ⎞× ×∈⎜ ⎟⎝ ⎠
( )2(0.99) : 5.27,24.29IC σ ∈
Métodos Estadísticos para la Mejora de la Calidad 68¿Podría ser σ2=25?
4. Inferencia sobre σ²
Contraste de hipótesis para σ²
( ) H ² ² H ² ²(a): H0 : σ²=σ0²; H1: σ²≠σ0²
(b): H0 : σ²≤σ0²; H1: σ²>σ0²
(c): H0 : σ²≥σ0²; H1: σ²<σ0²
Sigue la misma metodología que para otros parámetros
(c): H0 : σ ≥σ0 ; H1: σ σ0
Estadístico de contraste
220 2
ˆ( 1)n SXσ−
=2
20 2
0
nSXσ
=0σ 0σ
Distribución de referencia
2 20 1~ nX χ −
Métodos Estadísticos para la Mejora de la Calidad 69
0 1nχ
PASO 1: PASO 2: PASO 4:
(a)
Rechazo H0 Rechazo H0
Acepto H0
H0 : σ²=σ0²; H1: σ²≠σ0² 220 2
ˆ( 1)n SX −=
(a)
0 20σ
22 nSX =
21; / 2n αχ −
21;1 / 2n αχ − −
H0 : σ²≤σ0²; H1: σ²>σ0²
0 20
Xσ
=
Rechazo H0Acepto H0
PASO 3:
(b)21;n αχ −
(b)
H0 : σ²≥σ0²; H1: σ²<σ0²2 20 1~ nX χ −
Rechazo H0Acepto H0
(c)
La egión de echa o está
21;1n αχ − −
(c)
Métodos Estadísticos para la Mejora de la Calidad 70
La región de rechazo está donde señala H1
Ejemplo Sobre los transistores BC547B mencionados anteriormente, teníamos el objetivo de comprobar si la media no había cambiado, así como comprobar si la varianza no había aumentado. Podemos ahora contrastar comprobar si la varianza no había aumentado. Podemos ahora contrastar este segundo punto. Los datos históricos decían que σ0²=760. Por tanto el contraste es
H0:σ²≤760;H₁:σ²>760.
Rechazo H0Acepto H0
Con 100 datos2ˆ 766.85s =
299;0.05 123.2χ =
220 2
0
ˆ( 1) 99 766.85 99.89760
n sxσ− ×
= = =; 0 7σ
N h La diferencia entre los datos y la hipótesis no es significativa No rechazamos H0la hipótesis no es significativa
(con nivel 5%) y puede deberse al azar de la muestra
Métodos Estadísticos para la Mejora de la Calidad 71
top related