variabilidad muestral variabilidad muestralmuestral ... · variabilidad muestralvariabilidad...
Post on 27-Jan-2019
296 Views
Preview:
TRANSCRIPT
Variabilidad Variabilidad Variabilidad Variabilidad MuestralMuestralMuestralMuestral , Distribuciones , Distribuciones , Distribuciones , Distribuciones de Muestreo de Medias, Inferencia de Muestreo de Medias, Inferencia de Muestreo de Medias, Inferencia de Muestreo de Medias, Inferencia
Estadística (Naturaleza de las Pruebas )Estadística (Naturaleza de las Pruebas )Estadística (Naturaleza de las Pruebas )Estadística (Naturaleza de las Pruebas )(Cap(Cap(Cap(Cap. . . . 7 y Sec. 8.3)7 y Sec. 8.3)7 y Sec. 8.3)7 y Sec. 8.3)
Distribución muestral de un estadístico
Es la distribución de valores de un estadístico (a),
obtenidas de muestras repetidas, todas del
mismo tamaño y extraídas de la misma población.
{ }8,6,4,2,0=PDistribuciones muestralesDistribuciones muestrales
Cuando obtenemos de una población de tamaño N,
muestras de tamaño n, el número de muestras posibles
será diferente si el muestreo lo hacemos con reemplazo
(urnas) o sin reemplazo. Número de muestras posibles
(muestreo con reemplazo) se obtiene con la fórmula N n.
Ej. 5 2 =25 arreglos.
Distribución muestral de un estadístico
Es la distribución de valores de un estadístico (a),
obtenidas de muestras repetidas, todas del
mismo tamaño y extraídas de la misma población.
{{{{ }}}}====
∑∑∑∑
8,6,4,2,0P
============
−−−−====
−−−−====σσσσ
============µµµµ
∑∑∑∑∑∑∑∑
∑∑∑∑
222
x N
x
N
x
4520
N
x
0 2 4 6 8
0 (0,0) (0,2) (0,4) (0,6) (0,8)
2 (2,0) (2,2) (2,4) (2,6) (2,8)
4 (4,0) (4,2) (4,4) (4,6) (4,8)
6 (6,0) (6,2) (6,4) (6,6) (6,8)
8 (8,0) (8,2) (8,4) (8,6) (8,8)
muestralespuntos2552 ====
0 2 4 6 8
0 0 1 2 3 4
2 1 2 3 4 5
4 2 3 4 5 6
x
4 2 3 4 5 6
6 3 4 5 6 7
8 4 5 6 7 8
0
1
2
3
4
x (((( ))))xP (((( ))))xPx •••• (((( )))) (((( ))))xPx 2 ••••
4
5
6
7
8
(((( ))))∑∑∑∑ ====xPi
(((( ))))
(((( ))))[[[[ ]]]] 222x
x
xPx:lpoblacionaVarianza)ii
xPx:lpoblacionaMedia)i
µµµµ−−−−⋅⋅⋅⋅====σσσσ
⋅⋅⋅⋅====µµµµ
∑∑∑∑
∑∑∑∑
(((( ))))[[[[ ]]]]
(((( )))) 22
x
x
xPx.S.D)iii
xPx:lpoblacionaVarianza)ii
µµµµ−−−−⋅⋅⋅⋅====σσσσ====
µµµµ−−−−⋅⋅⋅⋅====σσσσ
∑∑∑∑
∑∑∑∑
Teorema del Límite Central (TLC)
Si de cualquier población con media “µ” y desviación estándar “σ”,
se toman todas las posibles muestras aleatorias cada una de
tamaño “n”, entonces la distribución de medias (promedios”:
....2
.1
esSD
mediax
σσ
µµ
=
=
....2n
esSDx
σσ =
La Distribución Muestral de Medias se aproxima a la Normal a
medida que aumenta el tamaño de la muestra. La Distribución de
Medias se aproximará más estrechamente a la Distribución Normal.(((( ))))2,Nx σσσσµµµµ~
El error estándar de la media es la desviación estándar de la
Distribución de Muestreo de Medias.
nes.S.D x
x
σσσσ====σσσσ
Ejemplo: Los niños de pre-escolar tienen estaturas que se
distribuyen de manera Normal alrededor de una media de 39
pulgadas y una D.S. igual 2 pulgadas. Se toma una muestra
aleatoria de tamaño 25 y se calcula la media. ¿Cuál es la
probabilidad de que este valor medio esté entre 38.5 “ y 40 “?
x
µ
3938.5 40.0
x
Z
Teorema del Límite Central (TLC)
La distribución de medias muestrales está distribuida
alrededor de una media poblacional, con un error estándar
D.S. Si la población muestreada aleatoriamente está
distribuida normalmente, entonces la Distribución de
Medias está distribuida normalmente para todos los
tamaños muestrales. Si la población muestreada
aleatoriamente no está distribuida normalmente, entoncesaleatoriamente no está distribuida normalmente, entonces
la Distribución de Medias está distribuida normalmente en
forma aproximada para tamaños de muestra que sean lo
suficiente grandes.
El TLC se puede aplicar a muestras pequeñas (n=15 o mayor
de 15) cuando los datos ofrecen una indicación de una
distribución unimodal que en forma aproximada es
simétrica.
TLC
Si hay evidencia de alguna asimetría en los datos,
entonces el tamaño de la muestra necesita ser mucho
mayor (quizas “n” mayor o igual que 50). Si los datos
muestran evidencia de una distribución extremadamente
sesgada, el TLC aplicará si el tamaño de la muestra es
suficiente “grande”. Puede ser el caso que no seasuficiente “grande”. Puede ser el caso que no sea
“práctico” para el estudio.
Según los autores, no hay una regla que defina el tamaño
de “ n suficientemente grande” ya que varía en gran
medida acorde a la distribución de la población.
Ejemplo: Se indica que las longitudes de los peces de lago
llamados De Moivre se comportan normalmente con una
media de 15.6 “ y una desviación estándar de 3.8”.
¿Cuál es la probabilidad de que un pez De Moivre
seleccionado aleatoriamente mida menos de 15.0 “?
Si se pescan 16 peces De Moivre (muestra aleatoria),Si se pescan 16 peces De Moivre (muestra aleatoria),
¿cuál es la probabilidad de que la longitud media de la
pesca total mida menos de 15.0 “?
¿Cuál es la probabilidad de que la longitud media de la
pesca total mida mayor que 17.0 “?
Ejemplo: Los diámetros de las manzana “De Moivre” se
comportan normalmente con una media de 2.63 “ y una
desviación estándar de 0.25”.
¿Cuál es la probabilidad de que las manzanas De Moivre
seleccionadas aleatoriamente midan (diámetro) menos
de 2.25 “?
Si se seleccionan 100 manzanas De Moivre (muestra
aleatoria), ¿cuál es la probabilidad de que el diámetro
promedio de las manzanas sea mayor que 2.56 “?
Margen de error (E)
Es la máxima diferencia probable (nivel de confianza) entre la
media muestral observada y el verdadero valor de la media de
la población
E es el error máximo de estimacion de la media poblacional.
xµ
Grado de confianza Significancia Valor críticoGrado de confianza Significancia Valor crítico
90% 10%=0.10 0.05
95% 5%=0.05 0.025
99% 1%=0.01 0.005
65.1±96.1±58.2±
Sin reemplazo
1−−=
N
nN
nx
σσ
Hay dos razones importantes para las que una media de muestra
es un mejor estimador de una media poblacional que otros
estimadores como la mediana o la moda.
� En muchas poblaciones, la distribución de las medias de muestras� En muchas poblaciones, la distribución de las medias de muestras
tiende a ser más uniforme (con menos variación) que las
distribuciones de otros estadísticos.
� Para todas las poblaciones, decimos que la media de muestras
es un estimador no predispuesto de la media poblacional, lo que
quiere decir que la distribución de las medias muestrales tiende a
centrarse alrededor del valor de la media poblacional.
Estimación puntual de un parámetro
Es el valor de la estadística de la muestra correspondiente, o sea
( )( ) 22 σ
µ=
=sE
xE
( ) σ=sEEstadística insesgada
Es la estadística cuya distribución muestral tiene un valor medio
igual al valor del parámetro que se está estimándose.
Rationale for Inferential Tests
Types I, II (Errors) and probabilities
α and β
Teorema del Límite Central (TLC)
Así, se ha presenciado un fenómeno asombroso: no
importa cuál sea la forma de una población original, la
Distribución de muestreo de un
estadístico
importa cuál sea la forma de una población original, la
distribución de medias es Normal o se aproxima a la
Normal cuando n aumenta (n>30).
Pruebas de hipótesis� Supuestos= son las condiciones que deben existir para
aplicar correctamente un procedimiento estadístico
(debe tener certeza). Por ejemplo, la población
muestreada está
Por ejemplo, la población muestreada está distribuida
normalmente.
� Hipótesis es un enunciado verdadero
� Prueba de hipótesis estadística= es el proceso por el
que se toma una decisión entre dos hipótesis opuestas.
Las dos hipótesis opuestas se establecen de modo queLas dos hipótesis opuestas se establecen de modo que
una es la negasión de la otra (verdadera vs falsa). Por lo
tanto se prueba una hipótesis esperando que pueda
demostrar ser un evento improbable, lo cual implica que
es probable que la otra hipótesis sea verdadera. Las dos
hipótesis se conocen como nula y alterna.
Nota: La prueba estadística usa la técnica de prueba por
contradicción.
� Hipótesis es un enunciado verdadero
� Hipótesis nula (Ho)= es una hipótesis estadística que
describe el parámetro como un valor en específico μ= μ0 .
Por ejemplo, Ho: El envase pesa 12 onzas.
� Hipótesis alterna (Ha or H )= es la hipótesis de� Hipótesis alterna (Ha or H1)= es la hipótesis de
investigación, es la que tenemos que verificar. Se acepta
cuando se rechaza la Ho. El rechazo de la Ho implica la
verdad probable de la Ha.
Cumple con la ley de la tricotomía del álgebra. La prueba
estadística usa la técnica de prueba por contradicción.
� Por ejemplo
Ha: A mayor grado de satisfacción global en el trabajo
que perciben los empleados, mayor será el
compromiso con la organización. Otro ejemplo Ha:
Existe diferencia significativa (difieren las medias 1 y
2) entre los sujetos que tienen centro de control
interno y los que tienen centro de control externo eninterno y los que tienen centro de control externo en
el aprovechamiento académico.
� Los 4 resultados posibles pueden obtenerse por el
hecho de que la Ho sea verdadera o falsa y la decisión
de rechazarla o no la Ho.
� Error de tipo I= es el rechazo de una hipótesis nula
(Ho) verdadera, cuando en realidad debería no
rechazarla. Ej. El sujeto es encontrado culpable, cuando
en realidad es no culpable.
� “α” es la probabilidad de cometer el error de tipo I.
� Error de tipo II= es el no rechazo de una hipótesis nula
(Ho) falsa, cuando en realidad debería rechazarla.
Ej. El sujeto es encontrado no culpable, cuando en
realidad es culpable.
� “ββββ” es la probabilidad de cometer el error de tipo II.
� Evaluación de la seriedad relativa de los errores I vs II:
Ejemplo:
Ho: La droga experimental es segura (efectiva) para el
cáncer.
Error de tipo I: Rechazó la Ho. La droga no es efectiva,
cuando en realidad es efectiva. ¿Qué puede pasar encuando en realidad es efectiva. ¿Qué puede pasar en
este caso?
Error de tipo II: No rechazó la Ho. La droga es efectiva,
cuando en realidad no es efectiva (segura). ¿Qué puede
pasar en este caso?
Rationale for Inferential Tests: Types I, II
(Errors) and probabilities α and β
Ej. Una doctora llega al lugar de un accidente grave y
examina a cada víctima (paciente) del accidente,
administra la asistencia médica apropiada a todas las
víctimas (a menos que esté segura de que la víctima estávíctimas (a menos que esté segura de que la víctima está
muerta).
H0: La víctima está viva (“moribunda”).
Ha: La víctima no está viva (muerta).
H0: La víctima está viva (“moribunda”).
Decisión Verdadera Falsa
No rechazar
la H0
Correcta (Tipo A); Prob.=1− α
Verdad: La víctima está viva.
Investigador indicó que la víctima está viva. En
realidad, la víctima estaba viva y fue tratada o
Error (Tipo II); Prob.= β
Verdad: La víctima no está viva.
Investigador indicó que la víctima está
viva. En realidad, la víctima no estaba viva
(((( )))) αααα====)"moribunda("vivaestabavìctimalaquedadovivaestuvieranosicomoasistidaP
(((( )))) ββββ====−−−− vivaestabanovìctimalaquedado"moribunda"vivaestuvierasicomoasistidaP
H0: La víctima está viva (“moribunda”).
P(error Tipo I)=
P(error Tipo II)
asistida como si estuviera viva (“moribunda”). y fue tratada o asistida como si estuviera
viva (“moribunda”).
II no es grave, la víctima está recibiendo
atención médica que no es de valor.
Rechazar la
H0
Error (Tipo I); Prob.= α
Verdad: La víctima está viva.
Investigador indicó que la víctima no está viva.
En realidad, la víctima estaba viva (o sea
moribunda) y fue tratada o asistida como si no
estuviera viva (muerta). I es muy grave ya que
la víctima puede morir si no recibe atención
médica en el momento.
Correcta (Tipo B); Prob.= 1−β
Verdad: La víctima no está viva.
Investigador indicó que la víctima no está
viva. En realidad, la víctima no estaba viva
y fue tratada o asistida como si no
estuviera viva (muerta). OK.
1—α es la probabilidad de una decisión correcta cuando
la hipótesis nula (H0) es verdadera. 1—β es la Potencia de
la Prueba Estadística o sea la medida de la capacidad de
una prueba inferencial para rechazar una hipótesis falsa,
una característica muy importante.
Equilibrio de α, β y n: Si α se reduce, entonces β aumenta
o n aumenta. Si β se reduce, entonces α aumenta o n
debe aumentar. Si n se reduce, entonces α aumenta o βdebe aumentar. Si n se reduce, entonces α aumenta o β
aumenta.
Ej.
H0: La droga experimental es efectiva.
Ha: La droga experimental no es efectiva.
H0: La droga experimental es efectiva.
Decisión Verdadera Falsa
No
rechazar
la H0
Correcta (Tipo A); Prob.=1− α
Verdad: La droga experimental es
efectiva.
Investigador indicó que la droga
experimental es efectiva. En realidad, la
droga experimental es efectiva y coincide
con lo encontrado por el
investigador.¡¡¡¡¡¡¡¡Salvar vidas!!!!!!!!!!!!!
Error (Tipo II); Prob.= β
Verdad: La droga experimental no
es efectiva.
Investigador indicó que la droga
experimental es efectiva cuando en
realidad la droga experimental no es
efectiva. II puede ser muy grave ya
que la droga fue vendida siendo no
H0: La droga experimental es efectiva.
investigador.¡¡¡¡¡¡¡¡Salvar vidas!!!!!!!!!!!!! que la droga fue vendida siendo no
efectiva. ¡¡Efectos secundarios o
muertes!!
Rechazar
la H0
Error (Tipo I); Prob.= α
Verdad: La droga experimental es
efectiva.
Investigador indicó que la droga
experimental no es efectiva cuando en
realidad la droga experimental es
efectiva. I es grave ya que “guardó” la
droga y evitó salvar vidas humanas.
Correcta (Tipo B); Prob.=1− β
Verdad: La droga experimental no
es efectiva.
Investigador indicó que la droga
experimental no es efectiva cuando
en realidad la droga experimental
no es efectiva. Ok. Por lo tanto no
administra la droga.
(((( )))) αααα====efectivaesdrogalaquedado"efectivaserno"porutilizadaseanodrogaP
(((( )))) ββββ====efectivaesnodrogalaquedado"efectivaserpor"utilizadaseadrogaP
P(error Tipo I)=
P(error Tipo II)=
(((( )))) ββββ====efectivaesnodrogalaquedado"efectivaserpor"utilizadaseadrogaP
Ej. Usted sospecha que un jabón de marca supera el jabón
de una tienda, y usted quiere probar los dos jabones ya
que preferirá comprar la marca más barata. La sospecha de
usted es que “el jabón de marca supera el de la tienda”,
por lo tanto se convierte en la Ha. Las hipótesis son:
H0: No hay diferencia en el rendimiento de los jabones.
0
Ha: El jabón de marca supera al jabón vendido en la
tienda.
H0: No hay diferencia en el rendimiento de los jabones.
(Suponer que el Investigador=consumidor)
Completar la tabla siguiente:
Decisión Verdadera Falsa
No
rechazar
la H0
Correcta (Tipo A); Prob.=1− α
Verdad: No hay diferencia entre los
jabones
Investigador indicó que .
En realidad,
El consumidor compró el jabón más
barato, ahorrando dinero y obteniendo los
mismos resultados.
Error (Tipo II); Prob.= β
Verdad: El jabón de marca es mejor.
Investigador indicó que
cuando en realidad
El consumidor compró el jabón más
barato, ahorrando dinero pero
obteniendo peores resultados
(“barato cuesta caro”)
H0: No hay diferencia en el rendimiento de los jabones.
mismos resultados. (“barato cuesta caro”)
Rechazar
la H0
Error (Tipo I); Prob.= α
Verdad: No hay diferencia entre los
jabones.
Investigador indicó
cuando en realidad
El consumidor compró el jabón de marca,
gastando dinero sin obtener mejores
resultados.
Correcta (Tipo B); Prob.=1− β
Verdad: El jabón de marca es mejor.
Investigador indicó que
cuando en realidad
El consumidor compró el jabón de
marca, gastando más dinero y
obteniendo los mejores resultados.
(((( )))) αααα====jaboneslosentrediferenciahaynoP
(((( )))) ββββ====mejoresmarcadejabónelP
P(error Tipo I)=
P(error Tipo II)=
(((( )))) ββββ====mejoresmarcadejabónelP
� Valores de conocidos: 5%=0.05; 1%=0.01; 2.5%
=0.025 Niveles de significado
� Nivel de confiabilidad: 1-α: 95%, 99%, 97.5%
� La prueba estadística es una variable aleatoria para la
toma de decisión de la Ho. Es una fórmula que se
representa con las letras: Z*; t*; χχχχ* .
αααα
representa con las letras: Z*; t*; χχχχ* .
� RR es la región de los valores que toma la estadística
de prueba que causan el rechazo de la Ho. Recordar: Es
la región sombreada.
� Enfoque basado en un valor de probabilidad “p-value”:
Es el nivel de significancia más pequeño
� Supuesto Ho verdadera. Existen tres casos: p=P(z>z*);
p=P(z<z*); y p=2P(z>ABS(z*)).
� Toma de decisiones: (1)Si el p-value es menor o igual
que α, entonces Ho es rechazada significativamente; (2) Si
el p-value es mayor que α, entonces Ho no es rechazada o
sea “No hay suficiente evidencia en el nivel de
significancia para rechazar lo indicado en la Ho.significancia para rechazar lo indicado en la Ho.
� Prueba Z
⇒para una población
⇒varianza poblacional conocida
⇒la distribución muestral de medias es normal
⇒muestras grandes o sea n ≥≥≥≥ 30.
� Prueba t “Student” para una población
� Ej. La media esperada de una población continua es 100
y su D.S. es 12. Una muestra aleatoria de 50 mediciones
de la población proporciona una media de 96. Con un
nivel de significancia de 0.01, se realiza una prueba para
decidir entre los enunciados “la media poblacional es
100” vs “la media poblacional es diferente de 100”.
Determine o calcular los siguientes:� Ho� Ho
� Ha
� α y 1 − α
� μ
�� Error estándar
� Error estándar de las medias
� Estadístico de prueba z calculado
� p−value
x
top related