variabilidad muestral variabilidad muestralmuestral ... · variabilidad muestralvariabilidad...

Post on 27-Jan-2019

296 Views

Category:

Documents

0 Downloads

Preview:

Click to see full reader

TRANSCRIPT

Variabilidad Variabilidad Variabilidad Variabilidad MuestralMuestralMuestralMuestral , Distribuciones , Distribuciones , Distribuciones , Distribuciones de Muestreo de Medias, Inferencia de Muestreo de Medias, Inferencia de Muestreo de Medias, Inferencia de Muestreo de Medias, Inferencia

Estadística (Naturaleza de las Pruebas )Estadística (Naturaleza de las Pruebas )Estadística (Naturaleza de las Pruebas )Estadística (Naturaleza de las Pruebas )(Cap(Cap(Cap(Cap. . . . 7 y Sec. 8.3)7 y Sec. 8.3)7 y Sec. 8.3)7 y Sec. 8.3)

Distribución muestral de un estadístico

Es la distribución de valores de un estadístico (a),

obtenidas de muestras repetidas, todas del

mismo tamaño y extraídas de la misma población.

{ }8,6,4,2,0=PDistribuciones muestralesDistribuciones muestrales

Cuando obtenemos de una población de tamaño N,

muestras de tamaño n, el número de muestras posibles

será diferente si el muestreo lo hacemos con reemplazo

(urnas) o sin reemplazo. Número de muestras posibles

(muestreo con reemplazo) se obtiene con la fórmula N n.

Ej. 5 2 =25 arreglos.

Distribución muestral de un estadístico

Es la distribución de valores de un estadístico (a),

obtenidas de muestras repetidas, todas del

mismo tamaño y extraídas de la misma población.

{{{{ }}}}====

∑∑∑∑

8,6,4,2,0P

============

−−−−====

−−−−====σσσσ

============µµµµ

∑∑∑∑∑∑∑∑

∑∑∑∑

222

x N

x

N

x

4520

N

x

0 2 4 6 8

0 (0,0) (0,2) (0,4) (0,6) (0,8)

2 (2,0) (2,2) (2,4) (2,6) (2,8)

4 (4,0) (4,2) (4,4) (4,6) (4,8)

6 (6,0) (6,2) (6,4) (6,6) (6,8)

8 (8,0) (8,2) (8,4) (8,6) (8,8)

muestralespuntos2552 ====

0 2 4 6 8

0 0 1 2 3 4

2 1 2 3 4 5

4 2 3 4 5 6

x

4 2 3 4 5 6

6 3 4 5 6 7

8 4 5 6 7 8

0

1

2

3

4

x (((( ))))xP (((( ))))xPx •••• (((( )))) (((( ))))xPx 2 ••••

4

5

6

7

8

(((( ))))∑∑∑∑ ====xPi

(((( ))))

(((( ))))[[[[ ]]]] 222x

x

xPx:lpoblacionaVarianza)ii

xPx:lpoblacionaMedia)i

µµµµ−−−−⋅⋅⋅⋅====σσσσ

⋅⋅⋅⋅====µµµµ

∑∑∑∑

∑∑∑∑

(((( ))))[[[[ ]]]]

(((( )))) 22

x

x

xPx.S.D)iii

xPx:lpoblacionaVarianza)ii

µµµµ−−−−⋅⋅⋅⋅====σσσσ====

µµµµ−−−−⋅⋅⋅⋅====σσσσ

∑∑∑∑

∑∑∑∑

Teorema del Límite Central (TLC)

Si de cualquier población con media “µ” y desviación estándar “σ”,

se toman todas las posibles muestras aleatorias cada una de

tamaño “n”, entonces la distribución de medias (promedios”:

....2

.1

esSD

mediax

σσ

µµ

=

=

....2n

esSDx

σσ =

La Distribución Muestral de Medias se aproxima a la Normal a

medida que aumenta el tamaño de la muestra. La Distribución de

Medias se aproximará más estrechamente a la Distribución Normal.(((( ))))2,Nx σσσσµµµµ~

El error estándar de la media es la desviación estándar de la

Distribución de Muestreo de Medias.

nes.S.D x

x

σσσσ====σσσσ

Ejemplo: Los niños de pre-escolar tienen estaturas que se

distribuyen de manera Normal alrededor de una media de 39

pulgadas y una D.S. igual 2 pulgadas. Se toma una muestra

aleatoria de tamaño 25 y se calcula la media. ¿Cuál es la

probabilidad de que este valor medio esté entre 38.5 “ y 40 “?

x

µ

3938.5 40.0

x

Z

Teorema del Límite Central (TLC)

La distribución de medias muestrales está distribuida

alrededor de una media poblacional, con un error estándar

D.S. Si la población muestreada aleatoriamente está

distribuida normalmente, entonces la Distribución de

Medias está distribuida normalmente para todos los

tamaños muestrales. Si la población muestreada

aleatoriamente no está distribuida normalmente, entoncesaleatoriamente no está distribuida normalmente, entonces

la Distribución de Medias está distribuida normalmente en

forma aproximada para tamaños de muestra que sean lo

suficiente grandes.

El TLC se puede aplicar a muestras pequeñas (n=15 o mayor

de 15) cuando los datos ofrecen una indicación de una

distribución unimodal que en forma aproximada es

simétrica.

TLC

Si hay evidencia de alguna asimetría en los datos,

entonces el tamaño de la muestra necesita ser mucho

mayor (quizas “n” mayor o igual que 50). Si los datos

muestran evidencia de una distribución extremadamente

sesgada, el TLC aplicará si el tamaño de la muestra es

suficiente “grande”. Puede ser el caso que no seasuficiente “grande”. Puede ser el caso que no sea

“práctico” para el estudio.

Según los autores, no hay una regla que defina el tamaño

de “ n suficientemente grande” ya que varía en gran

medida acorde a la distribución de la población.

Ejemplo: Se indica que las longitudes de los peces de lago

llamados De Moivre se comportan normalmente con una

media de 15.6 “ y una desviación estándar de 3.8”.

¿Cuál es la probabilidad de que un pez De Moivre

seleccionado aleatoriamente mida menos de 15.0 “?

Si se pescan 16 peces De Moivre (muestra aleatoria),Si se pescan 16 peces De Moivre (muestra aleatoria),

¿cuál es la probabilidad de que la longitud media de la

pesca total mida menos de 15.0 “?

¿Cuál es la probabilidad de que la longitud media de la

pesca total mida mayor que 17.0 “?

Ejemplo: Los diámetros de las manzana “De Moivre” se

comportan normalmente con una media de 2.63 “ y una

desviación estándar de 0.25”.

¿Cuál es la probabilidad de que las manzanas De Moivre

seleccionadas aleatoriamente midan (diámetro) menos

de 2.25 “?

Si se seleccionan 100 manzanas De Moivre (muestra

aleatoria), ¿cuál es la probabilidad de que el diámetro

promedio de las manzanas sea mayor que 2.56 “?

Margen de error (E)

Es la máxima diferencia probable (nivel de confianza) entre la

media muestral observada y el verdadero valor de la media de

la población

E es el error máximo de estimacion de la media poblacional.

Grado de confianza Significancia Valor críticoGrado de confianza Significancia Valor crítico

90% 10%=0.10 0.05

95% 5%=0.05 0.025

99% 1%=0.01 0.005

65.1±96.1±58.2±

Sin reemplazo

1−−=

N

nN

nx

σσ

Hay dos razones importantes para las que una media de muestra

es un mejor estimador de una media poblacional que otros

estimadores como la mediana o la moda.

� En muchas poblaciones, la distribución de las medias de muestras� En muchas poblaciones, la distribución de las medias de muestras

tiende a ser más uniforme (con menos variación) que las

distribuciones de otros estadísticos.

� Para todas las poblaciones, decimos que la media de muestras

es un estimador no predispuesto de la media poblacional, lo que

quiere decir que la distribución de las medias muestrales tiende a

centrarse alrededor del valor de la media poblacional.

Estimación puntual de un parámetro

Es el valor de la estadística de la muestra correspondiente, o sea

( )( ) 22 σ

µ=

=sE

xE

( ) σ=sEEstadística insesgada

Es la estadística cuya distribución muestral tiene un valor medio

igual al valor del parámetro que se está estimándose.

Rationale for Inferential Tests

Types I, II (Errors) and probabilities

α and β

Teorema del Límite Central (TLC)

Así, se ha presenciado un fenómeno asombroso: no

importa cuál sea la forma de una población original, la

Distribución de muestreo de un

estadístico

importa cuál sea la forma de una población original, la

distribución de medias es Normal o se aproxima a la

Normal cuando n aumenta (n>30).

Pruebas de hipótesis� Supuestos= son las condiciones que deben existir para

aplicar correctamente un procedimiento estadístico

(debe tener certeza). Por ejemplo, la población

muestreada está

Por ejemplo, la población muestreada está distribuida

normalmente.

� Hipótesis es un enunciado verdadero

� Prueba de hipótesis estadística= es el proceso por el

que se toma una decisión entre dos hipótesis opuestas.

Las dos hipótesis opuestas se establecen de modo queLas dos hipótesis opuestas se establecen de modo que

una es la negasión de la otra (verdadera vs falsa). Por lo

tanto se prueba una hipótesis esperando que pueda

demostrar ser un evento improbable, lo cual implica que

es probable que la otra hipótesis sea verdadera. Las dos

hipótesis se conocen como nula y alterna.

Nota: La prueba estadística usa la técnica de prueba por

contradicción.

� Hipótesis es un enunciado verdadero

� Hipótesis nula (Ho)= es una hipótesis estadística que

describe el parámetro como un valor en específico μ= μ0 .

Por ejemplo, Ho: El envase pesa 12 onzas.

� Hipótesis alterna (Ha or H )= es la hipótesis de� Hipótesis alterna (Ha or H1)= es la hipótesis de

investigación, es la que tenemos que verificar. Se acepta

cuando se rechaza la Ho. El rechazo de la Ho implica la

verdad probable de la Ha.

Cumple con la ley de la tricotomía del álgebra. La prueba

estadística usa la técnica de prueba por contradicción.

� Por ejemplo

Ha: A mayor grado de satisfacción global en el trabajo

que perciben los empleados, mayor será el

compromiso con la organización. Otro ejemplo Ha:

Existe diferencia significativa (difieren las medias 1 y

2) entre los sujetos que tienen centro de control

interno y los que tienen centro de control externo eninterno y los que tienen centro de control externo en

el aprovechamiento académico.

� Los 4 resultados posibles pueden obtenerse por el

hecho de que la Ho sea verdadera o falsa y la decisión

de rechazarla o no la Ho.

� Error de tipo I= es el rechazo de una hipótesis nula

(Ho) verdadera, cuando en realidad debería no

rechazarla. Ej. El sujeto es encontrado culpable, cuando

en realidad es no culpable.

� “α” es la probabilidad de cometer el error de tipo I.

� Error de tipo II= es el no rechazo de una hipótesis nula

(Ho) falsa, cuando en realidad debería rechazarla.

Ej. El sujeto es encontrado no culpable, cuando en

realidad es culpable.

� “ββββ” es la probabilidad de cometer el error de tipo II.

� Evaluación de la seriedad relativa de los errores I vs II:

Ejemplo:

Ho: La droga experimental es segura (efectiva) para el

cáncer.

Error de tipo I: Rechazó la Ho. La droga no es efectiva,

cuando en realidad es efectiva. ¿Qué puede pasar encuando en realidad es efectiva. ¿Qué puede pasar en

este caso?

Error de tipo II: No rechazó la Ho. La droga es efectiva,

cuando en realidad no es efectiva (segura). ¿Qué puede

pasar en este caso?

Rationale for Inferential Tests: Types I, II

(Errors) and probabilities α and β

Ej. Una doctora llega al lugar de un accidente grave y

examina a cada víctima (paciente) del accidente,

administra la asistencia médica apropiada a todas las

víctimas (a menos que esté segura de que la víctima estávíctimas (a menos que esté segura de que la víctima está

muerta).

H0: La víctima está viva (“moribunda”).

Ha: La víctima no está viva (muerta).

H0: La víctima está viva (“moribunda”).

Decisión Verdadera Falsa

No rechazar

la H0

Correcta (Tipo A); Prob.=1− α

Verdad: La víctima está viva.

Investigador indicó que la víctima está viva. En

realidad, la víctima estaba viva y fue tratada o

Error (Tipo II); Prob.= β

Verdad: La víctima no está viva.

Investigador indicó que la víctima está

viva. En realidad, la víctima no estaba viva

(((( )))) αααα====)"moribunda("vivaestabavìctimalaquedadovivaestuvieranosicomoasistidaP

(((( )))) ββββ====−−−− vivaestabanovìctimalaquedado"moribunda"vivaestuvierasicomoasistidaP

H0: La víctima está viva (“moribunda”).

P(error Tipo I)=

P(error Tipo II)

asistida como si estuviera viva (“moribunda”). y fue tratada o asistida como si estuviera

viva (“moribunda”).

II no es grave, la víctima está recibiendo

atención médica que no es de valor.

Rechazar la

H0

Error (Tipo I); Prob.= α

Verdad: La víctima está viva.

Investigador indicó que la víctima no está viva.

En realidad, la víctima estaba viva (o sea

moribunda) y fue tratada o asistida como si no

estuviera viva (muerta). I es muy grave ya que

la víctima puede morir si no recibe atención

médica en el momento.

Correcta (Tipo B); Prob.= 1−β

Verdad: La víctima no está viva.

Investigador indicó que la víctima no está

viva. En realidad, la víctima no estaba viva

y fue tratada o asistida como si no

estuviera viva (muerta). OK.

1—α es la probabilidad de una decisión correcta cuando

la hipótesis nula (H0) es verdadera. 1—β es la Potencia de

la Prueba Estadística o sea la medida de la capacidad de

una prueba inferencial para rechazar una hipótesis falsa,

una característica muy importante.

Equilibrio de α, β y n: Si α se reduce, entonces β aumenta

o n aumenta. Si β se reduce, entonces α aumenta o n

debe aumentar. Si n se reduce, entonces α aumenta o βdebe aumentar. Si n se reduce, entonces α aumenta o β

aumenta.

Ej.

H0: La droga experimental es efectiva.

Ha: La droga experimental no es efectiva.

H0: La droga experimental es efectiva.

Decisión Verdadera Falsa

No

rechazar

la H0

Correcta (Tipo A); Prob.=1− α

Verdad: La droga experimental es

efectiva.

Investigador indicó que la droga

experimental es efectiva. En realidad, la

droga experimental es efectiva y coincide

con lo encontrado por el

investigador.¡¡¡¡¡¡¡¡Salvar vidas!!!!!!!!!!!!!

Error (Tipo II); Prob.= β

Verdad: La droga experimental no

es efectiva.

Investigador indicó que la droga

experimental es efectiva cuando en

realidad la droga experimental no es

efectiva. II puede ser muy grave ya

que la droga fue vendida siendo no

H0: La droga experimental es efectiva.

investigador.¡¡¡¡¡¡¡¡Salvar vidas!!!!!!!!!!!!! que la droga fue vendida siendo no

efectiva. ¡¡Efectos secundarios o

muertes!!

Rechazar

la H0

Error (Tipo I); Prob.= α

Verdad: La droga experimental es

efectiva.

Investigador indicó que la droga

experimental no es efectiva cuando en

realidad la droga experimental es

efectiva. I es grave ya que “guardó” la

droga y evitó salvar vidas humanas.

Correcta (Tipo B); Prob.=1− β

Verdad: La droga experimental no

es efectiva.

Investigador indicó que la droga

experimental no es efectiva cuando

en realidad la droga experimental

no es efectiva. Ok. Por lo tanto no

administra la droga.

(((( )))) αααα====efectivaesdrogalaquedado"efectivaserno"porutilizadaseanodrogaP

(((( )))) ββββ====efectivaesnodrogalaquedado"efectivaserpor"utilizadaseadrogaP

P(error Tipo I)=

P(error Tipo II)=

(((( )))) ββββ====efectivaesnodrogalaquedado"efectivaserpor"utilizadaseadrogaP

Ej. Usted sospecha que un jabón de marca supera el jabón

de una tienda, y usted quiere probar los dos jabones ya

que preferirá comprar la marca más barata. La sospecha de

usted es que “el jabón de marca supera el de la tienda”,

por lo tanto se convierte en la Ha. Las hipótesis son:

H0: No hay diferencia en el rendimiento de los jabones.

0

Ha: El jabón de marca supera al jabón vendido en la

tienda.

H0: No hay diferencia en el rendimiento de los jabones.

(Suponer que el Investigador=consumidor)

Completar la tabla siguiente:

Decisión Verdadera Falsa

No

rechazar

la H0

Correcta (Tipo A); Prob.=1− α

Verdad: No hay diferencia entre los

jabones

Investigador indicó que .

En realidad,

El consumidor compró el jabón más

barato, ahorrando dinero y obteniendo los

mismos resultados.

Error (Tipo II); Prob.= β

Verdad: El jabón de marca es mejor.

Investigador indicó que

cuando en realidad

El consumidor compró el jabón más

barato, ahorrando dinero pero

obteniendo peores resultados

(“barato cuesta caro”)

H0: No hay diferencia en el rendimiento de los jabones.

mismos resultados. (“barato cuesta caro”)

Rechazar

la H0

Error (Tipo I); Prob.= α

Verdad: No hay diferencia entre los

jabones.

Investigador indicó

cuando en realidad

El consumidor compró el jabón de marca,

gastando dinero sin obtener mejores

resultados.

Correcta (Tipo B); Prob.=1− β

Verdad: El jabón de marca es mejor.

Investigador indicó que

cuando en realidad

El consumidor compró el jabón de

marca, gastando más dinero y

obteniendo los mejores resultados.

(((( )))) αααα====jaboneslosentrediferenciahaynoP

(((( )))) ββββ====mejoresmarcadejabónelP

P(error Tipo I)=

P(error Tipo II)=

(((( )))) ββββ====mejoresmarcadejabónelP

� Valores de conocidos: 5%=0.05; 1%=0.01; 2.5%

=0.025 Niveles de significado

� Nivel de confiabilidad: 1-α: 95%, 99%, 97.5%

� La prueba estadística es una variable aleatoria para la

toma de decisión de la Ho. Es una fórmula que se

representa con las letras: Z*; t*; χχχχ* .

αααα

representa con las letras: Z*; t*; χχχχ* .

� RR es la región de los valores que toma la estadística

de prueba que causan el rechazo de la Ho. Recordar: Es

la región sombreada.

� Enfoque basado en un valor de probabilidad “p-value”:

Es el nivel de significancia más pequeño

� Supuesto Ho verdadera. Existen tres casos: p=P(z>z*);

p=P(z<z*); y p=2P(z>ABS(z*)).

� Toma de decisiones: (1)Si el p-value es menor o igual

que α, entonces Ho es rechazada significativamente; (2) Si

el p-value es mayor que α, entonces Ho no es rechazada o

sea “No hay suficiente evidencia en el nivel de

significancia para rechazar lo indicado en la Ho.significancia para rechazar lo indicado en la Ho.

� Prueba Z

⇒para una población

⇒varianza poblacional conocida

⇒la distribución muestral de medias es normal

⇒muestras grandes o sea n ≥≥≥≥ 30.

� Prueba t “Student” para una población

� Ej. La media esperada de una población continua es 100

y su D.S. es 12. Una muestra aleatoria de 50 mediciones

de la población proporciona una media de 96. Con un

nivel de significancia de 0.01, se realiza una prueba para

decidir entre los enunciados “la media poblacional es

100” vs “la media poblacional es diferente de 100”.

Determine o calcular los siguientes:� Ho� Ho

� Ha

� α y 1 − α

� μ

�� Error estándar

� Error estándar de las medias

� Estadístico de prueba z calculado

� p−value

x

top related