elementos generales de los test de hipótesis y estadística inferencial una de las metas de la...

81
Elementos generales de los Elementos generales de los test de hipótesis y test de hipótesis y estadística inferencial estadística inferencial • Una de las metas de la estadística es realizar inferencias sobre la población a partir de muestras de la población. Estadística Biología Marina 200 3 Test Estadístico Componentes Hipótesis Nula (H Observaciones Test estadístico Supuestos

Upload: casilda-rozario

Post on 23-Jan-2016

222 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Elementos generales de los test de hipótesis y estadística inferencial Una de las metas de la estadística es realizar inferencias sobre la población a

Elementos generales de los test Elementos generales de los test de hipótesis y estadística de hipótesis y estadística

inferencial inferencial • Una de las metas de la estadística es

realizar inferencias sobre la población a partir de muestras de la población.

Estadística Biología Marina 2003

Test Estadístico

ComponentesComponentes

•Hipótesis Nula (Ho)•Observaciones•Test estadístico•Supuestos

Page 2: Elementos generales de los test de hipótesis y estadística inferencial Una de las metas de la estadística es realizar inferencias sobre la población a

Poniendo a prueba hipótesis Poniendo a prueba hipótesis estadísticas.estadísticas.

Estadística Biología Marina 2003

• Determinar la hipótesis nula partir de una declaración sobre la población.

• La hipótesis nula expresa el concepto de “NO DIFERENCIA”

• De esta manera, generalmente la hipótesis nula expresa la ausencia de un patrón.

Page 3: Elementos generales de los test de hipótesis y estadística inferencial Una de las metas de la estadística es realizar inferencias sobre la población a

Preguntas biológicas versus Preguntas biológicas versus hipótesis “nula” estadísticahipótesis “nula” estadística

• ¿Los machos y hembras difieren en tamaño?

• Ho: El tamaño promedio de machos y hembras es el mismo.

• ¿Existen diferencias entre la estructura de talla de dos poblaciones de peces?

• Ho: La distribución de frecuencia de tallas es independiente de la población.

Estadística Biología Marina 2003

Page 4: Elementos generales de los test de hipótesis y estadística inferencial Una de las metas de la estadística es realizar inferencias sobre la población a

• Si concluimos que la hipótesis nula es falsa…

• Una hipótesis alternativa (Ha) es asumida como verdadera.

Estadística Biología Marina 2003

Cada test estadístico debe tener una Ho y Ha, y todos los

posibles resultados son cubiertos por este par de

hipótesis.

Page 5: Elementos generales de los test de hipótesis y estadística inferencial Una de las metas de la estadística es realizar inferencias sobre la población a

“L as hipótesis deben ser establecidas ANTES que los

datos sean recolectados.

Proponer hipótesis después de la examinación de los datos puede invalidar un test estadístico.”

Estadística Biología Marina 2003

TENER EN CUENTA:TENER EN CUENTA:

Page 6: Elementos generales de los test de hipótesis y estadística inferencial Una de las metas de la estadística es realizar inferencias sobre la población a

Estadística Biología Marina 200

3

Testeado una hipótesis biológicaTesteado una hipótesis biológicaTesteado una hipótesis biológicaTesteado una hipótesis biológica

• ¿La droga A y B difieren en su eficacia en el tratamiento del cáncer?

• Generación de hipótesis biológica.

• Generación de predicción biológica.

• ¿La droga A y B difieren en su eficacia en el tratamiento del cáncer?

• Generación de hipótesis biológica.

• Generación de predicción biológica.

Cuestionamiento biológico

Hipótesis biológica

So

bre

viv

enci

a

A B

Page 7: Elementos generales de los test de hipótesis y estadística inferencial Una de las metas de la estadística es realizar inferencias sobre la población a

Al tener los datos se debe seguir Al tener los datos se debe seguir los siguientes pasos:los siguientes pasos:

1. Someter los datos a análisis estadístico.

2. La función del test estadístico es generar un valor (el valor de un test estadístico), el cual es convertido vía una tabla o un algoritmo (computador) a un valor de probabilidad.

3. Interpretación del test estadístico y su probabilidad.

Estadística Biología Marina 2003

Page 8: Elementos generales de los test de hipótesis y estadística inferencial Una de las metas de la estadística es realizar inferencias sobre la población a

Pero:Pero:• ¿Qué tan diferentes necesitan

ser dos valores para que podamos concluir, al menos TENTATIVAMENTE, que son diferentes?

Estadística Biología Marina 2003

So

bre

viv

enci

a

A B

¿Son diferentes?¿Son diferentes?

Page 9: Elementos generales de los test de hipótesis y estadística inferencial Una de las metas de la estadística es realizar inferencias sobre la población a

Tomando una decisiónTomando una decisión

• Es necesario un criterio objetivo para rechazar o no rechazar una hipótesis nula.

• Deben existir algunos puntos prácticos en los que nos situemos convencidos de rechazar o no rechazar una hipótesis.

• En este sentido la probabilidad asociada (P) con el test estadístico se encarga de tomar la decisión por nosotros.

Estadística Biología Marina 2003

HaHo

Page 10: Elementos generales de los test de hipótesis y estadística inferencial Una de las metas de la estadística es realizar inferencias sobre la población a

Algo sobre probabilidades:Algo sobre probabilidades:

• La probabilidad de que un evento ocurría oscila entre 0 y 1 (0 = evento imposible y 1 = siempre ocurre este evento).

• Para probar una hipótesis sobre la media, debemos evaluar si es alta o baja la probabilidad de que la media de la muestra esté cerca de la media de la distribución muestral.

• Si es baja, el investigador dudará en generalizar a la población o si es alta, el investigador podrá hacer generalizaciones

Estadística Biología Marina 2003

Page 11: Elementos generales de los test de hipótesis y estadística inferencial Una de las metas de la estadística es realizar inferencias sobre la población a

¿Qué tan alta o baja debe ser nuestra ¿Qué tan alta o baja debe ser nuestra probabilidad para poder indicar a ciencia probabilidad para poder indicar a ciencia

cierta que la media de la muestra está cierta que la media de la muestra está cerca o lejos de la media poblacional?cerca o lejos de la media poblacional?

Estadística Biología Marina 2003

Punto de referencia

Nivel de significáncia o

Nivel alfa (denotados por )

En general una probabilidad de 0.05 o 5% (a veces se utiliza también 0.01 o 1%) es comúnmente utilizada como

nivel de significancia

Veamos un ejemplo practico…

Page 12: Elementos generales de los test de hipótesis y estadística inferencial Una de las metas de la estadística es realizar inferencias sobre la población a

Vamos a apostar a las carreras Vamos a apostar a las carreras de caballos.de caballos.

¿Apostarían?, ¿A que caballo?

Estadística Biología Marina 2003

CatilloMorochito

5% v/s 95%5% v/s 95%

Pero…

¿Estarían completamente seguros de ganar?

¿Es una decisión difícil de tomar?

Page 13: Elementos generales de los test de hipótesis y estadística inferencial Una de las metas de la estadística es realizar inferencias sobre la población a

De esta forma alfa = 0.05 nos De esta forma alfa = 0.05 nos expresa el nivel de seguridad expresa el nivel de seguridad con el que estamos tomando con el que estamos tomando

nuestra decisiónnuestra decisión

Estadística Biología Marina 2003

• En otras palabras:– Un nivel de significáncia de 0.05 implica que el

investigador tiene 95% de seguridad para generalizar sin equivocarse, y sólo 5% en contra.

– En términos de probabilidad, 0.95 y 0.05, ambos suman la unidad (universo)

Page 14: Elementos generales de los test de hipótesis y estadística inferencial Una de las metas de la estadística es realizar inferencias sobre la población a

De esta manera, la matriz de posibilidades es:De esta manera, la matriz de posibilidades es:

• Si la probabilidad es > que el nivel de significancia, entonces OPERACIONALMENTE, concluimos que los datos APOYAN la Ho. Esto es, que la Ho es “verdadera”. No se obtuvo significancia estadística.

• Si la probabilidad generada es que el nivel de significancia, entonces concluimos que no es verdad que la Ho es correcta. De este modo la Ho es RECHAZADA.

• Mientras menor sea la probabilidad generada (0.0001 vs 0.049), mayor confidencia se tiene para rechazar la Ho.

Estadística Biología Marina 2003

Page 15: Elementos generales de los test de hipótesis y estadística inferencial Una de las metas de la estadística es realizar inferencias sobre la población a

En resumen:En resumen:

Estadística Biología Marina 2003

Page 16: Elementos generales de los test de hipótesis y estadística inferencial Una de las metas de la estadística es realizar inferencias sobre la población a

¿Es posible cometer un error al realizar estos procedimientos

de estadística inferencial?

Nunca podemos estar completamente seguros de nuestra estimación.

Trabajamos con altos niveles de confianza o seguridad y aunque el riesgo es mínimo,

podría cometerse un error.

Estos son…

Estadística Biología Marina 2003

Page 17: Elementos generales de los test de hipótesis y estadística inferencial Una de las metas de la estadística es realizar inferencias sobre la población a

Aceptar un hipótesis verdadera (decisión correcta).

Rechazar una hipótesis falsa (decisión correcta).

X Aceptar una hipótesis falsa (error conocido como el tipo II o beta).

X Rechazar una hipótesis verdadera (error conocido como de tipo I o error alfa).

Estadística Biología Marina 2003

Page 18: Elementos generales de los test de hipótesis y estadística inferencial Una de las metas de la estadística es realizar inferencias sobre la población a

Ambos errores son ideseables y para Ambos errores son ideseables y para reducir la probabilidad de cometerlos se reducir la probabilidad de cometerlos se

debe tener en cuenta:debe tener en cuenta:

Estadística Biología Marina 2003

Muestras representativas

Inspección cuidadosa de datos

Selección de pruebas estadísticas apropiadas

Conocimiento apropiado de la población con la que estamos trabajando

Page 19: Elementos generales de los test de hipótesis y estadística inferencial Una de las metas de la estadística es realizar inferencias sobre la población a

Tipos de errores en los Test de Hipótesis

Estadística Biología Marina 2003

Si Ho es verdadera

Si Ho es falsa

Si Ho es rechazada

Error tipo I (alfa)

No hay error

Si Ho no es rechazada

No hay errorError tipo II (beta)

Page 20: Elementos generales de los test de hipótesis y estadística inferencial Una de las metas de la estadística es realizar inferencias sobre la población a

Veamos como Veamos como funcionan los test funcionan los test

estadísticos con el test estadísticos con el test de chi-Cuadradode chi-Cuadrado

Estadística Biología Marina 2003

Page 21: Elementos generales de los test de hipótesis y estadística inferencial Una de las metas de la estadística es realizar inferencias sobre la población a

Test de bondad de ajuste Test de bondad de ajuste de chi-cuadrado o Xde chi-cuadrado o X22

• Es una prueba estadística para evaluar hipótesis acerca de la relación entre variables nominales.Como funciona:– A partir de datos “observados” evalua si la

población de éstos, se ajustan a una determinada distribución teórica “esperada”

Estadística Biología Marina 2003

¿Les suena conocido?

Page 22: Elementos generales de los test de hipótesis y estadística inferencial Una de las metas de la estadística es realizar inferencias sobre la población a

A = alelo para color amarillo.

a = alelo para color verde.

Se realiza un cruce monohibrido de 100 plantas

heterocigotas

¿Resultados?

Estadística Biología Marina 2003

Relación fenotípica de 3:1 (amarillas verdes)

Resultados: 84 amarillas.

16 verdes.

¿La distribución observada se ajusta o no se ajusta a la distribución esperada?

Page 23: Elementos generales de los test de hipótesis y estadística inferencial Una de las metas de la estadística es realizar inferencias sobre la población a

Cuales son la Hipótesis Cuales son la Hipótesis EstadísticasEstadísticas

• Ha: las frecuencias observadas son iguales a las frecuencias esperadas.

• Ha: las frecuencias observadas son diferentes a las frecuencias esperadas.

Estadística Biología Marina 2003

Page 24: Elementos generales de los test de hipótesis y estadística inferencial Una de las metas de la estadística es realizar inferencias sobre la población a

El cálculo del estadístico Chi-Cuadrado El cálculo del estadístico Chi-Cuadrado

• Entrega una medida de cuan lejos la distribución observada se encuentra de la distribución esperada.

Estadística Biología Marina 2003

if

iffiX

ˆ)ˆ( 2

2

X2 = (frecuencia esperada-frecuencia

observada)2

frecuencia esperada

o

Page 25: Elementos generales de los test de hipótesis y estadística inferencial Una de las metas de la estadística es realizar inferencias sobre la población a

Para nuestro ejemploPara nuestro ejemplo

• ¿Contra que comparamos este valor?• Contra un valor crítico de X2 ,.

Estadística Biología Marina 2003

Observados

Amarillo Verde

84 16

Amarillo Verde

75 25

¿Esperados?

if

iffiX

ˆ)ˆ( 2

2 = 4.320

Este se ubica en la tabla respectiva

Con grados de libertad de : = k -1 X2 0.05,1= 3.841

Page 26: Elementos generales de los test de hipótesis y estadística inferencial Una de las metas de la estadística es realizar inferencias sobre la población a

Finalmente:

• Si el valor calculado es mayor que el valor crítico, se rechaza la Ho.

• Es este caso Rechazamos Ho, ya que la probabilidad asociada al valor calculado 4.320 es menor a 0.05 (alpha). Es decir: 0.025<P<0.05.

Estadística Biología Marina 2003

Page 27: Elementos generales de los test de hipótesis y estadística inferencial Una de las metas de la estadística es realizar inferencias sobre la población a

Conclusión: Conclusión:

• La proporción de flores amarillas : verdes observadas no se ajusta a la proporción de flores amarillas : verdes esperadas para un cruzamiento de este tipo (chi-cuadrado bondad de ajuste 0.025<P<0.05).

Estadística Biología Marina 2003

Page 28: Elementos generales de los test de hipótesis y estadística inferencial Una de las metas de la estadística es realizar inferencias sobre la población a

Errores en Chi Cuadrado.Errores en Chi Cuadrado.

1. Efecto de una frecuencia observada pequeña:

Estadística Biología Marina 2003

Fe = 20.2 Fo = 22.0

Fe = 0.2 Fo = 2.0

X2

0.162

16.2

A pesar que la diferencia absoluta es igual en ambos casos, Chi-cuadrado es 10 veces más grande en el segundo caso.

¿Cuáles pueden ser las consecuencias de esta

situación?

Page 29: Elementos generales de los test de hipótesis y estadística inferencial Una de las metas de la estadística es realizar inferencias sobre la población a

RecomendaciónRecomendación

• En general se recomienda aplicar este test cuando tenemos frecuencias observadas mayores 5.

Estadística Biología Marina 2003

Page 30: Elementos generales de los test de hipótesis y estadística inferencial Una de las metas de la estadística es realizar inferencias sobre la población a

2. Problemas de continuidad: corrección de Yates para continuidad.

a) Permite que los datos de enumeración discreta se aproximen a la distribución continua de X2

b) Sólo se usa cuando GL = 1, o sea cuando se tienen dos clases

c) Siempre disminuye el valor de X2

Estadística Biología Marina 2003

if

iffiX

ˆ)5.0ˆ( 2

2

Page 31: Elementos generales de los test de hipótesis y estadística inferencial Una de las metas de la estadística es realizar inferencias sobre la población a

Si no se corrige, el efecto de discontinuidad incrementa

artificialmente el valor de X2 lo suficiente para ocasionar el

rechazo de una Ho verdadera.

Estadística Biología Marina 2003

¿Qué tipo de error es este?

Page 32: Elementos generales de los test de hipótesis y estadística inferencial Una de las metas de la estadística es realizar inferencias sobre la población a

%

3. Es fundamental tener en cuenta que el estadístico chi-cuadrado es calculado usando las frecuencias observadas.

No es valido convertir los datos a porcentajes e intentar realizar el cálculo.

Estadística Biología Marina 2003

Page 33: Elementos generales de los test de hipótesis y estadística inferencial Una de las metas de la estadística es realizar inferencias sobre la población a

Subdividiendo el Análisis de Subdividiendo el Análisis de Chi Cuadrado.Chi Cuadrado.

• Tenemos un cruzamiento dihíbrido ente semillas que arrojó las siguientes frecuencias observadas.

Estadística Biología Marina 2003

Amarillo suave

AmarilloVerde suave

Verde n

F obs 152 39 53 6 250

F esp 140.625 46.875 46.87515.262

5

¿Proporciones esperadas?

Page 34: Elementos generales de los test de hipótesis y estadística inferencial Una de las metas de la estadística es realizar inferencias sobre la población a

• Ho: La muestra viene de una población que tiene proporciones de 9:3:3:1 de semillas amarillas suaves, amarillas, verdes suaves y verdes.

• Ha: La muestra viene de una población que no tiene proporciones de 9:3:3:1 de semillas amarillas suaves, amarillas, verdes suaves y verdes.

Estadística Biología Marina 2003

Page 35: Elementos generales de los test de hipótesis y estadística inferencial Una de las metas de la estadística es realizar inferencias sobre la población a

Calcular:Calcular:

• X2

• Gl

• X20.05,3

Estadística Biología Marina 2003

= 8.972

= 3

= 7.815

Se rechaza Ho

Las frecuencias observadas en este cruce dihibrido se alejan significativamente del modelo 9:3:3:1 (X2,0.025 < P < 0.05)

Page 36: Elementos generales de los test de hipótesis y estadística inferencial Una de las metas de la estadística es realizar inferencias sobre la población a

• Pero a pesar de que Ho ha sido rechazada, podemos estar interesados en:

a. Probar si la diferencia significativa entre lo obs y lo esp esta concentrado en alguna clase en particular

b. Probar si la diferencia fue provocada por el efecto los datos en todas las clases.

Estadística Biología Marina 2003

Al analizar el calculo de X2, podemos ver que la ultima clase entrega el mayor aporte al valor final de X2 (5.926)

Veamos…

Page 37: Elementos generales de los test de hipótesis y estadística inferencial Una de las metas de la estadística es realizar inferencias sobre la población a

Al realizar el análisis dejando fuera Al realizar el análisis dejando fuera la última clase:la última clase:

– Ho: La muestra viene de una población con proporciones de 9:3:3 en sus primeros tres fenotipos.

– Ho: La muestra viene de una población sin proporciones de 9:3:3 en sus primeros tres fenotipos.

Gl = k-1= 2; X2=0.9201+1.3230+0.80032 = 2.544

X20.05,3 = 5.991 No se rechaza la Ho.

Estadística Biología Marina 2003

Las frecuencias observadas provienen de una población que presenta sus primeras tres

frecuencias fenotípicas de 9:3:3 (X2,0.25 < P < 0.50).

Page 38: Elementos generales de los test de hipótesis y estadística inferencial Una de las metas de la estadística es realizar inferencias sobre la población a

Ahora podemos unir las tres primeras Ahora podemos unir las tres primeras clases y comparar con la ultimaclases y comparar con la ultima

– Ho: La muestra viene de una población con proporciones de 1:15 de semillas verdes y otros fenotipos de semillas.

– Ho: La muestra no viene de una población con proporciones de 1:15 de semillas verdes y otros fenotipos de semillas.

Gl = k-1 = 1; X2 = 5.929 + 0.3953 = 6.324

X2 0.05,3 = 3.841 Se rechaza Ho.

Estadística Biología Marina 2003

Amarillo suave

AmarilloVerde suave

Verde n

F obs 152 39 53 6 250

F esp 140.625 46.875 46.87515.262

5

Page 39: Elementos generales de los test de hipótesis y estadística inferencial Una de las metas de la estadística es realizar inferencias sobre la población a

Las muestras no provienen de una población con proporciones

esperadas de 1:15 de semillas verdes y otros fenotipos de

semillas (X2, 0.01 < P < 0.025).

Atención: ¿Le falta algo a este último cálculo?

Estadística Biología Marina 2003

Page 40: Elementos generales de los test de hipótesis y estadística inferencial Una de las metas de la estadística es realizar inferencias sobre la población a

Heterogeneidad de Chi-cuadradoHeterogeneidad de Chi-cuadrado

• En ocasiones un determinado set de datos son probados en contra de una misma hipótesis nula.

¿Podremos combinar todos los datos con el propósito de desarrollar un único

análisis estadístico de Chi-cuadrado?

Estadística Biología Marina 2003

Veamos un ejemplo

Page 41: Elementos generales de los test de hipótesis y estadística inferencial Una de las metas de la estadística es realizar inferencias sobre la población a

• Ho: Las arbejas provienen de una población con una proporción de 3:1

Estadística Biología Marina 2003

Exp. Amarillo Verde Total(n) X2 GL

1 25 11 36 0.5926 1

2 32 7 39 1.0342 1

3 14 5 19 0.0175 1

4 70 27 97 0.4158 1

5 24 13 37 2.0270 1

6 20 6 26 0.0513 1

7 32 13 45 0.3630 1

8 44 9 53 1.8176 1

9 50 14 64 0.3333 1

10 44 18 62 0.5376 1 X2 0.05,1 = 3.841

“En ningún caso la Ho es rechazada”

Page 42: Elementos generales de los test de hipótesis y estadística inferencial Una de las metas de la estadística es realizar inferencias sobre la población a

•Debido a que la Ho no es rechazada en ninguno de los 10 casos.

- Es razonable poner a prueba la Ho de que las 10 muestras provienen de la misma población.

• Pasos a seguir:

1. X2 agrupado: Se calcula para decidir si todas las muestras provienen de la misma población 3:1– Ho: Las frecuencias observadas se ajustan a la

proporción esperada de 3:1.– Ha: Las frecuencias observadas no se ajustan a

la producción de 3:1

Estadística Biología Marina 2003

Page 43: Elementos generales de los test de hipótesis y estadística inferencial Una de las metas de la estadística es realizar inferencias sobre la población a

Estadística Biología Marina 200

3

Exp. Amarillo Verde Total(n) X2 GL

1 25 11 36 0.5926 1

2 32 7 39 1.0342 1

3 14 5 19 0.0175 1

4 70 27 97 0.4158 1

5 24 13 37 2.0270 1

6 20 6 26 0.0513 1

7 32 13 45 0.3630 1

8 44 9 53 1.8176 1

9 50 14 64 0.3333 1

10 44 18 62 0.5376 1

Total de X2 7.1899 10

X2 agrupado 355 123 478 0.1367 1 X2 0.05,1 = 3.841

Las frecuencias observadas se ajustan a distribución de 3:1

Pero antes de decidir esto…

Page 44: Elementos generales de los test de hipótesis y estadística inferencial Una de las metas de la estadística es realizar inferencias sobre la población a

2. X2 para heterogeneidad: Se calcula para decidir si las diez muestras

provienen de la misma población. (La prueba de heterogeneidad entre replicas del test de bondad de ajuste, se basa en que la suma de valores

individuales de X2 es en sí mismo un valor de Chi-cuadrado)

– Ho: Las diez muestras provienen de la misma población (son homogéneas).

– Ha: Las diez muestras provienen de al menos dos poblaciones diferentes (son heterogéneas).

Estadística Biología Marina 2003

Page 45: Elementos generales de los test de hipótesis y estadística inferencial Una de las metas de la estadística es realizar inferencias sobre la población a

Estadística Biología Marina 200

3

Exp. Amarillo Verde Total(n) X2 GL

1 25 11 36 0.5926 1

2 32 7 39 1.0342 1

3 14 5 19 0.0175 1

4 70 27 97 0.4158 1

5 24 13 37 2.0270 1

6 20 6 26 0.0513 1

7 32 13 45 0.3630 1

8 44 9 53 1.8176 1

9 50 14 64 0.3333 1

10 44 18 62 0.5376 1

Total de X2 7.1899 10

X2 agrupado 355 123 478 0.1367 1

X2 Heter. 7.0532 9 X2 0.05,9 = 16.919

No se rechaza la Ho.

Las 10 muestras provienen de una misma población y se justifica que se agrupen.

Page 46: Elementos generales de los test de hipótesis y estadística inferencial Una de las metas de la estadística es realizar inferencias sobre la población a

Corrección de Yates:Corrección de Yates:

• Debe ser aplicada una vez que hemos determinado que los datos se pueden agrupar.

• Para este ejemplo finalmente tenemos que X2c= 0.128 (en vez de X2 = 0.137)

Estadística Biología Marina 2003

Page 47: Elementos generales de los test de hipótesis y estadística inferencial Una de las metas de la estadística es realizar inferencias sobre la población a

Consideraciones en el test de Consideraciones en el test de heterogeneidadheterogeneidad

1. Se puede mal interpretar el resultado de X2 agrupado:

– Si el valor de probabilidad para X2 agrupado es bajo, se podría pensar en rechazar la Ho.

– Pero antes de eso se debe considerar la probabilidad asociada a X2 de heterogeneidad. Y si la probabilidad asociada a este valor es <0.05, entonces si se debe rechazar la Ho.

– En este último caso, no se justifica agrupar los datos.

Estadística Biología Marina 2003

Page 48: Elementos generales de los test de hipótesis y estadística inferencial Una de las metas de la estadística es realizar inferencias sobre la población a

2- Aumentando el poder de análisis:

• Puede ocurrir el caso en que en ningún caso se pueda rechazar Ho.

• Pero podemos observar un determinado patrón en nuestros datos.

Veamos el siguiente ejemplo…

Estadística Biología Marina 2003

Page 49: Elementos generales de los test de hipótesis y estadística inferencial Una de las metas de la estadística es realizar inferencias sobre la población a

Observaciones del uso de la tenaza derecha o izquierda para manejar el alimento en Petrolisthes laevigatus

Estadística Biología Marina 2003

Exp. Diestras Zurdas Total (n) X2 Gl

115

(11.00)7

(11.00)22 2.9091 1

216

(12.00)8

(12.00)24 2.6667 1

312

(8.50)5

(8.50)17 2.8824 1

413

(9.00)5

(9.00)18 3.5556 1

X2 0.05,1 = 3.841

Page 50: Elementos generales de los test de hipótesis y estadística inferencial Una de las metas de la estadística es realizar inferencias sobre la población a

Estadística Biología Marina 200

3

• Para cada muestra y para los datos agrupados, las hipótesis son:

– Ho: La población muestra una misma proporción de Petrolisthes laevigatus que usan la tenaza derecha y la izquierda.

– Ha: La población no muestra la misma proporción de Petrolisthes laevigatus uso de las tenazas.

Page 51: Elementos generales de los test de hipótesis y estadística inferencial Una de las metas de la estadística es realizar inferencias sobre la población a

Hipótesis test de heterogeneidad

• Ho: Todas las muestras provienen de la misma población.

• Ha: Las muestras provienen de a lo menos, dos poblaciones distintas.

Estadística Biología Marina 2003

Page 52: Elementos generales de los test de hipótesis y estadística inferencial Una de las metas de la estadística es realizar inferencias sobre la población a

¿Las muestras son homogéneas?

Estadística Biología Marina 2003

Exp. Diestras Zurdas Total (n) X2 Gl

115

(11.00)7

(11.00)22 2.9091 1

216

(12.00)8

(12.00)24 2.6667 1

312

(8.50)5

(8.50)17 2.8824 1

413

(9.00)5

(9.00)18 3.5556 1

Total de X2 12.0138 4

X2 agrupado 56(40.50)

25(40.50)

81 11.8642 1

X2 Heter. 0.1496 3

Las muestras provienen de una misma población

Se justifica agrupar los datos

Page 53: Elementos generales de los test de hipótesis y estadística inferencial Una de las metas de la estadística es realizar inferencias sobre la población a

Estadística Biología Marina 200

3

Exp. Diestras Zurdas Total (n) X2 Gl

115

(11.00)7

(11.00)22 2.9091 1

216

(12.00)8

(12.00)24 2.6667 1

312

(8.50)5

(8.50)17 2.8824 1

413

(9.00)5

(9.00)18 3.5556 1

Total de X2 12.0138 4

X2 agrupado 56(40.50)

25(40.50)

81 11.8642 1

X2 Heter. 0.1496 3

¿Qué tenaza es preferida por los cangrejos?

Page 54: Elementos generales de los test de hipótesis y estadística inferencial Una de las metas de la estadística es realizar inferencias sobre la población a

CONCLUSIÓN:

• X2c = 11.111

• X2 0.05,1 = 3.841

– La población de Petrolisthes laevigatus no muestra la misma proporción de uso de las tenazas derecha e izquierda (X2, P<0.001).

Estadística Biología Marina 2003

Page 55: Elementos generales de los test de hipótesis y estadística inferencial Una de las metas de la estadística es realizar inferencias sobre la población a

Test de Kolmogorov-Smirnov: Test de Kolmogorov-Smirnov: Prueba de ajuste de una muestra Prueba de ajuste de una muestra

para variables discretas.para variables discretas.

Estadística Biología Marina 2003

• Características:– Es una alternativa al test de Chi cuadrado.– Presenta tablas propias.– Puede ser utilizado con frecuencias pequeñas.– Muy útil para datos en escala ordinal y nominal.

Page 56: Elementos generales de los test de hipótesis y estadística inferencial Una de las metas de la estadística es realizar inferencias sobre la población a

• Usa frecuencias acumuladas.

• El diseño experimental es muy importante:

“n debe ser multiplo de k”

• El estadígrafo del test es dmax :

Estadística Biología Marina 2003

)ˆ( iFFidi

Page 57: Elementos generales de los test de hipótesis y estadística inferencial Una de las metas de la estadística es realizar inferencias sobre la población a

Ejemplo: Ejemplo: Un total de 35 poliquetos fueron utilizados para verificar cual era la preferencia de estos animales sobre sustratos con diferente grados de humedad.

Estadística Biología Marina 2003

• Ho: Los poliquetos no muestran preferencias por ningún sustrato en especial

• Ha: Los poliquetos muestran preferencias por algún sustrato determinado.

Grado de Humedad

1 2 3 4 5

F obs 8 13 6 6 2

F esp 7 7 7 7 7

Page 58: Elementos generales de los test de hipótesis y estadística inferencial Una de las metas de la estadística es realizar inferencias sobre la población a

Estadística Biología Marina 200

3

Grado de Humedad

1 2 3 4 5

F obs 8 13 6 6 2

F esp 7 7 7 7 7

F obs acum.

8 21

F esp acum.

7

di 1

Page 59: Elementos generales de los test de hipótesis y estadística inferencial Una de las metas de la estadística es realizar inferencias sobre la población a

Estadística Biología Marina 200

3

dmax = 7 dmax 0.05; 5,35 = 7

Grado de Humedad

1 2 3 4 5

F obs 8 13 6 6 2

F esp 7 7 7 7 7

F obs acum.

8 21 27 33 35

F esp acum.

7 14 21 28 35

di 1 7 6 5 0

• Se rechaza Ho.Existe una preferencia de los poliquetos sobre un sustrato con un grado de humedad determinado (K-S, P = 0.05).

Page 60: Elementos generales de los test de hipótesis y estadística inferencial Una de las metas de la estadística es realizar inferencias sobre la población a

Tablas de Contingencia.Tablas de Contingencia.

Estadística Biología Marina 2003

• Suele ocurrir que tenemos hemos determinado frecuencias para dos variables.

• Y se quiere determinar si las frecuencias de ocurrencia las categorías de una variable son independientes de las frecuencias observadas en la segunda variable.

Page 61: Elementos generales de los test de hipótesis y estadística inferencial Una de las metas de la estadística es realizar inferencias sobre la población a

Estadística Biología Marina 200

3

• Esta información debe ser ordenada en Tablas de Contingencia

• En este tipo de análisis no se necesitan frecuencias esperadas a priori.

• Esta basado en la distribución de chi-cuadrado.

• El número de columnas en una tabla es c.

• El número de filas en una tabla es r.

• Entonces una tabla esta compuesta por r x c celdas.

Page 62: Elementos generales de los test de hipótesis y estadística inferencial Una de las metas de la estadística es realizar inferencias sobre la población a

Ejemplo de tabla de Ejemplo de tabla de contingencia 2 x 4contingencia 2 x 4

Estadística Biología Marina 2003

Color de pelo

Sexo Negro Café Rubio RojoTOTA

L

Macho 32 43 16 9 100 R1

Hembra 55 65 64 16 200 R2

TOTAL 87 108 80 25 300

C1 C2 C3 C4

C = columnas y R = filas.

Page 63: Elementos generales de los test de hipótesis y estadística inferencial Una de las metas de la estadística es realizar inferencias sobre la población a

En este test, la hipótesis nula es que las En este test, la hipótesis nula es que las frecuencias observadas en las filasfrecuencias observadas en las filas son son

independientes de las independientes de las frecuencias observadas frecuencias observadas en las columnasen las columnas

Estadística Biología Marina 2003

• Ho: El color de pelo de las personas es independiente del sexo en la población muestreada.

• Ha: El color de pelo de las personas es dependiente del sexo en la población muestreada.

Page 64: Elementos generales de los test de hipótesis y estadística inferencial Una de las metas de la estadística es realizar inferencias sobre la población a

Análisis de la tabla de Análisis de la tabla de contingenciacontingencia

Estadística Biología Marina 2003

• La formula es:

• Los grados de libertad:Gl = (r-1)(c-1)

• Las frecuencias esperadas:

Fesp ij = (Ri)(Cj)/N

if

iffiX

ˆ)ˆ( 2

2

Page 65: Elementos generales de los test de hipótesis y estadística inferencial Una de las metas de la estadística es realizar inferencias sobre la población a

Calculo de frecuencias esperadasCalculo de frecuencias esperadas

Estadística Biología Marina 2003

• F11 = 100 x 87 / 300 = 29• F21 = 200 x 87 / 300 = 58

Color de pelo

Sexo Negro Café Rubio Rojo TOTAL

Macho32

(29.00)43 16 9 100

Hembra

55 (58.00)

65 64 16 200

TOTAL 87 108 80 25 300

Page 66: Elementos generales de los test de hipótesis y estadística inferencial Una de las metas de la estadística es realizar inferencias sobre la población a

8.987 3

X2 0.05,3 = 7.815

Estadística Biología Marina 2003

• X2 = • Gl =

Color de pelo

Sexo Negro Café Rubio Rojo TOTAL

Macho32

(29.00)43

(36.00)16

(26.67)9

(8.33)100

Hembra

55 (58.00)

65 (72.00)

64 (53.33)

16 (16.67)

200

TOTAL 87 108 80 25 300

• ¿Conclusión estadística?

Page 67: Elementos generales de los test de hipótesis y estadística inferencial Una de las metas de la estadística es realizar inferencias sobre la población a

El color de pelo en las personas El color de pelo en las personas es dependiente del sexo en la es dependiente del sexo en la

población muestreada población muestreada (tabla de contingencia (tabla de contingencia

0.025 < P < 0.05).0.025 < P < 0.05).

Estadística Biología Marina 2003

Page 68: Elementos generales de los test de hipótesis y estadística inferencial Una de las metas de la estadística es realizar inferencias sobre la población a

Método especial simplificado Método especial simplificado para tablas de contingencia de para tablas de contingencia de

2 x22 x2

Estadística Biología Marina 2003

• Este tipo de tablas es la que más se usa

• Para calcular verificar el siguiente requisito:

(f11) (f22) – (f12) (f21) > N / 2

Page 69: Elementos generales de los test de hipótesis y estadística inferencial Una de las metas de la estadística es realizar inferencias sobre la población a

Si se cumple…Si se cumple…

Estadística Biología Marina 2003

• Aplicar corrección de Yates para continuidad:

• Si no se cumple, se elimina el término N/2.• Este método la frecuencia esperada no se

calcula por separado.• De esta el cálculo de forma X2 es

» Más Fácil» Más Cuidadoso

• Tener en cuenta que no es recomendable utilizar frecuencias menores a 5.

X2 = N (| (f11) (f22) – (f12) (f21) |) – N/2)2

(C1) (C2) (R1) (R2)

Page 70: Elementos generales de los test de hipótesis y estadística inferencial Una de las metas de la estadística es realizar inferencias sobre la población a

Heterogeneidad para Heterogeneidad para tablas 2 x 2tablas 2 x 2

Estadística Biología Marina 2003

• El principio es el mismo empleado para poner a prueba la heterogeneidad de replicas en el test de bondad de ajuste de X2.

• La Ho busca determinar si las muestras provienen de una misma población.

Veamos el siguiente ejemplo

Page 71: Elementos generales de los test de hipótesis y estadística inferencial Una de las metas de la estadística es realizar inferencias sobre la población a

Estadística Biología Marina 200

3

• Se aplicó una droga para mejorar la supervivencia en los tanques de abalones de la universidad, los que estaban siendo atacados por una bacteria.

• Se hicieron 4 experimentos.• Las hipótesis eran:

– Ho: La supervivencia de los animales es independiente de la administración de la droga.

– Ha: La supervivencia de los animales es dependiente de la administración de la droga.

• En ningún caso se rechazó la hipotesis nulaVeamos los resultados.

Page 72: Elementos generales de los test de hipótesis y estadística inferencial Una de las metas de la estadística es realizar inferencias sobre la población a

Mueren Viven Total

Con droga 9 15 24 X2 = 2.4806

Sin droga 15 10 25 Gl = 1

Total 24 25 49

Mueren Viven Total

Con droga 13 12 25 X2 = 2.1222

Sin droga 18 7 25 Gl = 1

Total 31 19 50

Mueren Viven Total

Con droga 12 13 25 X2 = 2.0525

Sin droga 17 8 25 Gl = 1

Total 29 21 50

Mueren Viven Total

Con droga 10 14 24 X2 = 2.4522

Sin droga 16 9 25 Gl = 1

Total 26 23 49

Experimento 1Experimento 1

Experimento 2Experimento 2

Experimento 3Experimento 3

Experimento 4Experimento 4

X2 0.05,1 = 3.841

Page 73: Elementos generales de los test de hipótesis y estadística inferencial Una de las metas de la estadística es realizar inferencias sobre la población a

Se prueba un test de heterogeneidad con Se prueba un test de heterogeneidad con los 4 experimentoslos 4 experimentos

Estadística Biología Marina 2003

• Ho: Las cuatro muestras son homogéneas.• Ha: Las cuatro muestras son heterogéneas.

Datos agrupados para Exp. 1-4

Mueren Viven Total

Con droga 44 54 98 X2 = 8.9262

Sin droga 66 34 100 Gl = 1

Total 110 88 198

Total de X2 = 9.1075 Gl= 4

X2 Agrupado = 8.9262 Gl= 1

X2 Heterogeneidad = 0.1813 Gl= 3

X2 0.05,3 = 7.815 ¿Conclusión?

Page 74: Elementos generales de los test de hipótesis y estadística inferencial Una de las metas de la estadística es realizar inferencias sobre la población a

Se justifica agrupar los datosSe justifica agrupar los datos

Estadística Biología Marina 2003

– Ho: La supervivencia de los animales es independiente de la administración de la droga.

– Ha: La supervivencia de los animales es dependiente de la administración de la droga.

Mueren Viven Total

Con droga 44 54 98

Sin droga 66 34 100

Total 110 88 198

8.183 1

X2 0.05,1 = 3.841

• X2c= • Gl =

¿Conclusión?

RecordarAplicar

corrección

RecordarAplicar

corrección

Page 75: Elementos generales de los test de hipótesis y estadística inferencial Una de las metas de la estadística es realizar inferencias sobre la población a

Subdivisión de Tablas de Subdivisión de Tablas de ContingenciaContingencia

Estadística Biología Marina 2003

• En el primer ejemplo determinamos que: “Existe una dependencia del sexo sobre el color del pelo”

• Pero es posible observar que la proporción de hombres rubios es menor que las otras columnas

Color de pelo

Sexo Negro Café Rubio RojoTOTA

L

Macho 32 43 16 9 100

Hembra 55 65 64 16 200

TOTAL 87 108 80 25 300

Page 76: Elementos generales de los test de hipótesis y estadística inferencial Una de las metas de la estadística es realizar inferencias sobre la población a

Es posible que esta columna aporte Es posible que esta columna aporte en gran parte a la significancíaen gran parte a la significancía

Estadística Biología Marina 2003

• Si ignoramos momentáneamente esta columna y realizamos el análisis con una tabla 2 x 3:– Ho: La ocurrencia de pelo, negro, café y

colorín es independiente del sexo.– Ha: La ocurrencia de pelo, negro, café y

colorín no es independiente del sexo

Page 77: Elementos generales de los test de hipótesis y estadística inferencial Una de las metas de la estadística es realizar inferencias sobre la población a

La tabla quedaría…La tabla quedaría…

Estadística Biología Marina 2003

• De esta forma podemos concluir que los tres colores de pelo son independientes del sexo de los individuos (tabla de contingencia 0.75 < P< 0.9)

Sexo Negro Café Colorín Total

Hombre 32 43 9 84

Mujer 55 65 16 136

Total 87 108 25 220

X2 = 0.245 -Valor crítico X2 0.05,2 = 5.991Entonces no se rechaza Ho con 0.75 < P< 0.9

Page 78: Elementos generales de los test de hipótesis y estadística inferencial Una de las metas de la estadística es realizar inferencias sobre la población a

Ahora podemos hacer una tabla de 2 x 2, Ahora podemos hacer una tabla de 2 x 2, considerando en la columna el color rubio y en considerando en la columna el color rubio y en

la otra los otros tres coloresla otra los otros tres colores

Estadística Biología Marina 2003

• Ho: La ocurrencia del color rubio y no rubio es independiente del sexo.

• Ha: La ocurrencia del color rubio no es independiente del sexo

Sexo Rubio No rubio Total

Hombre 16 84 100

Mujer 64 136 200

Total 80 220 300

X2c = 7.928 con GL = 1; Valor crítico X2 0.05,1 = 3.841Entonces se rechaza Ho con 0.001< P< 0.005.

Page 79: Elementos generales de los test de hipótesis y estadística inferencial Una de las metas de la estadística es realizar inferencias sobre la población a

Estadística Biología Marina 200

3

• De esta manera se confirma la sospecha que entre los cuatro colores de pelo, el rubio presenta las frecuencias relativas diferentes en relación a los otros colores de cabello.

Page 80: Elementos generales de los test de hipótesis y estadística inferencial Una de las metas de la estadística es realizar inferencias sobre la población a

Estadística Biología Marina 200

3

• Estrictamente hablando, no se debería aplicar este tipo de procedimientos para poner a prueba hipótesis estadísticas.

• Los resultados solo deben considerados como una guía para desarrollar nuevas hipótesis con los datos.

Page 81: Elementos generales de los test de hipótesis y estadística inferencial Una de las metas de la estadística es realizar inferencias sobre la población a

Estadística Biología Marina 200

3