pruebas no parametricas

17
PRUEBAS NO PARAMETRICAS

Upload: joel-paucar-sinche

Post on 10-Apr-2016

235 views

Category:

Documents


1 download

DESCRIPTION

ejercicios resueltos de estadística no parametrica por metodo wallis

TRANSCRIPT

Page 1: Pruebas No Parametricas

PRUEBAS NO PARAMETRICAS

Page 2: Pruebas No Parametricas

METODO DE U MAN-WHITNEY (PARA 2 MUESTRAS INDEPENDIENTES)

es una prueba no paramétrica aplicada a dos muestras independientes. Es, de hecho, la versión no paramétrica de la habitual prueba t de Student. Fue propuesto inicialmente en 1945 por Frank Wilcoxon para muestras de igual tamaños y extendido a muestras de tamaño arbitrario como en otros sentidos por Henry B. Mann y D. R. Whitney en 1947.

DEFINICION

Page 3: Pruebas No Parametricas

FORMULAS:U1 U2

Donde:U1 y U2 = valores estadísticos de U Mann-Whitney.n1 = tamaño de la muestra del grupo 1.n2 = tamaño de la muestra del grupo 2.W1,W2 = la suma de los rangos

Page 4: Pruebas No Parametricas

FORMULAS:𝒁=

𝑼𝟏−(𝑼𝟏)(𝑼 𝟏) 𝟐 (𝑼𝟏 )=𝑵𝟏 .𝑵 𝟐(𝑵 𝟏+𝑵 𝟐+𝟏)

𝟏𝟐

Donde:Z=estadístico de prueba para U en muestras de gran tamaño.

= varianza del estadístico U1. = media

(𝑼𝟏 )=𝑵𝟏 .𝑵 𝟐𝟐

Page 5: Pruebas No Parametricas

PASOS:Determinar el tamaño de las muestras (n1 y n2). Si n1 y n2 son menores que 20, se consideran muestras pequeñas, pero si son mayores que 20, se consideran muestras grandes.Arreglar los datos en rangos del menor al mayor valor. En caso de que existan ligas o empates de rangos iguales, se deberán detectar para un ajuste posterior.Calcular los valores de U1 y U2, de modo que se elija el más pequeño para comparar con los críticos de U Mann-Whitney de la tabla de probabilidades asociadas con valores pequeños como los de U en la prueba de Mann-Whitney.En caso de muestras grandes, calcular el valor Z, pues en estas condiciones se distribuye normalmente.Decidir si se acepta o rechaza la hipótesis.

Page 6: Pruebas No Parametricas

EJEMPLO: En un estudio de rocas sedimentarias se obtuvieron los siguientes diámetros (en mm) en 2 tipos de arena como se observa en el siguiente cuadro. El problema va consistir en decidir si las dos poblaciones son las mismas o si una probablemente produzca observaciones mayores que la otra.

Page 7: Pruebas No Parametricas

ARENA 1 ARENA 20.63 1.130.17 0.540.35 0.960.49 0.260.18 0.390.43 0.880.12 0.920.20 0.530.47 1.011.36 0.480.51 0.890.45 1.070.84 1.110.32 0.580.40

Page 8: Pruebas No Parametricas

RESOLUCION:1. PLANTEO DE LA HIPOTESIS: H0 : las poblaciones son idénticas Ha : las poblaciones no son idénticas2. NIVEL DE SIGNIFICANCIA:= 0.013. CRITERIO: se rechaza la hipótesis nula si Z -2.575 o Z 2.575, donde Z calculado esta dado por la formula anterior dado.4. CALCULOS: ya que N1=15 y n2=14, ya que se había visto que W1= 162 encontramos ahora que:

Page 9: Pruebas No Parametricas

CALCULOS CORRESPONDIENTES:U1

𝒁=𝟒𝟐−𝟏𝟎𝟓√𝟓𝟐𝟓

=−𝟐 .𝟕𝟓

𝟐 (𝑼𝟏 )=𝟏𝟓 .𝟏𝟒 (𝟏𝟓+𝟏𝟒+𝟏 )𝟏𝟐 =𝟓𝟐𝟓

(𝑼𝟏 )=𝟏𝟓 .𝟏𝟒𝟐 =105

Page 10: Pruebas No Parametricas

DECISIÓN: dado que Z = -2.75 sobrepasa a -2.575, la hipótesis nula debe rechazarse.

CONCLUSION: existe diferencias en las dimensiones promedio reales de los granos de los dos tipos de arena.

Page 11: Pruebas No Parametricas

PRUEBA DE KRUSKAL-WALLIS PARA COMPARAR

MAS DE DOS GRUPOS

DEFINICIONLa prueba de Kruskal-Wallis, es una alternativa a la prueba F del análisis de varianza para diseños de clasificación simple. En este caso se comparan varios grupos pero usando la mediana de cada uno de ellos, en lugar de las medias.

Page 12: Pruebas No Parametricas

Se desea comparar k tratamientos diferentes, para lo cual se elige una muestra aleatoria de n sujetos y se divide aleatoriamente para aplicarles los diferentes tratamientos en k grupos de Tamaños

∑𝑖=1

𝑘

𝑛𝑖=𝑛 Denotemos las

observaciones de los tratamiento por

Tratamiento 1

Tratamiento 2

… …

Tratamiento k

Para realizar la prueba se ordenan todos los datos en forma no decreciente asignándoles un rango de 1 a n. Denotemos los rangos asignados en cada tratamiento por

Tratamiento 1

Tratamiento 2

… …

Tratamiento

Page 13: Pruebas No Parametricas

PLANTEAMOS LAS HIPOTESIS

Ho: La mediana de las k poblaciones consideradas son iguales y Ha: Al menos una de las poblaciones tiene mediana distinta a las otras.

Se suman los rangos en cada tratamiento y se denotan por:𝑅𝑖=∑𝑗=1

𝑛 𝑖

𝑅𝑖𝑗

Establecer un nivel de significación: = P(Re chazar Ho / Ho es verdadero)

𝐻=12¿ ¿

Estadístico de prueba

donde, n es el total de datos es datos.

Page 14: Pruebas No Parametricas

𝐻 ,=𝐻

1−∑j=1

𝑒

(𝑒¿¿ 𝑗2−𝑒 𝑗)

𝑛3−𝑛¿

COMENTARIOS: El cálculo de H se modifica si hay observaciones iguales. En este caso se

procede como sigue: a las observaciones iguales se les asigna el promedio de sus rangosnormales y se denotan por𝑅𝑖

∗=∑𝑖=1

𝑛𝑖

𝑅𝑖𝑗∗

y el estadístico de prueba es

es la suma de rangos medios del tratamiento i

Donde e = número de grupos con observaciones igualese = número de observaciones iguales en el grupo j (j = 1,2,…,e)

Región de rechazo de HoPara

Decisión: Si H se rechaza al nivel de significación

Conclusión: Se debe interpretar la decisión tomada

Page 15: Pruebas No Parametricas

Ejemplo:

Una operación de llenado tiene tres máquinas idénticas que se ajustan para vaciar una cantidad específica de un producto en recipiente de igual tamaño. Con el propósito de verificar la igualdad de las cantidades promedio vaciadas por cada máquina, se toman muestras aleatorias en forma periódica, de cada una. Para un periodo particular, se observaron los datos que aparecen en la siguiente tabla:

Maquina A

16 15 15 14 16  

Maquina B

18 19 19 20 19 19

Maquina C

19 20 18 20 19  

Solución:

Ho: Las medianas de las tres maquinas son iguales y Ha: Al menos una de las maquinas tiene mediana distinta a los otros.

¿Existen algunas diferencias estadísticamente significativas en lascantidades promedio vaciadas por las tres máquinas? Use = 0.05.

Page 16: Pruebas No Parametricas

𝐻= 1216∗17 [ 152

5+ 63.52

6+ 57.52

5 ]−3∗17=9.807

∑j=1

𝑒

(𝑒 𝑗2−𝑒 𝑗 )=(63−6 )+(33−3 )+(23−2 )+(23−2 )+ (23−2 )=252

𝐻 ,=𝐻

1−∑j=1

𝑒

(𝑒¿¿ 𝑗2−𝑒 𝑗)

𝑛3−𝑛¿

=

Cantidad

Maquina Rango

16 A 4.515 A 2.515 A 2.514 A 116 A 4.518 B 6.519 B 10.519 B 10.520 B 1519 B 10.519 B 10.519 C 10.520 C 1518 C 6.520 C 1519 C 10.5

 

Page 17: Pruebas No Parametricas

𝐶=𝑥(𝑘− 1,1−𝛼)2

𝐶=𝑥(3−1,1−0,05 )2

𝐶=5,99

C

H

5.99 10.45

Decisión: como H=10.45>5.99, H se rechaza al nivel de significación

Conclusión: al menos una de las maquinas tiene mediana distinta al de los otros