capítulo 16, métodos no paramétricos: análisis de datos ordenados por rango

37
1 Capítulo 16 Métodos no paramétricos: análisis de datos ordenados por rango Objetivos: Al terminar este capítulo podrá: 1. Realizar la prueba del signo para muestras dependientes empleando las distribuciones binomial y normal como estadísticos de prueba. 2. Realizar una prueba de hipótesis para muestras dependientes empleando la prueba de rangos con signo de Wilcoxon. 3. Realizar e interpretar la prueba de suma de rangos de Wilcoxon para muestras independientes. 4. Realizar e interpretar la prueba de Kruskal-Wallis para varias muestras independientes.

Upload: alejandro-ruiz

Post on 28-Jun-2015

3.460 views

Category:

Business


11 download

DESCRIPTION

Métodos no paramétricos: análisis de datos ordenados por rango

TRANSCRIPT

Page 1: Capítulo 16, Métodos no paramétricos: análisis de datos ordenados por rango

1

Capítulo 16Métodos no paramétricos: análisis de datos ordenados por rango

Objetivos: Al terminar este capítulo podrá:

1. Realizar la prueba del signo para muestras dependientes empleando las distribuciones binomial y normal como estadísticos de prueba.

2. Realizar una prueba de hipótesis para muestras dependientes empleando la prueba de rangos con signo de Wilcoxon.

3. Realizar e interpretar la prueba de suma de rangos de Wilcoxon para muestras independientes.

4. Realizar e interpretar la prueba de Kruskal-Wallis para varias muestras independientes.

Page 2: Capítulo 16, Métodos no paramétricos: análisis de datos ordenados por rango

2

5. Calcular e interpretar el coeficiente de correlación de rangos de Spearman.

6. Realizar una prueba de hipótesis para determinar si la correlación entre los rangos en la población es diferente de cero.

Capítulo 16 (Continuación)

Page 3: Capítulo 16, Métodos no paramétricos: análisis de datos ordenados por rango

3

La prueba del signo

La prueba del signo se basa en el signo de una diferencia entre dos observaciones correspondientes.

No es necesario alguna suposición con respecto a la forma de la población de diferencias.

La distribución binomial es el estadístico de prueba para las muestras pequeñas, y la normal estándar (z) para las muestras grandes.

La prueba requiere muestras (relacionadas) dependientes.

Page 4: Capítulo 16, Métodos no paramétricos: análisis de datos ordenados por rango

4

La prueba del signo (Continuación)

Procedimiento para conducir la prueba:

• Determine el signo de la diferencia entre pares relacionados.

• Determine el número de pares utilizados.• Compare el número de diferencias positivas (o

negativas) al valor crítico.• n es el número de pares utilizados (sin los lazos), X

es el número de positivos o negativos, y la probabilidad binomial =.5.

Page 5: Capítulo 16, Métodos no paramétricos: análisis de datos ordenados por rango

5

Aproximación normal Si ambos y son mayores que 5, la

distribución z es apropiada. Si el número de signos más o de signos menos es

mayor que n/2, entonces

n n( )1

zX n

n

( . ) .

.

5 5

5

zX n

n

( . ) .

.

5 5

5

Si el número de signos más o de signos menos es menor que n/2, entonces

Page 6: Capítulo 16, Métodos no paramétricos: análisis de datos ordenados por rango

6

Ejemplo 1El instituto de investigación de Gagliano para los estudios del negocio está comparando el costo de investigación y desarrollo (R&D) como porcentaje del ingreso para una muestra de las empresas del vidrio para 2000 y 2001.

¿En un nivel de significancia del .05 se tiene que el costo de R&D ha declinado? Utilice la prueba del signo.

Page 7: Capítulo 16, Métodos no paramétricos: análisis de datos ordenados por rango

7

Ejemplo 1 (Continuación)

Compañía 2000 2001 Diferencias Muestra

Savoth Glass 20 16 4 +

Ruisi Glass 14 13 1 +

Rubin Inc. 23 20 3 +

Vaught 24 17 7 +

Lambert Glass 31 22 9 +

Pimental 22 20 2 +

Olson Glass 14 20 -6 -

Flynn Glass 18 11 7 +

Page 8: Capítulo 16, Métodos no paramétricos: análisis de datos ordenados por rango

8

Paso 1: H0: =.5 H1: <.5

Paso 2: H0: se rechaza si el número de muestras negativas es 0 o 1.

Paso 3: Hay una diferencia negativa. Esto es, hubo un incremento en el porcentaje para una compañía.

Paso 4: H0: se rechaza. Concluimos que el gasto en R&D como un porcentaje del ingreso declinó del 2000 al 2001.

Ejemplo 1 (Continuación)

Page 9: Capítulo 16, Métodos no paramétricos: análisis de datos ordenados por rango

9

Prueba de hipótesis acercade la mediana

Cuando probamos el valor de la mediana, utilizamos la aproximación normal a la distribución binomial.

La distribución z se utiliza como el estadístico de prueba.

Page 10: Capítulo 16, Métodos no paramétricos: análisis de datos ordenados por rango

10

La agencia de viajes Gordon sostiene que su tarifa mediana para todos sus clientes a todos los destinos es $450. Esta afirmación está siendo desafiada por una agencia de la competencia, que cree que la mediana es diferente de $450. Una muestra escogida al azar de 300 boletos reveló que 170 boletos estaban por debajo de $450. Utilice el 0.05 de nivel de significancia.

Ejemplo 2

Page 11: Capítulo 16, Métodos no paramétricos: análisis de datos ordenados por rango

11

450.$ mediana :H $450 = mediana : 10 H

H0 es rechazada si z es menor que –1.96 o mayor que 1.96.

El valor de z es 2.252.

252.23005.

)300(50.)5.170(5.

50.)5.(

n

nXz

H0 es rechazada. Concluimos que la mediana no es $450.

Ejemplo 2 (Continuación)

Page 12: Capítulo 16, Métodos no paramétricos: análisis de datos ordenados por rango

12

Prueba de suma de rangosde Wilcoxon

Si la suposición de normalidad se viola para la prueba apareada-t, utilice la prueba de rangos con signo de Wilcoxon.

La prueba requiere la escala ordinal de la medida. Las observaciones deben ser relacionadas o

dependientes.

Page 13: Capítulo 16, Métodos no paramétricos: análisis de datos ordenados por rango

13

Prueba de suma de rangosde WilcoxonLos pasos para la prueba son:

• Calcule las diferencias entre las observaciones relacionadas.

• Ordene las diferencias absolutas de menor a mayor.

• Se suman los valores de las columnas positivas y negativas.

• Compare el más pequeño de las dos sumas de rangos con el valor de T, obtenido del Apéndice H.

Page 14: Capítulo 16, Métodos no paramétricos: análisis de datos ordenados por rango

14

Utilice la prueba de suma de rangos de Wilcoxon para determinar si los costos de R&D como porcentaje del ingreso (Ejemplo 1) ha declinado. Utilice el nivel de significancia del .05.

Paso 1: H0: Los porcentajes permanecen igual.

H1: Los porcentajes declinaron.

Paso 2: Se rechaza H0 si el más pequeño de las sumas de rango es menor o igual a 5.

Vea el Apéndice H.

Ejemplo 3

Page 15: Capítulo 16, Métodos no paramétricos: análisis de datos ordenados por rango

15

Compañía 2000 2001 Diferencia ABS-Dif. Rango R+ R-

Savoth Glass 20 16 4 4 4 4 * Ruisi Glass 14 13 1 1 1 1 * Rubin Inc. 23 20 3 3 3 3 * Vaught 17 7 7 7 7 * Lambert Glass 31 22 9 9 8 8 * Pimental 22 20 2 2 2 2 * Olson Glass 14 20 -6 6 5 * 5 Flynn Glass 18 11 7 7 6 6 *

Ejemplo 3 (Continuación)

Page 16: Capítulo 16, Métodos no paramétricos: análisis de datos ordenados por rango

16

La suma de rango más pequeña es 5, que es igual al valor crítico de T. Se rechaza H0. El porcentaje ha declinado a partir de un año al siguiente.

Ejemplo 3 (Continuación)

Page 17: Capítulo 16, Métodos no paramétricos: análisis de datos ordenados por rango

17

Prueba de suma de rangosde Wilcoxon

• No se requiere ninguna suposición sobre la forma de la población.

• Los datos deben ser por lo menos escala ordinal.• Cada muestra debe contener por lo menos ocho

observaciones.

La prueba de suma de rangos de Wilcoxon se utiliza para determinar si dos muestras independientes provienen de la misma o igual población.

Page 18: Capítulo 16, Métodos no paramétricos: análisis de datos ordenados por rango

18

Para determinar el valor del estadístico W, todos los valores de los datos se ordenan de menor a mayor como si fueran de una sola población.

La suma de rangos para cada dos muestras es determinada.

Prueba de suma de rangosde Wilcoxon

Page 19: Capítulo 16, Métodos no paramétricos: análisis de datos ordenados por rango

19

El más pequeño de las dos sumas de W se utiliza para calcular el estadístico de prueba de:

12)1(

2)1(

2121

211

nnnn

nnnW

z

Prueba de suma de rangosde Wilcoxon

Page 20: Capítulo 16, Métodos no paramétricos: análisis de datos ordenados por rango

20

La Universidad compró dos vehículos, un Ford y un Chevy, para el uso de la administración al viajar. Los costos de reparación para los dos autos durante los tres años pasados se muestran en la diapositiva siguiente. ¿En el nivel de significancia del .05 hay una diferencia en las dos distribuciones?

Ejemplo 4

Page 21: Capítulo 16, Métodos no paramétricos: análisis de datos ordenados por rango

21

Ejemplo 4 (Continuación)

Ford ($) Rango Chevy($) Rango

25.31 3.0 14.89 1.0

33.68 5.5 20.31 2.0

46.89 7.0 25.97 4.0

51.83 8.0 33.68 5.5

87.65 13.0 68.98 9.0

87.90 14.0 78.23 10.0

90.89 15.0 80.31 11.0

120.67 16.0 81.75 12.0

157.90 17.0

81.5 71.5

Page 22: Capítulo 16, Métodos no paramétricos: análisis de datos ordenados por rango

22

Paso 1: H0: Las poblaciones son iguales.

H1: Las poblaciones no son iguales.

Paso 2: H0: se rechaza si z >1.96 o z es menor

que –1.96

Ejemplo 4 (Continuación)

Page 23: Capítulo 16, Métodos no paramétricos: análisis de datos ordenados por rango

23

Paso 3: El valor del estadístico de prueba es 0.914.

914.0

12

)198)(9(8

2

)198(85.81

12

)1(

2

)1(

2121

211

nnnn

nnnW

z

Ejemplo 4 (Continuación)

Page 24: Capítulo 16, Métodos no paramétricos: análisis de datos ordenados por rango

24

Paso 4: No rechazamos la hipótesis nula. No podemos concluir que hay una diferencia en las distribuciones de los costos de la reparación de los dos vehículos.

Ejemplo 4 (Continuación)

Page 25: Capítulo 16, Métodos no paramétricos: análisis de datos ordenados por rango

25

Prueba de Kruskal-Wallis:análisis de varianza por rangos

La escala ordinal de la medida es requerida. Es un alternativa del ANOVA unidireccional. La distribución de ji-cuadrada es el estadístico de

prueba. Cada muestra debe tener por lo menos cinco

observaciones. Los datos de la muestra se ordenan de menor a mayor

como si fuera un solo grupo.

Esto se utiliza para comparar tres o más muestras para determinar si provienen de poblaciones iguales.

Page 26: Capítulo 16, Métodos no paramétricos: análisis de datos ordenados por rango

26

Prueba de Kruskal-Wallis:análisis de varianza por rangos (Continuación)

El estadístico de prueba está dado por:

Hn n

R

n

R

n

R

nnk

k

12

13 11

2

1

22

2

2

( )

( ) ( )...

( )( )

Page 27: Capítulo 16, Métodos no paramétricos: análisis de datos ordenados por rango

27

Keely Ambrose, director de recursos humanos para las industrias de Molinero, desea estudiar los Porcentajes de incremento en el sueldo para losgerentes medios. Ella recopila una muestra de gerentes ydetermina los porcentajes de incremento de sueldo a partirdel año pasado a este año.

¿Al nivel de significancia del 5% puede Kelly concluir que hay una diferencia en los porcentajes de incremento para las diferentes plantas?

Ejemplo 5

Page 28: Capítulo 16, Métodos no paramétricos: análisis de datos ordenados por rango

28

Millville Rango Camden Rango Eaton Rango Vineland Rango 2.2 2.0 1.9 1 3.7 6.0 5.7 9.0 3.6 5.0 2.7 3 4.5 7.0 6.8 10.5 4.9 8.0 3.1 4 7.1 13.5 8.9 16.0 6.8 10.5 6.9 12 9.3 17.0 11.6 18.5 7.1 13.5 8.3 15 11.6 18.5 13.9 20.0

39.0 35 62.0 74.0

Ejemplo 5 (Continuación)

Page 29: Capítulo 16, Métodos no paramétricos: análisis de datos ordenados por rango

29

Paso 1: H0: Las poblaciones son iguales.

H1: Las poblaciones no son iguales

Paso 2: H0: es rechazada si H es mayor que 7.185. Hay 3 grados de libertad en el nivel de significancia del .05.

Ejemplo 5 (Continuación)

Page 30: Capítulo 16, Métodos no paramétricos: análisis de datos ordenados por rango

30

La hipótesis nula no se rechaza. No hay diferencia

en los porcentajes de incremento de sueldo en las cuatro

plantas.

949.5

)120(35

745

625

355

39)120(20

12

)1(3)()()()(

)1(12

2222

24

2

23

2

22

1

21

n

nR

nR

nR

nR

nnH

k

Ejemplo 5 (Continuación)

Page 31: Capítulo 16, Métodos no paramétricos: análisis de datos ordenados por rango

31

Correlación rango-orden

El coeficiente de correlación de rangos de Spearman muestra la relación entre grupos de datos ordenados por rangos. Las características son:

Puede asumir cualquier valor entre -1.00 hasta 1.00.

Es similar al coeficiente de Pearson de correlación, pero se basa en datos ordenados por rangos.

Page 32: Capítulo 16, Métodos no paramétricos: análisis de datos ordenados por rango

32

Coeficiente de correlación de rangos de Spearman

La fórmula para encontrar el coeficiente de correlación de rangos es:

rd

n ns

16

1

2

2

( )

d es la diferencia entre los rangos de cada par.

n es el número de pares de observaciones.

Page 33: Capítulo 16, Métodos no paramétricos: análisis de datos ordenados por rango

33

Prueba de la significancia de rs

Determine la hipótesis nula: La correlación de rangos en la población es 0.

Determine la hipótesis alternativa: La correlación de rangos en la población no es 0.

El valor del estadístico de prueba se calcula con la fórmula:

t rn

rss

2

1 2

Page 34: Capítulo 16, Métodos no paramétricos: análisis de datos ordenados por rango

34

La diapositiva siguiente contiene las

estadísticas del fútbol de pretemporada

para la conferencia de la costa atlántica para

los técnicos y reporteros de deportes.

Determine el coeficiente de correlación

de rangos entre los dos grupos.

Ejemplo 6

Page 35: Capítulo 16, Métodos no paramétricos: análisis de datos ordenados por rango

35

Escuela Técnicos Reporteros

Maryland 2 3NC State 3 4NC 6 6Virginia 5 5Clemson 4 2Wake Forest 7 8Duke 8 7Florida State 1 1

Ejemplo 6 (Continuación)

Page 36: Capítulo 16, Métodos no paramétricos: análisis de datos ordenados por rango

36

Ejemplo 6 (Continuación)

Escuela Técnicos Reporteros d d 2

Maryland 2 3 -1 1

NC State 3 4 -1 1

NC 6 6 0 0

Virginia 5 5 0 0

Clemson 4 2 2 4

Wake Forest 7 8 -1 1

Duke 8 7 1 1

Florida State 1 1 0 0

Total 8

Page 37: Capítulo 16, Métodos no paramétricos: análisis de datos ordenados por rango

37

905.0)18(8

)8(61

)1(

61

2

2

2

nn

drs

Hay una correlación fuerte entre los rangos de los técnicos y los reporteros de deportes.

Ejemplo 6 (Continuación)