27_estadistica no parametric a ii

28
 DISEÑO DE EXPERIMENTOS: ESTADÍSTICA NO PARAMÉTRICA  AUTOR: Irene Guill én L una Curso 2007/08 1  ESTA STICA NO PARAMÉTRICA

Upload: isaac-alberto-mass-paredes

Post on 07-Jul-2015

719 views

Category:

Documents


0 download

TRANSCRIPT

5/9/2018 27_estadistica No Parametric A II - slidepdf.com

http://slidepdf.com/reader/full/27estadistica-no-parametric-a-ii 1/28

 

DISEÑO DE EXPERIMENTOS: ESTADÍSTICA NO PARAMÉTRICA

AUTOR: Irene Guillén LunaCurso 2007/08

1

 

ESTADÍSTICA NO PARAMÉTRICA

5/9/2018 27_estadistica No Parametric A II - slidepdf.com

http://slidepdf.com/reader/full/27estadistica-no-parametric-a-ii 2/28

 

DISEÑO DE EXPERIMENTOS: ESTADÍSTICA NO PARAMÉTRICA

AUTOR: Irene Guillén LunaCurso 2007/08

2

 

ÍNDICE

1.- INTRODUCCIÓN A LA ESTADÍSTICA NO PARAMÉTRICA 

2.- PRUEBA DE LA MEDIANA

3.- PRUEBA KUSKAL-WALLIS

4.- Q DE COCHRAN

5.- F DE FRIEDMAN

6.- CONCORDANCIA DE KENDALL

7.- ¿Y EN EXCEL?

BIBLIOGRAFÍA

5/9/2018 27_estadistica No Parametric A II - slidepdf.com

http://slidepdf.com/reader/full/27estadistica-no-parametric-a-ii 3/28

 

DISEÑO DE EXPERIMENTOS: ESTADÍSTICA NO PARAMÉTRICA

AUTOR: Irene Guillén LunaCurso 2007/08

3

 

1.- INTRODUCCIÓN A LA ESTADÍSTICA NO PARAMÉTRICA

La Estadística no paramétrica es una rama de la Estadística que estudia las

pruebas y modelos estadísticos cuya distribución subyacente no se ajusta a los

llamados criterios paramétricos. Su distribución no puede ser definida a priori,

pues son los datos observados los que la determinan. La utilización de estos

métodos se hace recomendable cuando no se puede asumir que los datos se

ajusten a una distribución normal o cuando el nivel de medida empleado no

sea, como mínimo, de intervalo. Las principales pruebas no paramétricas son

las siguientes:

•  Prueba de chi-cuadrado. Mide la discrepancia entre una distribución

observada y otra teórica (bondad de ajuste), indicando en qué medida

las diferencias existentes entre ambas, de haberlas, se deben al azar.

También se utiliza para probar la independencia de dos muestras entre

sí, mediante la presentación de los datos en tablas de contingencia.

•  Prueba binomial. Analiza variables dicotómicas y compara las

frecuencias observadas en cada categoría con las que cabría esperar 

según una distribución binomial de parámetro especificado en la

hipótesis nula. El nivel de significación crítico de esta prueba indica la

probabilidad de obtener una discrepancia igual o superior a la observada

a partir de la muestra si la distribución es la postulada por la hipótesis

nula.

•  Prueba de Anderson-Darling. Este test determina si los datos vienen

de una distribución específica.

•  Prueba de Cochran. Permite efectuar un test estadístico para

comprobar si existe una diferencia significativa entre tests realizados. 

•  Prueba de Cohen kappa. Test que evalúa las concordancias y

discordancias intra e interobservador respecto a una variable nominal

5/9/2018 27_estadistica No Parametric A II - slidepdf.com

http://slidepdf.com/reader/full/27estadistica-no-parametric-a-ii 4/28

 

DISEÑO DE EXPERIMENTOS: ESTADÍSTICA NO PARAMÉTRICA

AUTOR: Irene Guillén LunaCurso 2007/08

4

•  Prueba de Fisher. Prueba de significación estadística utilizada para

comparar proporciones en tablas de contingencia. 

•  Prueba de Friedman. Consiste en ordenar los datos por filas o bloques,

reemplazándolos por su respectivo orden. Al ordenarlos, debemosconsiderar la existencia de datos idénticos.

•  Prueba de Kendall. Es usada para comprobar el grado de coincidencia

de las valoraciones realizadas por lo expertos. 

•  Prueba de Kolmogorov-Smirnov. Se utiliza para determinar la bondad

de ajuste de dos distribuciones de probabilidad entre sí.

•  Prueba de Kruskal-Wallis. Sirve para testar si un grupo de datos

proviene de la misma población. Intuitivamente, es idéntico al ANOVA

con los datos reemplazados por categorías.

•  Prueba de Kuiper

•  Prueba de Mann-Whitney o prueba de Wilcoxon. Se aplica a dos

muestras independientes, cuyos datos han sido medidos al menos en

una escala de nivel ordinal. La prueba calcula el llamado estadístico U ,

cuya distribución para muestras con más de 20 observaciones seaproxima bastante bien a la distribución normal.

•  Prueba de McNemar. Se utiliza para decidir si puede o no aceptarse

que determinado ''tratamiento'' induce un cambio en la respuesta

dicotómica o dicotomizada de los elementos sometidos al mismo, y es

aplicable a los diseños del tipo ''antes-después'' en los que cada

elemento actúa como su propio control. 

•  Prueba de la mediana. Se trata de un caso especial de la prueba dechi-cuadrado, pues se basa en esta última. Su objetivo es comparar las

medianas de dos muestras y determinar si pertenecen a la misma

población o no.

5/9/2018 27_estadistica No Parametric A II - slidepdf.com

http://slidepdf.com/reader/full/27estadistica-no-parametric-a-ii 5/28

 

DISEÑO DE EXPERIMENTOS: ESTADÍSTICA NO PARAMÉTRICA

AUTOR: Irene Guillén LunaCurso 2007/08

5

•  Prueba de Siegel-Tukey: Consiste en determinar una mínima diferencia

significativa tal que toda diferencia entre dos medias que sea superior a

ese valor se declara significativa.

•  Coeficiente de correlación de Spearman. Mide la asociación o

interdependencia entre dos variables discretas. Para calcular  ρ, los

datos son ordenados y reemplazados por su respectivo orden.

•  Tablas de contingencia: Se emplean para registrar y analizar la

relación entre dos o más variables, habitualmente de naturaleza

cualitativa -nominales u ordinales.

•  Prueba de Wald-Wolfowitz: Las prueba de rachas es una prueba no

paramétrica, capaz de manejar variables cuantitativas y cualitativas de

tipo dicotómico.

La utilidad de esta prueba, abarca diferentes campos de la actividad

humana y puede servir desde para probar la aleatoriedad: de las

encuestas aplicadas por los entrevistadores, de las fallas de la

maquinaria en la producción, de las cantidades compradas o vendidas,

de las faltas de los empleados, hasta para controlar la calidad de la

producción.

•  Prueba de los signos de Wilcoxon. Compara la media de dos

muestras relacionadas para determinar si existen diferencias entre ellas.

La prueba de Wilcoxon se aplica al caso de las distribuciones continuas

simétricas, bajo estas suposiciones, la media es igual a la mediana y el

procedimiento puede emplearse en probar la hipótesis nula que U=Uo.

De forma general, en todas ellas se parte de la base de que algunos

contrastes de hipótesis dependen del supuesto de normalidad, muchos de

estos contrastes siguen siendo aproximadamente válidos cuando se aplican a

muestras muy grandes, incluso si la distribución de la población no es normal.

Sin embargo, muchas veces se da también el caso de que, en aplicaciones

prácticas, dicho supuesto de normalidad no sea sostenible. Lo deseable

5/9/2018 27_estadistica No Parametric A II - slidepdf.com

http://slidepdf.com/reader/full/27estadistica-no-parametric-a-ii 6/28

 

DISEÑO DE EXPERIMENTOS: ESTADÍSTICA NO PARAMÉTRICA

AUTOR: Irene Guillén LunaCurso 2007/08

6

entonces será buscar la inferencia en contrastes que sean válidos bajo un

amplio rango de distribuciones de la población. Tales contrastes se denominan

no paramétricos.

Los contrastes no paramétricos son generalmente, válidos cualquiera que

sea la distribución de la población. Es decir, dichos contrastes pueden ser 

desarrollados de manera que tengan el nivel de significación requerido, sin

importar la distribución de los miembros de la población.

La mayor parte de las técnicas estudiadas hacen suposiciones sobre la

composición de los datos de la población. Las suposiciones comunes son que

la población sigue una distribución normal, que varias poblaciones tienenvarianzas iguales y que los datos se miden en una escala de intervalos o en

una escala de razón. Este tema presentará un grupo de técnicas llamadas no

paramétricas que son útiles cuando estas suposiciones no se cumplen.

Como se ha indicado anteriormente existen otras muchas pruebas

estadísticas diseñadas para situaciones en las que no se cumplen las

suposiciones críticas o que involucran datos cuantitativos o categóricos. Se

presentarán aquí unas cuantas de las pruebas no paramétricas que mas se

usan.

¿Qué ocurre con las pruebas no paramétricas frente a las que si lo son?

Las pruebas no paramétricas no necesitan suposiciones respecto a la

composición de los datos poblacionales. Las pruebas no paramétricas son de

uso común:

1.- Cuando no se cumplen las suposiciones requeridas por otras técnicas

usadas, por lo general llamadas pruebas paramétricas.

2.- Cuando es necesario usar un tamaño de muestra pequeño y no es posible

verificar que se cumplan ciertas suposiciones clave.

5/9/2018 27_estadistica No Parametric A II - slidepdf.com

http://slidepdf.com/reader/full/27estadistica-no-parametric-a-ii 7/28

 

DISEÑO DE EXPERIMENTOS: ESTADÍSTICA NO PARAMÉTRICA

AUTOR: Irene Guillén LunaCurso 2007/08

7

3.- Cuando se necesita convertir datos cualitativos a información útil para la

toma de decisiones.

Existen muchos casos en los que se recogen datos medidos en una

escala nominal u ordinal. Muchas aplicaciones de negocios involucran

opiniones o sentimientos y esos datos se usan de manera cualitativa.

Las pruebas no paramétricas tienen varias ventajas sobre las pruebas

paramétricas:

1.- Por lo general, son fáciles de usar y entender.

2.- Eliminan la necesidad de suposiciones restrictivas de las pruebas

paramétricas.

3.- Se pueden usar con muestras pequeñas.

4.- Se pueden usar con datos cualitativos.

También las pruebas no paramétricas tienen desventajas:

1.- A veces, ignoran, desperdician o pierden información.

2.- No son tan eficientes como las paramétricas.

3.- Llevan a una mayor probabilidad de no rechazar una hipótesis nula falsa

(incurriendo en un error).

Las pruebas no paramétricas son pruebas estadísticas que no hacen

suposiciones sobre la constitución de los datos de la población.

Por lo general, las pruebas paramétricas son mas poderosas que las

pruebas no paramétricas y deben usarse siempre que sea posible. Es

importante observar, que aunque las pruebas no paramétricas no hacen

5/9/2018 27_estadistica No Parametric A II - slidepdf.com

http://slidepdf.com/reader/full/27estadistica-no-parametric-a-ii 8/28

 

DISEÑO DE EXPERIMENTOS: ESTADÍSTICA NO PARAMÉTRICA

AUTOR: Irene Guillén LunaCurso 2007/08

8

suposiciones sobre la distribución de la población que se muestrea, muchas

veces se apoyan en distribuciones muestrales como la normal o la ji cuadrada.

En estas técnicas, solamente se necesitan conocimientos elementales

de matemáticas, pues los métodos son relativamente más sencillos que en las

pruebas paramétricas. En estas pruebas, también se tienen supuestos, pero

son pocos y no tienen que ver con la naturaleza de la distribución de la

población, por lo que a estas técnicas también se les conoce como de libre

distribución.

Una limitación que tienen es que no son aplicables a casos en los que se

desean manejar muchas variables al mismo tiempo, para estos casos, sí serequeriría una prueba paramétrica; lo que sí se requiere y en general es el

supuesto que se debe cumplir en la mayoría de las pruebas no paramétricas

para confiar en ellas, es que la muestra haya sido seleccionada en forma

probabilística.

Además del problema de los supuestos, algunos experimentos o

estudios que se deseen realizar producen respuestas que no es posible evaluar 

con la escala que tiene más ventajas, por ejemplo, cuando los datos solamente

se encuentran en una escala ordinal como cuando se evalúan las habilidades

de los vendedores de semillas o productos fitosanitarios, o el atractivo de cinco

variedades de plantas de melón, o la preferencia por sopas de cinco marcas

diferentes. En general aspectos como la habilidad o preferencias de un

producto o alimento, solamente los podemos ordenar; resultados de este tipo

se presentan frecuentemente en estudios de mercado y en otros del campo de

las ciencias sociales.

Seguidamente se analizan varias de las pruebas o métodos estadísticos

no paramétricos como Prueba de la mediana, Prueba Kuskal-Wallis, Prueba de

Friedman,  Concordancia de Kendall, de estas pruebas se mencionarán sus

principales características y aplicaciones, además de la prueba paramétrica a

la que podrían sustituir en caso necesario, así como los supuestos en los que

5/9/2018 27_estadistica No Parametric A II - slidepdf.com

http://slidepdf.com/reader/full/27estadistica-no-parametric-a-ii 9/28

 

DISEÑO DE EXPERIMENTOS: ESTADÍSTICA NO PARAMÉTRICA

AUTOR: Irene Guillén LunaCurso 2007/08

9

se basa la prueba, que como se podrá ver, son menos rigurosos que para las

pruebas paramétricas.

2.- PRUEBA DE LA MEDIANA

La prueba de la mediana es una prueba no paramétrica que podemos

considerar un caso especial de la prueba de chi-cuadrado, pues se basa en

esta última. Su objetivo es comparar las medianas de dos muestras y

determinar si pertenecen a la misma población o no.

Para ello, se calcula la mediana de todos los datos conjuntamente.

Después, se divide cada muestra en dos subgrupos: uno para aquellos datos

que se sitúen por encima de la mediana y otro para los que se sitúen por 

debajo. La prueba de chi-cuadrado, descrita seguidamente determinará si las

frecuencias observadas en cada grupo difieren de las esperadas con respecto

a una distribución de frecuencias que combine ambas muestras.

Esta prueba de chi-cuadrado (pronunciado "ji-cuadrado") es

considerada también como una prueba no paramétrica que mide la

discrepancia entre una distribución observada y otra teórica (bondad de ajuste),

indicando en qué medida las diferencias existentes entre ambas, de haberlas,

se deben al azar. También se utiliza para probar la independencia de dos

muestras entre sí, mediante la presentación de los datos en tablas de

contingencia.

La fórmula que da el estadístico es la siguiente:

∑ ⎥⎦⎤

⎢⎣⎡ ⎟

 ⎠ ⎞⎜

⎝ ⎛  −= χ   

Los grados de libertad vienen dados por:

gl= (r -1)(k -1). Donde r es el número de filas y k el de columnas.

5/9/2018 27_estadistica No Parametric A II - slidepdf.com

http://slidepdf.com/reader/full/27estadistica-no-parametric-a-ii 10/28

 

DISEÑO DE EXPERIMENTOS: ESTADÍSTICA NO PARAMÉTRICA

AUTOR: Irene Guillén LunaCurso 2007/08

10

•  Criterio de decisión:

Se acepta H 0 cuando ( )( )−−< χ  χ  . En caso contrario se

rechaza.

Donde t  representa el valor proporcionado por las tablas, según el nivel de

significación elegido.

Cuanto más se aproxima a cero el valor de chi-cuadrado, más ajustadas están

ambas distribuciones.

Esta prueba de la mediana está especialmente indicada cuando los datos sean

extremos o estén sesgados.

Ejemplo:

En los experimentos de Mendel con guisantes, observó 315 lisos y

amarillos, 108 lisos y verdes, 101 rugosos y amarillos y 32 rugosos y verdes.

De acuerdo con su teoría, estos números deberían presentarse en la

proporción 9:3:3:1. ¿Hay alguna evidencia que permita dudar de su teoría al

nivel de significación del 0.01?

Solución:

Ensayo de Hipótesis:

Ho; La teoría de Mendel es acertada.

H1; La teoría de Mendel no es correcta.

El número total de guisantes es 315+108+101+32=556. Puesto que los

números esperados están el la proporción 9:3:3:1 (9+3+3+1=16), se esperaría:

5/9/2018 27_estadistica No Parametric A II - slidepdf.com

http://slidepdf.com/reader/full/27estadistica-no-parametric-a-ii 11/28

 

DISEÑO DE EXPERIMENTOS: ESTADÍSTICA NO PARAMÉTRICA

AUTOR: Irene Guillén LunaCurso 2007/08

11

lisos y amarillos

lisos y verdes

rugosos y amarillos

rugosos y verdes

Grados de libertad = k-1-m = 4-1-0 = 3

No se tuvo que calcular ningún parámetro para obtener las frecuencias

esperadas.

Regla de decisión:

Si X2R 11.3 no se rechaza Ho.

Si X2R >11.3 se rechaza Ho.

Cálculos:

Justificación y decisión:

5/9/2018 27_estadistica No Parametric A II - slidepdf.com

http://slidepdf.com/reader/full/27estadistica-no-parametric-a-ii 12/28

 

DISEÑO DE EXPERIMENTOS: ESTADÍSTICA NO PARAMÉTRICA

AUTOR: Irene Guillén LunaCurso 2007/08

12

Como 0.470 es menor que 11.3 no se rechaza Ho y se concluye con un nivel

de significación de 0.01 que la teoría de Mendel es correcta.

Como el valor de 0.470 está cercano a cero, se procede a hacer un ensayo

unilateral izquierdo:

Ensayo de Hipótesis:

Ho; La teoría de Mendel es acertada.

H1; La teoría de Mendel es muy acertada.

Regla de decisión:

Si X2R 0.115 no se rechaza Ho.

Si X2R < 0.115 se rechaza Ho.

Como el valor de 0.470 no es menor a 0.115 se concluye que el experimento o

la teoría de Mendel solo es buena.

3.- PRUEBA KUSKAL-WALLIS

En estadística, el test de Kruskal-Wallis (de William Kruskal y W. Allen

Wallis) es un estadístico no paramétrico para testar si un grupo de datos

proviene de la misma población. Intuitivamente, es idéntico al ANOVA con los

datos reemplazados por categorías. Es una extensión del test de la U de Mann-

Whitney para 3 o más grupos.

5/9/2018 27_estadistica No Parametric A II - slidepdf.com

http://slidepdf.com/reader/full/27estadistica-no-parametric-a-ii 13/28

 

DISEÑO DE EXPERIMENTOS: ESTADÍSTICA NO PARAMÉTRICA

AUTOR: Irene Guillén LunaCurso 2007/08

13

Ya que es un test no paramétrico, el test de Kruskal-Wallis no asume

normalidad en los datos, en oposición al tradicional ANOVA. Si asume bajo la

hipótesis nula que los datos vienen de la misma distribución. Una forma común

en que se viola este supuesto es con datos heterocedásticos.

Método

1. Ordenar todos los datos de la muestra de menor a mayor, y asignar al

menor un rango de 1, al segundo un 2, y así hasta el n-ésimo. Si existen

datos que se repiten, se asigna el rango promedio a cada uno de ellos

(si existen cuatro datos idénticos que ocupan los rangos 11, 12, 13 y 14,

se les asigna un rango de 12,5 a los cuatro).

2. El estadístico está dado por:

, donde: 

•  n g es el número de observaciones en el grupo g  

•  r ij es el rango (entre todas las observaciones) de la

observación j en el grupo i  

•  N es el número total de observaciones entre todos los grupos

•  ,

• es el promedio de r ij .

Nótese que el denominador de la expresión para K  es

exactamente . Luego

.

5/9/2018 27_estadistica No Parametric A II - slidepdf.com

http://slidepdf.com/reader/full/27estadistica-no-parametric-a-ii 14/28

 

DISEÑO DE EXPERIMENTOS: ESTADÍSTICA NO PARAMÉTRICA

AUTOR: Irene Guillén LunaCurso 2007/08

14

3. Se puede realizar una corrección para los valores repetidos dividiendo K  

por , donde G es el número de grupos de diferentes

rangos repetidos, y t i  es el número de observaciones repetidas dentrodel grupo i que tiene observaciones repetidas para un determinado valor.

Esta corrección hace cambiar a K  muy poco a menor que existan un

gran número de observaciones repetidas.

4. Finalmente, el p-value es aproximado por . Si algún ni  

es pequeño ( < 5) la distribución de K puede ser distinta de la chi-

cuadrado.

Ejemplo:

Se tienen los siguientes datos experimentales, correspondientes a 22 plántulas

de tomate de los que se ha recogido información de dos variables: una variable

explicativa Exp nominal y otra variable respuesta Rta cuantitativa. Los datos se

presentan de forma que en las filas hay varios individuos para facilitar la

lectura:

Rta Exp Rta Exp Rta Exp Rta Exp15 1 28 2 16 2 25 3

15 1 28 2 16 2 35 3

25 1 28 2 25 2

25 1 35 2 28 2

25 1 43 2

33 1 13 3

43 1 15 3

15 2 25 3

Calcular la prueba de Kruskal-Wallis de comparación de medianas para los

datos anteriores.

5/9/2018 27_estadistica No Parametric A II - slidepdf.com

http://slidepdf.com/reader/full/27estadistica-no-parametric-a-ii 15/28

 

DISEÑO DE EXPERIMENTOS: ESTADÍSTICA NO PARAMÉTRICA

AUTOR: Irene Guillén LunaCurso 2007/08

15

Cálculo de los rangos para cada observación

Para cada observación se le asigna el rango según el orden que ocupa la

observación en el conjunto total de los datos, asignando el rango medio en

caso de empates:

Rta Exp Rango (Rta) Rta Exp Rango (Rta)

15 1 3.5 28 2 15.5

15 1 3.5 28 2 15.5

25 1 10.5 28 2 15.5

25 1 10.5 35 2 19.5

25 1 10.5 43 2 21.5

33 1 18 13 3 1.0

43 1 21.5 15 3 3.5

15 2 3.5 25 3 10.5

16 2 6.5 25 3 10.5

16 2 6.5 35 3 19.5

25 2 10.5

28 2 15.5

Cálculo de la suma de rangos RmPara cada grupo m = 1,…,r, siendo r el número de grupos, se define Rm como

la suma de rangos de cada grupo m, que para los datos del ejemplo resultan

ser:

R 1 = ∑ rangos= 3,5+3,5 +10,5 +10,5 +10,5 +18 +21,5 =78.00 grupo1

R 2 = ∑ rangos = 3,5+6,5 +6,5 +10,5 +15,5 +15,5 +15,5 +15,5 +19,5 +21,5 =130.00 grupo2

R 3 = ∑ rangos  = 1+ 3,5+10,5 +10,5 +19,5 =45.00 grupo3

5/9/2018 27_estadistica No Parametric A II - slidepdf.com

http://slidepdf.com/reader/full/27estadistica-no-parametric-a-ii 16/28

 

DISEÑO DE EXPERIMENTOS: ESTADÍSTICA NO PARAMÉTRICA

AUTOR: Irene Guillén LunaCurso 2007/08

16

Cálculo del valor medio de los rangos E[Rm] y de los rangos medios  R m

E[ ] ( ) 2 / 1+= nn Rmm

 

y el rango medio  R m como:

mmm n R R  / =  

Para los datos del ejemplo resultan ser:

[ ] ( ) ( ) 50,802 / 122*72 / 111 =+=+= nn R E   

[ ] ( ) ( ) 50,1152 / 122*102 / 122 =+=+= nn R E   

[ ] ( ) ( ) 50,572 / 122*52 / 133 =+=+= nn R E   

14,11 /  111 == n R R  =2 R 00,13 /  22 =n R  00,9 /  333 == n R R  

Estadístico de contraste H’

El estadístico de contraste H’ se calcula como:

( ) ( ) [ ][ ] ( ) ⎥⎥⎦

⎢⎢⎣

⎡⎥⎦

⎤⎢⎣

⎡−−−

⎥⎥⎦

⎢⎢⎣

⎡−+= ∑∑ ==

nnd d  R R E  Rnnn H 

 j

 j j

m

mmm3

1

3

2

1

 / 1 /  / 11 / 12'

siendo dj el número de empates en j = 1,…,k siendo k el número de valores

distintos de la variable respuesta, que para los datos del ejemplo resulta ser:

( ) ( ) ( ) ( ) ( ) ( ) ( ) 348222244662244 333333

1

3 =−+−+−+−+−+−=−∑=

 j

 j jd d   

con lo que:

( ) ( ) ( ) ( ) ( )( )[ ] 3398,12222 / 3481 / 5,57455 / 111513010 / 15,80787 / 123*22 / 12' 3222 =−−−+−+−= H 

 

5/9/2018 27_estadistica No Parametric A II - slidepdf.com

http://slidepdf.com/reader/full/27estadistica-no-parametric-a-ii 17/28

 

DISEÑO DE EXPERIMENTOS: ESTADÍSTICA NO PARAMÉTRICA

AUTOR: Irene Guillén LunaCurso 2007/08

17

que sigue una distribución Chi-Cuadrado con r –1 = 2 grados de libertad, que

tiene asociada un p-valor de 0.5118

4.- PRUEBA Q DE COCHRAN

Prueba o Test de la Q de Cochran permite efectuar un test estadístico

para ver si existe una diferencia significativa entre tests realizados.

Se trata de un contraste de H0 de que varias variables dicotómicas

relacionadas tienen igual media. Las variables se miden en el mismo

individuo o en individuos relacionados. Es una extensión de la prueba de

McNemar para k muestras.

El estadístico Q se calcula con:

( ) ( )[ ] [ ]−−−=  

Este estadístico tiene aproximadamente una distribución Chi-cuadrado

con n – 1 grados de libertad.

Cuando se tiene el caso de N individuos de un palmeral, a cada una de

los cuales se le efectuó un tratamiento con n materias activas diferentes

para la erradicación del picudo (n > 1), se tiene el caso de mediciones

repetidas en la misma planta. Esto es un total de n valores apareados para

cada palmera. Los resultados de cada test se pueden expresar como sano

o enfermo, (+) o (-) etc. Lo mismo ocurre cuando n ingenieros agrónomos

opinan sobre N variedades de una misma especie. Suponiendo que la

magnitud plaga del picudo es X, entonces el valor Xij corresponde la

palmera i tratada con la materia activa j . Los resultados obtenidos se

pueden expresar como se hace en la Tabla siguiente:

5/9/2018 27_estadistica No Parametric A II - slidepdf.com

http://slidepdf.com/reader/full/27estadistica-no-parametric-a-ii 18/28

 

DISEÑO DE EXPERIMENTOS: ESTADÍSTICA NO PARAMÉTRICA

AUTOR: Irene Guillén LunaCurso 2007/08

18

 Tabla: N palmeras tratadas con n materias activas

Palmeras Matactiva 1

Matactiva 2

… Matactive j

… Matactiva n

Total

1 X11 X12 … X1j … X1n T1

2 X21 X22 … X2j … X2n T23 X31 X32 … X3j … X3n T3.

… … … … … … … …

i Xi1 Xi2 … Xij … Xin Ti.

… … … … … … … …

N XN1 XN2 … XNj … XNn TN.

Total T.1 T.2 … T.j … T.n T

Donde como convención se adopta X = 0 cuando es (+) y X = 1 cuando

es (-) entonces los valores observados son una serie de ceros y unos.Definiendo las sumatorias:

∑=

= : El total de la columna j. ∑ ∑= =

= El total de todas las

observaciones

∑=

= : El total de la fila i.

( )∑=

= : La suma de los cuadrados de las filas.

( )∑=

= :La suma de los cuadrados de las columnas.

Entonces se puede efectuar un test estadístico para ver si existe unadiferencia significativa entre los distintos tratamientos fitosanitarios llamado: La 

prueba Q de Cochran. El estadístico Q que se calcula con:

5/9/2018 27_estadistica No Parametric A II - slidepdf.com

http://slidepdf.com/reader/full/27estadistica-no-parametric-a-ii 19/28

 

DISEÑO DE EXPERIMENTOS: ESTADÍSTICA NO PARAMÉTRICA

AUTOR: Irene Guillén LunaCurso 2007/08

19

( ) ( ) ( ) [ ]−−−= , como ya

hemos dicho, que tiene aproximadamente una distribución Chi-cuadrado

con n –1 grados de libertad.

Ejemplo:

Se han examinado 12 palmeras a las que se les aplicado tres materias activas

diferentes para el tratamiento del picudo rojo.

Si los resultados se informan como (+) y (-) detectar si hay diferencias

significativas entre las tres tratamientos fitosanitarios empleados. Usando la

convención de 1 para los (+) y 0 para los (-) resultó:

Palmera Mat. activa 1 Mat. activa 2 Mat activa 3 Total

1 1 1 0 2

2 0 0 0 0

3 1 1 1 3

4 1 0 1 2

5 1 1 1 3

6 0 0 1 1

7 1 1 1 3

8 0 0 0 0

9 1 1 0 2

10 0 0 1 111 0 1 0 1

12 1 0 1 2

Total 7 6 7 20

== ∑ ∑= =

 

( )∑=

=++==  

( ) =++== ∑=

 

( ) ( )[ ] [ ]−−=  

=<= χ   

5/9/2018 27_estadistica No Parametric A II - slidepdf.com

http://slidepdf.com/reader/full/27estadistica-no-parametric-a-ii 20/28

 

DISEÑO DE EXPERIMENTOS: ESTADÍSTICA NO PARAMÉTRICA

AUTOR: Irene Guillén LunaCurso 2007/08

20

La conclusión es que no se han encontrado diferencias significativas entre los

tres métodos.

5.- F DE FRIEDMAN

La prueba de Friedman es el equivalente a la prueba ANOVA para dos

factores en la versión no paramétrica. El método consiste en ordenar los datos

por filas o bloques, reemplazándolos por su respectivo orden. Al ordenarlos,

debemos considerar la existencia de datos idénticos.

Método

Sea una tabla de datos, donde m son las filas (bloques) y n las

columnas (tratamientos). Una vez calculado el orden de cada dato en su

bloque, reemplazamos la tabla original con otra donde el valor rij es

el orden de xij en cada bloque i.

1. Cálculo de las varianzas intra e inter grupo:

• ,

• 

• 

• 

2. El estadístico viene dado por .

3. El criterio de decisión es .

5/9/2018 27_estadistica No Parametric A II - slidepdf.com

http://slidepdf.com/reader/full/27estadistica-no-parametric-a-ii 21/28

 

DISEÑO DE EXPERIMENTOS: ESTADÍSTICA NO PARAMÉTRICA

AUTOR: Irene Guillén LunaCurso 2007/08

21

Ejemplo:

Se conduce un estudio de campo con fresas (Fragaria x ananassa ) para

determinar la eficacia de seis herbicidas en el control de malezas gramíneas.

Las gramíneas fueron contadas dentro de cada tratamiento y examinadas con

ANAVA. Las medias de los tratamientos fueron separadas utilizando la prueba

de diferencia mínima significativa (DMS) de Fisher al 5% de significancia

(tomado de Gilreath et al., 2003).

ANAVA Prueba de Friedman ANAVA

Número de

gramíneas

Número de

gramíneas

Número

de frutos

Herbicidas

Medias

Herbicidas

Medianas

Herbicidas

Medias

1 90.7 a* 1 40 a 4 776.7 a

6 39.5 b 6 17 b 3 763.5 a

5 30.3 b 5 16 b 5 689.0 b

2 28.5 b 2 14 b 6 661.8 b

4 10.5 b 4 4 c 2 651.6 b

3 5.10 b 3 3 c 1 545.5 c

*Valores seguidos por la misma letra no difieren al 5% de significancia según

DMS.

Claramente, los datos de rendimiento expresados en número de frutos

cosechados lucen razonables. Los tratamientos que recibieron los herbicidas 3

y 4 tuvieron los mayores rendimientos, seguidos por los herbicidas 2, 5 y 6. Sin

embargo, los resultados del ANAVA para los conteos de malezas gramíneas no

ofrecen mucha información que concuerde con los datos de rendimiento.

5/9/2018 27_estadistica No Parametric A II - slidepdf.com

http://slidepdf.com/reader/full/27estadistica-no-parametric-a-ii 22/28

 

DISEÑO DE EXPERIMENTOS: ESTADÍSTICA NO PARAMÉTRICA

AUTOR: Irene Guillén LunaCurso 2007/08

22

¿Cómo se puede explicar que 39.5 gramíneas en promedio sean

estadísticamente igual a 5.1? La respuesta yace en la gran variabilidad inicial

que existía en la distribución de las gramíneas en el campo bajo estudio, la cual

violaba los supuestos de normalidad y de homogeneidad de varianza, como lo

expresan las pruebas de Shapiro-Wilk (p<0.0001) para normalidad y de Bartlett

para homogeneidad de varianzas (p=0.0023). Cuando los mismos datos de

enmalezamiento fueron sometidos a la prueba de Friedman, los resultados

indicaron que los tratamientos con menos malezas gramíneas fueron los de

mayor rendimiento.

Este ejemplo, además compara el uso de métodos paramétricos y no

paraméticos.

6.- CONCORDANCIA DE KENDALL

Análisis de la concordancia en la valoración de aspectos (coeficiente de

Kendall).

Después de obtener una proposición final en la consulta a los expertos

agrónomos necesitamos demostrar su confiabilidad, debemos probar el nivel

de acuerdo entre los expertos para otorgar mayor autenticidad a nuestro

estudio, es preciso comprobar el grado de coincidencia de las valoraciones

realizadas por lo expertos.

Podemos utilizar entonces el Coeficiente de Concordancia de Kendall,

que constituye un estadígrafo muy útil en estudios de confiabilidad entre

expertos de una materia, en este caso agronómica, al determinar la asociación

entre distintas variables. Es una medida de coincidencia entre ordenaciones

que pueden ser objetos o individuos. En este caso el coeficiente concordancia

(W) será un índice de la divergencia del acuerdo efectivo entre los expertos

mostrado en los datos del máximo acuerdo posible (perfecto).

5/9/2018 27_estadistica No Parametric A II - slidepdf.com

http://slidepdf.com/reader/full/27estadistica-no-parametric-a-ii 23/28

 

DISEÑO DE EXPERIMENTOS: ESTADÍSTICA NO PARAMÉTRICA

AUTOR: Irene Guillén LunaCurso 2007/08

23

Para la aplicación del Coeficiente de Concordancia de Kendall (W), se

construye una tabla Aspectos a evaluar / Expertos donde se asientan en una

tabla los rangos de valoración (en términos numéricos, 1 a 5) asignados a cada

aspecto evaluado contra cada uno de los expertos, siempre tomando los datos

a partir de la tabla que se uso en el método Delphi, o sea, la tabla de Aspectos

/ Rangos de Valoración donde se encuentran los criterios de los expertos y los

rangos de valoración.

Aspectos aEvaluar

Experto 1 Experto 2 Experto 3 … UltimoExperto

12

3

A partir de aquí se sigue la metodología establecida:

• Determinación de la suma de los valores numéricos asignados a cada

aspecto a evaluar, según la apreciación del experto (Rj)

• Determinación del valor medio de las Rj, dada por la sumatoria de los Rj

entre N, total de aspectos a evaluar.

• Determinación de la desviación media, dada por la diferencia entre cada Rj y

el valor de la media.

• Determinación de la suma de los cuadrados de las desviaciones medias, S.

• Determinación del cuadrado del número total de expertos, K.

• Determinación del cubo del número total de aspectos a evaluar, N.

• Determinación de la diferencia entre el cubo de N y N y su multiplicación por 

el cuadrado de K.

• Determinación del estadígrafo que responde a la siguiente expresión:

5/9/2018 27_estadistica No Parametric A II - slidepdf.com

http://slidepdf.com/reader/full/27estadistica-no-parametric-a-ii 24/28

 

DISEÑO DE EXPERIMENTOS: ESTADÍSTICA NO PARAMÉTRICA

AUTOR: Irene Guillén LunaCurso 2007/08

24

En la prueba estadística Coeficiente de Concordancia de Kendall (W), el

coeficiente W ofrece el valor que posibilita decidir el nivel de concordancia

entre los expertos. El valor de W oscila entre 0 y 1. El valor de 1 significa una

concordancia de acuerdos total y el valor de 0 un desacuerdo total. Obviamente

la tendencia a 1 es lo deseado pudiéndose realizar nuevas rondas si en la

primera no es alcanzada significación en la concordancia.

Conclusiones.

Podemos concluir que el método de expertos agronómicos, su procesamiento a

través del método Delphi y la verificación de concordancia a través del

estadígrafo de correlación de Kendall, tiene una serie de ventajas ydesventajas dentro de los métodos básicos de análisis cualitativos.

Ventajas:

• Se basa en la suposición de que varios expertos pueden llegar a un mejor 

pronóstico que una sola persona.

• No existe secreto y se fomenta la comunicación porque a veces los

pronósticos y validaciones tienen influencia de factores sociales y pueden no

reflejar un consenso.

• Como pronóstico visionario es una profecía que usa ideas y juicio personales,

intuitivos, vinculados entre sí.

Desventajas:

• Se ha criticado por su poca seguridad, demasiada sensibilidad de los

resultados a la ambigüedad de las preguntas.

• Dificultad para establecer el grado de experiencia de los miembros del panel,

la imposibilidad de que tome en cuenta lo inesperado y por los grandes

retrasos entre las repeticiones del proceso.

5/9/2018 27_estadistica No Parametric A II - slidepdf.com

http://slidepdf.com/reader/full/27estadistica-no-parametric-a-ii 25/28

 

DISEÑO DE EXPERIMENTOS: ESTADÍSTICA NO PARAMÉTRICA

AUTOR: Irene Guillén LunaCurso 2007/08

25

• Los métodos cualitativos confían principalmente en el juicio de los expertos y

tienden a ser menos precisos que los métodos cuantitativos.

A pesar de estas limitaciones y teniendo en cuenta sus cualidades positivas, su

uso actual en las organizaciones e investigaciones sugiere que con frecuencia

su potencial excede a sus limitaciones.

Así mismo el procesamiento a través de un sistema automatizado, siempre

garantiza la calidad de nuestra investigación.

Tal como hemos descrito el método a seguir es el siguiente: se crean todas las

combinaciones de puntos posibles [(xi, yi), (xj, yj)] tal que i ≠ j y se definen c =

número de parejas concordantes (xi>xj y yi>yj) o (xi<xj y yi<yj) d = número

de parejas discordantes (xi>xj y yi<yj) o (xi<xj y yi>yj) ey=número de ligas

en y, con xi≠xj ex=número de ligas en x, con yi≠yj, aplicando el siguiente

estadístico:

( ) ( )( )( )++++−≡τ   

El coeficiente de Kendall se define tal que −1 ≤ τ    ≤ 1 donde ±1 indica

correlación perfecta, y 0 indica no correlación.

La significancia de no asociación viene dada por una distribución normal:

( ) ( )∞−

−∫ −= π   

( ) ( )( )−+= τ   

7.- ¿Y EN EXCEL?

COMO SE HACE EN EXCEL.xls 

5/9/2018 27_estadistica No Parametric A II - slidepdf.com

http://slidepdf.com/reader/full/27estadistica-no-parametric-a-ii 26/28

 

DISEÑO DE EXPERIMENTOS: ESTADÍSTICA NO PARAMÉTRICA

AUTOR: Irene Guillén LunaCurso 2007/08

26

5/9/2018 27_estadistica No Parametric A II - slidepdf.com

http://slidepdf.com/reader/full/27estadistica-no-parametric-a-ii 27/28

 

DISEÑO DE EXPERIMENTOS: ESTADÍSTICA NO PARAMÉTRICA

AUTOR: Irene Guillén LunaCurso 2007/08

27

BIBLIOGRAFÍA

•  Bioestadística: Métodos y aplicaciones

•  Presentación en Power Point.- Análisis Multivariable.- Itziar

Aretxaga•  Estadística no paramétrica - Wikipedia, la enciclopedia libre

•  Contraste de Kruskall-Wallis

•  Estadística No-Paramétrica

•  Tesauro SPINES :: estadística no parametrica

•  Estadística no paramétrica

•  http://www.bioestadistica.freeservers.com/tema14.pdf

•  http://spines.r020.com.ar/index.php?tema=2345&/distribucionesestadísticas

•  Tutorial estadística no paramétrica gratis - emagister.com

•  Estadística Aplicada Facultad de Agronomía USAC

•  http://www.medmayor.cl/odontologia/quinto/bioestadistica/estadisti

canoparametrica.doc

•  Estadística multivariante y no ... - Búsqueda de libros de Google

•  Estadística para administración y ... - Búsqueda de libros de Google

•  Estadística matemática con aplicaciones - Búsqueda de libros de

Google

•  http://www.redbio.org/portal/encuentros/enc_2001/minicursos/pdf/M

C-01/GOIANIA-REDBIO3-CROSSA.pdf

•  Estadística No Paramétrica

•  http://www.uclm.es/profesorado/mdsalvador/58109/teoria/anova_un

 _factor-lectura.pdf

•  http://gcrec.ifas.ufl.edu/WeedScience/Documents/Fumigant

Studies/Estad no param02.doc

•  Diseño de experimentos. Clase 20

•  Anova un factor y Kruskal-Wallis

•  Curso: Estadística I

5/9/2018 27_estadistica No Parametric A II - slidepdf.com

http://slidepdf.com/reader/full/27estadistica-no-parametric-a-ii 28/28

 

DISEÑO DE EXPERIMENTOS: ESTADÍSTICA NO PARAMÉTRICA

AUTOR: Irene Guillén LunaCurso 2007/08

28

BIBLIOGRAFÍA

•  Yahoo! GeoCities

•  Pruebas para k muestras dependientes

•  http://patoral.umayor.cl/favicon.ico•  Proporción poblacional

•  Glosario

•  http://www.azprensa.com/favicon.ico