capÍtulo 3. metodologÍa -...

13
CAPÍTULO 3: Metodología 41 CAPÍTULO 3. METODOLOGÍA

Upload: doantruc

Post on 28-Sep-2018

222 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: CAPÍTULO 3. METODOLOGÍA - catarina.udlap.mxcatarina.udlap.mx/u_dl_a/tales/documentos/lii/rivera_a_f/capitulo3.pdf · tratamiento en el diseño factorial 2k con una sola réplica

CAPÍTULO 3: Metodología

41

CAPÍTULO 3.

METODOLOGÍA

Page 2: CAPÍTULO 3. METODOLOGÍA - catarina.udlap.mxcatarina.udlap.mx/u_dl_a/tales/documentos/lii/rivera_a_f/capitulo3.pdf · tratamiento en el diseño factorial 2k con una sola réplica

CAPÍTULO 3: Metodología

42

3. METODOLOGÍA

En este capítulo tiene como objetivo el describir la manera en que se realizó este

proyecto, explicar los pasos que se siguieron para poder demostrar la existencia de

contrastes en estadística no paramétrica. Aquí podemos encontrar una simulación de lo

que es el programa, el diagrama de flujo del mismo, la descripción del algoritmo y del

programa mismo.

3.1 Prueba Propuesta

Esta prueba consiste en estimar los efectos principales y de las interacciones en un

experimento factorial del tipo 2k con una sola réplica por medio de contrastes estimados

a través de estadística no paramétrica y de simulación, todo esto para saber cuáles de los

factores son significativos y deben seguirse investigando.

Se tiene un experimento factorial del tipo 2k, con k observaciones, una por cada

tratamiento en el diseño factorial 2k con una sola réplica. Los pasos a seguir son los

siguientes:

1. Partiendo de la hipótesis de que el efecto de cada factor y sus interacciones son

significativos, el primer paso a seguir es el de asignar rangos a las observaciones del

experimento, cabe decir que las observaciones no se ordenan, sólo adquieren el

número de posición que les corresponde sin perder su posición de acuerdo al

tratamiento, en seguida se ilustra en la figura 3.1.1 la manera en que se asignan

rangos a las observaciones, para ello se tomó los datos de la primera réplica de un

experimento 23. (Ver Montgomery 1991)

Page 3: CAPÍTULO 3. METODOLOGÍA - catarina.udlap.mxcatarina.udlap.mx/u_dl_a/tales/documentos/lii/rivera_a_f/capitulo3.pdf · tratamiento en el diseño factorial 2k con una sola réplica

CAPÍTULO 3: Metodología

43

2. Ahora que se tienen los rangos se calculan los contrastes de cada uno de los factores

de la siguiente forma:

donde S R+ denota la suma de rangos de los tratamientos con coeficientes positivos y S R- denota la suma

la suma rangos de los tratamientos con coeficientes negativos

3. Ya que se tiene el contraste, obtenido de las observaciones originales, se comienza

con la simulación. Esta consiste en generar números aleatorios utilizando una

distribución Uniforme U (0,1), uno para cada observación, generar rangos igual que

se hizo con las observaciones y calcular el contraste con la fórmula 3.1 que se utilizó

para el cálculo de los contrastes antes de la simulación.

Fórmula 3.1

[ ]2

12

2

1˙̊˘

ÍÎ

È -= Â Â -+-

RRContrastek

* Cuando se tienen dos números iguales entonces el rango que les asignado es el promedio de los rangos que les corresponden Figura 3.1.1

A B AB C AC BC ABC Observaciones

(1) -1 -1 1 -1 1 1 -1 -3

a 1 -1 -1 -1 -1 1 1 0

b -1 1 -1 -1 1 -1 1 -1

ab 1 1 1 -1 -1 -1 -1 2

c -1 -1 1 1 -1 -1 1 -1

ac 1 -1 -1 1 1 -1 -1 2

bc -1 1 -1 1 -1 1 -1 1

abc 1 1 1 1 1 1 1 6

Observaciones Rangos-3 10 4

-1 2.5*2 6.5*

-1 2.5*2 6.5*1 56 8

Page 4: CAPÍTULO 3. METODOLOGÍA - catarina.udlap.mxcatarina.udlap.mx/u_dl_a/tales/documentos/lii/rivera_a_f/capitulo3.pdf · tratamiento en el diseño factorial 2k con una sola réplica

CAPÍTULO 3: Metodología

44

4. Cuando se han realizado las simulaciones necesarias para estimar el efecto de cada

factor y sus interacciones entonces se procede a calcular el Valor P mediante la

fórmula siguiente:

( )Â=

>=-B

i

i AAIB

PValor1

221

5. Por último se calculan los intervalos de confianza para cada efecto calculado y Valor

P correspondiente, para ello se utilizará la siguiente fórmula:

s2

Z x confianza de Intervalo a±=

En el punto 3.2 de este capítulo se muestra un ejemplo de los pasos que se han explicado

anteriormente.

Donde B es el número de simulaciones y 2iA son los efectos estimados a través de simulación y 2A es

el resultado del contraste estimado con las observaciones originales.

Fórmula 3.2

Fórmula 3.3

Page 5: CAPÍTULO 3. METODOLOGÍA - catarina.udlap.mxcatarina.udlap.mx/u_dl_a/tales/documentos/lii/rivera_a_f/capitulo3.pdf · tratamiento en el diseño factorial 2k con una sola réplica

CAPÍTULO 3: Metodología

45

3.2 Ejemplo de simulación del programa

Tenemos un diseño factorial 23, con los factores A, B, C a dos niveles, un experimento

con una sola réplica y los datos son los siguientes:

A B C OBSERVACIONES-1 -1 -1 32.8+1 -1 -1 27.4-1 +1 -1 54.1+1 +1 -1 16.6-1 -1 +1 45.3+1 -1 +1 83.4-1 +1 +1 22.7+1 +1 +1 17.4

Este ejemplo tiene el propósito de demostrar si el Efecto de C es significativo para

el experimento o si no lo es. Por lo tanto tenemos la siguiente hipótesis:

H0: El efecto de C es significativo (a=0.05)

H1: El efecto de C no es significativo (a=0.05)

Se calculó el Efecto de C por medio de contrastes en estadística no paramétrica

por medio de rangos.

A continuación se le asignan rangos a las observaciones, como sigue:

C OBSERVACIONES RANGOS-1 32.8 5-1 27.4 4-1 54.1 7-1 16.6 1+1 45.3 6+1 83.4 8+1 22.7 3+1 17.4 2

Figura 3.2.1

Figura 3.2.2

Page 6: CAPÍTULO 3. METODOLOGÍA - catarina.udlap.mxcatarina.udlap.mx/u_dl_a/tales/documentos/lii/rivera_a_f/capitulo3.pdf · tratamiento en el diseño factorial 2k con una sola réplica

CAPÍTULO 3: Metodología

46

Ya establecidos los rangos, se procede a calcular el contraste de C, con la

siguiente fórmula 3.1 entonces:

( ) ( )[ ][ ] 0.2517452386C de Contraste 2 2 =+++-+++=

Ahora comienza la simulación

Primera Simulación

C U (0,1) RANGOS-1 0.035 2-1 0.824 7-1 0.956 8-1 0.011 1+1 0.233 3+1 0.379 4+1 0.726 6+1 0.708 5

( ) ( )[ ][ ] 056431872C de Contraste 22I =+++-+++=

Segunda simulación

C U (0,1) RANGOS-1 0.963 8-1 0.687 7-1 0.26 3-1 0.527 6+1 0.018 1+1 0.306 4+1 0.471 5+1 0.156 2

( ) ( )[ ][ ] 963782541C de Contraste 22II =+++-+++=

Figura 3.2.3

Figura 3.2.4

Page 7: CAPÍTULO 3. METODOLOGÍA - catarina.udlap.mxcatarina.udlap.mx/u_dl_a/tales/documentos/lii/rivera_a_f/capitulo3.pdf · tratamiento en el diseño factorial 2k con una sola réplica

CAPÍTULO 3: Metodología

47

Tercera Simulación

C U (0,1) RANGOS-1 0.363 2-1 0.742 7-1 0.761 8-1 0.474 5+1 0.24 1+1 0.401 4+1 0.395 3+1 0.627 6

( ) ( )[ ][ ] 458726341C de Contraste 22III =+++-+++=

Cuarta Simulación

C U (0,1) RANGOS-1 0.809 8-1 0.537 5-1 0.091 1-1 0.144 2+1 0.326 4+1 0.782 7+1 0.629 6+1 0.161 3

( ) ( )[ ][ ] 121583674C de Contraste 22IV =+++-+++=

Figura 3.2.5

Figura 3.2.6

Page 8: CAPÍTULO 3. METODOLOGÍA - catarina.udlap.mxcatarina.udlap.mx/u_dl_a/tales/documentos/lii/rivera_a_f/capitulo3.pdf · tratamiento en el diseño factorial 2k con una sola réplica

CAPÍTULO 3: Metodología

48

Quinta Simulación

C U (0,1) RANGOS-1 0.449 3-1 0.087 1-1 0.765 5-1 0.768 7+1 0.496 4+1 0.096 2+1 0.948 8+1 0.766 6

( ) ( )[ ][ ] 175136824C de Contraste 22V =+++-+++=

Concluidas las simulaciones, se calcula el Valor P con la fórmula 3.2 probar la hipótesisnula.

( ) 8.045

1==-VALUEP

Con esto podemos concluir que,

Como el Valor P es 0.8 > 0.05, no se rechaza H0.

Este es un ejemplo de lo que el programa hará, calculará los contrastes de los factoresdel experimento utilizando estadística no paramétrica. En este ejemplo sólo se utilizaron5 simulaciones pero el programa es capaz de llevar a cabo hasta 100,000 de ellas.

Figura 3.2.7

Page 9: CAPÍTULO 3. METODOLOGÍA - catarina.udlap.mxcatarina.udlap.mx/u_dl_a/tales/documentos/lii/rivera_a_f/capitulo3.pdf · tratamiento en el diseño factorial 2k con una sola réplica

CAPÍTULO 3: Metodología

49

3.3 Descripción del algoritmo

En esta sección del capítulo se describe el algoritmo propuesto, para el que se ha escrito

un programa en el que el investigador solamente tiene que introducir los datos de las

observaciones obtenidos por medio de un experimento y el programa se encargará de

llevar a cabo los cálculos y procedimientos necesarios. Cabe mencionar que el programa

no le pide al investigador el estadístico Za/2 porque ya lo tiene predefinido y este trabaja

con un porcentaje del 95% de confiabilidad.

El algoritmo propuesto es el siguiente:

1. Se introducen los datos de las observaciones y la tabla de signos

para los factores principales en dos archivos, entonces se compila y

se corre el programa.

2. Se solicitan al usuario los siguientes datos:

ÿ La semilla para la simulación

ÿ Número de simulaciones (IB)

ÿ Número de repeticiones por simulación (IREPB).

3. Se le asignan rangos a las observaciones originales.

4. Se genera la tabla de signos para cada factor y se calculan los

contrastes para cada factor e interacciones.

5. Empieza la simulación (NB=0). El contador de simulaciones está

en cero (NB=0)

6. Se obtienen números aleatorios para las nuevas observaciones U

(0,1)

7. Se asignan rangos a estas observaciones simuladas y se calculan

los contrastes simulados para cada factor e interacciones.

8. Se incrementa en 1 el contador de simulaciones (IB=IB+1).

Page 10: CAPÍTULO 3. METODOLOGÍA - catarina.udlap.mxcatarina.udlap.mx/u_dl_a/tales/documentos/lii/rivera_a_f/capitulo3.pdf · tratamiento en el diseño factorial 2k con una sola réplica

CAPÍTULO 3: Metodología

50

9. El contador de rechazos para la obtención del Valor P está en cero

(Contrech=0)

10. Se comparan los contrastes simulados con los originales y se

incrementa el contador de rechazos (Contrech=contrech+1)

11. Se calcula el Valor P cuando se termina las repeticiones de la

simulación, es decir cuando (RB=B)

12. Se calculan las varianzas de cada contraste.

13. Y por último se calcula el intervalo de confianza correspondiente a

cada contraste

14. Se imprimen los contrastes originales e intervalos de confianza

para cada factor e interacciones.

15. Parar

Page 11: CAPÍTULO 3. METODOLOGÍA - catarina.udlap.mxcatarina.udlap.mx/u_dl_a/tales/documentos/lii/rivera_a_f/capitulo3.pdf · tratamiento en el diseño factorial 2k con una sola réplica

CAPÍTULO 3: Metodología

51

3.4 Diagrama de Flujo

El siguiente diagrama de flujo representa gráficamente el algoritmo computacional para

el cálculo de contrastes en estadística no paramétrica, el cual es la base para escribir el

programa de simulación en cualquier lenguaje.

Lectura de Datos:Factores Principales ( A, B, …)Observaciones ( 2K)IB= # de simulacionesIREPB=# de repeticiones por simulaciónSemilla de simulación

¿Desea probar un contraste?

Introducir contraste

Calcular contraste

NB = 0, contrech = 0

SI

NOPARAR

1

2

3

Page 12: CAPÍTULO 3. METODOLOGÍA - catarina.udlap.mxcatarina.udlap.mx/u_dl_a/tales/documentos/lii/rivera_a_f/capitulo3.pdf · tratamiento en el diseño factorial 2k con una sola réplica

CAPÍTULO 3: Metodología

52

*1 Después de generar U (0,1), se crean los rangos y se calcula el contraste de los efectos.

*2 BcontrechPValor =

Generar U (0,1) necesarios

Calcular CNB *1

CNB>C SIContrech = contrech + 1

NO

NB = B

NO

SI

Calcular P- value *2

Calcular e imprimir Contrastes originales e Intervalosde confianza

1

3

2

Page 13: CAPÍTULO 3. METODOLOGÍA - catarina.udlap.mxcatarina.udlap.mx/u_dl_a/tales/documentos/lii/rivera_a_f/capitulo3.pdf · tratamiento en el diseño factorial 2k con una sola réplica

CAPÍTULO 3: Metodología

53

3.4 Descripción del programa de simulación

El programa diseñado para este algoritmo tiene tres versiones y fueron escritos en el

lenguaje de programación Fortran y denominados como fabiola1.exe, fabiola2.exe,

fabiola3.exe. A continuación se describe como trabajan dichos programas.

En general, el propósito del programa es el de generar los contrastes para cada uno de los

factores y sus interacciones y saber cuales de ellos son significativos para seguir

estudiándolos. El programa también proporciona al usuario el intervalo de confianza

mediante la repetición de las simulaciones, determinadas por el experimentador, y con la

ayuda del valor P previamente calculado. Esto da una mayor claridad acerca de la

precisión de la prueba.

Este programa tiene una capacidad de correr hasta un diseño factorial 28 , esto es

256 observaciones pero puede ser modificado según las necesidades del investigador.

Como ya se mencionó antes, hasta el momento se tienen tres versiones disponibles del

programa, la de los diseños 23, 24 y 25 pero es posible modificarlo fácilmente. Los

aspectos que se pueden modificar son la matriz de signos de los factores principales, las

columnas de las interacciones de los factores en la matriz de factores y los valores

numéricos de las observaciones. La forma de hacer dichas modificaciones se encuentra

en el Apéndice II. También cabe mencionar que el programa no imprime los contrastes

originales y los intervalos de confianza para los valores P en el orden natural de Fisher, si

no que primero imprime factores principales, después interacciones dobles, interacciones

triples, así hasta llegar a imprimir la interacción de los k factores. El program le

especifica al usuario el orden para una fácil comprensión de los resultados de éste.