dca dbca

21
Autor: LETG. 1 Practica Dirigida De Análisis y Diseños de Experimentos 1. DCA ij i ij e u Y Donde y, denota la j-ésima observación del i-ésimo grupo en tratamiento; p, es la media de la i-ésima población en tratamiento, y e, es el error experimental. Éste es un modelo estadístico lineal para la clasificación de tratamientos de un factor, en un diseño de experimentos totalmente aleatorizado. El modelo tiene cierta tolerancia para la variación entre las observaciones de un grupo de tratamiento dado. Debido al error experimental, cada observación se desvía de la media de su población p, en una cantidad e,. La varianza del error experimental u2 es la varianza de e,, y se supone que es la misma para toda la población en tratamiento. PROBLEMA 1: Se realizó un estudio de ingeniería de tránsito sobre los retrasos en las intersecciones con semáforos en las calles de una ciudad. Se usaron tres tipos de semáforo: 1) programado, 2) semiactivado y 3) activado. Se usaron cinco intersecciones para cada tipo de semáforo. La medida de retraso utilizada fue el promedio de tiempo que cada vehículo permanece detenido en cada intersección (segundos/vehículo). Los datos son los siguientes: Programado Semiactivado Activado 36.6 17.5 15 39.2 20.6 10.4 30.4 18.7 18.9 37.1 25.7 10.5 34.1 22 15.2 a. Escriba el modelo lineal estadístico para este estudio y explique sus componentes. ij i ij e u Y i u = media del tipo de semáforo, ij e = error experimental b. Establezca las suposiciones necesarias para un análisis de varianza de los datos. ij e Aleatorio, independiente con media 0 y varianza igual para todos los semáforos

Upload: todd-martinez

Post on 23-Nov-2015

268 views

Category:

Documents


11 download

TRANSCRIPT

  • Autor: LETG. 1

    Practica Dirigida De Anlisis y Diseos deExperimentos

    1. DCA ijiij euY

    Donde y, denota la j-sima observacin del i-simo grupo en tratamiento; p, es lamedia de la i-sima poblacin en tratamiento, y e, es el error experimental. ste es unmodelo estadstico lineal para la clasificacin de tratamientos de un factor, en undiseo de experimentos totalmente aleatorizado. El modelo tiene cierta tolerancia parala variacin entre las observaciones de un grupo de tratamiento dado. Debido al errorexperimental, cada observacin se desva de la media de su poblacin p, en unacantidad e,. La varianza del error experimental u2 es la varianza de e,, y se supone quees la misma para toda la poblacin en tratamiento.

    PROBLEMA 1:Se realiz un estudio de ingeniera de trnsito sobre los retrasos en las interseccionescon semforos en las calles de una ciudad. Se usaron tres tipos de semforo: 1)programado, 2) semiactivado y 3) activado. Se usaron cinco intersecciones para cadatipo de semforo. La medida de retraso utilizada fue el promedio de tiempo que cadavehculo permanece detenido en cada interseccin (segundos/vehculo). Los datos sonlos siguientes:

    Programado Semiactivado Activado36.6 17.5 1539.2 20.6 10.430.4 18.7 18.937.1 25.7 10.534.1 22 15.2

    a. Escriba el modelo lineal estadstico para este estudio y explique suscomponentes.

    ijiij euY iu = media del tipo de semforo, ije = error experimental

    b. Establezca las suposiciones necesarias para un anlisis de varianza de los datos.

    ije Aleatorio, independiente con media 0 y varianza igual para todos los semforos

  • Autor: LETG. 2

    c. Calcule el anlisis de varianza.Sintaxis SAS:

    data dbca;input tipo $ rpta;cards;programado 36.6programado 39.2programado 30.4programado 37.1programado 34.1semiactivado 17.5semiactivado 20.6semiactivado 18.7semiactivado 25.7semiactivado 22activado 15activado 10.4activado 18.9activado 10.5activado 15.2

    ;proc glm;class tipo ;model rpta=tipo;means tipo/tukey;means tipo/duncan;run;

    Source DF Sum of Squares Mean Square F Value Pr > FModel 2 1202.628000 601.314000 52.35

  • Autor: LETG. 3

    d. Pruebe la hiptesis de que no hay diferencia entre las medias de retraso para lostipos de semforo; a un nivel de significacin de .05.

    Means with the same letter arenot significantly different.

    Tukey Grouping Mean N tipoA 35.480 5 programa

    B 20.900 5 semiacti

    C 14.000 5 activado

    NOTA IMPORTANTE:Qu mtodo de comparacin debe usarse?

    Si bien es cierto que se reporta un buen desempeo en la deteccin de diferencias realescon la prueba de rango de Duncan, este no incluye el ndice de error del experimento,debido a que TUKEY si lo efecta o incluye mucho prefieren su uso.

    Contrastes:

    Sirven para hacer comparaciones mltiples entre los distintos tratamientos porejm:

    Programado vs activado: contrast "programado vs activado" tipo 1 0 -1;

    Contrast DF Contrast SS Mean Square F Value Pr > Fprogramado vs activado 1 119.0250000 119.0250000 10.36 0.0074

    Por medio de esta Prueba: se pueden observar si existen de manera interna diferencias entre lostratamientos, como se vio inicialmente el P value nos deca que si existan diferencias entre lostratamientos, y con estas prueba reafirmamos eso. (El modo de proceder de esta prueba es lasiguiente: si se le asigna letras diferentes, entonces sern los diferentes los tratamientos, si tuviesenletras iguales, son tratamientos similares, que producirn el mismo efecto.

    Como vemos el P-value es menor a 0.05, entonces rechazamos la hiptesis que indica la igualdad, enotras palabras existe una diferencia entre los tratamientos planteado en este caso programado yactivado.

  • Autor: LETG. 4

    2. DBCAijjjij eptuY

    Donde p es la media general, z, es el efecto del tratamiento y e,es el error experimental.El efecto del bloque p, representa la desviacin promedio de las unidades en el bloque ja partir de la media general. Se supone que los efectos del tratamiento y del bloque sonaditivos, Aditividad significa que no existe interaccin entre tratamientos y bloques;tambin se supone que los errores experimentales son independientes, con medias ceroy varianza comn d. La suposicin de independencia se justifica a travs de laasignacin aleatoria de los tratamientos a las unidades experimentales.

    PROBLEMA 2:

    Se quiere evaluar si las concentraciones de Cianuro manipuladas por los operariostienen el mismo resultado, se sospecha que los operarios del mismo nivel (puede ser: 1,2,3 4) no tienen el mismo rendimiento con respecto a los resultados esperados de lasconcentraciones, por lo que el investigador decide hacer un Diseo de BloquesCompletos al Azar (se escoge a 4 operarios, uno de cada nivel y se les hace manipularlos 3 tipos de concentraciones de cianuro). Con ste diseo se espera reducir en granparte la variabilidad causada digamos por la mala capacitacin del personal.

    a. Escriba el modelo lineal estadstico para este estudio y explique suscomponentes.

    ijjiij eptuY u: es el efecto de la media global , Ti:es el efecto del i-esimotratamiento y Pj es el efecto del j-esimo bloque.

    Operario

    concentracin op1 op2 op3 op4

    c1 35,32,40 37,32,40 27,26,28 31,37,40

    c2 31,40,42 40,42,41 26,32,31 41,47,30

    c3 42,35,30 35,37,40 25,27,30 26,35,40

  • Autor: LETG. 5

    b. Calcule el anlisis de varianza.

    Sintaxis SAS:

    data dbca;input cc $ op $ rpta;cards;c1 oper-3 27c1 oper-3 26c1 oper-3 28c3 oper-3 25c3 oper-3 27c3 oper-3 30c2 oper-3 26c2 oper-3 32c2 oper-3 31c2 oper-2 40c2 oper-2 42c2 oper-2 41c3 oper-2 35c3 oper-2 37c3 oper-2 40c1 oper-2 37c1 oper-2 32c1 oper-2 40c3 oper-4 26c3 oper-4 35c3 oper-4 40c1 oper-4 31c1 oper-4 37c1 oper-4 40c2 oper-4 41c2 oper-4 47c2 oper-4 30c2 oper-1 31c2 oper-1 40c2 oper-1 42c3 oper-1 42c3 oper-1 35c3 oper-1 30c1 oper-1 35c1 oper-1 32c1 oper-1 40;proc glm;class cc op;model rpta=cc op;means op/Tukey;means cc/Tukey;run;

    Source DF Sum of Squares Mean Square F Value Pr > FModel 5 650.722222 130.144444 6.89 0.0002Error 30 566.500000 18.883333Corrected Total 35 1217.222222

  • Autor: LETG. 6

    Source DF Type I SS Mean Square F Value Pr > Fcc 2 87.0555556 43.5277778 2.31 0.1172op 3 563.6666667 187.8888889 9.95 0.0001

    NOTA:Los diseos por bloques mejorarn mucho la precisin de las estimaciones de lasmedias de tratamiento si la reduccin del SC error con el uso de bloques es sustancial,reduccin que se puede eliminar si se reducen los grados de libertad, ya que r - 1 de losgrados de libertad deben asignarse al SC bloques.

    Means with the same letter arenot significantly different.

    Tukey Grouping Mean N opA 38.222 9 oper-2AA 36.333 9 oper-1AA 36.333 9 oper-4

    B 28.000 9 oper-3

    Al ver que no existan diferencias entre las concentraciones de cianuro resulta msinteresante ver las diferencias entre los operarios y vemos que efectivamente haydiferencias pero tambin existe similitud entre los operarios 2,1 y 4, adems estos sondiferentes del operario 3.

    Si bien es cierto que el DCA nos basamos en este cuadro, en el DBCA ya no lo haremos debido a queahora estamos en presencia de 2 factores que son los tratamientos y los bloques, se desdobla estecuadro en 2, pero de todos modos lo que se puede apreciar del cuadro anterior es el rechazo de lahiptesis nula

    La interpretacin que podemos obtener de los factores seria:Para el caso de las concentraciones de cianuro (tratamientos) se ve que se acepta la hiptesis nulaes decir que no existe un efecto de las concentraciones en las observaciones.Pero en el caso de los operarios (bloques) se observa el rechazo de la hiptesis nula es decir quehay un efecto de los operarios en las observaciones.

  • Autor: LETG. 7

    Contrast DF Contrast SS Mean Square F Value Pr > Fop3 vs op1,2y4 1 542.2592593 542.2592593 28.72

  • Autor: LETG. 8

    3. LATINOEl modelo estadstico lineal para un experimento con t tratamientos en un diseo de cuadrado latinode t X t es:

    Donde y, es la observacin de la unidad experimental en el i-simo rengln y la j-sima columna deldiseo. Los efectos respectivos de rengln y columna son p, y v; rk es el efecto del k-simotratamiento, y las e, son errores experimentales independientes aleatorios con media O y varianza $.Se supone que no hay interaccin entre los tratamientos y las columnas y renglones. La notacinpara los totales y las medias de las observaciones para renglones y columnas siguen la convencinusual con y,, = y, para el total de un rengln y y, = Yy,, para el total de una columna. El total deltratamiento estar representado como y,, que implica un suma de observaciones sobre las t unidadesexperimentales que reciben el tratamiento k. De la misma manera,Yk representar la media deLas observaciones en el k-simo tratamiento.

    PROBLEMA 3:En la tabla se muestran las observaciones junto con las medias de rengln, columna ytratamiento en un arreglo de cuadrado latino. Los datos se refieren a la cosecha de granopara cada grfica en cientos de libras por acre.Tabla: Cosecha de grano de una variedad de trigo para cinco tasas de siembra en undiseo de cuadrado latino [etiqueta de tratamiento (A, B, C, D o E) en los parntesisenseguida del valor de la cosecha.

    a. Calcule el anlisis de varianza

    Sintaxis SAS:

    data dbca;input renglon $ columna $ trat $ rpta;cards;1 1 e 59.451 2 a 47.281 3 c 54.441 4 b 50.14

  • Autor: LETG. 9

    1 5 d 59.452 1 c 55.162 2 d 60.892 3 b 56.592 4 e 60.172 5 a 48.713 1 b 44.413 2 c 53.723 3 d 55.873 4 a 47.993 5 e 59.454 1 a 42.264 2 b 50.144 3 e 55.874 4 d 58.744 5 c 55.875 1 d 60.895 2 e 59.455 3 a 49.435 4 c 59.455 5 b 57.31

    ;proc glm;class renglon columna trat;model rpta=renglon columna trat;means renglon/tukey;means trat/tukey;run;

    Source DF Sum of Squares Mean Square F Value Pr > FModel 12 659.9813120 54.9984427 11.65

  • Autor: LETG. 10

    Source DF Type I SS Mean Square F Value Pr > Frenglon 4 99.2035040 24.8008760 5.26 0.0111columna 4 38.4808240 9.6202060 2.04 0.1527trat 4 522.2969840 130.5742460 27.67

  • Autor: LETG. 11

    Para el caso del tratamiento:

    Means with the same letterare not significantly different.

    Tukey Grouping Mean N tratA 59.168 5 dAA 58.878 5 eA

    B A 55.728 5 cBB 51.718 5 b

    C 47.134 5 a

    Lo que apreciamos por medio de Tukey es los tratamientos d, e y c son similares pero tambin loson c y b, se puede apreciar tambin que solo uno es totalmente diferente y es el tratamiento a.

  • Autor: LETG. 12

    4. FACTORIAL

    ijkijjiijk etbbtuY )(

    Donde u es el promedio general, t es del efecto de factor A, b es el efecto del factor B,(tb) es el efecto de la interaccin.Suposiciones:- existe igualdad entre los tratamientos ...21 tt- existe igualdad entre los tratamientos de los factores A ...21 bb- existe igualdad entre los interacciones ... tbtb

    PROBLEMA 4:Los depsitos de sal se acumulan en los suelos irrigados para cultivos agrcolas y dehorticultura. Con el paso del tiempo, la creciente salinidad del suelo impide el desarrollode las plantas y disminuye las cosechas.Hiptesis de investigacin: Un investigador plante la hiptesis de que la exposicin delas plantas a elevadas cantidades de sales en su medio inhibe el consumo de agua ynutrientes de la planta, lo que impide su crecimiento y desarrollo. Se llev a cabo unexperimento con plantas de cebada para medir el efecto del aumento de la salinidad enla cantidad de agua consumida por las plantas.Diseo del tratamiento: Se us un arreglo factorial con "salinidad del medio" y "edadde la planta" en das, como los dos factores. Las plantas se cultivaron en soluciones denutrientes con 3 niveles de salinidad que expresados como unidades de presinosmtica, fueron de 0,6 y 12 barios y se cosecharon a los 14,21 y 28 das.Diseo del experimento: Cada una de las nueve combinaciones de tratamiento, desalinidad con das, se asign a dos contenedores rplica en un diseo totalmentealeatorizado, los contenedores se colocaron en un cmara de cultivo en un arreglo alazar.

  • Autor: LETG. 13

    a. calcule el analisis de varianza

    Sintaxis SAS:

    data dbca;input dias $ salinidad $ rpta;cards;14 0 2.214 0 3.314 6 3.714 6 4.514 12 2.814 12 3.421 0 521 0 5.721 6 5.921 6 7.221 12 4.521 12 5.928 0 13.228 0 12.428 6 9.428 6 1128 12 7.628 12 8.3;proc glm;class dias salinidad;model rpta=dias salinidad dias*salinidad;run;

    Source DF Sum of Squares Mean Square F Value Pr > FModel 8 179.7044444 22.4630556 40.27 Fdias 2 151.9877778 75.9938889 136.24

  • Autor: LETG. 14

    Para observar la respuesta Optima:

    A diferencia de los anteriores modelos si bien es cierto que el anlisis de varianza es tilpara este caso solo nos servir para observar las significancias de los factores ya que ahoralo que se busca es la mejor respuesta basada en que factor o en que interaccin es por esarazn que usaremos una serie de grficos que nos dirn en que nivel se logra la mejorrespuesta aun as vemos que:Existe un efecto de los das sobre el consumo de agua, tambin existe un efecto por parte dela salinidad y de la interaccin de estos mismos factores.

  • Autor: LETG. 15

    Resultado efectos principales:

    Es en este nivel donde selogra un mayor consumo deagua en nivel 28 de das.

    Es en este nivel donde selogra un mayor consumo deagua en nivel 0 de salinidad

  • Autor: LETG. 16

    PROBLEMA 5:Los investigadores desean conocer como influyen la temperatura y salinidad del agua yla densidad de poblacin del camarn en la tasa de crecimiento de los camaronescultivados en acuarios y si estos factores actan independientemente sobre la poblacin.Diseo del tratamiento: Se us un arreglo factorial con tres factores: "temperatura"(25"C, 35C); "salinidad del agua (lo%, 25%, 40%), y "densidad" de camarones en elacuario (80 camarones140 litros, 160 camarones140 litros). Se consider que si el factorinflua en el crecimiento de los camarones stos niveles tenan las posibilidades msaltas de mostrar efectos.Diseo del experimento: El diseo del experimento consisti en tres acuarios rplicapara cada una de las 12 combinaciones de tratamiento del factorial 2 x 2 X 3, cadacombinacin se asign al azar a tres acuarios en un diseo totalmente aleatorizado. y alprincipio de la prueba se pusieron camarones en etapa postlarvaria en los 36 acuarios. En la tabla 6.13 se muestra el aumento de peso por camarn en cuatro semanas paracada acuario.

    Aqu tenemos el grafico de interacciones y vemos en donde se produce el mayorconsumo de agua que se da en el nivel de salinidad 0 y en el nivel de das 28.

  • Autor: LETG. 17

    a. calcule el anlisis de varianza

    Sintaxis SAS:

    data dbca;input t $ D $ S $ rpta;cards;25 80 10 8625 80 10 5225 80 10 7325 80 25 54425 80 25 37125 80 25 48225 80 40 39025 80 40 29025 80 40 39725 160 10 5325 160 10 7325 160 10 8625 160 25 39325 160 25 39825 160 25 20825 160 40 24925 160 40 26525 160 40 24335 80 10 43935 80 10 43635 80 10 34935 80 25 24935 80 25 24535 80 25 33035 80 40 24735 80 40 27735 80 40 20535 160 10 324

  • Autor: LETG. 18

    35 160 10 30535 160 10 36435 160 25 35235 160 25 26735 160 25 31635 160 40 18835 160 40 22335 160 40 281

    ;proc glm;class T D S ;model rpta=T D S T*D T*S D*S;run;

    Source DF Sum of Squares Mean Square F Value Pr > FModel 9 443597.9444 49288.6605 13.67 Ft 1 15376.0000 15376.0000 4.27 0.0490D 1 21218.7778 21218.7778 5.89 0.0225S 2 96762.5000 48381.2500 13.42

  • Autor: LETG. 19

    Resultados efectos Principales

    Lo que se quiere mostrar como se logra el mayor aumento de peso en los distintosniveles, en la temperatura se logra a nivel de 35 en la densidad a nivel de 100 y enla salinidad a nivel de 350.

  • Autor: LETG. 20

    Resultados Interacciones:

    Se logra el mayor aumento depeso cuando estamos entemperatura 35 y densidad 80 Se logra el mayor aumento de

    peso cuando estamos entemperatura 25 y salinidad 25

  • Autor: LETG. 21

    5. ANCOVAEL enunciado y la data del problema se encuentran en el documento PDF. Que lesenvo.

    Sintaxis SAS:

    data ancova;input trat $ bloq $ pi pf ;cards;1 1 20.4 24.62 1 27.2 32.63 1 26.8 31.74 1 22.4 29.15 1 21.8 27.01 2 19.6 23.42 2 32.0 36.63 2 26.5 30.74 2 23.2 28.95 2 24.3 30.51 3 25.1 30.32 3 33.0 37.73 3 26.8 30.44 3 28.6 35.25 3 30.3 36.41 4 18.1 21.82 4 26.8 31.03 4 28.6 33.84 4 24.4 30.25 4 29.3 35.0;proc glm;class trat bloq ;model pf=trat bloq pi/solution;run;

    La respectiva interpretacin tambin se encuentra en ese documento.