experimentos con un solo factor

62
INTRODUCCIÓN Muchos experimentos se llevan a cabo para estudiar los efectos producidos por dos o más factores. Ningún factor se considera extraño; todos tienen el mismo interés. En el experimento factorial o arreglo factorial, se investigan todas las posibles combinaciones de los niveles de los factores en cada ensayo completo o réplica del experimento. El experimento factorial afecta al diseño de tratamientos, que se refiere a la elección de los factores a estudiar, sus niveles y la combinación de ellos. Razones para estudiar conjuntamente varios factores 1. Encontrar un modelo que describa el comportamiento general del fenómeno en estudio. 2. Optimizar la respuesta o variable dependiente; es decir, encontrar la combinación de niveles que optimizan la variable dependiente. La característica general y esencial que hace necesario el estudio conjunto de factores es que el efecto de un factor cambie según sean los niveles de otros factores o sea que exista interacción. Ventajas de los Experimentos Factoriales 1. Economía en el material experimental ya que se obtiene información sobre varios factores sin incrementar el tamaño del experimento. 2. Permitir el estudio de la interacción, o sea determinar el grado y la forma en la cual se modifica el efecto de un factor por los niveles de otro factor Desventajas de los Experimentos Factoriales Una desventaja de los experimentos factoriales es que requieren un gran número de tratamientos. Este hecho tiene los siguientes efectos: Unidad II- DISEÑO DE EXPERIMENTOS DE UN FACTOR

Upload: martinbaltazar

Post on 28-Sep-2015

64 views

Category:

Documents


1 download

DESCRIPTION

Informacion y Problemas resueltos de Experimentos con un solo Factor

TRANSCRIPT

INTRODUCCINMuchos experimentos se llevan a cabo para estudiar los efectos producidos por dos o ms factores. Ningn factor se considera extrao; todos tienen el mismo inters. En el experimento factorial o arreglo factorial, se investigan todas las posibles combinaciones de los niveles de los factores en cada ensayo completo o rplica del experimento. El experimento factorial afecta al diseo de tratamientos, que se refiere a la eleccin de los factores a estudiar, sus niveles y la combinacin de ellos. Razones para estudiar conjuntamente varios factores1. Encontrar un modelo que describa el comportamiento general del fenmeno en estudio.2. Optimizar la respuesta o variable dependiente; es decir, encontrar la combinacin de niveles que optimizan la variable dependiente.La caracterstica general y esencial que hace necesario el estudio conjunto de factores es que el efecto de un factor cambie segn sean los niveles de otros factores o sea que exista interaccin.Ventajas de los Experimentos Factoriales1. Economa en el material experimental ya que se obtiene informacin sobre varios factores sin incrementar el tamao del experimento.2. Permitir el estudio de la interaccin, o sea determinar el grado y la forma en la cual se modifica el efecto de un factor por los niveles de otro factorDesventajas de los Experimentos FactorialesUna desventaja de los experimentos factoriales es que requieren un gran nmero de tratamientos. Este hecho tiene los siguientes efectos:1. Si se desea usar bloques completos es difcil encontrar grupos de unidades experimentales homogneas para aplicar todos los tratamientos.2. Se aumenta el costo del experimento al tener muchas unidades experimentales.Los experimentos factoriales se pueden ejecutar bajo cualquier tipo de diseo de control de error o un Submuestreo o con covariables. En las siguientes secciones slo se presenta el anlisis de un experimento factorial de dos factores bajo un DCA.EXPERIMENTOS CON UN SOLO FACTOREn este tipo de diseo de experimento se considera un slo factor de inters y el objetivo es comparar ms de dos tratamientos, con el fin de elegir la mejor alternativa entre las varias que existen, o por lo menos para tener una mejor comprensin del comportamiento de la variable de inters en cada uno de los distintos tratamientos. En esta unidad se presentan los diseos experimentales que se utilizan cuando el objetivo es comparar ms de dos tratamientos. Puede ser de inters comparar tres o ms mquinas, varios proveedores, cuatro procesos, tres materiales, cinco dosis de un frmaco, etc. Es obvio que, al hacer tales comparaciones, existe un inters y un objetivo claro. Por ejemplo, una comparacin de cuatro dietas de alimentacin en la que se utilizan ratas de laboratorio, se hace con el fin de estudiar si alguna dieta que se propone es mejor o igual que las que ya existentes; en este caso, la variable de inters es el peso promedio alcanzado por cada grupo de animales despus de ser alimentado con la dieta que le toco.Por lo general, el inters del experimentador est centrado en comparar los tratamientos en cuanto a sus medias poblacionales, sin olvidar que tambin es importante compararlos con respecto a sus varianzas. As, desde el punto de vista estadstico, la hiptesis fundamental a probar cuando se comparan varios tratamientos es:

(2.1)Con la cual se quiere decidir si los tratamientos son iguales estadsticamente en cuanto a sus medias, frente a la alternativa de que al menos dos de ellos son diferentes. La estrategia natural para resolver este problema es obtener una muestra representativa de mediciones en cada uno de los tratamientos, y construir un estadstico de prueba para decidir el resultado de dicha comparacinSe podra pensar que una forma de probar la hiptesis nula de la expresin (2.1) es mediante la prueba T de Student aplicadas a todos los posibles pares de medias; sin embargo, esta manera de proceder incrementara de manera considerable el error tipo I (rechazar H0 siendo verdadera).El diseo estadstico de experimentos es precisamente la forma ms eficaz de hacer pruebas. El diseo de experimentos consiste en determinar cules pruebas se deben realizar y de qu manera, para obtener datos que, al ser analizados estadsticamente, proporcionen evidencias objetivas que permitan responder las interrogantes planteadas, y de esa manera clarificar los aspectos inciertos de un proceso, resolver un problema o lograr mejoras. Algunos problemas tpicos que pueden resolverse con el diseo y el anlisis de experimentos son los siguientes:1. Comparar a dos o ms materiales con el fin de elegir al que mejor cumple los requerimientos.2. Comparar varios instrumentos de medicin para verificar si trabajan con la misma precisin y exactitud.3. Determinar los factores (las x vitales) de un proceso que tienen impacto sobre una o ms caractersticas del producto final.4. Encontrar las condiciones de operacin (temperatura, velocidad, humedad, por ejemplo) donde se reduzcan los defectos o se logre un mejor desempeo del proceso.5. Reducir el tiempo de ciclo del proceso.6. Hacer el proceso insensible o robusto a oscilaciones de variables ambientales.7. Apoyar el diseo o rediseo de nuevos productos o procesos8. Ayudar a conocer y caracterizar nuevos materialesEn general, cuando se requiere mejorar un proceso existen dos maneras bsicas de obtener la informacin necesaria para ello: Observar o monitorear va herramientas estadsticas, hasta obtener seales tiles que permitan mejorarlo; se dice que sta es una estrategia pasiva. La otra manera consiste en experimentar, es decir, hacer cambios estratgicos y deliberados al proceso para provocar dichas seales tiles.Al analizar los resultados del experimento se obtienen las pautas a seguir, que muchas veces se concretan en mejoras sustanciales del proceso. En este sentido, experimentar es mejor que sentarse a esperar a que el proceso nos indique por s solo cmo mejorarlo. El diseo de experimentos es un conjunto de tcnicas activas, en el sentido de que no esperan que el proceso mande las seales tiles, sino que ste se manipulan para que proporcione la informacin que se requiere para su mejora. El saber diseo de experimentos y otras tcnicas estadsticas, en combinacin con conocimientos del proceso, sitan al responsable del mismo como un observador perceptivo y proactivo que es capaz de proponer mejoras y de observar algo interesante (oportunidades de mejora) en el proceso y en los datos donde otra persona no ve nada.

2.1.FAMILIADE DISEOS PARACOMPARAR TRATAMIENTOS.Los diseos experimentales ms utilizados paracomparar tratamientos son:1.Diseo completamente al azar(DCA)2.Diseo enbloque completamente al azar (DBCA)3. Diseo en cuadro latino (DCL)4.Diseo encuadro grecolatino(DCGL)La diferencia fundamental entre estos diseos es el nmero de factores de bloque que incorporan o controlan de forma explcita durante el experimento. La comparacin de los tratamientos en cuanto a la respuesta media que logran, en cualquiera de estos diseos, se hace mediante la hiptesis

que sepruebacon la tcnicaestadsticallamadaAnlisisdeVarianza(ANOVA)con uno, dos, tres o cuatro criterios de clasificacin, dependiendo del nmero de factores de bloques incorporados al diseo.

El modelo estadstico que describe el comportamiento de la variable observada Y en cada diseo, incorpora un trmino adicional por cada factor de bloqueo controlado. De acuerdo con los modelos dados en la tabla, para cada diseo comparativo se tienen al menos dos fuentes de variabilidad: los tratamientos o niveles del factor de inters y el error aleatorio. Se agrega una nueva fuente de variabilidad porcada factor de bloque que se controla directamente. Se observa que los diseos suponen que no hay efectos de interaccin entre los factores, lo cual sera lo deseable que ocurra; de no ocurrir as, tal efecto se recarga al error y el problema de comparacin no se resuelve con xito.Un efecto de interaccin entre dos factores hace referencia a que el efecto de cada factor depende del nivel en que se encuentra el otro.

4. Supuestos acerca del modelo estadsticoa. Aditividad: Los factores o componentes del modelo estadstico son aditivos, es decir la variable respuesta es la suma de los efectos del modelo estadstico.b. Linealidad: La relacin existente entre los factores o componentes del modelo estadstico es del tipo lineal.c. Normalidad: Los valores resultados del experimento provienen de una distribucin de probabilidad Normal con media y variancia.d. Independencia: Los resultados observados de un experimento son independientes entre s.e. Variancias Homogneas (Homocedasticidad): Las diversas poblaciones generadas por la aplicacin de dos o ms tratamientos tienen variancias homogneas (variancia comn).

Los experimentos factoriales se emplean en todos los campos de la investigacin, son muy tiles en investigaciones exploratorias en las que poco se sabe acerca de muchos factores.VENTAJAS:1.- Permite estudiar los efectos principales, efectos de interaccin de factores, efectos simples y efectos cruzados.2.- Todas las unidades experimentales intervienen en la determinacin de los efectos principales y de los efectos de interaccin de los factores, por lo que el nmero de repeticiones es elevado para estos casos.3.- El nmero de grados de libertad para el error experimental es alto, comparndolo con los grados de libertad de los experimentos simples de los mismos factores, lo que contribuye a disminuir la variancia del error experimental, aumentando por este motivo la precisin del experimento.DESVENTAJA:1.- Se requiere un mayor nmero de unidades experimentales que los experimentos simples y por lo tanto se tendr un mayor costo y trabajo en la ejecucin del experimento.2.- Como en los experimentos factoriales c/u de los niveles de un factor se combinan con los niveles de los otros factores; a fin de que exista un balance en el anlisis estadstico se tendr que algunas de las combinaciones no tiene inters prctico pero deben incluirse para mantener el balance.3.- El anlisis estadstico es ms complicado que en los experimentos simples y la interpretacin de los resultados se hace ms difcil a medida de que aumenta el nmero de factores y niveles por factor en el experimento.Ejemplo de formacin de factoriales:Sea los factores A y B con sus respectivos niveles:Factor A: a0 a1 a2Factor B: b0 b1La combinacin de los niveles de los factores ser: a0 a1 a2 b0 b1 b0 b1 b0 b1 a0 b0 a0 b1 a1 b0 a1 b1 a2b0 a2 b1 } tratamientosAl combinar ambos factores (A y B) se tiene:3 x 2 = 6 tratamientos para ser evaluadosNiveles de A x niveles de B Si cada tratamiento se aplica a 4 unidades experimentales, se requiere 24 unidades experimentales, para realizar el experimento:Repeticionesa0 b0a0 b1a1 b0a1 b1a1b0a2 b1

1

2

3

4

2.2 EL MODELO DE EFECTOS FIJOSCaso de dos factores en un DCAEl modelo de efectos fijos se supone cuando el investigador est interesado nicamente en losniveles del factory en losniveles del factor, presentes en el experimento. Los datos de este experimento factorial se pueden presentar en un cuadro como el siguiente:FACTOR B

FACTOR A

El modelo estadstico asociado a este experimento es dado por:

Dondees la constante que representa el promedio global,es el efecto verdadero delnivel del factor,es el efecto verdadero delnivel del factor,es efecto verdadero de la interaccin delnivel del factorcon elnivel del factoryes el error experimental asociado con launidad experimental sujeta a lacombinacin de tratamiento. Se supone quees una constante y que las variables aleatoriasestn distribuidas normal independiente con media cero y varianza constante.

Las restricciones del modelo son:

Estimacin de ParmetrosAl aplicar el mtodo de mnimos cuadrados se obtienen los estimadores de los parmetros

Anlisis de VarianzaLa tabla de ANOVA para este caso est dada por:Tabla 1. ANOVA para un factorial de dos factores en un DCACausa de

variacin

Grados de

libertad

Suma de

cuadrados

Cuadrados

medios

F

Cuadrado Medio

esperado

ACMCMCM

BCMCMCM

ABCMCMCM

Error

experimental

CM

Total

Para el factor A:dondees la media global yes la media poblacional del nivelComoy sies ciertay comoentonces se tienen dos estimadores insesgados deque sony, por ello se utiliza como pruebael cual debe tomar valores cercanos a uno estadsticamente.Para el factor B:dondees la media poblacional del nivelyes la media global. Comoy sies ciertay comoentonces se tienen dos estimadores insesgados deque sony, por ello se utiliza como pruebapara probar la hiptesis. Esta estadstica de prueba debe tomar valores estadsticamente cercanos a uno cuandoes cierta.Para la interaccin de los factores

Escrita de una forma ms sencilla tendremos:

Como, sies ciertarazonando como en los casos anteriores se tiene que la estadstica de prueba para esta hiptesis esCmo se aplican los mtodos de comparacin mltiple?Si la hiptesis de interaccin es significativa (se rechaza la hiptesis nula), se deben realizar comparaciones mltiples entre los niveles de un factor pero en cada nivel del otro factor.Si Si la hiptesis de interaccin es no significativa (no se rechaza la hiptesis nula), y algn factor es significativo, se debe realizar comparaciones mltiples para los niveles de este factor como si fuese un DCA sin estructura factorial.Cmo probar los supuestos?Primero se deben obtener los residuales, los cuales para el caso de dos factores se determina de la siguiente manera:1.El residual es dado por

2.La respuesta estimadaes

Y as el residual es determinado por

La prueba de los supuestos se hace de manera similar a un DCA sin estructura factorial2.3 DISEO COMPLETAMENTE ALEATORIO Y ANOVAEldiseo completamente al azares el ms sencillo de los diseos de experimentos que tratan de comparar dos o ms tratamientos, puesto que slo considera dos fuentes de variabilidad: los tratamientos y el error aleatorio.Para ilustrar el diseo, supongamos que queremos determinar si cuatro dosificaciones de un hormign A, B, C y D presentan una misma resistencia caracterstica a compresin. Para ello se han elaborado 5 probetas para cada tipo de dosificacin y, a los 28 das, se han roto las probetas a compresin simple y los resultados son los que hemos recogido en la tabla que sigue.

DOSIFICACIONES DE HORMIGN

ABCD

Resistencia caracterstica a compresinfck (Mpa)42456456

39466155

48455062

43395559

44435860

Para este caso, lavariable de respuestaesla resistencia caracterstica del hormign a compresin (MPa), launidad experimentales la probeta de hormign y elfactores la dosificacin de hormign. En este caso se trata de undiseo balanceadoporque hemos realizado el mismo nmero de repeticiones (5) para cada uno de los tratamientos (dosificaciones).Este tipo de diseo se llamacompletamente al azarporque todas las repeticiones experimentales se realizan en orden aleatorio completo, pues no se han tenido en cuenta otros factores de inters. Si durante el estudio se hacenNpruebas, stas se deben realizar al azar, de forma que los posibles efectos ambientales y temporales se vayan repartiendo equitativamente entre los tratamientos.Elnmero de repeticionesa realizar en cada tratamiento depende de la variabilidad que se espera observar en los datos, a la diferencia mnima que el experimentador considera que es importante detectar y al nivel de confianza que se desea tener en las conclusiones. Normalmente se recomiendan entre 10 y 30 mediciones en cada tratamiento. Con 10 mediciones se podran detectar diferencias de medias mayores o iguales a 1,5 sigmas con una probabilidad alta, y con 30 mediciones se podran detectar diferencias mayores o iguales a 0,7 sigmas.Se utiliza elanlisis de la varianza(ANOVA) para comprobar si existen diferencias en las medias. Fundamentalmente este anlisis consiste en separar la contribucin de cada fuente de variacin en la variacin total observada. Sin embargo, ste ANOVA est supeditado a los siguientes supuestos que deben verificarse: Normalidad Varianza constante (igual varianza en los tratamientos) IndependenciaPara los que queris saber qu ha pasado con nuestro experimento con las amasadas, os dir que que el ANOVA di como resultado el rechazo de la igualdad de medias, es decir, que la resistencia media se ve afectada por la dosificacin. Sin embargo, las cuatro dosificaciones no son igual de efectivas, pues existen diferencias significativas entre las resistencias medias de cada una de ellas. De hecho, las dosificaciones A y B no presentan diferencias significativas entre s, tampoco entre la C y la D, sin embargo, entre ambos grupos s que hay diferencias significativas. Asimismo, se ha podido comprobar que se cumplieron los supuestos de normalidad, varianza constante e independencia.DISEOS COMPLETAMENTE ALEATORIOS

Se supone que el experimentador cuenta con los resultados de k muestras aleatorias independientes, cada una de tamao n, de k diferentes poblaciones (datos relativos a k tratamientos, k grupos, k mtodos de produccin, etc.). Interesa probar la hiptesis de que las medias de esas k poblaciones son todas iguales.Se denota a la j-sima observacin de la i-sima muestra por yij. El esquema general para un criterio de clasificacin es:Medias

Muestra 1y11y12y1j.y1n

Muestra 2y21y22y2jy 2n

.

Muestra iyi1yi2yijyin

.

Muestra kyk1yk2ykjykn

Bajo este esquema experimental, en referencia al ejemplo tratado, yij (i=1,2,..,4; j=1,2,, 12) es la j-sima medicin del peso del revestimiento del isimo laboratorio, e es la media global (o gran media) de las 48 observaciones.Para pruebas de hiptesis (medias iguales) se supondr estar trabajando con poblaciones normales de la misma 2.Si i es la media de la poblacin i-sima y 2 es la varianza comn de las k poblaciones, se puede expresar cada observacin yij como i ms el valor del componente aleatorio:

y i j = i + i j para i=1,2,..,k; j=1,2,, n

i j es una variable aleatoria con distribucin normal, = 0 y 2 comn. Para dar uniformidad a las ecuaciones, se reemplaza i por + i , donde es la media de las i y i es el efecto del i-simo tratamiento, de aqu que:

Esto surge de:

Luego, la expresin de yij queda:

y i j = i + i j para i=1,2,..,k; j=1,2,, n

Por lo tanto, la Hiptesis Nula (las medias de las k poblaciones iguales) se reemplaza por la Hiptesis Nula de que 1 = 2 = = k = 0. La Hiptesis Alterna de que al menos dos de las medias son distintas equivale a que i < > 0 para alguna i. Para probar la Hiptesis Nula, se comparan las estimaciones de 2 (una en base a la observacin de las medias mustrales y la otra con la variacin dentro de la muestra).Ya que cada muestra viene de una poblacin con varianza 2, la varianza se puede estimar de cualquiera de las muestras:

y entonces tambin por su media:

Cada una de las varianzas mustrales si2 est basada en (n-1) grados de libertad y entonces est basada en k.(n-1) grados de libertad.Por otro lado, la varianza de las k medias mustrales est dada por:

Y si la hiptesis es verdadera, esta expresin da una estimacin de 2/n y as una estimacin de 2 , pero basada en la diferencia entre las medias, est dada por:

Basada en (k-1) grados de libertad.

Si Ho es cierta, se puede demostrar que y son estimaciones independientes de 2 y por ello:

F = /

Es una variable aleatoria con distribucin F con = k-1 y = k.(n-1) grados de libertad.

Cabe esperar que la varianza entre muestras, , exceda la varianza dentro de las muestras, , cuando la Hiptesis Nula es falsa, por eso Ho ser rechazada si F>F.Con el argumento anterior se ha indicado cmo la prueba de las k medias se puede fundamentar en la comparacin de dos estimaciones de varianzas.Es notable el hecho de que las dos estimaciones en cuestin [excepto para los divisores (k-1) y k.(n-1)] pueden obtenerse partiendo o analizando la varianza total de las n.k observaciones en dos partes. La varianza muestral de las n.k observaciones est dada por:

Se puede probar el siguiente teorema respecto del numerador, llamado Suma de Cuadrados Total:

Demostracin:

y como:

Se verifica la relacin anterior:

Se acostumbra a denotar:

a) Suma de Cuadrados Total, SST:

b) Suma de Cuadrados de Error, SSE:

c) Suma de Cuadrados de Tratamiento SS(Tr):

Luego, F se puede escribir as:

Los resultados obtenidos son resultados en la siguiente tabla:

Fuentes de Variacin Grados de LibertadSuma de CuadradosMedia CuadradaF

Tratamientosk-1SS(Tr)MS(Tr)=SS(Tr)/(k-1)MS(Tr)/MSE

Errork.(n-1)SSEMSE=SSE/k.(n-1)

Totaln.k-1SST

Ejemplo: A fin de utilizar el Anlisis de Varianza para un criterio de clasificacin, suponer el siguiente esquema de mediciones de cuatro laboratorios de un parmetro determinado (revestimiento de estao de 12 discos) cuyos resultados son:

Lab. A.25.27.22.30.27.28.32.24.31.26.21.283.21

Lab. B.18.28.21.23.25.20.27.19.24.22.29.162.72

Lab. C.19.25.27.24.18.26.28.24.25.20.21.192.76

Lab. D.23.30.28.28.24.34.20.18.24.28.22.213.00

Total11.69

Del que se quiere probar que las medias obtenidas por cada uno de ellos es significativamente igual (Hiptesis Nula) con =0.05. Construir una Tabla de anlisis de varianza.

Para facilitar clculos, se utilizan las frmulas:

Demostracin:

Para Suma de Cuadrados total

Para Suma de Cuadrados de Tratamientos:

donde C (llamado Trmino de Correccin) y Ti es:

Donde Ti es el nmero total de n observaciones de la i-esima muestra, Mientras que T es el Gran Total de las k.n observaciones. Luego, SSE se obtiene de:

SSE = SST SS(Tr)

Para el ejemplo:

T = 11.69 C = T2/(k.n) = 11.692/(4.12) = 2.8470

SST= 0.252 + 0.272 ++0.212 - 2.8740 = 0.0809

SS(Tr) = (3.212 + 2.722 + 2.762 + 3.002 ) / 12 - 2.8740 = 0.0130

SSE = 0.809 0.0130 = 0.0679

La Tabla queda:

Fuentes de Variacin Grados de LibertadSuma de CuadradosMedia CuadradaF

Laboratorios30.01300.00432.87

Error440.06790.0015

Total470.0809

Conforme a las tablas de la funcin F, se puede encontrar el valor correspondiente de la abscisa que deja a la derecha un rea de 0.05 siendo adems los grados de libertad para el numerador y denominador 3 y 44, respectivamente, como lo indica el siguiente grfico

Ya que F (2.87) excede a F0.05= 2.82, se rechaza la Hiptesis Nula, luego los laboratorios no estn logrando resultados consistentes.

2.4 COMPARACIONES O PRUEBAS DE RANGOS MULTIPLESCuando se rechaza la hiptesis nula de no diferencia de ms de dos medias (H0:m1=m2= =mk)en un anlisis de varianza surge la pregunta acerca de cules pares de medias son diferentes, puesto que el rechazo de una hiptesis nula con cuatro tratamientos (H0:m1=m2=m3=m4), podra deberse a uno o varios de los seis pares de diferencias que se pueden tener, esto es:m1m2om1m3om1m4om2m3om2m4om3m4Existen varios procedimientos para determinar cules son los pares de medias que son diferentes. El primero de estos procedimientos, y el ms utilizado en el pasado, es el de la Diferencia Significativa Mnima (DSM) de Fisher publicada en 1935 en su libroThe Design of Experiments. Este procedimiento es una extensin de la pruebatde Student para el caso de comparacin de dos medias con varianza ponderada.Otros procedimientos ms recientemente usados para el mismo propsito son: la prueba de Student-Neuman-Keuls, la prueba de Diferencia Significativa Honesta de Tukey (DSH), la prueba del Rango mltiple de Duncan, la prueba de Dunnett y la prueba de Scheff, entre otras. Vase Steel and Torrie y Federer.Para ilustrar mejor las diferentes pruebas se tomar el siguiente ejemplo:Ejemplo 1:Una empresa tiene cuatro plantas y sabe que la planta A satisface los requisitos impuestos por el gobierno para el control de desechos de fabricacin, pero quisiera determinar cul es la situacin de las otras tres. Para el efecto se toman cinco muestras de los lquidos residuales de cada una de las plantas y se determina la cantidad de contaminantes. Los resultados del experimento aparecen en la siguiente tabla.Tabla 1 Cantidad de contaminantes para cuatro plantas de una empresa.Plantacontaminantesni

A1.651.721.501.351.6057.841.568

B1.701.851.462.051.8058.861.772

C1.401.751.381.651.5557.731.546

D2.101.951.651.882.0059.581.916

Total:N= 20

Antes de realizar el anlisis de varianza se debe trazar el diagrama de cajas mltiple para determinar si existen casos extraordinarios y si se cumple el supuesto de varianzas iguales:

Figura 1 Diagrama de caja para los datos del ejemplo 1Los clculos se muestran en la siguiente tabla de ANDEVA.Tabla de ANDEVA para los datos de contaminacin.Fuenteg.l.Suma de cuadradosCuadrados mediosFcalculadaFtablas

Trat."Plantas"4-1=3

Error20-4=16

Total20-1=19

Conclusin:Puesto queFcalc>Fteorse rechazaH0, y se concluye que hay diferencia significativa (al 5%) entre las cantidades medias de contaminantes para las diferentes plantas.PRUEBA DE DIFERENCIA SIGNIFICATIVA MNIMA (DSM).DE FISHERCuando el anlisis de varianza indica la existencia de una diferencia significativa se desea conocer cul de los pares de medias causa la diferencia. Cuando las muestras son de igual tamao laDiferencia Significativa Mnima(DSM) de Fisher nos ayuda a localizar esta fuente.La Diferencia Significativa Mnima (DSM)se define como la diferencia mnima que podra existir entre dos medias de muestras significativamente diferentes. Para obtener la frmula para laDSM, se usa la pruebatde Student para la diferencia entre dos medias cuando las varianzas no son diferentes cuyo estadstico de contraste es: Adems, si se considerani= nj= n, entoncesSi este valor calculado es mayor que el valor terico (de tablas) decimos que la diferencia entrem1ym2es significativa. As, laDSMpuede considerarse como la menor de las diferencias, es decir, Dondey, por lo tanto, se tiene:Ejemplo 2:Calcule laDSMde Fisher para los datos del ejemplo 1

Los valores absolutos de las diferencias entredel ejemplo 1 se muestran en la siguiente tabla.Tabla Valores absolutos de las diferencias entredel ejemplo 1

0.2040.0220.348

0.2260.144

0.370

Como se puede observar, las diferencias que exceden (DSM) estn entre las medias, y, por lo tanto, slo difieren las mediasm4dem1y dem3.Es importante tener presente que la pruebaDSMslo se debe emplear cuando elANOVAha conducidoal rechazo deH0. Si las muestras no son del mismo tamao no se debe usarDSM.PRUEBA DE DIFERENCIA SIGNIFICATIVA HONESTA (DSH) DE TUKEYLa prueba deDiferencia Significativa Honesta (DSH) de Tukey, al igual que laDSM, slo se debe usar despus que se ha rechazado la hiptesis nula en el anlisis de varianza y cuando todos los tamaos de muestra son iguales; pero a diferencia de laDSMemplea el valor. En lugar de. Este valorqse obtiene de la tabla T-8, para el nivel de significanciaa, el nmero de tratamientosKy los grados de libertad del error, entonces:[13.7]Ejemplo 3:Para los datos del ejemplo 1 ya= 0.05,

Los valores absolutos de las diferencias entredel ejemplo 1 se muestran en la siguiente tabla.Valores absolutos de las diferencias entredel ejemplo 1

0.2040.0220.348

0.2260.144

0.370

Como se puede observar, las diferencias que exceden (DSH) estn entre las medias, y, por lo tanto, slo difieren las mediasm4dem1y dem3.Es importante tener presente que la pruebaDSHslo sedebeemplear cuando elANDEVAha conducidoal rechazo deH0. Si las muestras no son del mismo tamao no se debe usarDSH.

PRUEBA DEL RANGO MLTIPLE DE DUNCANLa Prueba delRango mltiple Duncanes otra prueba para determinar la diferencia entre pares de medias despus que se ha rechazado la hiptesis nula en el anlisis de varianza.Este procedimiento emplea los valores de la tabla T-9 y consiste en calcular varios "rangos" (Duncan los llama rangos significativos mnimos) dados por la frmula:

Dondeptoma valores entre 2 yK(Kes el nmero de tratamientos),dse obtiene de la tabla T-9 y elCMErrorse obtiene de la tabla de ANDEVA respectiva.Ejemplo 4:Se realiz un experimento para determinar la cantidad (en gramos) de grasa absorbida por 48 donas (doughnuts) usando ocho tipos diferentes de grasas (aceites y mantecas). Las medias para los ocho tratamientos se muestran a continuacin:

Se usaron seis "donas" en cada tipo de grasa y se obtuvo un cuadrado medio del error de 141.6, los grados de libertad del error son 48-8 =40.Seleccionandoa= 0.05 para este ejemplo, los rangos de Duncan son:

Los valores 3.300, 3.266,..., 2.858 se obtuvieron de la tabla de Duncan (T-9) paraa=0.05, 2p8 y 40 grados de libertad.El siguiente paso es ordenar las medias en orden creciente para establecer los "rangos".

El rango entre las medias mxima y mnima se compara conD8, esto es,, entonces existe diferencia significativa entre las grasas 4 y 7.

El prximo paso es comparar subconjuntos de siete medias con el rangoD7., entonces, entoncesComo los dos exceden el rangoD7se subdividen estos dos subconjuntos en conjuntos de seis medias., entonces, entonces, entoncesNuevamente stos excedenD6, entonces stos se subdividen en subconjuntos de cinco medias, entonces, entonces, entonces, entoncesComo las medias para las grasas 3, 2, 6 y 1 estn incluidos en el conjunto 43261 que fue no significativo, los rangos de las medias en el subconjunto 3261 no se comparan conD4;solamente los rangos de las medias en el subconjunto 2615 se comparan conD4; por lo tanto,, entoncesLos otros subconjuntos de cuatro medias (3, 2, 6,1) y (6, 1, 5,3) no se comparan conD4porque ya fueron declarados no significativos en los conjuntos de cinco medias. Por lo tanto, el proceso termina.Los resultados se muestran grficamente en la siguiente figura, donde las medias que estn debajo de una lnea no son significativamente diferentes.

El investigador puede concluir que las cantidades absorbidas usando las grasas 4 y 3 son significativamente mayores que las 5, 8 y 7, y que la 2 es significativamente mayor que las 8 y 7 y las dems grasas no son significativamente diferentes en relacin con la cantidad absorbida.PRUEBA DE DUNNETTEn muchos experimentos uno de los tratamientos es el control, y el investigador est interesado en comparar cada una de las otrasK-1 medias de los tratamientos contra el control, por lo tanto, existenK-1 comparaciones. Un procedimiento para realizar estas comparaciones es la prueba de Dunnett (desarrollada en 1964). Si se supone que el control es el tratamientoa,entonces se desea probar las hiptesis

El procedimiento de Dunnett es una modificacin de la pruebat. Para cada hiptesis se calcula el valor absoluto de la diferencia de medias observadas

El rechazo de la hiptesis nula se realiza con una probabilidad de error tipo I,asi,donde la constantese busca en la tabla T-10.Observe quefes el nmero de grados de libertad del error yaes el nivel de significacin asociado con todos lasK-1 pruebas y utilizado en el anlisis de varianza.

Ejemplo 5:En el ejemplo 1, la compaa desea comparar todas las otras plantas con laplanta Aque es la que cumple con los requisitos (control), por lo tanto, la prueba de Dunnett sera ms adecuada que la de Fisher o la de Tukey para este caso.

En consecuencia, la nica planta que difiere significativamente de la plantaAes laD.PRUEBA DE SCHEFFEsta prueba es similar a la prueba de Tukey, difiere de ella en que en vez de usar la tabla T-8 para obtener valores "studentizados"qutiliza la tablaFde Fisher (T-7) para obtener el factordondeKes el nmero de tratamientos yael nivel de significacin.Este factorse multiplica por el error estndar de la diferencia entre dos mediaspara obtener la cantidad:que se comparar con las diferencias entre los pares de medias de los tratamientos.

Ejemplo 6:Usando los datos del ejemplo 4, se tiene:

Si la diferencia entre cualquier par de medias excede este valor se dice que hay diferencia significativa entre las medias comparadas. Las diferencias entre las ocho medias se muestran en la siguiente tabla.Tabla Valores absolutos de las diferencias entredel ejemplo 4

37913202324

4610172021

26131617

4111415

71011

34

1

En este ejemplo todas las diferencias entre los pares de medias son menores que 27.3, por lo que no hay diferencia significativa entre los pares de grasas.NOTA: Todas las pruebas estudiadas para comparar pares de medias requieren que todos los tratamientos tengan el mismo nmero de observacionesn. Algunos autores, entre ellos Snedecor y Cochran, han recomendado usar la media armnicanhentre los tamaos de muestranjcuando el nmero de observaciones no es el mismo. Aparentemente esta aproximacin no altera el error de Tipo I.

2.5 VERIFICACION DE LOS SUPUESTOS DEL MODELO

La validez de los resultados obtenidos en cualquier anlisis de varianza queda supeditada a que los supuestos del modelo se cumplan. Estos supuestos son:A) NormalidadB) Varianza constante (igual varianza de los tratamientos)C) IndependenciaEsto es, la respuesta (Y) se debe distribuir de manera normal, con la misma varianza en cada tratamiento y las mediciones deben ser independientes. Estos supuestos sobre Y se traducen en supuestos sobre el termino error () en el modelo+Ti+ ijEs una prctica comn utilizar la muestra de residuos para comprobar los supuestos del modelo, ya que si los supuestos se cumplen, los residuos o residuales se pueden ver como una muestra aleatoria de una distribucin normal con media cero y varianza constante.Los residuos, eij se definen como la diferencia entre la respuesta observada (Yij ) y la respuesta predicha por el modelo (), lo cual permite hacer un diagnstico ms directo de la calidad del modelo, ya que su magnitud seala qu tan bien describe a los datos del modelo.

VeamosRecordemos que el modelo que se espera describa los datos en el DCA est dada por:+Ti+ ijDonde: :(i= 1,2,k;j= 1,2, , n) es el j- esimo dato en el tratamiento i: es la media globalTi: es el efecto del tratamiento iij: representa el error asociado con la observacin YijCuando se realiza el ANOVA, y slo cuando ste resulta significativo, entonces se procede a estimar el modelo ajustado o modelo de trabajo dado por:

Para comprobar cada supuesto existen pruebas analticas y grficas que veremos a continuacin. Por sencillez, muchas veces se prefieren las pruebas grficas. stas tienen el inconveniente de que no son exactas, pero aun as, en la mayora de las situaciones prcticas proporcionan la evidencia suficiente en contra o a favor de los supuestos.NormalidadUn procedimiento grfico para verificar el cumplimiento del supuesto de normalidad de los residuos consiste en graficar los residuos en papel o en la grfica de probabilidad normal que se incluye casi en todos los paquetes estadsticos. Esta grfica del tipo X-Y tiene las escalas de tal manera que si los residuos siguen una distribucin normal, al graficarlos tienden a quedar alineados en una lnea recta; por lo tanto, si claramente no se alinean se concluye que el supuesto de normalidad no es correcto. Cabe enfatizar el hecho de que el ajuste de los puntos a una recta no tiene que ser perfecto, dado que el anlisis de varianza resiste pequeas y moderadas desviaciones al supuesto de normalidad.

Figura 2.2 Grafica de normalidad para los cuatro tipos de cueroVarianza constanteUna forma de verificar el supuesto de varianza constante (o que los tratamientos tienen la misma varianza) es graficado los predichos contra residuos (Yij vs. ei), por lo general Yij va en el eje horizontal y los residuos en el eje vertical. Si los puntos en esta grfica se distribuyen de manera aleatoria en una banda horizontal (sin ningn patrn claro y contundente), entonces es seal de que se cumple el supuesto de que los tratamientos tienen igual varianza. Por el contrario, si se distribuyen con algn patrn claro y contundente, como por ejemplo una forma de corneta o embudo, entonces es seal de que no se est cumpliendo el supuesto de varianza constante.

Figura 2.3 Grafica de la varianza constante para los cuatro tipos de cuero

IndependenciaLa suposicin de independencia en los residuos puede verificarse si se grafica el orden en que se colect un dato contra el residuo correspondiente. De esta manera, si al graficar en el eje horizontal el tiempo (orden de corrida) y en el eje vertical los residuos, se detecta una tendencia o patrn no aleatorio claramente definido, esto es evidencia de que existe una correlacin entre los errores y, por lo tanto, el supuesto de independencia no se cumple. Si el comportamiento de los puntos es aleatorio dentro de una banda horizontal, el supuesto se est cumpliendo. La violacin de este supuesto generalmente indica deficiencias en la planeacin y ejecucin del experimento; asimismo, puede ser un indicador de que no se aplic en forma correcta el principio de aleatorizacin, o de que conforme se fueron realizando las pruebas experimentales aparecieron factores que afectaron la respuesta observada. Por ello, en caso de tener problemas con este supuesto, las conclusiones que se obtienen del anlisis son endebles y por ello es mejor revisar lo hecho y tratar de investigar por qu no se cumpli con ese supuesto de independencia, a fin de reconsiderar la situacinEleccin del tamao de la muestraUna decisin importante en cualquier diseo de experimentos es decidir el nmero de rplicas que se har por cada tratamiento (tamao de muestra). Por lo general, si se esperan diferencias pequeas entre tratamientos ser necesario un mayor tamao de muestra. Aunque existen varios mtodos para estimar el tamao muestral, muchas veces tienen poca aplicabilidad porque requieren cierto conocimiento previo sobre la varianza del error experimental. Si recurrimos a la experiencia vemos que el nmero de rplicas en la mayora delas situaciones experimentales en las que se involucra un factor vara entre cinco y diez; incluso, en algn caso puede llegar hasta 30. La tendencia podra inclinarse por un extremo de este rango e incluso salirse de ste, de acuerdo con las siguientes consideraciones: A menor diferencia que se espera en los tratamientos, mayor ser la cantidad de rplicas si se quieren detectar diferencias significativas, y viceversa, es decir, si se esperan grandes diferencias quiz con pocas replicas sea suficiente Si se espera mucha variacin dentro de cada tratamiento, debido a la variacin de fuentes no controladas como mtodos de medicin, medio ambiente, materia prima, etc., entonces se necesitarn ms rplicas Si son varios tratamientos (cuatro o ms), entonces ste es un punto favorable para reducir el nmero de rplicas.Adems de lo anterior, es preciso considerar los costos y el tiempo global del experimento. De aqu que si toman en cuenta las consideraciones antes expuestas se podr establecer el tamao de muestra que permita responder en una primera fase las preguntas ms importantes que se plantearon con el experimentoSupongamos que el experimentador ya tiene el nmero de tratamientos que desea probar K y que tomando en cuenta las consideraciones antes citadas tiene una propuesta inicial del nmero de rplicas por tratamiento que va a utilizar, n0. Tambin tiene una idea aproximada del valor de (la desviacin estndar del error aleatorio), as como una idea de la magnitud de las diferencias, dt , entre tratamientos que le interesa detectar. Por ejemplo, supongamos que en el caso de los tiempos promedio de los K= 4 mtodos de ensamble (del ejemplo 1), tiene idea realizar n0 = 5 pruebas; en cuanto a las diferencias, le interesa detectar 2 minutos, dt entre un mtodo y otro, y espera que cada mtodo tenga una variabilidad intrnseca de = 1,5; esto debido a factores no controlados (habilidad del operador, cansancio, variabilidad de las partes a ensamblar, error de medicin del tiempo de ensamble, etctera).La frmula que tentativamente debemos usar para la eleccin del tamao de muestra es:

El valor de n arrojado por esta frmula dar una idea del nmero de rplicas por tratamiento, de acuerdo con las consideraciones iniciales que se reflejan a travs de (K,n0, dt), y sobre todo por el nmero total de corridas experimentales, n, que es lo que muchas veces interesa ms al experimentador debido a los costos y tiempos. Si N est fuera del presupuesto se podrn revisar algunas consideraciones y quiz pensar en un nmero menor de tratamientos. Al aplicar esta expresin al caso de los cuatro mtodos del ensamble obtenemos con un nivel se significancia del 0,05:K= 4n0= 5 = 1,5dt= 2= 0,05

Por lo tanto n=5 se debera utilizar como tamao de muestra (nmero de pruebas por tratamiento).

2.6. USO DE UN SOFTWARE ESTADSTICOExcela) En una hoja de Excel capturar primeramente la tabla de datosb) En la misma hoja de clculo seleccionar del cintillo superior Datos, luego Anlisis de datosc) Seleccionar anlisis de varianza de un factor en la ventana despleg

d) En rango de entrada (en ventana de captura) seleccionar todos los grupos, incluyendo su rtulo (sombrearlos con el mouse), automticamente se incluyene) En el siguiente recuadro seleccionar si nuestros datos estn ordenados en filia o columnas, adems indicar si tenemos rtulos en los encabezados, e indicar que los resultados los arroje en una hoja nueva.

Nota: Si no aparece Anlisis de datos en la parte superior derecha de la hoja de clculo, se deber de activar de la siguiente manera: En el smbolo del sistema en la parte superior izquierda de los encabezados dar clic. En la ventana desplegada seleccionar opciones de Excel en la parte inferior dando un clic. De la ventana desplegada sealar en el men del lado izquierdo complementos De la ventana desplegada en el lado derecho, sealar en la parte inferior de la misma ir con un clic. De la ventana desplegada palomear el recuadro de herramientas para anlisis, y aceptar Nota: como no est instalada esta herramienta el sistema nos preguntara si queremos instalarla a lo que indicaremos que s, y la instalara en un par de minutos.Minitab En la hoja de clculo que despliega Minitab capturar nuestra tabla de datos indicando sus correspondientes rtulos en la primera fila que no est numerada. En el cintillo superior indicar con el mouse Estadsticas. Del men desplegado seleccionar ANOVA, en el men desplegado seleccionar Un solo factor (Desapilado) y dar clic con el mouse.

En ventana de captura desplegada (Anlisis de varianza- Un solo factor), en la parte izquierda aparecern automticamente los grupos de tabla de datos. En el cuadro superior derecho (Respuestas (en columnas separadas)) indicar separando por un espacio (sin comas) los nombres de las columnas que generalmente son letras, esto tambin se logra dando doble clic en cada letra del cuadro de la izquierda, automticamente son capturadas. En nivel de confianza por default es 95% Sealar Aceptar y nos arrojara el resultado ANOVA en la parte superior de la hoja de clculo.

Si queremos hacer comparaciones de rango mltiples, entonces sealamos de la ventana anterior comparaciones dando un clic. En la ventana desplegada sealaremos las comparaciones que queramos, y en control nivel del grupo indicamos la A, y damos clic en aceptar.

Si queremos las grficas del supuesto del modelo entonces, damos clic a grficas (antepenltima ventana) y sealamos tres en uno y damos clic en aceptar

EJEMPLOS ADICIONALES DE LOS DISTINTOS TEMAS INVESTIGADOSModelo de efectos fijos (Tomado de Montgomery)Un ingeniero disea una bateria para su uso en un dispositivo que ser sometido a ciertas variaciones extremas de temperatura. El nico parmetro de diseo que l puede seleccionar en este punto es el material de al cubierta de la batera, y tiene tres alternativas. Cuando el dispositivo se manufactura y se enva al campo, el ingeniero no tiene control sobbre los extremos de las temperaturas a que ser expuesto el dispositivo, y sabe por experiencia que es probabble que la temperatura influye sobre la duracin de la batera.- Sin embargo, s es posible controlar la temperatura en el laboratorio de desarrollo de productos para los fines del ensayo.El ingeniero decide probar los tres materiales de la cubierta a tres niveles de temperaturas (15, 70 y 125) consistentes en el entorno de su uso final del producto. Se prueban cuatro bateras a cada combinacin del material de cubierta y temperatura, y las 36 pruebas se ejecuta al azar. La siguiente tabla muestra los datos resultantes de la duracin observada de las bateras.Temperatura

Tipo de

material

1570125

1130

74

155

180

34

80

40

75

20

82

70

58

2150

159

188

126

126

106

122

115

25

58

70

45

3138

168

110

160

174

150

120

139

96

82

104

60

Como auxiliar de la interpretacin de los resultados de este experimento resulta til la construccin de una grfica de las respuestas promedios de cada combinacin de tratamiento.

Figura 1. Grfica de lineas para los tipos de materiales en los niveles de temperaturaDe la grfica dse puede observar que la diferencia entre los promedios de los materiales 1 y 2 no es la misma en los tres niveles, anlgogamente para los casos de los materiales 1 y 3, y 2 y 3. De lo que se puede sospechar que los materiales no se comportan de la misma manera en cada nivel de temperatura, por lo cual se puede establecer que existe interaccin entre los tipos de materiales y los niveles de temperatura.Tabla 1. ANOVA para los datos del ejemplo 1Causa de

variacin

Grados de

libertad

Suma de

cuadrados

Cuadrados

medios

F

ValorPFtabla

Tipo de material210633.1675316,5833337.980.001888483.35

Temperatura239083.16719541,5833329.341.6944E-073.35

Interaccin49437.662359,4166673.540.018973062.7277

Error

experimental

2717980665,9537037

Total3777134.75

De la tabla de Anova se puede observar que al nivel de significacin de 0.05 todas las causa de variacin resultan significativas, pero no se debe tener encuenta para el anlisis los factores individuales sino la interaccin, ya que esta interaccin nos dice que la repuesta se potencia cuando se combinan los niveles de los factores y no cuando se aplican por separado. Por tanto lo que sigue en el anlisis es aplicar los procedimiento de comparacin mltiple para los niveles de tipo de material en cada nivel de temperatura.Diseo de experimentos con un factor fijoUn campus universitario tiene cuatro facultades. Se quiere estudiar la variable tiempo que tarda unalumno en hacer una consulta en la base de datos de la biblioteca de su facultad. Para ello se ha recogidouna muestra aleatoria cuyos resultados son los de la tabla adjunta. Analizar estos datos y estudiar lainfluencia del factor facultad en la variable de inters.ArquitecturaI. InformticaDerechoI. Caminos

4837241837431913

312916640402621

3124222451353126

3638103049331324

3941252436391212

111524551621

354030

26

Solucin:Se calcula la media y desviacin tpica de cada una de las facultades y del total:

Y== 11'654(cuasi-desviacin tpica muestral)

sY== 11'537(desviacin tpica muestral)

Por tanto, la suma de cuadrados global es:

Razonando igual en cada grupo, se obtiene

El contraste de inters es el siguiente:

A la vista de los resultados del cuadro anterior se puede intuir que se va a rechazar la hiptesis nula yque por tanto el factor facultad influye en la variable de inters.Se calcula la tabla ANOVA. Para ello, se tiene en cuenta que las predicciones coinciden con las mediascondicionadas:

Se calcula la suma de cuadrados explicada por el factor scT (facultad)=i= 14=i= 14ni2=

= 102+ 122+

+ 152+ 132= 4101'33

Finalmente, se obtiene la suma de cuadrados residual

La tabla ANOVA es

Se rechazala hiptesis nula para cualquier valor de>0'0001y se concluye que el factor facultades significativo.LascRse calcula a partir de los residuosscR=ijeij2=ij2=

=2+...+2+2+...+2+

2+...+2+2+...+2

= 2553'47

Se calculan intervalos de confianza al90%para los diferentes parmetros del modelo:Intervalo de confianza para la varianza:2

=46

31'44 =460'0001y se concluye que el factoroperador es significativo, esto es, hay variabilidad entre los diferentes operadores.Se estiman las varianzas del modelo:R2

Al igual que en el problema anterior las siguientes grficas ayudan a comprender e interpretar laresolucin del problema.

Figura 4.30. Grfico de cajas mltiple para los datos del problema 2.9.

Figura 4.31. Grfico de medias condicionadas.

Figura 4.32. Grfico de residuos frente a predicciones para los datos del problema 2.9.ELECCIN DE MUESTRAEn un lote de frascos para medicina, con una poblacin de 8000 unidades, se desea estimar la media de la capacidad en centmetros cbicos de los mismos.A travs de un premuestreo de tamao 35 se ha estimado que la desviacin estndar es de 2 centmetros cbicos. Si queremos tener una precisin 0.25 cms3, y un nivel de significancia del 5% . De que tamao debe de ser la muestra?DATOS:S = 2 cms3; N = 8000 ; d = 0.25 cms3;a= 0.05 (5%)Za/2= 1.96N Za/2S 8000(1.96)(2)n = -------------- = --------------------------- = 238 frascosNd + Za/2S 8000(0.25) + (1.96)(2)Solo faltara muestrear 203 frascos, pues los datos de los 35 frascos del premuestreo siguen siendo vlidos.Una cantidad, con frecuencia, de inters para una clnica es el porcentaje de pacientes retrasados para su vacunacin. Algunas clnicas examinan cada registro para determinar el porcentaje; Sin embargo, en una clnica grande, la realizacin de un censo de los registros puede llevar mucho tiempo. Cullen (1994) realizo una muestra de los 580 nios a los que da servicio una clnica familiar, en Auckland para estimar la proporcin de inters.Que tamao de muestra sera necesario con una muestra aleatoria simple (sin reemplazo) para estimar la proporcin con el 95% de confianza y un margen de error de 0.10 .DATOS:N = 580 Nios

En realidad, Cullen realizo una muestra aleatoria simple con reemplazo de tamao 120, de los cuales 27 resultaron como no retrasados para la vacuna. De un intervalo de confianza al 95% para la proporcion de nios no retrasados.Solucin:

En un estudio, se desea determinar en qu proporcin los nios de una regin toman incaparina en el desayuno. Si se sabe que existen 1,500 nios y deseamos tener una precisin del 10 por ciento, con un nivel de significancia del 5%. De qu tamao debe de ser la muestra?DATOS:N = 1500; d = 10 % = 0.1;a= 5 %p = 0.5 y q = 0.5 (asumiendo varianza mxima).Za/2= 1.96Za/2pq 1500 (1.96)(0.5)(0.5)n = ----------------- = ------------------------------- = 91d + Za/2pq1500(0.1) + (1.96)(0.5)(0.5)Se deben de muestrear 91 nios.

BIBLIOGRAFA http://www.virtual.unal.edu.co/cursos/ciencias/2000352/html/un5/cont_505-83.html ioestadistica Principios y Procedimientos. Steel and Torrie. 2Edicin. Mc Graw Hill,1988. .. Diseo y Anlisis de Experimentos. Douglas Montgomery. Grupo Editorial Iberoamerica.1991. Bioestadstica. William C. Schefler. Fondo Educativo Interamericano, S.A., 1981. http://victoryepes.blogs.upv.es/2013/04/27/diseno-completamente-al-azar-y-anova/ http://colposfesz.galeon.com/disenos/teoria/cap13bmj/cap13bmj.htm

Unidad II- DISEO DE EXPERIMENTOS DE UN FACTOR9