diseño de experimentos · 2014-03-24 · diseño de experimentos en r la vida de anaquel de las...
TRANSCRIPT
Diseño de Experimentos
1Hugo Alberto Brango García, MsC.
Email: [email protected]
Web: www.habrango.jimdo.com
Horarios de o�cina: Miercoles 8 am - 10 am, Jueves 2- 4 pm
Mayo de 2013
Hugo Alberto Brango García, MsC. (UNICORDOBA) Mayo de 2013 1 / 31
Qué es R?
R es un lenguaje de alto nivel y un entorno para el análisis de datos ygrá�cos. Puede descargarse libremente del sitio llamado CRAN en lasiguiente direccion: http://cran.r-project.org o bien, simplementebuscando CRAN en Google.
Hugo Alberto Brango García, MsC. (UNICORDOBA) Mayo de 2013 2 / 31
Hugo Alberto Brango García, MsC. (UNICORDOBA) Mayo de 2013 3 / 31
Al llegar a la pantalla anterior seguir para descargar el programa lasiguiente ruta: Download R for windows/install R for the �rsttime./Download R 2.14.2 for Windows. Una vez instalado el programaen entorno Windows, lo que vemos es la interfaz RGui, con el smbolo >esperando la entrada de instrucciones, tal y como puede apreciarse enla �gura siguiente:
Hugo Alberto Brango García, MsC. (UNICORDOBA) Mayo de 2013 4 / 31
Hugo Alberto Brango García, MsC. (UNICORDOBA) Mayo de 2013 5 / 31
Para crear un vector x con las componentes 2, 3,6,7,9,10,15,9,6,7,12
x=c(2,3,6,7,9,10,15,9,6,7,12)
Hugo Alberto Brango García, MsC. (UNICORDOBA) Mayo de 2013 6 / 31
R
A continuación se presenta un listado de funciones estadísticas en Rpara un vector x, las cuales se trabajaron en el curso de Estadística:
length(x) Número de datos n
sqrt(x) Raíz cuadrada de x
mean(x) Media de la variable x
median(x) Mediana de la variable x
var(x) varianza de la variable x
quantile(x) Cuantíles de x
summary(x) Resumen de estadísticas de x
boxplot(x) Diagrama de cajas
hist(x) Histograma de x
t.test(x) Intervalo de con�anza y prueba de hopótesis para µ
Hugo Alberto Brango García, MsC. (UNICORDOBA) Mayo de 2013 7 / 31
Diseño de experimentos en R
La vida de anaquel de las carnes almacenadas es el tiempo que un cortepreviamente empacado es sano, nutritivo y vendible. Un paquetenormal expuesto al aire ambiental tiene una vida aproximada de 48horas, después de las cuales la carne comienza a deteriorarse porcontaminación de microbios, degradación del color y encogimiento. Elempaque al vacío es efectivo para suprimir el desarrollo de microbios;sin embargo, continúan siendo un problema los otros aspectos.
Algunos estudios recientes sugieren las atmósferas controladas de gas,como alternativa a los empaques actuales. Dos atmósferas queprometen combinar la capacidad de suprimir el desarrollo de microbioscon la conservación de las cualidades de la carne son: 1) dióxido decarbono puro (CO2) y 2) mezclas de monóxido de carbono (CO),oxigeno (O2) y nitrógeno (N).
Hugo Alberto Brango García, MsC. (UNICORDOBA) Mayo de 2013 8 / 31
Diseño de experimentos en R
Hipótesis de investigación: Con base en esta nueva información, elinvestigador plantea la hipótesis de que alguna forma de atmósferacontrolada proporcionará un entorno más efectivo de empaque para elalmacenamiento de carne.
Diseño del tratamiento: El diseño del tratamiento desarrollado porel investigador para evaluar la hipótesis incluyó empaques con: 1) airedel ambiente con un empaque comercial de plástico; 2) al vacío; 3) unamezcla de gases con 1% CO, 40% O2, y 59% N y 4) 100% CO2. Losempaques con el aire del ambiente y al vacío sirven como tratamientosde control, ya que ambos son estándares con cuya efectividad se puedecomparar la de los nuevos empaques.
Hugo Alberto Brango García, MsC. (UNICORDOBA) Mayo de 2013 9 / 31
Diseño de experimentos en R
Diseño del experimento: Se usó un DCA para el experimento. Cadacorte se empacó por separado en las condiciones asignadas. En esteproblema, se evalúa la efectividad de cada tratamiento para suprimir eldesarrollo bacterial. Después de 9 días de almacenamiento a 4
oC en
una instalación normal, se midió el número de bacterias sicotrópicas enla carne. Las bacterias sicotrópicas se encuentran en la super�cie de lacarne y se asocian con la carne deteriorada. Los datos se presentan enla siguiente tabla:
Hugo Alberto Brango García, MsC. (UNICORDOBA) Mayo de 2013 10 / 31
Diseño de experimentos en R
T1 T2 T3 T4
7.66 5.26 7.41 3.51
6.98 5.44 7.33 3.91
7.80 5.80 7.04 3.66
5.56 7.33 3.76
7.56
y=c(7.66,6.98,7.8,5.26,5.44,5.8,5.56,7.41,7.33,7.04,7.33,7.56,3.51,3.91,3.66,3.76)
tto=factor(c(1,1,1,2,2,2,2,3,3,3,3,3,4,4,4,4))
Hugo Alberto Brango García, MsC. (UNICORDOBA) Mayo de 2013 11 / 31
Diseño de experimentos en R
boxplot(y~tto,col=�red�,xlab=�Tratamientos�)
Hugo Alberto Brango García, MsC. (UNICORDOBA) Mayo de 2013 12 / 31
Diseño de experimentos en R
dca=aov(y~tto)
summary(dca)
Df Sum Sq Mean Sq F value Pr(>F)
tto 3 37.386 12.4621 194.97 1.919e-10 ***
Residuals 12 0.767 0.0639
Signif. codes: 0 `***' 0.001 `**' 0.01 `*' 0.05 `.' 0.1 ` ' 1
Hugo Alberto Brango García, MsC. (UNICORDOBA) Mayo de 2013 13 / 31
Diseño de experimentos en R
Prueba de Tukey
TukeyHSD(dca)
Tukey multiple comparisons of means
95 % family-wise confidence level
$tto
diff lwr upr p adj
2-1 -1.965 -2.5382801 -1.3917199 0.0000016
3-1 -0.146 -0.6941606 0.4021606 0.8572755
4-1 -3.770 -4.3432801 -3.1967199 0.0000000
3-2 1.819 1.3154823 2.3225177 0.0000009
4-2 -1.805 -2.3357542 -1.2742458 0.0000017
4-3 -3.624 -4.1275177 -3.1204823 0.0000000
Hugo Alberto Brango García, MsC. (UNICORDOBA) Mayo de 2013 14 / 31
Diseño de experimentos en R
plot(TukeyHSD(dca))
Hugo Alberto Brango García, MsC. (UNICORDOBA) Mayo de 2013 15 / 31
Diseño de experimentos en R
Prueba de Duncan
library(agricolae)
duncan.test(dca,"tto",alpha=0.05)
Hugo Alberto Brango García, MsC. (UNICORDOBA) Mayo de 2013 16 / 31
Diseño de experimentos en R
Supuestos
εij ∼ NI(0, σ2j
)error=resid(dca)
shapiro.test(error)
Shapiro-Wilk normality test
data: error
W = 0.9589, p-value = 0.6422
Hugo Alberto Brango García, MsC. (UNICORDOBA) Mayo de 2013 17 / 31
Diseño de experimentos en R
Homocedasticidad
bartlett.test(y,tto)
Bartlett test of homogeneity of variances
data: y and tto
Bartlett's K-squared = 2.7974, df = 3, p-value = 0.4239
library(car)
leveneTest(y,tto)
Df F value Pr(>F)
group 3 0.5181 0.6777
12
Hugo Alberto Brango García, MsC. (UNICORDOBA) Mayo de 2013 18 / 31
Diseño de experimentos en R
Cargar base de datos en R
Para cagar una base de datos desde R hay varias maneras y depende deel formato que tenga la base. Una manera muy fácil para hacerlo desdeexcel es:
Carguemos en excel los datos de la siguiente manera
Hugo Alberto Brango García, MsC. (UNICORDOBA) Mayo de 2013 19 / 31
Diseño de experimentos en R
Se selecciona la parte y se da copiar (solo se copia, no se pega enningún lado)
Hugo Alberto Brango García, MsC. (UNICORDOBA) Mayo de 2013 20 / 31
Diseño de experimentos en R
Luego se escribe en R:
datos=read.delim("clipboard",dec=�,�)
Para llamar las variables con las que vamos a trabajar, hacemos losiguiente:
y=datos$y
laboratorio=factor(datos$laboratorio)
alimento=factor(datos$alimento)
Hugo Alberto Brango García, MsC. (UNICORDOBA) Mayo de 2013 21 / 31
Diseño de experimentos en R
Diagrama de cajas
boxplot(y~alimento)
Hugo Alberto Brango García, MsC. (UNICORDOBA) Mayo de 2013 22 / 31
Diseño de experimentos en R
dbca=aov(y~laboratorio+alimento)summary(dbca)
Df Sum Sq Mean Sq F value Pr(>F)
labora 2 24 12 24 0.00592 **alimento 2 14 7 14 0.01562 *Residuals 4 2 0.5
Signif. codes: 0 `***' 0.001 `**' 0.01 `*' 0.05 `.' 0.1 ` ' 1
Hugo Alberto Brango García, MsC. (UNICORDOBA) Mayo de 2013 23 / 31
Diseño de experimentos en R
Prueba de Tukey
TukeyHSD(dbca)
Hugo Alberto Brango García, MsC. (UNICORDOBA) Mayo de 2013 24 / 31
Diseño de experimentos en R
Gra�co de Tukey
plot(TukeyHSD(dbca))
Hugo Alberto Brango García, MsC. (UNICORDOBA) Mayo de 2013 25 / 31
Diseño de experimentos en R
Pruebas de Homocedasticidad en los tratamientos
bartlett.test(y,alimento)
library(car)leveneTest(y,alimento)
Hugo Alberto Brango García, MsC. (UNICORDOBA) Mayo de 2013 26 / 31
Diseño de experimentos en R
Prueba de Normalidad en los errores
error=resid(dbca)shapiro.test(error)
Hugo Alberto Brango García, MsC. (UNICORDOBA) Mayo de 2013 27 / 31
Diseño de experimentos en R
Ejemplo Cuadrado Latino
En una industria procesadora de alimentos se decide comprobar si essigni�cativa la pérdida de peso en gramos de un producto almacenadoen 4 empaques diferentes, para lo cual se le solicita la comprobación delmismo a 4 diferentes tecnólogos utilizando para tal efecto cuatrobalanzas diferentes
TecnólogoBalanza
1 2 3 4
I A=500 B=507 C=530 D=512
II B=514 A=490 D=495 C=536
III C=527 D=509 A=501 B=505
IV D=511 C=537 B=499 A=510
Hugo Alberto Brango García, MsC. (UNICORDOBA) Mayo de 2013 28 / 31
Diseño de experimentos en R
Cargar en excel los datos
Se escriben en excel los datos de la siguiente manera, selecciona y secopia el área seleccionada
Hugo Alberto Brango García, MsC. (UNICORDOBA) Mayo de 2013 29 / 31
Diseño de experimentos en R
Importar los datos desde R
latino=read.delim(�clipboard�,dec=�,�)y=latino$ytecnologo=factor(latino$tecnologo)balanza=factor(latino$balanza)tto=factor(latino$tto)
Hugo Alberto Brango García, MsC. (UNICORDOBA) Mayo de 2013 30 / 31
Diseño de experimentos en R
ANOVA
dcl=aov(y~tecnologo+balanza+tto)summary(dcl)
Hugo Alberto Brango García, MsC. (UNICORDOBA) Mayo de 2013 31 / 31