estadistica descriptiva tema 07 estadigrafos de dispersiÓn

9

Click here to load reader

Upload: ivan-fernando-suarez-lozano

Post on 25-Jul-2015

24.234 views

Category:

Education


0 download

TRANSCRIPT

Page 1: ESTADISTICA DESCRIPTIVA TEMA 07 ESTADIGRAFOS DE DISPERSIÓN

ESTADÍSTICA I

ESTADÍGRAFOS DE DISPERSIÓN

Iván Fernando Suarez Lozano

ÍNDICE. ESTADÍGRAFOS DE DISPERSIÓN. ................................................................................................... 1

VARIANZA. ...................................................................................................................................... 1

DESVIACIÓN ESTÁNDAR Ó TÍPICA. .............................................................................................. 2

DESVIACIÓN MEDIA. ...................................................................................................................... 2

COEFICIENTE DE VARIACIÓN Ó COEFICIENTE DE VARIACIÓN DE PEARSON ........................ 4

VARIANZA Y DESVIACIÓN ESTÁNDAR DE UNA MUESTRA Y UNA POBLACIÓN. .......................... 4

ANÁLISIS DE LA VARIANZA. .............................................................................................................. 4

TÉRMINOS: ......................................................................................................................................... 5

VARIANZA Y DESVIACIÓN PARA DATOS AGRUPADOS. ................................................................ 5

BIBLIOGRAFÍA .................................................................................................................................... 6

EJERCICIO RESUELTO. ..................................................................................................................... 7

ESTADÍGRAFOS DE DISPERSIÓN. Los estadígrafos de dispersión son aquellos que nos determinan ó indican como se comportan los datos alrededor de un promedio. Los estadígrafos de dispersión son:

VARIANZA.

La varianza es una de las medidas más utilizadas dentro de los estadígrafos de dispersión. La varianza se define como el promedio de la diferencia de cada uno de los datos respecto a su media, en otras palabras:

n

Xxn

ii∑

=

−= 1

2__

Una de las características de la varianza, es que el resultado obtenido se encuentra en una unidad de medida distinta a la de los datos tomados, por tanto puede no llegar a decirnos mucho sobre la realidad de la distribución. De igual manera, por estar elevadas al cuadrado cada una de las observaciones, el valor obtenido podrá llegar a ser más alto que las observaciones mismas. Ejemplo:

Prueba Tiempo Media

−__

Xxi

2__

− Xxi

Prueba 1 4,8 Min 5,2 Min (0,435) 0,189Min2

Prueba 2 4,9 Min 5,2 Min (0,335) 0,112Min2

Prueba 3 5,0 Min 5,2 Min (0,235) 0,055Min2

Prueba 4 5,0 Min 5,2 Min (0,235) 0,055Min2

Prueba 5 5,0 Min 5,2 Min (0,235) 0,055Min2

Prueba 6 5,1 Min 5,2 Min (0,135) 0,018Min2

Page 2: ESTADISTICA DESCRIPTIVA TEMA 07 ESTADIGRAFOS DE DISPERSIÓN

ESTADÍSTICA I

ESTADÍGRAFOS DE DISPERSIÓN

Iván Fernando Suarez Lozano

Prueba Tiempo Media

−__

Xxi

2__

− Xxi

Prueba 7 5,1 Min 5,2 Min (0,135) 0,018Min2

Prueba 8 5,1 Min 5,2 Min (0,135) 0,018Min2

Prueba 9 5,1 Min 5,2 Min (0,135) 0,018Min2

Prueba 10 5,2 Min 5,2 Min (0,035) 0,001Min2

Prueba 11 5,2 Min 5,2 Min (0,035) 0,001Min2

Prueba 12 5,2 Min 5,2 Min (0,035) 0,001Min2

Prueba 13 5,2 Min 5,2 Min (0,035) 0,001Min2

Prueba 14 5,2 Min 5,2 Min (0,035) 0,001Min2

Prueba 15 5,3 Min 5,2 Min 0,065 0,004Min2

Prueba 16 5,3 Min 5,2 Min 0,065 0,004Min2

Prueba 17 5,3 Min 5,2 Min 0,065 0,004Min2

Prueba 18 5,4 Min 5,2 Min 0,165 0,027Min2

Prueba 19 5,4 Min 5,2 Min 0,165 0,027Min2

Prueba 20 5,5 Min 5,2 Min 0,265 0,070Min2

Prueba 21 5,6 Min 5,2 Min 0,365 0,133Min2

Prueba 22 5,7 Min 5,2 Min 0,465 0,216Min2

Prueba 23 5,8 Min 5,2 Min 0,565 0,319Min2

∑ 1,352Min2

23

M352,1 22 in=σ

0,0588Min2

DESVIACIÓN ESTÁNDAR Ó TÍPICA.

La desviación estándar la definimos simplemente como la raíz cuadrada de la varianza, de esta forma tenemos:

n

Xxn

ii∑

=

−= 1

2__

σ Representativamente podemos utilizar el término 2σ para la varianza y σ para la

desviación estándar.

Continuando con el ejemplo anterior tendríamos: 23

M352,1 22 in=σ =0,0588Min

2 para la varianza, y

sacando la raíz tendríamos 0,242Min

DESVIACIÓN MEDIA.

Page 3: ESTADISTICA DESCRIPTIVA TEMA 07 ESTADIGRAFOS DE DISPERSIÓN

ESTADÍSTICA I

ESTADÍGRAFOS DE DISPERSIÓN

Iván Fernando Suarez Lozano

La desviación media tiene un poco menos de importancia que las varianza y la desviación estándar. La desviación media se define como la media de las desviaciones respecto a la media aritmética, tomadas en valor absoluto. Su ecuación es:

n

Xx

MDi∑ −

=

___

.

Ejemplo: Tomando los datos del ejemplo anterior:

Prueba Tiempo Media

−__

Xxi __

Xxi −

Prueba 1 4,8 Min 5,2 Min -0,4 0,4348

Prueba 2 4,9 Min 5,2 Min -0,3 0,3348

Prueba 3 5,0 Min 5,2 Min -0,2 0,2348

Prueba 4 5,0 Min 5,2 Min -0,2 0,2348

Prueba 5 5,0 Min 5,2 Min -0,2 0,2348

Prueba 6 5,1 Min 5,2 Min -0,1 0,1348

Prueba 7 5,1 Min 5,2 Min -0,1 0,1348

Prueba 8 5,1 Min 5,2 Min -0,1 0,1348

Prueba 9 5,1 Min 5,2 Min -0,1 0,1348

Prueba 10 5,2 Min 5,2 Min 0,0 0,0348

Prueba 11 5,2 Min 5,2 Min 0,0 0,0348

Prueba 12 5,2 Min 5,2 Min 0,0 0,0348

Prueba 13 5,2 Min 5,2 Min 0,0 0,0348

Prueba 14 5,2 Min 5,2 Min 0,0 0,0348

Prueba 15 5,3 Min 5,2 Min 0,1 0,0652

Prueba 16 5,3 Min 5,2 Min 0,1 0,0652

Prueba 17 5,3 Min 5,2 Min 0,1 0,0652

Prueba 18 5,4 Min 5,2 Min 0,2 0,1652

Prueba 19 5,4 Min 5,2 Min 0,2 0,1652

Prueba 20 5,5 Min 5,2 Min 0,3 0,2652

Prueba 21 5,6 Min 5,2 Min 0,4 0,3652

Prueba 22 5,7 Min 5,2 Min 0,5 0,4652

Prueba 23 5,8 Min 5,2 Min 0,6 0,5652

∑ 4,3739

n

XxMD

i∑ −=

___

. = 0,1902

Page 4: ESTADISTICA DESCRIPTIVA TEMA 07 ESTADIGRAFOS DE DISPERSIÓN

ESTADÍSTICA I

ESTADÍGRAFOS DE DISPERSIÓN

Iván Fernando Suarez Lozano

COEFICIENTE DE VARIACIÓN Ó COEFICIENTE DE VARIACIÓN DE PEARSON

Una de las desventajas del análisis de varianza es cuando las variables que se presentan están expresadas en distintas medidas ó unidades, con lo cual nos interesaría determinar la variación respecto a una base. De esta forma el coeficiente de variación podemos definirlo como:

%100___

xX

SCv =

Continuando con el ejercicio anterior tendríamos:

%1002,5

0,242°CxCv = = 4,6 %

VARIANZA Y DESVIACIÓN ESTÁNDAR DE UNA MUESTRA Y UNA POBLACIÓN. La varianza y desviación estándar que se ha presentando hasta el momento, están especificadas para una población, sin embargo, rara vez podemos realizar un análisis poblacional de estos estadígrafos, por ello es necesario que tengamos en cuenta el análisis para la muestra. La formula la para el análisis de la varianza y la desviación estándar es:

11

2__

2

−=∑

=

n

Xx

S

n

ii

Para la varianza y 1

1

2__

−=∑

=

n

Xx

S

n

ii

para la desviación estándar

(n-1) nos da los grados de libertad. En toda operación estadística, los grados de libertad están determinados por todas las observaciones menos todas las restricciones impuestas por estas observaciones. ANÁLISIS DE LA VARIANZA. Como ya hemos mencionado, la varianza y la desviación estándar nos mide el promedio de la diferencia elevada al cuadrado de cada dato respecto a la media. Por tanto debemos tener presente lo siguiente: Entre más alta sea la varianza y la desviación estándar, mayor es la desviación de los datos, de igual manera entre menor sea la varianza y la desviación estándar, menor es la dispersión de los datos frente a la media. ¿Qué pasa si la varianza ó la desviación estándar es igual a cero? Solo cuando la diferencia entre cada dato y su promedio es cero, la varianza es cero, por tanto, podemos decir que cada dato es igual al promedio. Esto también puede ser aplicado al coeficiente de variación y desviación media.

Page 5: ESTADISTICA DESCRIPTIVA TEMA 07 ESTADIGRAFOS DE DISPERSIÓN

ESTADÍSTICA I

ESTADÍGRAFOS DE DISPERSIÓN

Iván Fernando Suarez Lozano

TÉRMINOS: Teniendo presente lo que hemos expuesto en relación a la diferencia entre la población y la muestra, podemos resumir el uso de los términos según la siguiente tabla:

Promedio Varianza Desviación

Muestra ___

X 2S S

Población µ 2σ σ VARIANZA Y DESVIACIÓN PARA DATOS AGRUPADOS. Al igual que se ha especificado para en las clases anteriores, para el caso de los datos agrupados tendremos:

n

nYyn

iii∑

=

−= 1

2__

2σ Para el caso de la varianza de la una población,

n

nYyn

iii∑

=

−= 1

2__

σ Para el caso de la desviación estándar de la población.

Para el caso de la muestra debemos dividir por n-1, como lo expresamos anteriormente.

Page 6: ESTADISTICA DESCRIPTIVA TEMA 07 ESTADIGRAFOS DE DISPERSIÓN

ESTADÍSTICA I

ESTADÍGRAFOS DE DISPERSIÓN

Iván Fernando Suarez Lozano

BIBLIOGRAFÍA ANDERSON, D. R., SWEENEY, D. J., & WILLIAMS, T. A. (2001). ESTADÍSTICA PARA ADMINIISTRACIÓN Y ECONOMÍA (7a ed., Vol. I). (V. GONZALEZ POZO, Trad.) Buenos Aires, Argentina: Internacional Thomson Editores. ANDERSON, D. R., SWEENEY, D. J., & WILLIAMS, T. A. (2008). ESTADÍSTICA PARA ADMINISTRACIÓN Y ECONOMÍA (10a Edición ed.). (S. R. CERVANTES GONZÁLEZ, Ed.) México D.F., México: CENGAGE Learning. LIND, D. A., MARCHAL, W. G., & MASON, R. D. (2004). ESTADÍSTICA PARA ADMINISTRACIÓN Y ECONOMÍA (11 ed.). (F. D. CASTRO PEREZ, M. CUPA LEÓN, Edits., & M. D. HANO ROA, Trad.) Bogotá D.C., Colombia: ALFAOMEGA. MENDENHALL, W. (1990). ESTADISTICA PARA ADMINISTRADORES (1era ed.). (N. GREPE P, Ed., & D. VALCKX VERBEECK, Trad.) México D. F., México: Grupo Editorial Iberoamérica S.A. de CV.

Page 7: ESTADISTICA DESCRIPTIVA TEMA 07 ESTADIGRAFOS DE DISPERSIÓN

ESTADÍSTICA I

ESTADÍGRAFOS DE DISPERSIÓN

Iván Fernando Suarez Lozano

EJERCICIO RESUELTO. 1. Para pruebas de duración de un producto, se encontraron los siguientes datos.

Usted tiene que decidir cual del conservante va a utilizar basándose en la varianza, desviación estándar y desviación media. Grafique los datos obtenidos. Saque conclusiones. Desarrollo: Los primero que debemos hacer es sacar el promedio de cada una de las mediciones. Utilizando la formula:

n

xn

ii∑

== 1µ

De esta forma tenemos para cada uno de los datos:

Acido

sórbico

Sorbato

sódico

Sorbato

potásico

Promedio 5,6 5,8 5,7

Una vez que hemos hayado los promedios hayamos la varianza para cada uno de los datos. Así: De esta forma tenemos:

20

1,138Dias2 22 =σ =1,056875, que seria nuestra varianza.

Para el caso de la desviación estandar tendríamos:

1,02804426, que es simplemente la raíz cuadrada de la

varianza.

Continuando, para el Sorbato Sódico.

Acido sórbico Sorbato sódico Sorbato potásico

Dato1 5 6 5,5

Dato2 4,5 7 6

Dato3 5 6 6

Dato4 6 6 5,5

Dato5 5 6 5,5

Dato6 4 6 6,5

Dato7 4,5 6 7

Dato8 5 7 6,5

Dato9 6 7 6,8

Dato10 6 7 5,5

Dato11 7 5 5,8

Dato12 5 5 5,5

Dato13 6 5 5,4

Dato14 4 5 5

Dato15 5 5 4,8

Dato16 6 5 4,8

Dato17 7 6 4,7

Dato18 6 6 5,2

Dato19 8 5 5,3

Dato20 6,5 5 5,8

Acido sórbico

−__

Xxi

2__

− Xxi

Dato1 5 -0,575 0,3306

Dato2 4,5 -1,075 1,1556

Dato3 5 -0,575 0,3306

Dato4 6 0,425 0,1806

Dato5 5 -0,575 0,3306

Dato6 4 -1,575 2,4806

Dato7 4,5 -1,075 1,1556

Dato8 5 -0,575 0,3306

Dato9 6 0,425 0,1806

Dato10 6 0,425 0,1806

Dato11 7 1,425 2,0306

Dato12 5 -0,575 0,3306

Dato13 6 0,425 0,1806

Dato14 4 -1,575 2,4806

Dato15 5 -0,575 0,3306

Dato16 6 0,425 0,1806

Dato17 7 1,425 2,0306

Dato18 6 0,425 0,1806

Dato19 8 2,425 5,8806

Dato20 6,5 0,925 0,8556

∑ 21,138

Page 8: ESTADISTICA DESCRIPTIVA TEMA 07 ESTADIGRAFOS DE DISPERSIÓN

ESTADÍSTICA I

ESTADÍGRAFOS DE DISPERSIÓN

Iván Fernando Suarez Lozano

De esta forma tenemos:

20

1,2Dias1 22 =σ =0,56, que seria nuestra varianza.

Para el caso de la desviación estándar tendríamos:

0,74833148, que es simplemente la raíz cuadrada de la

varianza.

Continuando, para el Sorbato Sódico. De esta forma tenemos:

20

,1495Dias8 22 =σ =0,407475, que seria nuestra varianza.

Para el caso de la desviación estándar tendríamos:

0,63833768, que es simplemente la raíz cuadrada de la

varianza.

Resumiendo tenemos:

Sorbato

sódico

−__

Xxi

2__

− Xxi

Dato1 6 0,2 0,04

Dato2 7 1,2 1,44

Dato3 6 0,2 0,04

Dato4 6 0,2 0,04

Dato5 6 0,2 0,04

Dato6 6 0,2 0,04

Dato7 6 0,2 0,04

Dato8 7 1,2 1,44

Dato9 7 1,2 1,44

Dato10 7 1,2 1,44

Dato11 5 -0,8 0,64

Dato12 5 -0,8 0,64

Dato13 5 -0,8 0,64

Dato14 5 -0,8 0,64

Dato15 5 -0,8 0,64

Dato16 5 -0,8 0,64

Dato17 6 0,2 0,04

Dato18 6 0,2 0,04

Dato19 5 -0,8 0,64

Dato20 5 -0,8 0,64

∑ 11,2

Sorbato de

Potacio

−__

Xxi

2__

− Xxi

Dato1 5,5 -0,155 0,024

Dato2 6 0,345 0,119

Dato3 6 0,345 0,119

Dato4 5,5 -0,155 0,024

Dato5 5,5 -0,155 0,024

Dato6 6,5 0,845 0,714

Dato7 7 1,345 1,809

Dato8 6,5 0,845 0,714

Dato9 6,8 1,145 1,311

Dato10 5,5 -0,155 0,024

Dato11 5,8 0,145 0,021

Dato12 5,5 -0,155 0,024

Dato13 5,4 -0,255 0,065

Dato14 5 -0,655 0,429

Dato15 4,8 -0,855 0,731

Dato16 4,8 -0,855 0,731

Dato17 4,7 -0,955 0,912

Dato18 5,2 -0,455 0,207

Dato19 5,3 -0,355 0,126

Dato20 5,8 0,145 0,021

∑ 8,1495

Acido sórbico Sorbato sódico Sorbato potásico

Page 9: ESTADISTICA DESCRIPTIVA TEMA 07 ESTADIGRAFOS DE DISPERSIÓN

ESTADÍSTICA I

ESTADÍGRAFOS DE DISPERSIÓN

Iván Fernando Suarez Lozano

¿Cuál escogería? Debo asumir que el mayor tiempo de duración promedio debe ser el elegido, sin embargo, es importante que tengamos presente que los tiempos son muy cercanos entre sí, por tanto debemos dar prioridad a la desviación de los datos, teniendo presente que debemos dar prioridad a la menor desviación puesto que nos da mayor seguridad en relación a la duración de los tiempos. Podemos asumir entonces que la menor desviación nos dará una mayor seguridad que los datos se desviaran muy poco respecto a la media, por tanto podría asumir que el sorbato de Potasio seria el elegido.

Dato1 5 6 5,5

Dato2 4,5 7 6

Dato3 5 6 6

Dato4 6 6 5,5

Dato5 5 6 5,5

Dato6 4 6 6,5

Dato7 4,5 6 7

Dato8 5 7 6,5

Dato9 6 7 6,8

Dato10 6 7 5,5

Dato11 7 5 5,8

Dato12 5 5 5,5

Dato13 6 5 5,4

Dato14 4 5 5

Dato15 5 5 4,8

Dato16 6 5 4,8

Dato17 7 6 4,7

Dato18 6 6 5,2

Dato19 8 5 5,3

Dato20 6,5 5 5,8

Promedio 5,6 5,8 5,7

Varianza 1,057 0,560 0,407

Desviación estándar 1,028 0,748 0,638