compendio 6

28
COMPENDIO SEIS LIC. JORGE OBANDO ESTADISTICA DESCRIPTIVA

Upload: jaquelinesanchezhernadez

Post on 14-Nov-2015

9 views

Category:

Documents


0 download

DESCRIPTION

COMPENDIO 6

TRANSCRIPT

COMPENDIO SEIS

LIC. JORGE OBANDO

ESTADISTICA DESCRIPTIVAGRUPO 5012015

DESVIACION MEDIA PARA DATOS NO AGRUPADOS

EJEMPLO:Los siguientes datos fueron tomados en el laboratorio de fsica:X = Espacio recorridot = tiempo X Espacio (cm.)10203040

Tiempo (seg.)0.30.40.450.5

Calculemos el tiempo promedio

= 0,413

Miremos como los datos representados en segundos se acercan o se alejan de este valor promedio.

= = 0.06250.063 es el error promedio que se comete al remplazar los segundos de cada medida de cada uno de los datos por 0.413 segundos.Esta distancia corta habla tambin de la homogeneidad de los datos y de la confianza que se le debe tomar a esta media aritmtica

DESVIACION MEDIA PARA DATOS AGRUPADOS

Xi = Marca de clase del intervalo de referencia

= Media Aritmticaf = frecuencia absolutan = nmero de datos

EJEMPLO:La siguiente tabla representa los salarios (Medidos en miles de pesos diarios) de 50 trabajadores entre los que se cuentan, celadoras, aseadoras, secretarias de un ncleo educativo. Determine la desviacin media de estos datos.

SalariosFXif*Xi

*f

100 _ 200200 _ 300300 _ 400400 _ 500500 _ 600600 _ 7001015510551502503504505506501500375017504500275032502001000100200300200015000100010001500

Total 50175007000

= $350.000

== 140

VARIANZA PARA DATOS NO AGRUPADOS

EJEMPLO:En una universidad de la regin se nota que el promedio de los hombres en las notas del primer periodo corresponde a 3.2 y la suma de los cuadrados de todas las notas tiene un valor 900; y la media de las mujeres es de 3 con una suma de cuadrados de 900; determine cul de los dos grupos es mas variable en su rendimiento sabiendo que son 30 hombres y 20 mujeres.

S2h = - = 2 = 30 10.24 = 19,76

S2m = - = 2 = 45 9 = 36

Como la varianza es ms pequea en la de los hombres, podemos decir que el grupo de las mujeres es mas variable en su rendimiento, entendindose por la variabilidad en el hecho de que pueden existir estudiantes mujeres con notas ms bajas que altas.

2. A la rectora del colegio han llegado 15 cajas con libros de diferentes editoriales para ser revisados y evaluados por los docentes. El encargado de abrir las cajas es el rector del colegio. El deber seleccionar los libros por reas para entregarlos a los respectivos profesores. En el transporte de los libros desde la editorial hasta la rectora sufrieron algunos daos. Los siguientes datos representan las cajas y la cantidad de libros que se han daado por caja. C1=1C2=2 C3=0C4=5C5=2C6=3C7=1C8= 4C9=3C10=1C11=0C12=3C13=1C14=0C15=5

3 Cajas cada una con 0 libros daados Total Libros = 04 cajas cada una con 1 libro daado Total Libros = 42 Cajas cada una con 2 libros daados Total Libros = 43 Cajas cada una con 3 libros daados Total Libros = 91 Cajas cada una con 4 libros daados Total Libros = 42 Cajas cada una con 5 libros daados Total libros = 10

Total de cajas 15; total de libros daados 31

Promedio de Libros daados por Caja: = = 2.06

S2 =

Este valor pequeo de desviacin indica que el promedio de libros daados por caja es confiable, se puede afirmar con seguridad dicho valor.

VARIANZA PARA DATOS AGRUPADOS

EJEMPLO:Se desea determinar la desviacin Standard de la situacin econmica de 50 familias clasificadas en diferentes estratos y que pertenecen a la comunidad educativa de un colegio. Los datos expuestos en la siguiente tabla representan los salarios que devengan dichas familias medidos en miles de pesos.Salariosf

100 _ 2001

200 _ 30014

300 _ 40025

400 _ 5007

500 _ 6003

50

Para encontrar el valor de la varianza se elabora la siguiente tabla la que permitir calcular primero la media y con la formula llegar al resultado esperado.

Salarios fXif*Xi(Xi-)2(Xi-)2*f

100 _ 200200 _ 300300 _ 400400 _ 500500 _ 6001142573150 250350450550150350087503150195040000100000100009000040000140000070000270000

17500520.00

$350.000 Salario promedio

S2 = =10.400

DESVIACION STANDART

Ejemplo de Aplicacin

Consideremos la distribucin de datos dado por los siguientes nmeros los que representan el comportamiento de las valoraciones alcanzadas por tres estudiantes en las asignaturas de: Qumica, Fsica, espaol, trigonometra y filosofa para efecto de graficacin se ha hecho la siguiente semejanza.D = 1;I = 2; A = 3; S = 4; E= 5. NombresQumica Fsica Espaol TrigoFilosofa

Juan Carlos SnchezDavid Alejandro Morales Laura Natalia Cspedes IASASAASIDIAAAS

Si reemplazamos la tabla de las valoraciones con su respectiva denominacin obtenemos la tabla.NombresQumica Fsica Espaol TrigoFilosofa

Juan Carlos SnchezDavid Alejandro Morales Laura Natalia Cspedes 234343342123334

Aunque a simple vista podemos determinar cul es el estudiante con mejor desempeo en las cinco asignaturas dejemos que el resultado de la desviacin Standard calculada en Excel sea quien determine el estudiante con mayor variabilidad.

Juan Carlos es el que presenta mayor variabilidad de su promedio, indica que tiene valoraciones bajas y eso perjudica su promedio. David y Laura tienen la misma desviacin Standard y aunque no tienen los mismos las mismas valoraciones a los dos se les pueden clasificar en el mismo rango de rendimiento acadmico.

COEFICIENTE DE VARIACION MEDIA: Por ejemplo, para una coleccin de datos que representan la edad de 15 estudiantes. 108769578106789109

Calculemos la edad promedio

= = 7,9 aosAhora la desviacin Standard

S = = 1,6 aos

Cv = = 0,20

EJERCICIOS DE APLICACIN

1. El ICFES decidi establecer un nuevo currculo para las materias de ciencias y matemticas en las escuelas intermedias pblicas del pas. Para probarlo selecciono 9 escuelas segn la disponibilidad de los maestros de esas escuelas y la recomendacin de las secretarias de Educacin. Luego de implantados los cambios, decidieron demostrar que esas escuelas son representativas del total de escuelas intermedias pblicas del pas. Utilizaron como criterio de representatividad el ingreso promedio (en miles de pesos) de los padres de estudiantes que asisten a esas escuelas. Los resultados se resumen en la siguiente grfica.

Los resultados indican que en las nueve escuelas cerca del 72.5% de los estudiantes estaban bajo el nivel de pobreza, mientras que en la poblacin de escuelas ese porcentaje es del 79.75%. La desviacin estndar poblacional es de 7.8 puntos porcentuales. Su conclusin es que como el 72.5% se encuentra a menos de una desviacin estndar de la media poblacional de 79.75%, entonces no hay diferencia significativa.

La conclusin del centro es errnea PORQUE Las escuelas de la muestra tienen un nivel de pobreza promedio menor que los de la poblacin

2. Los siguientes datos representan las edades de los pacientes admitidos al hospital departamental de Villavicencio durante el mes de agosto de este ao:

37 62 47 54 54 8 63 781 1 16 3 64 2 24 1011 39 16 4 34 22 24 680 4 35 58 71 84 8 10.

Durante el mes de agosto de 2002, la edad media de los pacientes admitidos al hospital de la comunidad era de 8 aos. Hay suficiente evidencia para concluir que la edad media de los pacientes admitidos durante el mes de agosto de este ao es mayor que la edad mediana de los admitidos en el 2002?

I. se debe calcular la media y realizar una diferencia para establecer la evidencia de la afirmacinII. Se debe calcular la varianza para establecer la veracidad de la afirmacinCOMANDOS EN RRESULTADO

>Datos=c(37,62,47,54,54,8,63,7,81,1,16,3,64,2,24,10,11,39,16,4,34,22,24,6,80,4,35,58,71,84,8,10)>Rang=max(Datos)min(Datos)>Rang83

>m=1+3.3*log10(32)>m5,95Se redondea por exceso 6

>C =Rang/m>C13,83Se redondea por exceso a 14

>NRang = C * m>NRang84NRang-Rang= 84 83 = 1Xmin - 0.5 = 0.5Xmax + 0.5 = 84.5

EdadesFxif* xi(Xi-)2(Xi-)2*f

0.5 _ 14.514.5 _ 28.528.5 _ 42.542.5 _ 56.556.5 _ 70.570.5 _ 84.512543447.521.535.549.563.577.590107.5142148.5254310640.72127.977.22278.47941.721996.977688.64639.8528.88835.413766.887987.88

32105220947.54

Con los resultados de la tabla ya se puede hacer:

Media.Variacin

X = 32.8125 = 33

=654.61

La edad promedio de los pacientes en este ao es de: 33 aos.La edad promedio de los pacientes en el 2002 es de: 8 aos.Mediactual-Media2002= 33-8= 25

3. Una compaa recoge informacin sobre los precios de libros de texto de matemticas. En el 2000, el precio promedio para todos los textos de matemticas era de $45.400, con una desviacin tpica de $100. Los precios de 32 libros de matemticas seleccionados al azar durante este ao son:50 40 41 48 48 42 49 5048 45 56 41 57 42 45 4645 66 45 45 55 66 42 5046 46 55 48 45 58 47 35El precio promedio de los libros para este ao es mayor que el precio de los libros en el ao 2000 POR QUE, el coeficiente de variacin es tambin mayor.

COMANDOS EN RRESULTADO

>Datos=c(50,40,41,48,48,42,49,50,48,45,56,41,57,42,45,46,45,66,45,45,55,66,42,50,46,46,55,48,45,58,47,35)>Media=mean(Datos)>49

MediaVariacinCoeficiente de variacin

X = 48.1875= 49

>X=c(35,40,41,42,45,46,47,48,49,50,55,56,57,58,66)> D2=sum(Media-X)^2> D2[1] 148.5352> Var=D2/n> Var[1] 4.641724

> Cv=(sqrt(Var)/Media)*100> Cv[1] 4.471006> Cvx=45.4/100> Cvx[1] 0.454

El precio promedio actual de los libros: $48.187El precio promedio de los libros en el ao 2000: $45.400

4. Multiplicando por 4 cada uno de los valores de la variable, X: 3, 2, 0, 5, se obtiene la serie Y: 12, 8, 0, 20, Para comprobar que las series tienen el mismo coeficiente de variacin se debe

Calcular las medias de ambas series Calcular la Varianza de ambas series

MediasVarianzaDesviacin estndarcoeficiente d variacin

= 2.5 = 10

S2=

S2=

= 1.80

= 7.21 =72%= 72%

5. En una universidad de la capital, se ha Encontrado que los promedios en los 4 primeros semestres de las notas de Matemticas corresponden a: 3.2, 3.4, 3.0, 3.8, si la cantidad de alumnos matriculados fue de 30, 35, 40, 22 respectivamente, y sabiendo que existe un 4 de Varianza, entonces el coeficiente de variacin del promedio total de las notas de los cuatro semestres corresponde a:

A. 60.6 %B. 70.6%C. 75.6%D. 65.6% E. 55.6%

1semestre2semestre3 semestre4semestre

Notas3.23.43.03.8

matriculados30354022

NotaF

3,230

3,435

3,040

3,822

127

MediaVariacinDesviacin estndarCoeficiente de variacin

Notas=c (3.2, 3.4, 3.0, 3.8)Matriculados=c(30,35,40,22)nMatriculados=sum (Matriculados)Media=sum (Matriculados*Notas)/nMatriculadosMedia[1] 3.296063

=4

= 2

=60%

6. En una distribucin de datos correspondientes a salarios de 50 educadores de un colegio, Se encontr que el salario promedio es de $600.000, con una varianza de $625, se puede concluir que:

1. La varianza en el ejemplo representa una buena medida para establecer la veracidad del dato promedio.2. $600.000 de acuerdo a la desviacin Standard no es una medida suficiente representativa.3. La media de $600.000 es suficientemente representativa ya que la desviacin estndar es pequea.4. La media no est acorde con la realidad lo dice el enorme tamao de la Varianza.

MediaVarianzaDesviacin estndarCoeficiente de variacin

600

= 25

Cv=4,16%

7. Mediante una curva normal y utilizando las desigualdades de TChebycheff se diseo un modelo para cualificar el desempeo acadmico de los estudiantes de la U.C.C en el programa de Sistemas. D = deficiente

R = Regular

B=bueno

S=Sobresaliente

E=Excelente

O=Optimo

.Si en total existen 180 estudiantes con un promedio total de 3,4 y un coeficiente de variacin del 2.5%, entonces cuntos estudiantes sobresalientes tiene la facultad?

nMediaCoeficiente de variacinPorcentajesEstudiantes sobresalientes

180

3,4

2,5%D = 2%

R = 10%

B=55%

S=25%

E=5%

O=3%

180 100% X 25%

=45

A. 100 B. 96 C. 45 D. 99 E. 9

8. La Varianza de todo el grupo corresponde a:A. 0.085B. 0.025C. 7.2D. 0.085E. 0.0072

Coeficiente de variacinVarianzaDesviacin estndar

=2,5%

= 0,085

9. Una cantidad que se toma en cuenta para evaluar proyectos azarosos es la desviacin estndar. sta mide la dispersin de los resultados del proyecto azaroso. Es decir, si hay dos proyectos: A y B. Y si la desviacin estndar del rendimiento del proyecto A es mayor que la del B. El proyecto A es ms arriesgado, el B es ms Estable. Si ambos tienen valor esperado parecido el A tiene posibilidades de rendir mucho ms que el B pero, tambin el A tiene posibilidad de generar mayores prdidas que el B. La Afirmacin anterior es verdadera porque:

A. La desviacin Standard mide la variabilidad de dos grupos A y B cualquiera.C. La desviacin Standard permite comparar a dos grupos y decidir la estabilidad del uno con respecto al otro.D. La desviacin Standard mide el margen de error de un grupo con respecto a otro.E. La desviacin Standard mide la distancia entre los datos y la media aritmticaF. La desviacin Standard mide el margen de error cometido al usar la media en una distribucin

10. La resistencia de 100 baldosas de la fabrica De las casas se referencia en la siguiente tabla.

Kg./Cm2F

100_ 200200_ 300300_ 400400_ 500500_ 600600_ 700700_ 80041021331895

100

xif* xi(Xi-)2(Xi-)2*f

1502503504505506507506002500735014850990058503750888043920496044104044080491204355216392040201684132187272367236456020

44.8001.959.600

SI el promedio de salario en la fbrica de Las casas es de $541.000 y la desviacin Standard es $1.791

Concluimos que:

A. Es mucho ms dispersa la informacin correspondiente a la resistencia de las baldosas.B. Es mucho ms dispersa la informacin correspondiente al salario de los empleados.C. Ambas informaciones presentan la misma dispersin y por tanto no se puede tomar una decisin.D. La Varianza en los salarios es diferente en la resistencia de las baldosas eso hace que el anlisis entre las dos informaciones sea indiferente

11. Se consulto en 30 almacenes de la capital el precio de monitores para computador y se obtuvo los siguientes resultados en miles de pesos.

100101120115130150112145138121126115140137143118147149150115100127135149146137122118135129

Elabore una distribucin de frecuencias, para datos agrupados, indicando los valores de los lmites reales. Y calcule: Cuartil 2, Coeficiente de variacin, Interpretacin con respecto al Cv.

COMANDOS EN RRESULTADO

>Datos=c(100,100,101,112,115,115,115,118,118,120,121,122,126,127,129,130,135,135,137,137,138,140,143,145,146,147,149,149,150,150)>Rang=max(Datos)min(Datos)>Rang50

>m=1+3.3 log10(30)>m5,851Se redondea por exceso a 6

>C =Rang/m>C8,33Se redondea por exceso a 9.

>NRang = C * m>NRang=9*6

>NRang54NRang-Rang= 54 50= 4Xmin - 2 = 98Xmax + 2= 152

PreciosfFxif* xi(Xi-)2(Xi-)2*f

98 _ 107107 _ 116116 _ 125125 _ 134134 _ 143143 _ 1523454773712162330102,5111,5120,5129,5138,5147,5307,5446602,5518969,51032,5712,89313,2975,690,0986,49334,892138,671253,16378,450,36605,432344,23

3038766720,3

Con los resultados de la tabla ya se puede hacer:

Clculo de la mediavariacin

Desviacin estndar

Coeficiente de variacin

segundo Cuartil

X = 129.2= 130

= 224,01

= 14.9669

= 11%

Q2 =

= 15 sabemos que las operaciones se harn en el cuarto intervalo ya que en las frecuencias acumuladas el valor de 15 queda perfectamente contenido en 16.Por tanto: Li = 125 Fa = 12 C=9

=15 fo=4

Q2 = . = 125 + *9 = 131,75Lo que indica que el 50 % de los precios de los monitores corresponden a $131.450

SEGUNDO CUARTIL

COMANDOS EN RRESULTADO

>precios=c(100,100,101,112,115,115,115,118,118,120,121,122,126,127,129,130,135,135,137,137,138,140,143,145,146,147,149,149,150,150)>quantile(precios,prob=seq(0,1,length=5),type=6)0% 25% 50% 75% 100% 100.00 117.25 129.50 143.50 150.00

13. En los siguientes enunciados uno es verdadero.

A. La media en una muestra de datos agrupados la divide en dos partes iguales.B. Una distribucin de datos permite calcular todas las medidas de tendencia centralC. La moda es un dato que permite analizar un resultado esperado.D. Una medida de dispersin esta libre del clculo de la media

14. Cuando la media aritmtica de un determinado nmero de datos es $270.50 y la desviacin tpica es de $33.99, el coeficiente de variacin (CV) es igual a:

A. 6.2%B. 795.82%C. 2.6%D. 5.4%E. 1.8%