Download - APUNTES DE ESTADISTICA DESCRIPTIVA
Estadística Descriptiva
1 Ing. Wilson A. Velastegui. Ojeda. Msc
WILSON ANTONIO VELASTEGUI OJEDA
ESTADÍSTICA DESCRIPTIVA
“Las cosas complejas y estadísticamente
improbables, son por naturaleza más
difíciles de explicar que las cosas simples y
estadísticamente probables”. Richard
Dawkins
Estadística Descriptiva
2 Ing. Wilson A. Velastegui. Ojeda. Msc
WILSON ANTONIO VELASTEGUI OJEDA
LUGAR DE NACIMIENTO Riobamba –Ecuador
ESTUDIOS REALIZADOS: SECUNDARIA:
Colegio Nacional de Comercio y Administración “Juan de Velasco” (Riobamba)
Título: Bachiller en Ciencias de Administración y Contabilidad
SUPERIOR:
Escuela Superior Politécnica de Chimborazo (ESPOCH), Riobamba – Ecuador
Título: Ingeniero en Empresas
Universidad Regional Autónoma de los Andes (UNIANDES), Ambato – Ecuador
Título: Diplomado Superior en Investigación de la Educación a Distancia y Abierta
Universidad Regional Autónoma de los Andes (UNIANDES), Ambato – Ecuador
Título: Especialista en Diseño Curricular y Material Educativo para la Educación a Distancia
Universidad Regional Autónoma de los Andes (UNIANDES), Ambato – Ecuador
Título: Magister en Educación a Distancia y Abierta
PRÁCTICA DOCENTE:
Catedrático universitario de la Escuela Superior Politécnica de Chimborazo Facultad de Administración de Empresas, Escuela: Ingeniería en Contabilidad y Auditoría por cinco años en las asignaturas de Contabilidad General, Contabilidad Comercial, Contabilidad de Sociedades, Paquetes Contables, Proyecto Integrador, Control de
Estadística Descriptiva
3 Ing. Wilson A. Velastegui. Ojeda. Msc
Costos y Presupuestos por ordenador, Auditoría Interna, Informática Aplicada y Matemáticas para los Negocios
Catedrático universitario de la Escuela Superior Politécnica de Chimborazo Facultad de Administración de Empresas en la Unidad de Educación a Distancia de la FADE, por cuatro años en las asignaturas de Contabilidad General, Paquetes Contables, Presupuestos, Contabilidad Superior, Contabilidad Financiera, Contabilidad de Costos, Contabilidad del Sector Financiero y Auditoria Financiera.
Docente del Instituto Tecnológico República Federal de Alemania (Riobamba – Ecuador), por cinco años en las asignaturas de Contabilidad General, Contabilidad Comercial, Contabilidad de Costos, Presupuestos, Auditoria Financiera, Auditoria Administrativa, Mónica 8.0, Tmax 2000, Planificación Estratégica, Administración General, Administración de Recursos Humanos y Matemática Financiera
DATOS DE CONTACTO: Celular: 0999775143
Teléfono: 2962018 Mail: [email protected]
Página web: www.wavo.galeon.com Publicaciones: www.slisdeshare.net/wilsonvelas
Estadística Descriptiva
4 Ing. Wilson A. Velastegui. Ojeda. Msc
CONTENIDOS DEL MÓDULO
PRIMERA UNIDAD: CONCEPTOS BÁSICOS
Objetivos Contenidos 1. Introducción Histórica 2. Concepto de Estadística Descriptiva 3. Clasificación de la Estadística
3.1. Estadística Descriptiva (Deductiva) 3.2. Estadística Inferencial (Inductiva) 3.3. Esquema de Estadística Inductiva
4. Organización de Datos 5. Variables Estadísticas
5.1. Variables Discretas 5.2. Variables Continuas
Actividad de Aprendizaje No.1 Auto evaluación No. 1
SEGUNDA UNIDAD: DESCRIPCION DE UN CONJUNTOS DE DATOS Objetivos Contenidos 1. Descripción de Datos 2. Procedimiento para agrupar los datos. 3. Distribución de Frecuencias, intervalos y marcas de clase. 4. Representación gráficas de los datos
4.1 Histograma 4.2 Polígono de frecuencia 4.3 Diagrama de distribución u ojiva 4.4 Diagrama de pastel o ciclograma 4.5 Diagrama de barras
Actividad de Aprendizaje No. 2 Auto evaluación N.2
TERCERA UNIDAD: MEDIDAS DE TENDENCIA CENTRAL
Objetivos Contenidos 1. Introducción Histórica 2. Medida Aritmética o promedio para datos no agrupados 3. Mediana para datos no agrupados 4. Moda para datos agrupados 5. Media aritmética para datos agrupados 6. Mediana para datos agrupados 7. Moda para datos agrupados
Actividad de Aprendizaje No. 3 Auto evaluación No.3
Estadística Descriptiva
5 Ing. Wilson A. Velastegui. Ojeda. Msc
CUARTA UNIDAD: MEDIDAS DE DISPERSION
Objetivos Contenidos 1. Cuartiles, Deciles, y Percentiles para datos no agrupados. 2. Cuartiles, Deciles, y Percentiles para datos agrupados. 3. Medidas de dispersión para datos no agrupados y agrupados. 4. Desviación Media para datos no agrupados y agrupados. 5. Varianza y desviación típica para datos agrupados y no agrupados 6. Forma de Distribución de frecuencias 7. Curtosis
Actividad de Aprendizaje No. 4 Auto evaluación No.4
Estadística Descriptiva
6 Ing. Wilson A. Velastegui. Ojeda. Msc
PRE – TEST O PRUEBA DE DIAGNOSIS
1. Escriba los diez primeros múltiplos del número 7 2. ¿Halle el divisor de los números: 12, 15, 30, 39? 3. Si hay 15 mujeres en un grupo de 65 estudiantes. ¿Qué porcentaje del grupo
representan las mujeres? y ¿Qué proporción de grupo representan los varones?
4. Suponga que: X1 = 4, X2 = 8, X3 = 8, X4 = – 6, Halle el resultado de:
4
1i
Xi X1 + X2 + X3 =
5. Redondee los siguientes números decimales:
a) 1,0519 a tres dígitos b) 125,84 a tres cifras enteras c) 425,45 a una cifra decimal d) 1 25,0126 a tres dígitos
6. Si n1 = 7; n2 = 9; y n3 = -6. ¿Cuánto vale n = ?
7. ?)2/5/()3(/22/9()53(21
8. Dé los valores absolutos de 1.96 y –1.96
9. Si X1 = 25 y X = 29, y si K = X1 – X, ¿Cuál es el valor absoluto de (K)?
10. Si ?¿,20;10,45000, 22222 xcuántovaleynysinyyx
11. Si 22 )(
))((
1 xxn
yxxynB
, donde
.22420;82;460;3995,10 2 xyxxyn Halle B1
12. Dado los siete valores de X y de Y aquí indicados:
X = 8, 12, 10, 11, 8, 7, 6 Halle X =
Y = 9, 10, 8, 9, 8, 7, 7 Halle Y =
13. Dado el siguiente conjunto de datos: 2, 1, 8, 5, -1, 3, 9. Ordene en forma ascendente y en forma descendente.
Estadística Descriptiva
7 Ing. Wilson A. Velastegui. Ojeda. Msc
14. Si tengo los siguientes números: 48.5 y 20.2. ¿Cuál es el mayor valor y cuál es el menor valor? y cuál es su diferencia?
15. Usted como estudiante considere ser una variable Y quién financia sus estudios sea una variable X ¿Cuál es la variable dependiente y cuál la variable independiente?
16. Si )()( 22 yx
xyr
, despeje ( 2)( x
Estadística Descriptiva
8 Ing. Wilson A. Velastegui. Ojeda. Msc
PRIMERA UNIDAD: CONCEPTOS
BÁSICOS
“No dejes que lo que no puedes hacer, interfiera con lo que puedes hacer” (Autor Desconocido)
OBJETIVOS:
Al término de esta unidad el estudiante estará en capacidad de:
Dar el concepto de estadística.
Diferenciar entre una población y muestra
Distinguir entre variable continua y una variable discreta
DESARROLLO DE CONTENIDOS
1.- INTRODUCCION HISTORICA.
La Estadística se estructuró como disciplina científica, en el siglo pasado pero ya se conocía
y se utilizaba en la antigüedad. La misma puede catalogarse en orden cronológico en los
siguientes antecedentes:
a.- Las antiguas civilizaciones, como por ejemplo la de Egipto realizaban relevantamientos
estadísticos (captación de datos), debido a las inundaciones del río Nilo, efectuaban censos
anuales, los mismos que permitan conocer como distribuir los bienes y reparto de
propiedades para que fueran restituidos.
También., se sabe que los griegos levantaban censos demográficos (nacimientos, muertes,
casamientos, etc.) y de propiedad.
b.- En la época del Imperio Romano se aplicaba censos poblacionales y de bienes a los
pueblos sometidos al imperio con objeto de aplicar el régimen de impuestos.
En la época moderna, la técnica censal adquirió un gran desarrollo llegando constituirse un
eficaz auxiliar de las tareas gubernamentales.
2.- CONCEPTO DE ESTADISTICAS DESCRIPTIVA
La Estadística es la ciencia de recolectar, organizar, representar, analizar e interpretar datos
para ayudar en una toma de decisiones más efectiva.
Dicho de otro modo la Estadística se refiere a la colección, representación y utilización de
datos numéricos para realizar inferencias y alcanzar decisiones ante la incertidumbre que
plantean muchas disciplinas que van desde las ciencias, la ingeniería, las leyes, la medicina, la
economía, la administración y otras ciencias, sociales y físicas.
Estadística Descriptiva
9 Ing. Wilson A. Velastegui. Ojeda. Msc
El aspecto más importante de la estadística es la obtención de conclusiones basadas en los
datos experimentales.
3.- CLASIFICACIÓN DE LA ESTADÍSTICA
La Estadística se subdivide en: Descriptiva e Inductiva.
3.1.- Estadística Descriptiva:- Se refiere a la recopilación y descripción de un grupo de datos.
Es aquella que estudia toda la población.
3.2.- Estadística Inductiva:- Es el proceso para lograr generalizaciones acerca del todo
(llamado la población) examinando una parte de ella (llamada la muestra). Para que esto
sea valido, la muestra debe ser representativa de la población.
3.3.- Esquema de Estadística Inductiva
Veamos que significa población y muestra
Población:- Es la colección de toda la posible información que caracteriza a un fenómeno.
La población- o Universo puede ser tan grande o pequeña.
Muestra:- Es mi subconjunto representativo seleccionado de una población.
4.- ORGANIZACION DE DATOS
Los datos sin organizar carecen de sentido, es decir los datos brutos no permiten interpretar
nada acerca de la información obtenida. Por esta razón es necesario organizar los datos, lo
cual se realiza dependiendo del tipo de variable con la que se esta trabajando. Veamos que
significa variable.
Variable:- Es la que asume distintos valores en un evento o proceso, y pueden ser números
o cantidades/ Ejemplo: salarios, precios, edades, peso, estatura, etc.
5.- VARIABLES ESTADISTICAS
Las variables estadísticas pueden ser de dos clases: discretas y continuas.
INDUCCION
Encuesta
Muestra Población
Estadística Descriptiva
10 Ing. Wilson A. Velastegui. Ojeda. Msc
5.1.- VARIABLES DISCRETAS.- Son aquellas que asumen valores específicos o
determinados, en general son números enteros y sirve para contar o enumerar. Eje: El
número de trabajadores de una empresa, el número de habitantes de un país, el numero de
alumnos del ISTRA, etc. La variable discreta no tiene un límite determinado.
5.2.- VARIABLES CONTINUAS
Son aquellas que asumen valores determinados en un rango, pueden ser enteros o
fraccionarios y sirven para medir.
Ejemplo: La temperatura, el peso, la estatura, la edad, etc.
Estadística Descriptiva
11 Ing. Wilson A. Velastegui. Ojeda. Msc
1.- Narre de dos a cinco Historias de la humanidad, o de su país, provincia, cantón,
parroquia, o comunidad, donde se haya aplicado el concepto de Estadística de forma
empírica. Es decir sin que haya sido considerada como ciencia.
2.- Describa en forma general desde cuando usted conoció la ciudad de Riobamba.
3.- De los siguientes ítems compare y diga cual es población y cual es muestra
a) Número de periódicos vendidos a la semana en el mundo
b) Número de periódicos vendidos a la semana en Ecuador
c) Número de periódicos vendidos a la semana en la ciudad de Riobamba
d) Estudiantes de todas las universidades del mundo
e) Estudiantes de todas las universidades europeas
f) Estudiantes de todas las universidades españolas
g) Estudiantes de todas las universidades americanas
h) Estudiantes de todas las universidades ecuatorianas
i) Estudiantes de todas las universidades de la ciudad de Riobamba
4.- Escriba 10 ejemplos de Población y 10 de muestra
5.- ¿A que tipo de variable corresponde las siguientes expresiones?:
a) Promedio de calificación de los estudiantes
b) Distancia que los estudiantes recorren para llegar a clases
c) Calificaciones de estudiantes en el primer examen parcial de Estadística
d) Clasificación de alumnos de acuerdo a la provincia que nacieron
e) Número de horas de estudio de los estudiantes del ISTRA
f) Edad de los estudiantes del Unidad Educativa Sultana de los Andes
ACTIVIDAD DE APRENDIZAJE No. 1
Estadística Descriptiva
12 Ing. Wilson A. Velastegui. Ojeda. Msc
g) Peso de todos los que integran el Instituto República de Alemania “ISTRA”
6.- Escriba 10 ejemplos de variable discreta y 10 ejemplos de variable continua
7.- Luego de haber leído cualquier periódico o revista relacionado a la economía. Haga un
resumen y diga que tipo de variable o variables intervienen en la misma.
8.- Describa con sus propias palabras cómo se puede utilizar la estadística para resolver
problemas en diversas disciplinas y puestos de trabajo
9.- El presidente de una asociación de estudiantes quiere tomar una muestra de las
opiniones de los 150 miembros en relación con las actividades de recreación para el período
académico que empezará en el mes octubre.
a) ¿Cuál es la población? b) ¿Cuál sería la mejor manera de tomar la muestra?
10.- ¿Qué tipo de variable representan las siguientes designaciones?
a) Los estudiantes califican a su profesor de estadística en una escala de: Horrible, no tan
malo, bueno, magnífico. serio, estricto.
Estadística Descriptiva
13 Ing. Wilson A. Velastegui. Ojeda. Msc
SEGUNDA UNIDAD: CONCEPTOS
BÁSICOS
“No dejes que lo que no puedes hacer, interfiera con lo que puedes hacer” (Autor Desconocido)
OBJETIVOS:
Al término de esta unidad el estudiante estará en capacidad de:
Diferenciar entre un conjunto de datos no agrupados y agrupados.
Agrupar un conjunto de datos
Determinar la marca de clase y distribuciones de frecuencias
Realizar representaciones gráficas de los datos de un conjunto.
DESARROLLO DE CONTENIDOS
1. DESCRIPCION DE DATOS U OBSERVACIONES
Al número de datos u observaciones se lo representan con n. Para describir los dates puede
presentar dos casos:
1er CASO:- Cuando el conjunto de observación tiene pocos datos o valores
Ejemplo. Un estudiante durante un semestre dio diez exámenes parciales calificados sobre
diez (10 puntos), obteniendo los siguientes resultados:
6 – 7 – 6 – 8 – 5 – 7 – 6 – 9 – 10 y 6. En este ejemplo, n = 10 (número de datos).
Para este tipo de conjunto (o estadística) primero se hace un cuadro o una tabla, luego en la
primera columna del cuadro se ordenan los datos o valores ya sea en forma ascendente o
descendente (creciente o decreciente) en la segunda columna se ponen el número de los
valores que se repiten, al número que se repite se llama frecuencia (f).
Esto lo visualizamos mediante el siguiente cuadro.
Estadística Descriptiva
14 Ing. Wilson A. Velastegui. Ojeda. Msc
Notas
Frecuencia (f)
Absoluta
5
1
6
4
7
2
8
1
9
1
10
1
TOTAL n = 10
2do. CASO. - Cuando el conjunto de observación tiene muchos valores diferentes
Para este caso se emplea un procedimiento llamado “Agrupamiento de datos". Esto es
posible cuando el numero do datos es mayor que 30 (n >30)
OBSERVACIÓN:- El número de clases que se emplea para agrupar los datos en un
conjunto depende del número de datos.
* Si el numero de datos es pequeño, el numero de clases a emplear será cercano a cinco
(5), pero generalmente nunca menos que cinco (5)
* Si existe una cantidad elevada de datos, el número de clases debe encontrarse entre ocho
(8) y doce (12) clases
* En general el número de clases puede encontrarse entre 5 a 15 clases, el número de
clases se puede elegir uno mismo (entre 5 a 15)
Para saber en cuantos grupos o clases agrupamos estos datos, se utiliza la formula de Sturges K= 1+3,322 Log (n), donde K. es el numero de clases y n es el número de dates u observaciones. Esto se clarifica mediante el siguiente ejemplo:
La demanda diaria, en unidades de un producto, durante 30 días de trabajo es:
105 106 105 107 109 111 110 110 107 107 104 99 103 99 103
101 100 101 100 103 98 92 97 94 95 95 93 95 95 95
91 82 91 85 90 86 87 89 87 89
Estadística Descriptiva
15 Ing. Wilson A. Velastegui. Ojeda. Msc
El número de datos u observaciones es n = 40. Como el número de datos es mayor que 30,
agrupamos los datos utilizando la fórmula de Sturges:
K = 1+3,322 log (n)
K = 1+3.322 log (40)
K = 1+3,322 (1.60205)
K = 1+5,322
K = 6,32 = 6 Por tanto los 40 datos podernos agrupar en 6 grupos intervalos o
Clases
2. - PROCEDIMIENTO PARA AGRUPAR LOS DATOS
1.- Ordenamos los datos en forma creciente o decreciente (ascendente o descendente)
2.- Encontramos el dato mayor y el dato menor, llamado también observación mayor (OM) y
observación menor (om). Con estos datos encontramos el rango o recorrido, en formula es:
Rango = R = OM – om
3.- Determinamos el numero de clases o grupos (K), utilizando la fórmula de Sturges, (en
nuestro ejemplo anterior K=6).
4.- Hallamos o determinamos la longitud o amplitud del intervalo de la clase, que se designa
con la letra C, en formula es:
K
R
clasesdeNúmero
RangoC
...., C= es la amplitud de la clase
5.- Preparamos un cuadro con 3 columnas, para las clases, limite de clases y en frecuencia,
esto es
CLASE LIMITE DE CLASE FI
Estadística Descriptiva
16 Ing. Wilson A. Velastegui. Ojeda. Msc
6.- En la columna de límites de clase anotamos como límite inferior (Li) de la clase a la
observación menor. Luego de acuerdo a la amplitud del intervalo de la clase (C), incluimos
tantos datos hasta el límite superior (Ls), así sucesivamente iremos anotando en clase,
hasta llegar a la última clase en la que debe escribir incluido el dato mayor
7.- Finalmente contamos cuantos datos están incluidos en cada clase y lo ponemos en la
columna de las frecuencias (f)
Ejemplo. Dado conjunto anterior aplique los pasos y agrupe este conjunto de datos
105 106 105 107 109 111 110 110 107 107 104 99 103 99 103
101 100 101 100 103 98 92 97 94 95 95 93 95 95 95
91 82 91 85 90 86 87 89 87 89
1.- Ordenamos los dates del ejemplo que estamos tratando en forma ascendente
82 85 86 87 87 89 89 90 91 91 92 93 94 95 95 95 95 95 97 98
99 99 100 100 101 101 103 103 103 104 105 105 106 107 107
107 109 110 110 111
2.- Hallamos el Rango
R = OM – om
R = 111 – 82 = 29
3.- Determinamos el número de clases. K = 1+3,322 log(40) = 6, (K=6)
4.- Determinamos la amplitud del intervalo de la clase.
C = R/K 29/6 = 4.83
C = 5
5.- Preparamos una tabla con 3 columnas
Estadística Descriptiva
17 Ing. Wilson A. Velastegui. Ojeda. Msc
Clases
Límites de Clases
Frecuencia fi
1
82 – 86
3
2
87 – 91
7
3
92 – 96
8
4
97 – 101
8
5
102 – 106
7
6
107 – 111
7
TOTAL n = 40
EJEMPLO.- En un centro distribuidor de electrodomésticos, la demanda diaria de televisores
de 14 pulgadas durante 31 días de trabajo es:
38 – 35 – 76 – 58 – 48 – 59 – 67 – 63 – 33 – 69 – 53 – 51 – 28 – 25 – 36 – 32 – 61 – 57 – 49
– 78 – 48 – 42 – 72 – 52 – 47 – 66 – 58 – 44 – 44 – 56. Agrupe este conjunto de datos
1.- Ordenamos los datos en forma ascendente
25 28 32 33 35 35 38 42 44 44
47 48 48 49 51 52 53 56 57 58
58 59 61 63 66 67 69 72 76 78
2.- R = 78 - 25 = 53
3.- K = 1+ 3,3221og(30)
K = 1+ 4.9 = 5.90 = 6
4.- C = R / K = 53 / 6 = 8.833 = 9
5.- Presentamos los datos en columnas
CLASE Li – Ls F
1 25 – 33 4
2 34 – 42 4
3 43 – 51 7
4 52 – 60 7
5 61 – 69 5
6 70 – 78 3
TOTAL n = 30
Estadística Descriptiva
18 Ing. Wilson A. Velastegui. Ojeda. Msc
NOTA:- Para ordenar los datos es conveniente saber si los datos se trata de atributos o
variables
Atributo:- Son los que expresan cualidades. Eje: bueno, malo, masculino femenino
Variable:- Es la que asume distintos valores en un evento, generalmente son números.
Para ordenar datos que son atributos es conveniente clasificar de acuerdo con las
categorías, el atributo puede dividirse. Por Ejemplo: si queremos ordenar datos
correspondientes a calificaciones de exámenes serán, sobresaliente, muy buena, buena,
regular, insuficiente.
Pero, si queremos ordenar datos correspondientes a variables, hay que ordenar los valores
en forma creciente o decreciente (ascendente o descender, (e)
3.- DISTRIBUCIONES DE FRECUENCIAS, INTERVALOS Y MARCA DE CLASE.
Para hacer la descripción gráfica de los datos es necesario conocer algunos elementos de la
estadística
3.1.- LIMITES DE INTERVALOS DE CLASE
Todo grupo, intervalo o clases tiene dos límites: Límite inferior (Li) y límite superior (Ls)
3.2.- PUNTOS MEDIOS 0 MARCAS DE CLASES (Xc)
Cuando estamos trabajando con datos agrupados es conveniente buscar para cada
intervalo un valor que lo represente. Este valor se llama punto medio o marca de clase, que
se representa con Xc, en formula es:
Por ejemplo: en el intervalo
29
2/58
33,25,3325
23325
Xc
Xc
LsLi
Xc = 29 es el punto medio o marca de clase
2
sic
LLX
Estadística Descriptiva
19 Ing. Wilson A. Velastegui. Ojeda. Msc
3.3.- FRECUENCIA ABSOLUTA
Es el número de veces que se repite un dato, o el número de datos que sc encuentre dentro
de un intervalo o clase, se lo representa con la letra "F minúscula, es decir a este tipo de
frecuencia se llama Frecuencia Absoluta.
3.4.-FRECUENCIA RELATIVA
Se obtiene dividiendo el número de datos u observaciones de la clase o grupo para el
número total de datos u observaciones:
se representa con la letra (fr), en fórmula es:
n
f
datosdetotalNúmero
clasededatosdeNúmerofr
......
........
3.5. FRECUENCIA ACUMULADA ( Fa )
Se obtiene de la siguiente forma: En la primera clase se pone la frecuencia absoluta del
mismo, en la segunda clase se pone la suma de la frecuencia de la primera clase con la
segunda clase, y así sucesivamente hasta la suma con la frecuencia de la última clase.
3.6.- FRECUENCIA RELATIVA ACUMULADA
Se obtiene de forma similar que la frecuencia acumulada, pero sumando las frecuencias
relativas correspondientes. La suma de todas las frecuencias relativas es igual a 1en
formula es:
K
Ikr ffff
121 1.....
3.7.- PORCENTAJE
El porcentaje se obtiene multiplicando la frecuencia relativa por 100, en formula es:
P = 100(%) xfN
f
r
Estadística Descriptiva
20 Ing. Wilson A. Velastegui. Ojeda. Msc
Aplicando esta formula se obtiene el porcentaje, cuyo resultado debe expresarse con %
(tanto por ciento). La suma de todos los porcentajes es igual a 100%
Ejemplo: Dada la siguiente tabla hallar:
a) El punto medio, b) Frecuencia acumulada, c) frecuencia relativa, d) frecuencia relativa
acumulada y e) el porcentaje.
Clase
Límite de clase
Li – Ls
Frecuencia
f
Punto Medio
Xc
Fa
fr
fra Porcentaje %
P 1
25 – 33
4
29
4
0.13
0.13
0.13X100=13
2
34 – 42
4
38
8
0.13
0.26
0.13X100=13
3
43 – 51
8
47
16
0.26
'0.52
0.26X100=26
4
52 – 60
7
56
23
0.23
0.75
0.23X100=23
5
61- 69
5
65
28
0.16
0.91
0.16X100=16
6
70 – 78
3
74
31
0.09
1.00
0.09X100=9
TOTAL n = 31 1.00 100%
4.- REPRESENTACION GRAFICA DE LOS DATOS
La representación gráfica de los datos es un medio eficaz para el análisis de las
estadísticas, que nos permiten ver el comportamiento de los datos en mi conjunto del cual
se este investigando. Para luego sacar sus conclusiones.
La representación gráfica de los datos constituye mi medio auxiliar de la investigación
estadística pues esta se fluidamente en la descripción.
SISTEMAS DE REPRESENTACION.- El sistema de representación mas usual es el
PLANO CARTESIANO, en el eje X se ponen los valores distintos de la variable para dates
no agrupados y los límites de clases para los datos agrupados, en el eje Y se ponen las
frecuencias absolutas (o frecuencias relativas), Veamos las representaciones gráficas mas
usuales en la estadística
4.1.- HISTOGRAMA.- El histograma es un gráfico que tiene un conjunto de rectángulos de
igual base y de altura igual a su respectiva frecuencia absoluta o frecuencias relativas.
Para construir un histograma se traza primero en el primer cuadrando positivo del plano
cartesiano, luego en el ej. X se anotan los limites inferiores; y superiores de las clases,
procurando que haya una continuidad o coincidencia, Esto es que, el límite superior de una
clase se constituye en límite inferior do In siguiente clase
NOTA:- Para esto es necesario hallar los limites reales (L-R) de la clase. En el eje Y que
corresponden a sus alturas se ponen sus respectivas (frecuencias.
Estadística Descriptiva
21 Ing. Wilson A. Velastegui. Ojeda. Msc
Ejemplo: dado los siguientes datos de la siguiente tabla grafique el histograma
Clase Límites de clase f L – R
1 25 – 33 4 24,5 – 33,5
2 34 – 42 4 33,5 – 42,5
3 43 – 51 8 42,5 – 51,5
4 52 – 60 7 51,5 – 60,5
5 61 – 69 5 60,5 – 69,5
6 70 – 78 3 69,5 – 78,5
Total N = 31
Histograma: de la demanda diaria de la venta de televisores
4.2.- POLÍGONO DE FRECUENCIA.- Es un gráfico lineal, su construcción es similar al
histograma; para su construcción se unen los puntos medios de cada clase, con sus
respectivas frecuencias; de tal manera que al unir sus puntos medios por segmentos forman
un polígono
Ejemplo: dado los siguientes datos de la tabla construya el polígono de frecuencia
Clase
Limites de Clase
f
L.R
Xc
1
25 – 33
4
24.5 - 33.5
29
2
34 – 42
4
33.5 – 42.5
42.5
38
3
43 – 51
8
42.5 - 51.5
47
4
52 – 60
7
51.5 - 60.5
56
5
61 – 69
5
60.5 - 69.5
65
6
70 – 78 3
69.5 - 78.5
74
Polígono de Frecuencia: de la demanda diaria
8
7
6
5
4
3
2
1
0
24.5 33.5 42.5 51.5 60.5 69.5 78.5
Estadística Descriptiva
22 Ing. Wilson A. Velastegui. Ojeda. Msc
29 38 47 56 65 74
4.3.- DIAGRAMA DE DISTRIBUCIÓN U OJIVA (CURVAS DE FRECUENCIAS
ACUMULADAS)
El gráfico de una distribución de frecuencias acumuladas (se llaman OJIVA) o curva de
distribución de frecuencias acumuladas
Para su construcción se procede de la siguiente manera. Se considera el plano cartesiano, en el
eje X se anotan los limites reales (L – R) de la clase, en el eje Y se anotan las frecuencias
acumuladas (desde la menor hasta la mayor)
Ejemplo: dado los siguientes datos de la tabla construya la curva de distribución u (OJIVA)
Clase Li – Ls f Fa L – R
1 25 – 33 4 4 24,5 – 33,5
2 34 – 42 4 8 33,5 – 42,5
3 43 – 51 8 16 42,5 – 51,5
4 52 – 60 7 23 51,5 – 60,5
5 61 – 69 5 28 60,5 – 69,5
6 70 – 78 3 31 69,5 – 78,5
Estadística Descriptiva
23 Ing. Wilson A. Velastegui. Ojeda. Msc
Gráfico de la curva de distribución (OJIVA)
4.4.- DIAGRAMA DE PASTEL O CICLOGRAMAS
Los gráficos en sectores o diagramas de pastel se utilizan para representar los datos cuyo
conjunto forman un todo.
Pertenecen a este grupo los CIRCUNGRAMAS O CICLOGRAMAS, que son círculos que
representan al número total de datos (n) divididos en tantos sectores circulares como
categorías tiene el grupo.
Cada sector circular es proporcional a la frecuencia de su clase o categoría.
Para encontrar el número de grados de cada clase o categoría se utiliza la siguiente formula.
GRADO = (fx360)/n
Donde f es la frecuencia de la clase y n el número total de dates
Ejemplo: dado los siguientes datos de la tabla construya el diagrama de pastel
CLASE
O serie
LIMITE DE CLASE FRECUENCIA
F
GRADOS
(fx360)/n
PORCENTAJE
Fr x 100
Serie 1 Serie 2 Serie 3 Serie 4 Serie 5 Serie 6
25 – 33 34 – 42 43 – 51 52 – 60 61 – 69 70 – 78
4 4 8 7 5 3
46.5° 46.5° 93° 81° 58° 35°
0.13x100=13 0.13x100=13 0.26x100=26 0.23x100=23 0.16 x100=16 0.09X100=9
TOTAL n = 31 360° 100%
0
5 10
15
20
25 30
35
Serie1
24.5 33.5 42.5 51.5 60.5 78.5
Estadística Descriptiva
24 Ing. Wilson A. Velastegui. Ojeda. Msc
4.5.- DIAGRAMA DE BARRAS O GRÁFICO DE BARRAS.
El diagrama de barras es un gráfico que se representa por medio de rectángulos que se
levantan desde el eje X, hasta una altura que corresponde aI eje Y y que es igual a las
frecuencias de las diferentes categorías de los datos.
La diferencia entre el diagrama de barras y el histograma esta en que el histograma se
refiere a una distribución de frecuencias y los diagramas de barras se utilizan para cualquier
tipo de atributos cualidades o categorías.
Ejemplo: Los siguientes datos corresponden a los campos petroleros existentes en el
Oriente Ecuatoriano.
Campos Petroleros f
1 Yana yacu 20
2 Coca 57
3 Durano Guanto 100
4 Yana Yacu sur 8
5 Lago Agrio 16
6 Shushufindy 14
7 Yana yacu norte 12
8 Sachas 1 28
9 Sachas 2 56
total n= 311
DIAGRAMA DE BARRAS DE CAMPOS PETROLEROS
1
2
3
4
5
6
0
20
40
60
80
100
120
1 2 3 4 5 6 7 8
Series1
Estadística Descriptiva
25 Ing. Wilson A. Velastegui. Ojeda. Msc
1.- La agencia de viajes Ecuador, ofrece tarifas especiales en ciertas travesías por las Islas
Galápagos a ciudadanos de la tercera edad. El presidente de la agencia quiere información
adicional sobre las edades de las personas que viajan, una muestra aleatoria de 40 clientes
que hicieron la travesía el año pasado dio a conocer las siguientes edades.
77 18 63 84 38 54 50 59 54 56 36 26 50 34 44 41 58 58 53 51 62 43 52 53 63 62 62 65 61 52 60 60 45 66 83 71 63 58 61 71
a) Organice los datos en una distribución de frecuencias b) ¿En cuántas clases, grupos o intervalos se puede agrupar este conjunto de datos? c) ¿Cuál es límite inferior que usted recomendaría para la primera clase? d) Comente sobre la distribución de frecuencias
2.- De Ia tabla siguiente: Construya el Histograma, el polígono de frecuencia y la curva de
distribución u ojiva
Li – Ls f
19,2 – 19,4 1
19,5 – 19,7 2
19,8 – 20,0 8
20,1 – 20,3 4
20,4 – 20,6 3
20,7 – 20,9 2
TOTAL n = 20
3) Dada la siguiente tabla que representa el número de carros vendidos en una feria
internacional. Grafique el diagrama de barras
MARCA DE CARROS
f
Datsun Ford
Toyota Vitara
Montero San Remo
40 45 32 44 38 46
TOTAL n = 204
4.- El director del programa de investigaciones científicas de la Universidad Estatal tiene 16
solicitudes para su admisión en el próximo año. Las calificaciones de la prueba de los
solicitantes es:
ACTIVIDAD DE APRENDIZAJE No. 2
Estadística Descriptiva
26 Ing. Wilson A. Velastegui. Ojeda. Msc
27 27 27 28 27 25 25 28 26 28 26 28 31 30 26 26
Tales calificaciones deben organizarse en una distribución de frecuencias.
a) ¿Cuántas clases grupos o intervalos recomendaría? b) ¿Qué intervalo de clase sugeriría? c) ¿Cuál es el límite inferior que recomendaría para la primera clase?
5.- En la siguiente serie estadística de intervalos: Determine:
x F
120 – 125
114 – 119
108 – 113
102 – 107
96 – 101
90 – 95
5
6
10
9
15
2
Total N=47
a) La marca de clase. e) El histograma
b) La frecuencia relativa f) El polígono de frecuencia
c) La frecuencia acumulada g) La curva de distribución (OJIVA)
d) El porcentaje de la frecuencia relativa h) El diagrama de pastel
Estadística Descriptiva
27 Ing. Wilson A. Velastegui. Ojeda. Msc
PARTE A: APLICACIÓN DE LOS CONCEPTOS Y DEFINICIONES
Señale con una (X) la alternativa o alternativas verdaderas que corresponda a cada
pregunta.
1.- En el siguiente redondeo de datos señale las aproximaciones que son correctas de
acuerdo al Sistema Internacional
a) 125,85 aproximado a tres cifras enteras es 126
b) 235,135 aproximado a dos cifras decimales es 235,14
c) 425,45 aproximado a una cifra decimal es 425,5
d) 1 250,1245 aproximado a una cifra decimal es 1250,2.
2.- Señale con una (x) las variables continuas.
a) Provincias del Ecuador b) Habitantes del Ecuador
c) La estatura de los alumnos de un colegio. d) La edad de los alumnos de la
Modalidad Abierta y a distancia
3.- La variable familias del Ecuador es:
a) Continua b) Discreta
c) Cualitativa d) Ninguna de las anteriores
4.- Señale con una (x) las proposiciones que son correctas.
a) C = Ls – Li +1 b) xc = Ls+Li/2 c) xc = (Ls+Li)/2
d) La marca de clase es el valor medio de cada intervalo.
5.- determine los límites reales que le corresponden al siguiente intervalo: 46 – 50
a) 46,5 - 50,5 b) 45,5 - 49,5
c) 45,5 - 50,5 d) Ninguna de las soluciones anteriores.
AUTO EVALUACIÓN No.1 y 2
Estadística Descriptiva
28 Ing. Wilson A. Velastegui. Ojeda. Msc
6.- Un colegio tiene 3 200 estudiantes. Si los alumnos matriculados en el primer curso
son 400, el porcentaje que le corresponde a este curso es de:
a) 8,5% b) 12,5% c) 80%
d) Ninguna de las soluciones anteriores
7.- El ancho del intervalo 51 – 57 es:
a) C = 5 b) C = 6
c) C = 7 d) Ninguna de las anteriores
8.- La marca de clase del intervalo 30 – 35 es:
a) 4 b) 5
c) 32 d) Ninguna de las soluciones anteriores
9.- Para el cálculo de la frecuencia relativa debemos utilizar la fórmula
a) n
fxr
100 b) nff r . c)
n
ff r d) Ninguna de las soluciones anteriores
10) La fórmula para calcular el porcentaje de la frecuencia es:
a) N
fp
100. b)
100
.,Nfp c)
n
fp d) Ninguna de las anteriores
11.- ¿Cuál de las siguientes es una gráfica de superficie?
a) Curva de magnitud b) Polígono de frecuencia
c) Barras compuestas d) Pictograma
12.- En un polígono de frecuencias, los valores representados en el eje vertical
corresponden
a) Los intervalos de clase b) Las frecuencias acumuladas
c) Los puntos medios d) las frecuencias
Estadística Descriptiva
29 Ing. Wilson A. Velastegui. Ojeda. Msc
13.- En un histograma, las frecuencias se ubican en el eje vertical y en el eje horizontal
a) Los limites reales de clase b) La variable
c) Los porcentajes de las frecuencias d) las frecuencias relativas
14.- Cuando en el polígono de frecuencia los puntajes se distribuyen en forma uniforme, la
prueba aplicada ha sido:
a) Con un alto grado de dificultad b) Con cierto grado de dificultad.
c) Normal d) Ninguna de las soluciones anteriores
15.- El gráfico que se obtiene al representar la variable y la frecuencia acumulada
a) Pictograma b) Ojiva o curva de magnitud
c) Polígono de Frecuencia d) Diagrama de frecuencias
16.- El polígono de frecuencia es un gráfico
a) De superficie b) Lineal
c) Libre d) Ninguno de los anteriores
17.- Para trazar un diagrama de barras horizontales en el eje de las abscisas se localizan las
frecuencias y en el eje de las ordenadas.
a) la amplitud de la variable b) Los limites reales de clase
c) Los datos de la variable d) Las frecuencias acumuladas
18.- En un diagrama de sectores los 360 grados del ángulo central de un círculo se
distribuyen utilizando la fórmula
a) A° = N
f 100. b) A° =
f
f 360. c) A° =
f
N 100. d) A° = N
f 360.
19.- El diagrama espiral se utiliza para representar:
Estadística Descriptiva
30 Ing. Wilson A. Velastegui. Ojeda. Msc
a) Solo series con datos geográficos b) Dos series de datos
c) Una variación expansiva de un fenómeno d) Los porcentajes de la variable
20.- Diga si es variable cuantitativa o variable cualitativa los siguientes ítems
a) Numero de libros que ha leído usted en este año
b) Peso del contenido en kilogramos de varias cajas de cereales
c) Número de pases de semestres otorgados a los estudiantes del ISTRA
d) Número de asignaturas en que los estudiantes del ISTRA se han matriculado este
semestre
Estadística Descriptiva
31 Ing. Wilson A. Velastegui. Ojeda. Msc
TERCERA UNIDAD: MEDIDAS
DE TENDENCIA CENTRAL
“No dejes que lo que no puedes hacer, interfiera con lo que puedes hacer” (Autor Desconocido)
OBJETIVOS:
Al término de esta unidad el estudiante estará en capacidad de:
Definir los conceptos de las medidas de tendencia central como: promedio, mediana, moda, media geométrica y media armónica.
Determinar la media aritmética, mediana y moda de datos no agrupados y agrupados
DESARROLLO DE CONTENIDOS
1.- INTRODUCCION.- En las unidades anteriores se plantearon los conceptos y las
técnicas gráficas para describir las distribuciones ocultas en un conjunto de datos. En esta
unidad se definen algunas “medidas numéricas” que se emplean para describir un
conjunto de datos. Estas medidas son: Medidas de tendencia central o de centralización
Estudiaremos tanto para datos no agrupados y agrupados. Las medidas de tendencia
central se refieren a la localización de una distribución. La más importantes medidas de
tendencia central son: la media ( X ), la mediana (Mdn), la moda (Mo), media geométrica
(MG) y la mediana armónica(MA)
2.- MEDIA ARITMETICA O PROMEDIO PARA DATOS NO AGRUPADOS
DEFINICION.- La media se define como la suma de los valores de un conjunto de datos
dividido para el número total de datos.
Existen dos tipos de medias aritméticas: La media poblacional que se representa por u (miu)
y la media muestral que se representa por ( X ) (equis barra).
La media para datos no agrupados está dada por la siguiente fórmula:
n
xxxx
n
X
X n
n
ii
.....3211
Estadística Descriptiva
32 Ing. Wilson A. Velastegui. Ojeda. Msc
Donde
n
iiX
1 a la suma de cada uno de los valores del conjunto de datos y (n) es el
número total de elementos del conjunto.
Ejemplo: Dado el siguiente conjunto de datos hallas su media.
38 – 35 – 76 – 58 – 48 – 59 – 67 – 63 – 33 – 69 – 53 – 51 – 28 – 25 – 36 – 32 – 61 – 57 – 49
78 – 48 – 42 – 72 – 52 – 47 – 66 – 58 – 44 – 44 – 56 – 45
Aquí es este conjunto n = 30
29,5131
1590
31
45564444.....48587635381
n
X
X
n
ii
3. MEDIANA PARA DATOS NO AGRUPADOS
DEFINICIÓN.- La mediana es una colección de datos debidamente ordenados en forma
ascendente o descendente (creciente o decreciente). Es el valor medio o la media aritmética
de los dos valores medios.
La mediana está justamente en el 50% de los datos (en la mitad). Para hallar la mediana,
puede presentar dos casos.
1er. CASO.- Cuando el número de datos es impar.- En este caso la mediana se encuentra
en la mitad de la “serie ordenada” de los datos, se puede encontrar utilizando la siguiente
fórmula
2
1
nMdn
El resultado de esta operación nos indica la posición o el lugar donde está la mediana (este
valor no es la respuesta).
DATOS SIN ORDENAR
DATOS ORDENADOS
38 35 76 58 45 28 32 33 35 36
Estadística Descriptiva
33 Ing. Wilson A. Velastegui. Ojeda. Msc
67 63 33 69 53 59
28 25 36 32 61 51
49 78 48 42 72 57
47 66 58 44 44 52 56
42 44 44 45 47 48 48
51 52 53 56 57 58 58
59 61 63 66 67 69 72 76 78
n = 31 (NÚMERO DE DATOS IMPAR)
162
131
2
1
nMdn
El 16 no es la mediana, el 16 nos indica la posición o el lugar donde se encuentra ubicado la
mediana en el ordenamiento de los datos, en nuestro ejemplo el puesto 16 ocupa el número
51. Por lo tanto la mediana es:
Mdn = 51
2do. CASO.- Cuando el número de datos es par.- En este caso se utiliza el mismo
procedimiento que el 1er. Caso, y se obtiene un número entero con decimales, en este caso
la median se encuentra hallando la media aritmética de los dos valores medios
DATOS SIN ORDENAR
DATOS ORDENADOS
38 35 76 58 45
67 63 33 69 53 59
28 25 36 32 61 51
49 78 48 42 72 57
47 66 58 44 44 52 56
28 32 33 35 36
42 44 44 45 47 48 48
51 52 53 56 57 58 58
59 61 63 66 67 69 72 76 78
Posición 5,152
31
2
130
2
1
nMdn
El número 15, 5 no es la mediana, este valor nos dice que la mediana está entre el elemento
15 y el elemento 16 de los datos ordenados, esto es: El puesto 15 está ocupado por el
número 51 y el puesto 16 por el número 52.
Por lo tanto la mediana es:
5,512
103
2
5251
Mdn
Estadística Descriptiva
34 Ing. Wilson A. Velastegui. Ojeda. Msc
4.- MODA PARA DATOS NO AGRUPADOS
DEFINICIÓN.- La moda en un conjunto de datos u observaciones es el valor que se repite
con mayor frecuencia. A la moda o modo se lo representa con Mo.
NOTA.- Si existe un solo valor que se repite, el conjunto tiene una sola moda y se llama
UNIMODAL
Ejemplo 1: Hallar la moda del siguiente conjunto de datos.
19 1 3 4 2 5
7 6 6 6 6 6
20 17 8 18 9 10
En este conjunto el número que se repite es el 6, por tanto la moda es Mo = 6
Ejemplo 2: Hallar la moda del siguiente conjunto de datos.
1 2 3 3 3 3
4 5 6 7 8 9
10 11 11 11 11 12
En este conjunto los números que se repiten son el 3 y el 11, por tanto la moda es
Mo = 3
Mo = 11 por lo tanto es bimodal (tiene dos modas)
Si existen dos valores que se repiten, el conjunto tiene dos modas, es BIMODAL.
Si existen más de dos valores que se repiten, se dice que el conjunto tiene varias modas, en
este caso se llama MULTIMODAL
Estadística Descriptiva
35 Ing. Wilson A. Velastegui. Ojeda. Msc
5.- MEDIA ARITMÉTICA PARA DATOS AGRUPADOS
La media para datos agrupados se calcula por la siguiente fórmula:
n
XfXfXf
n
Xf
X CkkCC
k
iCi
.....22111
Donde
k
ii Xcf
1= a la suma del producto de las frecuencias por el punto medio o marca de
clase.
n = número total de datos u observaciones
K = número de intervalos grupos o clases
Para hallar la media de datos agrupados, primero encontramos los puntos medios o marca
de clase XC, luego multiplicamos la frecuencia cada clase por el punto medio de la misma
Finalmente sumamos la columna de los productos y su resultado dividimos para el número
total de datos.
Ejemplo: Dado la siguiente tabla de frecuencias halle la media aritmética.
Li – Ls f Xc f. Xc
25 – 33
34 – 42
43 – 51
52 – 60
61 – 69
70 – 78
4
4
8
7
5
3
29
38
47
56
65
74
4x29=116
4x38=152
8x47=376
7x56=392
5x65=325
3x74=222
n = 31
6
11583.
iCXf
06,5131
1583.
6
1
n
XFI
C
X
Estadística Descriptiva
36 Ing. Wilson A. Velastegui. Ojeda. Msc
6.- MEDIANA PARA DATOS AGRUPADOS
PROCEDIMIENTO
1.- De la tabla hallamos las frecuencias acumuladas límites de clases
2.- Dividimos el número total de datos para dos utilizando la expresión 2
n
3.- El resultado encontrado en 2) localizamos en la columna de frecuencias acumuladas
4.- Aplicamos la fórmula de la mediana para datos agrupados que esta dado por:
CLMdnm
ia
f
fn
i
)(2
, o también CLMdnm
sa
f
fn
s
)(2
donde;
iL. = significa límite real inferior de la calase mediana.
2
n = es el número de datos del conjunto dividido para dos.
iaf = suma de las frecuencias acumuladas inferiores a la clase mediana
C = amplitud del intervalo o ancho del intervalo
mf = frecuencia de la clase mediana
Ejemplo: Dado la siguiente tabla de frecuencias halle la mediana
Li – Ls f Fa
25 – 33
34 – 42
43 – 51
52 – 60
61 – 69
70 – 78
4
4
8
7
5
3
4
8
16
23
28
31
n = 31
NOTA: La clave primero esta en dividir el número total de datos para dos, esto es:
Estadística Descriptiva
37 Ing. Wilson A. Velastegui. Ojeda. Msc
2
n = 5,15
2
31 este valor se encuentra en la clase 3 o el intervalo 43 – 51
iL. = 42,5 iaf = 8 C = 43 – 34 = 9 mf = 8
Reemplazando estos valores en la fórmula de la mediana tenemos su resultado
4375,85,42
8
5,675,42)9(
8
5,75,42)9(5,42
8
85,15
Mdn = 50,9375
7.- MODA PARA DATOS AGRUPADOS
Para hallar la moda para datos agrupados, primeramente se observa en columna da las
frecuencias, el valor más alto (clase con la mayor frecuencia.) Luego se halla la moda
utilizando la siguiente fórmula
CLModd
di
21
1
donde;
iL = Límite inferior de la calase modal (clase con la mayor frecuencia).
1d = Frecuencia de la clase modal menos la frecuencia de la clase anterior
2d = Frecuencia de la clase modal menos la frecuencia de la siguiente clase.
C = Amplitud o longitud del intervalo de clase
Ejemplo: Dado la siguiente tabla de frecuencias halle la moda
Li – Ls f
25 – 33
34 – 42
43 – 51
52 – 60
61 – 69
70 – 78
4
4
8
7
5
3
n = 31
NOTA: La frecuencia mas alta 8 y esta en el intervalo 43 – 51 o tercera clase, donde:
Estadística Descriptiva
38 Ing. Wilson A. Velastegui. Ojeda. Msc
f = 8 frecuencia más alta
iL = 42,5 = Límite inferior de la calase modal (clase con la mayor frecuencia)
1d = 8 – 4 = 4 = frecuencia de la clase modal menos la frecuencia de la clase anterior
2d = 8 – 7 = 1 = frecuencia de la clase modal menos la frecuencia de la siguiente
clase.
C = 70 – 61 = 9 = Amplitud o longitud del intervalo de clase
Estos valores reemplazamos en la fórmula de la moda y su valor es:
CLModd
di
21
1
= 45,42
9
365,42)9(5,42
544 = 46,5
EJEMPLO DE RECAPITULACIÓN:
Dado la siguiente tabla de datos agrupados halle la media aritmética, mediana y la moda
Clase Li – Ls fi Xc f. Xc Fa 1 2 3 4 5 6
1.00 – 1.04 1.05 – 1.09 1.10 – 1.14 1.15 – 1.19 1.20 – 1.24 1.25 – 1.29
4 6 10 15 8 5
1.02 1.07 1.12 1.17 1.22 1.27
4.08 6.42
11.20 17.55 9.76 6.35
4 10 20 35 43 48
Total
n = 48
6
136,55.
iCXf
48
36,55.
1
n
Xf
X
k
iC
= 1.1533333 = 1.15
Para la mediana primero dividimos el número total de datos para dos, esto es:
2
n = 24
2
48 este valor se encuentra en la 4º clase o el intervalo 1.15 – 1.19
iL. = 1.15 iaf = 20 C = 1.15 – 1.10 = 0.05 mf = 15
Reemplazando estos valores en la fórmula de la mediana tenemos su resultado
Estadística Descriptiva
39 Ing. Wilson A. Velastegui. Ojeda. Msc
CLMdnm
ia
f
fn
i
)(2
0133.015.1)05.0(15/415.1)05.0(15.115
2024
Mdn = 1.1633 = 1.163
Para hallar la moda observamos cual es la frecuencia más alta, en este caso es 15 y está en la cuarta clase, donde se tiene:
iL = 1.15 1d = 15 – 10 = 5 2d = 15 – 8 = 7
C = 1.20 – 1.15 = 0,05
Estos valores reemplazamos en la fórmula de la moda y su valor es:
CLModd
di
21
1
CLModd
di
21
1
= 020833333.015.1
12
25.015.1)05.0(15.1
755 = 1.17083
Mo= 1.170 1.2
Estadística Descriptiva
40 Ing. Wilson A. Velastegui. Ojeda. Msc
1.- Los siguientes datos representan las latas de frutas de una muestra de 20 unidades que
contienen pesos netos que oscilan entre 19.3 onzas y 20.9 onzas.
19.7 - 19.9 - 20.2 - 19.9 - 20.0 - 20.6 - 19.3 - 20.4 - 19.9 - 20.3 - 20.1 - 19.5 - 20.9 - 20.3 -
20.8 - 19.9 - 20.0 - 20.6 - 19.9 - 19.8
Hallar: el peso promedio, la mediana y la moda, para este conjunto de datos no agrupados
2.- La agencia de viajes Ecuador, ofrece tarifas especiales en ciertas travesías por las Islas
Galápagos a ciudadanos de la tercera edad. El presidente de la agencia quiere información
adicional sobre las edades de las personas que viajan, una muestra aleatoria de 40 clientes
que hicieron la travesía el año pasado dio a conocer las siguientes edades.
77 18 63 84 38 54 50 59 54 56 36 26 50 34 44 41 58 58 53 51 62 43 52 53 63 62 62 65 61 52 60 60 45 66 83 71 63 58 61 71
Hallar: la edad promedio, la mediana y la moda, para este conjunto de datos no agrupados
4.- El director del programa de investigaciones científicas de la Universidad Estatal tiene 16
solicitudes para su admisión en el próximo año. Las calificaciones de la prueba de los
solicitantes es:
27 27 27 28 27 25 25 28 26 28 26 28 31 30 26 26
Halle: la calificación promedio, la mediana y la moda, para este conjunto de datos no
agrupados
5.- Los siguientes datos representan las calificaciones obtenidas en un examen de
estadística en una clase de 40 estudiantes. Halle: la calificación promedio, la mediana y la
moda, para este conjunto de datos no agrupados
2 3 3 3 3 3 4 4 4 4 4 5 5 5 5 5 6 6 6 6 6 6 6 6 7 7 7 7
ACTIVIDAD DE APRENDIZAJE No. 3
Estadística Descriptiva
41 Ing. Wilson A. Velastegui. Ojeda. Msc
7 7 8 8 8 8 9 9 9 9 10 10
6.- a) Determine la media aritmética de los siguientes valores muestrales 5, 9, 4, 10
b) Demuestre que
4
10)(
ixx
7.- Determine el salario medio por hora pagado a carpinteros que obtuvieron los siguientes
pagos por hora: $ 15.40, $ 20.10, $ 18.75, $ 22.76, $ 30.67, $ 18.00
8.- Cual sería el valor modal que reportaría para un conjunto de observaciones si hay un
total de:
a) 10 observaciones y no hay dos valores iguales
b) 6 observaciones y todos son iguales
c) 6 observaciones y los valores son 1, 2, 3, 3, 4 y 4
Para los ejercicios 9 al 11, a) determine la mediana, y b) la moda
9.- Los siguientes datos representa el número de cambios de aceite para los últimos siete
días en el taller denominado Auto – car, localizado en la esquina de la calle Alvarado y Luz
E. Borja
41 15 39 54 31 15 33
10.- Los siguientes datos muestrales representan el cambio en porcentaje para el ingreso
neto del 2002 al 2003, en el caso de 12 compañías de construcción
5 1 - 10 - 6 5 12 7 8 2 5 - 1 11
11.- A continuación se presentan la edad de 10 personas en la tienda de videos en el centro
de la ciudad de Riobamba
12 8 17 6 11 14 8 17 10 8
Estadística Descriptiva
42 Ing. Wilson A. Velastegui. Ojeda. Msc
CUARTA UNIDAD: MEDIDAS DE
DISPERSIÓN
“No dejes que lo que no puedes hacer, interfiera con lo que puedes hacer” (Autor Desconocido)
OBJETIVOS:
Al término de esta unidad el estudiante estará en capacidad de:
Determinar la varianza, la desviación típica o estándar, la desviación media y la desviación mediana de datos no agrupados y agrupados.
Determinar la asimetría, el sesgo de la curva de distribución “curtosis”.
DESARROLLO DE CONTENIDOS
1.- MEDIDAS DE DISPERSIÓN PARA DATOS NO AGRUPADOS Y AGRUPADOS
La dispersión se refiere a la variabilidad o amplitud los datos dentro de un conjunto del cual
se este investigando.
Las medidas de dispersión o variabilidad se refieren a la dispersión o distanciamiento de los
datos con respecto a su media. Las más importantes son: varianza (S2), la desviación típica
o estándar (S), La desviación media (Dm), la desviación mediana (DMdn), los cuartiles,
deciles y percentiles
2.- VARIANZA Y DESVIACIÓN ESTÁNDAR PARA DATOS NO AGRUPADOS
2.1.- VARIANZA PARA DATOS NO AGRUPADOS
La varianza para datos no agrupados está dada por la siguiente fórmula:
1
.....
1
22
2
2
11
2
2
n
xxxxxx
n
xx
S n
n
i
1
2
1
2
2
n
xnx
S
n
i (Método abreviado)
Estadística Descriptiva
43 Ing. Wilson A. Velastegui. Ojeda. Msc
n
ixx
1
2 = Suma de la diferencia de cada valor del conjunto de datos menos la media
aritmética elevado al cuadrado.
n – 1 = número de datos de la observación menos uno.
Ejemplo: Dado el siguiente conjunto de datos no agrupados halle la varianza
82 85 86 87 87 89 89 90 91 91
92 93 94 95 95 95 95 95 97 98
99 99 100 100 101 101 103 103 103 104
105 105 106 107 107 107 109 110 110 111
La media aritmética es: 9.97x donde
40
1
2222 )9.97111(.........)9.9786()9.9782()(i
xx = 2379, 61
Por lo tanto la varianza es
39
61,2370140
)(2
40
1
2
i
xx
S = 61. 015
2.2.- DESVIACIÓN ESTÁNDAR PARA DATOS NO AGRUPADOS
DEFINICIÓN.- La raíz cuadrada más la varianza recibe el nombre de Desviación estándar
Del ejemplo anterior tenemos que la varianza es: S2 = 61.015
Desviación Estándar: S = 81.7015.61 = 7.81
3.- VARIANZA Y DESVIACIÓN ESTÁNDAR PARA DATOS AGRUPADOS
3.1.- VARIANZA PARA DATOS AGRUPADOS.- en fórmula esta dado por:
Estadística Descriptiva
44 Ing. Wilson A. Velastegui. Ojeda. Msc
1
1
2
2
n
xxf
S
k
ic
=
1
.....22
2
2
1
n
xxfxxfxxf ckcc
Ejemplo: Dado el siguiente conjunto de datos agrupados halle la varianza
Li – Ls Punto Medio
cx
f
ci Xf xxc 2xxf ci
82 – 86
87 – 91
92 – 96
97 – 101
102 – 106
107 – 111
84
89
94
99
104
109
3
7
8
8
7
7
252
623
752
792
728
763
13.75
8,75
3.75
1.25
6.25
11.25
567.1875
535.9375
112.5000
12.5000
273.4375
885.9375
TOTAL n = 40 3910
6
1
2
ici xxf 2387.5
75.9740
39101
n
XcfK
ii
x luego la varianza es:
39
5.23871
2
6
1
2
n
xxfi
i
S = 61.2179
3.2.- DESVIACIÓN ESTÁNDAR PARA DATOS AGRUPADOS.- La raíz cuadrada de
la varianza recibe el nombre de Desviación estándar, en fórmula esta dado por:
S=
1
...22
2
2
11
)(1
2
n
xxfxxfxxf ckccn
XXcfk
ii
Del ejemplo anterior la varianza es: S2 = 61.2179 por consiguiente la desviación estándar es
2179.61S
S = 7.824
Estadística Descriptiva
45 Ing. Wilson A. Velastegui. Ojeda. Msc
4.- DESVIACIÓN MEDIA PARA DATOS NO AGRUPADOS
La desviación media para datos no agrupados está dada por:
Dm =n
xxn
ii
1
Dm = Desviación media
xxi = valor absoluto de la diferencia entre cada dato de la muestra y la media.
n = Número de datos.
Ejemplo: Del siguiente conjunto da datos: Hallar la desviación media (D.m)
82 85 86 87 87 89 89 90 91 91
92 93 94 95 95 95 95 95 97 98
99 99 100 100 101 101 103 103 103 104
105 105 106 107 107 107 109 110 110 111
40
111110.....868582x 97.9
1.131.12.....9.119.129.15
9.971119.97110.....9.97869.97859.9782
1
1
n
ii
n
ii
xx
xx
n
ii xx
1 = 15.9 + 12.9 + 11.9 + …..+ 12.1 + 13.1 = 264.2
Por lo tanto: la desviación media es:
D m = n
xxn
ii
1 = 40
2.264 = 6. 605 = 6.61
5.- DESVIACIÓN MEDIANA PARA DATOS NO AGRUPADOS
Estadística Descriptiva
46 Ing. Wilson A. Velastegui. Ojeda. Msc
La fórmula de la desviación mediana para datos no agrupados en fórmula esta dado por
D Mdn=
n
MdnxMdnxMdnx
n
Mdnxn
n
ii
.....211
Ejemplo: Del mismo conjunto anterior hallamos la desviación mediana, Donde
La posición: Mdn = 2
1n =
2
41
2
140
= 20,5 esta entre el elemento 20 y 21
El elemento 20 es 98 y el elemento 21 es 99, el verdadero valor de la mediana es:
D Mdn = 2
9998 = 98.5 hallamos el valor de la desviación mediana
D Mdn=
40
5.981115.98110....5.98855.98821
n
Mdnxn
ii
= 5.92
6.- DESVIACION MEDIA PARA DATOS AGRUPADOS
La desviación media para datos agrupados esta dado por la siguiente fórmula:
D m =
n
xxfxxf
n
xxfckc
ci
.....1
Donde fi = es la frecuencia de cada clase
xxc = es la diferencia entre la marca de clase (punto medio) y la media.
Ejemplo: De la siguiente tabla de datos agrupados calcular la desviación media.
Li – Ls Punto Medio
cx f
ci Xf xxc xxf ci Fa *
82 – 86 87 – 91 92 – 96 97 – 101
102 – 106 107 – 111
84 89 94 99
104 109
3 7 8 8 7 7
252 623 752 792 728 763
13.75 8.75 3.75 1.25 6.25
11.25
3(13.75) = 41.25 7(8.75) = 61.25 8 ( 3.75) = 30.00 8 (1.25) = 10.00 7 ( 6.25) = 43.75 7 (11.25) = 78.75
3 10 18 26 33 40
TOTAL n = 40 3910 2656
1
ici xxf
Estadística Descriptiva
47 Ing. Wilson A. Velastegui. Ojeda. Msc
75.9740
39101
N
XcfK
ii
x la desviación media es D m =
n
xxf ci
= 40
265 = 6.625
6.- DESVIACIÓN MEDIANA PARA DATOS AGRUPADOS
La fórmula de la desviación mediana para datos no agrupados en fórmula esta dado por
D Mdn =
n
MdnxfMdnxfMdnxf
n
Mdnxfckcc
k
ici )(.....)()( 211
Ejemplo: De la tabla anterior de datos agrupados calcular la desviación mediana.
NOTA: La clave primero esta en dividir el número total de datos para dos, esto es:
2
n = 20
2
40 este valor se encuentra en la clase 3 o el intervalo 97 – 101
iL. = 96,5 iaf = 18 C = 106 – 101 = 5 mf = 8
Con estos datos hallamos la mediana
25,15,96
8
105,96)5(
8
25,96)5(5,96
8
1820
Mdn = 97.75
Aquí la mediana es igual a la media aritmética por lo que la desviación media es también
igual a la desviación mediana esto es:
D Mdn =
n
Mdnxfk
ici
1 = 40
265 = 6.625
OSERVACIÓN: No siempre va a ser igual la desviación media con la desviación
mediana en los demás problemas.
Estadística Descriptiva
48 Ing. Wilson A. Velastegui. Ojeda. Msc
Para los problemas del 1 al 5 calcule: a) la varianza, b) la desviación típica o estándar, c) la
desviación media y la desviación mediana, todos representan datos muestrales.
1.- Una muestra de archivos personales de 10 empleadas del Hospital General indicó que,
durante un período de de seis meses, no asistieron el siguiente número de días por
enfermedad: 6, 3, 0, 2 10, 2, 1, 4, 12, 7
2.- Cinco representantes de servicio al cliente de la empresa Electro Sony, que trabajaron el
último viernes, vendieron respectivamente 10, 8, 4, 3, 5, 6, 8 y 2 videograbadoras (VCR)
3.- El departamento de Estadística del INEC de la ciudad de Riobamba ofrece ocho cursos
de Estadística Básica. Los siguientes datos son el número de estudiantes inscritos en tales
cursos: 46, 52, 34, 28, 29, 41, 38 y 36
4.- Los siguientes datos representan las calificaciones obtenidas en la clase de Estadística
80, 83, 87, 85, 90, 86, 84, 82, 88
5.- El número de horas trabajadas por Angélica en los últimos meses fueron
52, 48, 37, 54, 48, 15, 42, 12
Para los problemas del 1 al 2 que representan datos agrupados calcule: a) la varianza, b) la
desviación típica o estándar, c) la desviación media, y la desviación mediana, todos
representan datos muestrales.
1.- La siguiente tabla representa el número de días al año en que los empleados de una
empresa manufacturera estuvieron ausentes del trabajo debido a una enfermedad. Además
responda a las siguientes preguntas:
a) ¿Cuántos empleados estuvieron ausentes menos de tres días al año?
b) ¿Cuántos lo estuvieron ausentes menos de seis días debido a la enfermedad?
ACTIVIDAD DE APRENDIZAJE No. 4
Estadística Descriptiva
49 Ing. Wilson A. Velastegui. Ojeda. Msc
Número de inasistentes
f
0 a 3 5
3 a 6 12
6 a 9 23
9 a 12 8
12 a 15 8
Total n = 50
2.- El contador en jefe de la empresa XX quiere preparar un informe acerca de las cuentas
por cobrar de la compañía. A continuación se presenta una distribución de frecuencias que
muestra la cantidad sobresaliente.
Cantidad f
0 a 2 000 4
2 000 a 4 000 15
4 000 a 6 000 18
6 000 a 8 000 10
8 000 a 10000 4
10 000 a 12 000 3
Total n = 54
5.- CUARTILES, DECILES Y PERCENTILES, PARA DATOS NO AGRUPADOS
Los cuartiles, deciles y percentiles se asemejan mucho a la mediana porque también
subdividen una distribución de mediciones de acuerdo con la proporción de frecuencias
observadas.
Mientras la mediana divide un conjunto de datos en dos mitades, los cuartiles la dividen en 4
partes, los deciles la dividen en 10 partes y los percentiles la dividen en 100 partes.
Para los datos no agrupados, las fórmulas que se emplean son las siguientes:
CUARTILES:
Primero: Q1 = (N/4) + (1/2) Segundo: Q2 = (2N/4) +(172) Tercer: Q3 = (3N/4) + (1/2).
DECILES
Primero: (N/10) + (1/2) = D1 Segundo: (2N/10) + (1/2) = D2
Tercero: (3N/10) + (1/2) = D3 Cuarto: (4N/10) + (1/2) = D4
Quinto: (5N/10) + (1/2) = D5 Sexto: (6N/10) + (1/2) = D6
Estadística Descriptiva
50 Ing. Wilson A. Velastegui. Ojeda. Msc
Séptima: (7N/10) + (1/2) = D7 Octavo: (8N/10) + (1/2) = D8
Noveno: (9N/10) + (1/2) = D9
PERCENTILES
Primero: P1 = (N/100) + (1/2) Segundo: P2 = ( 2N/100) +(1/2)
………………………………………………………………………………………………
Diez P10 = ( 10N/100) +(1/2) Setenta = P70 = ( 70N/100) +(1/2)
Ochenta = P80 = ( 80N/100) +(1/2) Noventa = P90 = ( 90N/100) +(1/2)
Ejemplo: Del siguiente conjunto de datos hallar, los cuartiles, el decil segundo y decil
noveno, además hallar los percentiles décimo, veinticinco avo, setenta y cinco avo (75) y
noventa avo.
82 85 86 87 87 89 89 90 91 91
92 93 94 95 95 95 95 95 97 98
99 99 100 100 101 101 103 103 103 104
105 105 106 107 107 107 109 110 110 111
En este problema el número de datos es n = 40
CUARTILES
Q1 = (n/4) +(1/2) = (40/4) + (1/2) = 10 +0.5; Q1 = 2
183
2
9291
= 91.5
Q2= (2(40)/4) +(1/2) = 20+ 0.5 = 20.5 Q2 = 2
197
2
9998
= 98.5
Q3 = (3(40)/4) +(1/2) = 30+0.5 = 30.5 Q3 = 2
209
2
105104
= 104.5
DECILES
D1 = (2(40)/10) +(1/2) = 8+0.5 = 8.5 D1 = 2
181
2
9190
= 90.5
D9 = (9(40)/10) +(1/2) = 36+0.5 = 36.5 D9 = 2
206
2
109107
= 108.5
PERCENTILES
P10= (10(40)/100) +(1/2) = 4+0.5 = 4.5 P10 = 2
174
2
8787
= 74
Estadística Descriptiva
51 Ing. Wilson A. Velastegui. Ojeda. Msc
P25 = (25(40)/100) +(1/2) = 10+0.5 = 10.5 P25 = 2
183
2
9291
= 91.5
P75 = (75(40)/100) +(1/2) = 30 + 0.5 = 30.5 P75 = 2
209
2
105104
= 104.5
P90 = (90(40)/100) +(1/2) = 36+0.5 = 36.5 P90 = 2
216
2
109107
= 108
De todas estas medidas los más utilizados son los Percentiles:
DEFINICIÓN: Se llama recorrido intercuantil a la diferencia entre los percentiles 75 avo. Y
25 avo. En formula es: Recorrido intercuantil = P75 – P25
Del ejemplo anterior tenemos: Recorrido intercuantil = P75 – P25 = 104.5 – 91.5 = 13
DEFINCIÓN: Se llama recorrido interdecil a la diferencia entre los percentiles 90avo. Y 10
avo. En fórmula es: Recorrido interdecil = P90 – P10.
Del ejemplo anterior tenemos: Recorrido interdecil = P90 - P10 = 108 – 87 = 21
6.- CUARTILES, DECILES Y PERCENTILES PARA DATOS AGRUPADOS
Para hallar los cuartiles, deciles y percentiles de datos agrupados, basta recordar la fórmula
de la mediana para datos agrupados.
Esto Es: CLiMdnmf
ifN ])(2/[
Por lo tanto las formulas para los Cuartiles, deciles y percentiles son:
CUARTILES:
CLiQ
cuartilf
ifN.
)(4/
1
CLiQ
cuartilf
ifN.
)(4/2
2
CLiQ
cuartilf
ifN.
)(4/3
3
DECILES
CLiD
decilf
ifN.
)(10/
1
CLiD
decilf
ifN.
)(10/5
5
CLiD
decilf
ifN.
)(10/8
8
Estadística Descriptiva
52 Ing. Wilson A. Velastegui. Ojeda. Msc
CLiD
decilf
ifN.
)(10/9
9
PERCENTILES
Dentro de los percentiles los más utilizados son:
CLiP
percentilf
ifN.
)(10/
10
CLiP
percentilf
ifN.
)(10/25
25
CLiP
percentilf
ifN.
)(10/75
75
CLiP
percentilf
ifN.
)(10/90
90
Así tenemos lo siguiente:
Recorrido intercuantil = P75 – P25
Recorrido interdecil = P90 – P10.
Ejemplo: De la siguiente tabla determinar, el recorrido intercuantil y el recorrido interdecil
clase LIMITE DE CLASE FRECDUENCIA
fi
FRECUENCIA
ACUMULADA
1
2
3
4
5
6
82 – 86
87 – 91
92 – 96
97 – 101
102 – 106
107 – 111
3
7
8
8
7
7
3
110
18
26
33
40
Total n =40
CLiP
percentilF
ifN.
)(100/10
10
CLiP
percentilF
ifN.
)(100/25
25
Estadística Descriptiva
53 Ing. Wilson A. Velastegui. Ojeda. Msc
4100
400
100
)40(10
100
10
n(2da clase)
Li= 87; ( f)i = 3; f= 7; C=5
P 10 = 87 + (4-3/7) 5
P10 = 87 + (1/7) 5= 87+0.71
P10 = 87.71
10100
1000
100
)40(25
100
25
n(2da clase)
Li= 87; ( f)i = 3; f= 7; C=5
P 25 = 87 + (10-3/7) 5
P25 = 87 + (7/7) 5 = 87+5
P25 = 92
CLiP
percentilF
ifN.
)(100/90
90
90N = 3600=36 (6ta clase).
100
Li= 107; ( f)i = 33; f= 7.
P 90 = 107+ (36-33/7) 5
P90 = 107 + (3/7) 5= 107+2.14
P90 = 109.14
CLiP
percentilF
ifN.
)(100/10
10
75N = 3000=30 (5ta clase).
100
Li= 102; ( f)i = 26; f= 7.
P 75 = 102+ (30-26/7) 5
P75 = 102+ (4/7) 5= 102+2.85
P75 = 104.86
Recorrido intercuantil = P75 – P25 = 104.86 – 92 = 12.86 13
Recorrido interdecil = P90 – P10 = 109.14 – 87.71 = 21.43
EJERCICIO1: Dado el siguiente conjunto de datos no agrupados (20 datos)
Datos no ordenados Datos ordenados
40.2
26.9
44.2
31.7
29.3
28.7
32.3
36.8
35.6
99.8
55.2
45.2
88.2
35.6
50.6
25.1
42.9
37.8
25.4
39.7
25.1
25.4
26.9
28.7
29.3
31.7
32.3
35.6
35.6
36.8
37.8
39.7
40.2
42.9
44.2
45.2
50.6
55.2
88.2
99.8
Estadística Descriptiva
54 Ing. Wilson A. Velastegui. Ojeda. Msc
Calcular: el recorrido intercuantil y recorrido interdecil
P10= [10(20)/100 + 0.5 = 2 + 0.5 = 2.5; está entre el elemento 2 y 5 de los datos ordenados
P10= (25.4 + 26.9)/2 = 52.3/2 = 26.15
P25 = (29.3 + 31.7)/ 2 = 61/ 2 = 30.5
P75 = [75(20)/100) + 0.5 = 15 + 0.5 = 15.5; está entre el elemento 15 y 16
P75 = (44.2 + 45.2 / 2 = 89.4 /2 = 44.7
P90 = [90(20)/100) + 0.5 = 18+0.5 = 18.5; está entre el elemento 18 y 19
P90 = (88.2 + 55.2)/ 2 = 134.4/2 = 71.7
Recorrido intercuantil = P75 – P25 = 44.7 – 30.5 = 14.2
Recorrido interdecil = P90 – P10 = 71.7 – 26.15 = 45.55
EJERCICIO 2: Los siguientes datos agrupados representan los pagos por almacenamiento
para los 50 más grandes detallistas durante el año 2003. Hallar, la media, mediana, moda,
la varianza y la desviación típica
Li – Ls
f Xc fA Fi Xc Xc - X F1(Xc- X) (Xc- X)2 F1(Xc - X)2
1.10 - 1.86
1.87 - 2.63
2.64 - 3.40
3.41 - 4.17
4.18 - 4.94
4.95 - 5.71
5.72 - 6.48
6.49 - 7.25
4
14
11
9
7
1
2
2
1.48
2.25
3.02
3.79
4.56
5.33
6.10
6.87
4
18
29
38
45
46
48
50
5.92
31.5
33.22
34.11
31.92
5.33
12.20
13.74
1.88
1.11
0.34
0.43
1.20
1.79
2.76
3.51
7.52
15.54
3.74
3.87
8.40
1.97
5.48
7.02
3.176
1.024
0.059
0.276
1.684
4.277
8.139
13.017
12.704
14.336
.649
2.511
11.788
4.277
16.278
26.034
Total n=50 167.94 53.54 88.577
36.350
99.167
8
1
n
XcFI
I
X n/2 = 50/2= 25 está en la tercera clase
Li = 2.635 (
8
1
)i
if 18; fm=11
Estadística Descriptiva
55 Ing. Wilson A. Velastegui. Ojeda. Msc
C= 5.72 – 4.95 = 0.77
m
i
f
yfN
LiMdn
8
1
)2/
Mdn= = 2.635 + (25 –18)/11 (0.77) = 2.635 + (0.636)(0.77) = 2.635 + 0.49 = 3.125
La moda CLiModd
d21
1
d1 = 14 – 4 = 10 d2 = 14 – 11 = 3 Li = 1.865
5923.0865.113
7.7865.1)77.0(
310
10865.1
Mdn = 2.4573 = 2.46
la desviación media
5054.53
)(8
11
n
xXcfiDm = 1.0708
* La varianza
49577.88
1
)(2
28
11
n
xXcfiS = 1, 80769 = 1.81
* La desviación típica o estándar
808.11
)(8
1
2
n
XXcfi
i
S = 1.344 = 1.34
OBSERVACIÓN: Otros autores al límite inferior pueden tomar el mismo valor es decir Li =
2.64 y no restar 0.001, en nuestro caso: Li = 2.64 – 0.001 =2.635
7.- FORMA DE DISTRIBUCION DE FRECUENCIA
La forma de la distribución sobre conjuntos que tienen una sola moda (unimodales) se
refiere a: Su simetría o falta de ella (asimetría)
Estadística Descriptiva
56 Ing. Wilson A. Velastegui. Ojeda. Msc
La curtosis (la agudeza de su punta).
SIMETRIA.- Una distribución se dice que es simétrica cuando la media, mediana y la moda
son iguales, es decir
X = Mdn = Mo
Donde su asimetría es igual a cero.
Se dice que una distribución esta sesgada positivamente, si la cola derecha es más larga
que la cola izquierda
X > Mdn > Mo
Se dice que una distribución esta sesgada negativamente si la cola izquierda es más larga
que la cola derecha
Mo > Mdn > X
Esto se puede visualizar mediante el siguiente gráfico
La asimetría (Sk) puede medirse por el coeficiente de simetría de Pearson
Sk = 3(u – med) para poblaciones
Estadística Descriptiva
57 Ing. Wilson A. Velastegui. Ojeda. Msc
Sk = 3(X – med) para muestras.
SP
La asimetría puede medirse también por el tercer momento respecto a la media y se puede
hallar también mediante las siguientes fórmulas:
3
3
1
)(
xnk
i
i
Sk para poblaciones
3
3
1
)(
s
xxfik
i
i
Sk
para muestras.
Donde, u3 es el tercer momento central;
Si u3 < 0, se dice que la distribución es asimétrica negativamente
Si u3 > 0, se dice que la distribución es asimétrica positivamente
Si u3 = 0, se dice que la distribución es simétrica.
CURTOSIUS.- La curtosis estudia la puntiagudez de la curva
Una curva de punta aguda se llama leptocúrtica.
Una curva de punta atachada se llama platircúrtica
Una curva que se encuentra entre la leptocúrtica y platicúrtica se llama mesocúrita (ver fig.)
La curtosis puede medirse por el cuarto momento respecto a la media dividido por la
desviación estándar elevada a la cuarta potencia. Es fórmula es:
4
4
1
)(
xnk
i
i
Sk para poblaciones
4
4
1
)(
s
xxfik
i
i
Sk
para muestras.
Donde, u2 es el cuarto momento central
La curtosis para una curva leptocúrtica >3
La curtosis para una curva mesocúrtica = 3
La curtosis para una curva platicúrtica < 3
Estadística Descriptiva
58 Ing. Wilson A. Velastegui. Ojeda. Msc
Coeficiente de Pearson: 5
)(3 MdnxP
Si P < 0, los datos están sugados a la izquierda
Si P > 0, los datos están sugados a la derecha
Si P = 0, los datos están distribuidos normalmente.
TEOREMA DE CHEBYSHEY: Afirma que al menos un dato (observaciones) de un conjunto
se encuentra en yKkk
1,1 2
1 desviación típica de la media.
Coeficiente de variación: Mide el grado de dispersión de un conjunto de datos en relación
con su media.
)100(5x
CV
Estadística Descriptiva
59 Ing. Wilson A. Velastegui. Ojeda. Msc
INSTRUCCIÓN: Señale con una (x) la(s) alternativa(s) verdadera(s) que correspondan a
cada pregunta.
1.- Las medidas de tendencia central son valores:
a) Que ocupan el centro de una serie ordenada
b) Con los cuales se separan los datos con respecto a su media.
c) Hacia los cuales tienden a acercase o alejarse los demás valores de la serie.
d) Que resultan de multiplicar las desviaciones para el número de casos.
2.- La media aritmética es el valor promedio que resulta de:
a) Multiplicar la sumatoria de valores por el número total de casos.
b) Dividir la suma de las desviaciones para el número de casos.
c) Dividir un conjunto de valores para el número total de los mismos.
d) Ninguna de las proposiciones anteriores.
3.- La fórmula N
fX cX
se la utiliza para hallar la media aritmética de:
a) Una serie estadística b) Una serie estadística de intervalo
c) Una serie estadística de frecuencia d) Datos agrupados
4.- La mediana de la siguiente serie de datos: 19, 15, 18, 16, 17 es:
a) 18 b) 17
c) 16 d) Ninguno de los valores anteriores.
5.- La fórmula 2NMdn se la utiliza para:
a) Determinar el valor de la mediana
POS - TEST
Estadística Descriptiva
60 Ing. Wilson A. Velastegui. Ojeda. Msc
b) Encontrar el valor que más se repite en la serie
c) Determinar la posición de la mediana
d) Encontrar el valor de la mediana de una serie estadística
6.- Señale cual de las siguiente medidas individuales es equivalente a la mediana.
a) El percentil 25 b) El segundo cuartil
c) El cuarto decil d) Ninguna de las anteriores
7.- El modo de la siguiente serie estadística es:
X f
145 12
144 10
143 15
142 14
141 9
Total n = 46
a) 14.5 b) 15 c) 143 d) Ninguna de las anteriores
8.- Señale cuál de las siguientes proposiciones es verdadera
a) La media geométrica es la raíz cuadrada del producto de los valores de la
variable
b) La media geométrica es el valor recíproco de la media aritmética.
c) El modo es el valor que se presenta con más frecuencia en el conjunto
d) Ninguna de las anteriores
9.- La media geométrica se la puede aplicar para:
a) Hallar en economía el costo promedio
b) Obtener un promedio exacto de una progresión geométrica
c) Para calcular la desviación típica
d) Hallar promedios de velocidades
10.- Identifique cuál de las siguientes medidas son de dispersión
Estadística Descriptiva
61 Ing. Wilson A. Velastegui. Ojeda. Msc
a) Modo b) Varianza
c) Mediana d) Desviación típica
PRUEBA DE ENSAYO
INSTRUCCIONES: Esta prueba consta de seis problemas en las cuales es preciso que
escriba todo el procedimiento
1.- Determine la media aritmética y desviación media de la siguiente serie estadística
X f
66 – 70 16
61 – 65 20
56 – 60 12
51 – 55 22
46 – 50 10
Total n = 80
2.- Si la edad de los profesores de un colegio es la que está en la siguiente tabla: Calcular la
mediana:
X f
26 – 30 25
31 – 35 32
36 – 40 24
41 – 45 15
46 – 50 10
51 – 55 9
Total n = 115
3.- Determine la desviación media de la siguiente tabla ordenada pero no agrupada
Peso en KG. f
60 5
61 8
62 12
63 25
64 16
65 4
Total n = 70
Estadística Descriptiva
62 Ing. Wilson A. Velastegui. Ojeda. Msc
4.- Determine la desviación típica de la serie estadística que se encuentra registrada en el
siguiente cuadro estadístico
Descendente Ascendente
EDADES f EDADES f
51 – 57 12 16 – 22 10
44 – 50 21 23 – 29 14
37 – 43 35 30 – 36 26
30 – 36 26 37 – 43 35
23 – 29 14 44 – 50 21
16 – 25 10 51 – 57 12
Total n=118 Total n = 118
5.- En la siguiente serie estadística de intervalos: Determine. El promedio, la mediana y la
moda, para este conjunto de datos agrupados
x F
120 – 125 114 – 119 108 – 113 102 – 107 96 – 101 90 – 95
5 7 10 9 15 4
Total n = 50
6.- De Ia tabla siguiente: Determine. El promedio, la mediana y la moda, para este conjunto
de datos agrupados.
Li – Ls f
19,2 – 19,4 1
19,5 – 19,7 2
19,8 – 20,0 8
20,1 – 20,3 4
20,4 – 20,6 3
20,7 – 20,9 2
TOTAL n = 20
7.- Si la media aritmética es 7 y la varianza es 20, de los datos, X1, X2, X3,…..,Xn. Calcular la
media aritmética de las 223
22
21 ..,,.........,, nXXXX . Rpta. 69
SUGERENCIA: Utilice las siguientes expresiones.
n
xxxx
n
X
X n
n
ii
.....3211
n
xxxxxx
n
xx
S n
n
i
22
2
2
11
2
2 .....
8.- Dos marcas competidoras de calzado para corredores se sometieron a una prueba para
comprobar el desgaste del calzado. Cada una de ellas indicó el siguiente número de horas
de uso necesarios para que se detecte un desgaste significativo.
Estadística Descriptiva
63 Ing. Wilson A. Velastegui. Ojeda. Msc
Marca A Marca B
97 78
83 56
75 87
82 54
98 89
65 65
75
n = 7 n = 6
a) ¿Qué calzado parece presentar menor desgaste? b) ¿Qué calzado parece tener el programa de control de calidad que produce u8n
desgaste más uniforme?
Estadística Descriptiva
64 Ing. Wilson A. Velastegui. Ojeda. Msc
BIBLIOGRAFIA
ALLEN L. WEBSTER: Estadística Aplicada para la Administración y Economía, IRWIN, 1999.
ALLISON, D. E. 1970: “Test anxiety, stress y intelligence perfomance” Sxiencia, 2
CONOVER, W. J y otros 1974: “Some reasons for not using the ytes”.
DIXON, W. J. Y F. J. MASSER, 1980: Introduction to statical Analysis (4ta. Ed.) Nueva York: McGrawHill. FRENCH, J. W. 1946: “Efects of anxiety on verbl and mathematical examination scores”, Educational and Bychological Mea surement, 22, 553 – 564. BURSTEIN, H. 1971: Ttribute Sampling: Tables and Ex Planations o Tubles for Determinig confidence limits and smple sizes based on close aproximations of the binomial distribution.
KENNETH D. HOPKINS y B.R. HOPKINS: Estadística Básica. México 1997 Ingramex. GEORGE CANAYOS: Probabilidades y Estadística. México 1992. McGrawHill
MASON/LIND/MARCHAL: 10ª Edición: Estadística para Administración y Economía 2003